Превосходят ли 4 агента Grok 4.20 по производительности Gemini 3.1 PRO?
Автор: Discover AI
Загружено: 2026-02-20
Просмотров: 4754
Описание:
Превосходят ли 4 агента Grok (GROK 4.20 BETA) одного агента Gemini 3.1 PRO?
Я тестирую свой набор инструментов для причинно-следственного анализа (нелинейная логика, научное мышление) на 4 агентах GROK (на их платформе) против одного агента LLL на arena.ai.
Может ли агент LLM (Gemini 3.1 Pro) на arena.ai победить 4 агентов GROK в их естественной среде обитания?
Google опубликовала предварительную версию новой модели ИИ Gemini 3.1 PRO, и я провел первый тест производительности причинно-следственного анализа, сравнивая ее с Claude 4.6 Thinking и Sonnet 4.6, GPT-5.2 xhigh и GLM-5, MiMo V2 Flash и Grok 4.1 Thinking.
@Google @googledeepmind
#airesearch
#aiexplained
#aitesting
#gemini_3_1
#reasoningskills
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: