Превосходят ли 4 агента Grok 4.20 по производительности Gemini 3.1 PRO?

Автор: Discover AI

Загружено: 2026-02-20

Просмотров: 4754

Описание: Превосходят ли 4 агента Grok (GROK 4.20 BETA) одного агента Gemini 3.1 PRO?

Я тестирую свой набор инструментов для причинно-следственного анализа (нелинейная логика, научное мышление) на 4 агентах GROK (на их платформе) против одного агента LLL на arena.ai.

Может ли агент LLM (Gemini 3.1 Pro) на arena.ai победить 4 агентов GROK в их естественной среде обитания?

Google опубликовала предварительную версию новой модели ИИ Gemini 3.1 PRO, и я провел первый тест производительности причинно-следственного анализа, сравнивая ее с Claude 4.6 Thinking и Sonnet 4.6, GPT-5.2 xhigh и GLM-5, MiMo V2 Flash и Grok 4.1 Thinking.

@Google @googledeepmind

#airesearch
#aiexplained
#aitesting
#gemini_3_1
#reasoningskills

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Превосходят ли 4 агента Grok 4.20 по производительности Gemini 3.1 PRO?

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Будущее — это уже не предсказание. Это график, сгенерированный искусственным интеллектом.

Будущее — это уже не предсказание. Это график, сгенерированный искусственным интеллектом.

Can A Medium Qwen 3.5 Reason? Flash, 27B, 9B TEST

Can A Medium Qwen 3.5 Reason? Flash, 27B, 9B TEST

Сонет Близнецов 3.1 против Сонета 4.6 — какой из них лучше?

Сонет Близнецов 3.1 против Сонета 4.6 — какой из них лучше?

Grok 4.20 First Look & Hands-On Test – A BIG Upgrade!

Grok 4.20 First Look & Hands-On Test – A BIG Upgrade!

БИТВА ТИТАНОВ! Claude Opus 4.6 vs Gemini 3.1 Pro. ФАНТАСТИЧЕСКИЕ нейросети! ШОК

БИТВА ТИТАНОВ! Claude Opus 4.6 vs Gemini 3.1 Pro. ФАНТАСТИЧЕСКИЕ нейросети! ШОК

8B превосходит GPT-120B в многоагентной среде.

8B превосходит GPT-120B в многоагентной среде.

Как я делаю ДЛИННЫЕ видео в GROK за 0₽ (ГАЙД 2026) + Google Gemini и Google Studio

Как я делаю ДЛИННЫЕ видео в GROK за 0₽ (ГАЙД 2026) + Google Gemini и Google Studio

Минфин НЕ БУДЕТ продавать валюту в марте!

Минфин НЕ БУДЕТ продавать валюту в марте!

21 неожиданный способ использовать Gemini в повседневной жизни

21 неожиданный способ использовать Gemini в повседневной жизни

GLM-5 УНИЧТОЖИЛА DeepSeek! Бесплатная нейросеть БЕЗ ограничений. Полный тест 2026

GLM-5 УНИЧТОЖИЛА DeepSeek! Бесплатная нейросеть БЕЗ ограничений. Полный тест 2026

Gemini 3.1 Pro меняет всё. Вот почему.

Gemini 3.1 Pro меняет всё. Вот почему.

Революция в ИИ, которую мы проспали. И это не хайп.

Революция в ИИ, которую мы проспали. И это не хайп.

Google Gemini 3.1 Pro vs Claude Opus 4.6 vs GLM 5: сравнение llm - моделей | Кто сильнее?

Google Gemini 3.1 Pro vs Claude Opus 4.6 vs GLM 5: сравнение llm - моделей | Кто сильнее?

ДИЗАЙНЕРЫ ПЛАЧУТ! Gemini 3.1 Pro за 1000₽ делает ВСЁ идеально. КОРОЛЬ

ДИЗАЙНЕРЫ ПЛАЧУТ! Gemini 3.1 Pro за 1000₽ делает ВСЁ идеально. КОРОЛЬ

Плачу $100 за Claude. Он автоматизировал весь мой YouTube

Плачу $100 за Claude. Он автоматизировал весь мой YouTube

Агенты хаоса в OpenClaw | OpenAI Frontier как ОС для компаний?

Агенты хаоса в OpenClaw | OpenAI Frontier как ОС для компаний?

9 Скрытых Фишек ChatGPT о которых никто не говорит

9 Скрытых Фишек ChatGPT о которых никто не говорит

Я проверила все нейросети Google и поделилась своим мнением (2026)

Я проверила все нейросети Google и поделилась своим мнением (2026)

Dario Amodei WARNS:

Dario Amodei WARNS: "You Have No Idea What's Coming in 6 Months"

Генерация видео на АВТОМАТЕ | Безлимитно и полностью Бесплатно | Пошаговый Гайд

Генерация видео на АВТОМАТЕ | Безлимитно и полностью Бесплатно | Пошаговый Гайд