ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Gemini 3.1 Pro and the Downfall of Benchmarks: Welcome to the Vibe Era of AI

Автор: AI Explained

Загружено: 2026-02-20

Просмотров: 37785

Описание: Do we have a new best AI model, or do we have the downfall of benchmarks in general, as a way of capturing machine intelligence? Full breakdown of Gemini 3.1 Pro, guest-starring the new Sonnet 4.6, plus analysis from 7 papers/posts that will give you much needed context. Oh, and a new record on Simple Bench!

https://epoch.ai/ai-explained-datacen...


Check out my fast-growing (!) app, free to use, and code INSIDER15 for Pro: https://lmcouncil.ai

AI Insiders ($9!):   / aiexplained  


Chapters:
00:00 - Introduction
00:30 - Post-training Dominance
04:00 - ARC-AGI 2 Caveat
05:54 - Simple Bench Record
08:22 - Hallucination Caveat
10:05 - Model Card
11:12 - Exponential Coming
12:20 - Amodei on Generalizing
15:10 - One True Benchmark?
17:02 - Other Metrics…

Gemini 3.1 Model Card: https://storage.googleapis.com/deepmi...

Release: https://blog.google/innovation-and-ai...

Where are Agents deployed?: https://www.anthropic.com/research/me...

Newsletter Post: https://signaltonoise.beehiiv.com/p/4...

Hallucination AA: https://artificialanalysis.ai/evaluat...

Melanie Mitchell: https://x.com/MelMitchell1/status/202...
ARC-AGI-2: https://x.com/arcprize/status/2024522...

Chollet on Agentic Coding and ML: https://x.com/fchollet/status/2024519...

METR Caveat: https://metr.org/notes/2026-01-22-tim...

Talaas Fast: https://chatjimmy.ai/

Amodei Interview Continual learning: https://www.dwarkesh.com/p/dario-amod...

Metaculus FutureEval: https://www.metaculus.com/futureeval/

Next Vid to Watch:   / what-you-need-to-150647292  



Non-hype Newsletter: https://signaltonoise.beehiiv.com/

Podcast: https://aiexplainedopodcast.buzzsprou...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Gemini 3.1 Pro and the Downfall of Benchmarks: Welcome to the Vibe Era of AI

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Sam Altman: AGI is

Sam Altman: AGI is "Pretty Close" | Highlights Video

AI News: 5 New Models Dropped This Week!

AI News: 5 New Models Dropped This Week!

Casting SALT like Metal - What Happens?

Casting SALT like Metal - What Happens?

NVIDIA Killer Is Here (17000 Tokens Per Second)!

NVIDIA Killer Is Here (17000 Tokens Per Second)!

Вы не отстаёте. Как освоить ИИ за 17 минут.

Вы не отстаёте. Как освоить ИИ за 17 минут.

Gemini 3.1 против Claude Opus 4.6 — Тест на реальном коде

Gemini 3.1 против Claude Opus 4.6 — Тест на реальном коде

AI Blackmails OSS Maintainer

AI Blackmails OSS Maintainer

УЧИТЕ ГУДИНИ, ПОКА НЕ ПОЗДНО! #houdini #ии

УЧИТЕ ГУДИНИ, ПОКА НЕ ПОЗДНО! #houdini #ии

Google just dropped Gemini 3.1... (WOAH)

Google just dropped Gemini 3.1... (WOAH)

Google выпустила предварительную версию Gemini 3.1 Pro, и это просто невероятно! (Новые варианты ...

Google выпустила предварительную версию Gemini 3.1 Pro, и это просто невероятно! (Новые варианты ...

Самолет ВСЕХ КИНУЛ? // Люди останутся без жилья?

Самолет ВСЕХ КИНУЛ? // Люди останутся без жилья?

ANTHROPIC RUG-PULL: The Death of OpenClaw (and the Sovereign Move)

ANTHROPIC RUG-PULL: The Death of OpenClaw (and the Sovereign Move)

Magnus Invents A New Opening So OUTRAGEOUS, You'll Question EVERY Chess Principle!

Magnus Invents A New Opening So OUTRAGEOUS, You'll Question EVERY Chess Principle!

Is Seedance 2.0 the Best AI Video Generator Right Now?

Is Seedance 2.0 the Best AI Video Generator Right Now?

Gemini 3.1 Pro, Claude 4.6 Sonnet, Grok 4.20, and more! | Feature Crew Live 2/20

Gemini 3.1 Pro, Claude 4.6 Sonnet, Grok 4.20, and more! | Feature Crew Live 2/20

I Spent 200 Million Tokens Vibe Coding With Gemini 3.1 Pro

I Spent 200 Million Tokens Vibe Coding With Gemini 3.1 Pro

Происходят масштабные перемены — в автомобильной, промышленной, энергетической отраслях и произво...

Происходят масштабные перемены — в автомобильной, промышленной, энергетической отраслях и произво...

$1,000 a Day in AI Costs. Three Engineers. No Writing Code. No Code Review. But More Output.

$1,000 a Day in AI Costs. Three Engineers. No Writing Code. No Code Review. But More Output.

Искусственный интеллект Meta лучше, чем OpenClaw (демонстрация Manus AI)

Искусственный интеллект Meta лучше, чем OpenClaw (демонстрация Manus AI)

Anthropic just BANNED OpenClaw...

Anthropic just BANNED OpenClaw...

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]