2025 será recordado por esto
Автор: Productomania
Загружено: 2026-01-07
Просмотров: 367
Описание:
Han pasado muchas cosas en 2025 en el año de la IA, ha sido un año intenso. Al contrario de lo que algunos piensan, las capacidades de los modelos han mejorado enormemente este último año. Y esto ha sido posible al nuevo paradigma del test-time compute. En este vídeo te explico en qué consiste esto del test-time compute y cómo los laboratorios de IA están aplicando técnicas de Reinforcement Learning para mejorar la capacidad de razonamiento de los modelos.
Enlaces comentados en el vídeo:
🔗 Paper de DeepSeek R1: https://arxiv.org/pdf/2501.12948
🔗 ARC-AGI: https://arcprize.org/leaderboard
🔗 SantotoBench: https://santotobench.productomania.io/
⏱️ Timestamps
00:00 Intro
03:20 ¿Qué es el test-time compute?
07:10 ¿Cómo funciona el RL?
15:03 Un nuevo parámetro: esfuerzo de razonamiento
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: