Is SFT Dead? How Meta only uses 13 Parameters to Learning to Reason

Автор: AI fun facts for all

Загружено: 2026-02-15

Просмотров: 80

Описание: What if I told you that a 7B model like Qwen2.5-7B could jump from 76% to 91% accuracy… using just 26 bytes of trainable data?

That’s smaller than a tweet.

In this video, we break down Meta’s groundbreaking paper, Meta’s “Learning to Reason in 13 Parameters.” We explore how TinyLoRA challenges everything we thought we knew about fine-tuning large language models.

We’ll cover:

Why 13 parameters can outperform traditional LoRA setups

Why Reinforcement Learning (GRPO) crushes Supervised Fine-Tuning for reasoning

The shocking “Inverse Scaling Law” that suggests bigger models may need less training

If you care about alignment, local LLMs, or the future of AI efficiency, this one will rewire how you think about model steering.

Join my AI newsletter:
https://upaspro.com/newsletter/
More information: https://upaspro.com/is-sft-dead-how-m...

👇 Timestamps:
00:00- Train Qwen 2.5 with 26 bytes
02:02- 1- Myth of Capacity
04:13- 2- Signal-to-Noise Ratio
06:28- 3- Inverse Scaling Law
07:09- Recap

#AI #LLM #TinyLoRA #ReinforcementLearning #MetaAI #MachineLearning #OpenSourceAI #Alignment #Qwen #DeepLearning

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Is SFT Dead? How Meta only uses 13 Parameters to Learning to Reason

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Вы не готовы: агентное программирование в 2026 году

Вы не готовы: агентное программирование в 2026 году

Лекция от легенды ИИ в Стэнфорде

Лекция от легенды ИИ в Стэнфорде

Use AI Safer & Better: 6 Rules to Live by

Use AI Safer & Better: 6 Rules to Live by

Искусственный интеллект только начал заниматься НАСТОЯЩЕЙ наукой.

Искусственный интеллект только начал заниматься НАСТОЯЩЕЙ наукой.

GraphRAG: Stop LLM Hallucinations with Knowledge Graphs

GraphRAG: Stop LLM Hallucinations with Knowledge Graphs

Теория мертвого интернета: почему вы — единственный оставшийся человек.

Теория мертвого интернета: почему вы — единственный оставшийся человек.

Use Gemini CLI and Claude code for free

Use Gemini CLI and Claude code for free

Давайте запустим Qwen-3.5 — локальную модель AI HERO для OpenClaw, написания текстов, программиро...

Давайте запустим Qwen-3.5 — локальную модель AI HERO для OpenClaw, написания текстов, программиро...

Крах, случающийся раз в жизни, к которому никто не готов (хуже, чем в 2008 году?).

Крах, случающийся раз в жизни, к которому никто не готов (хуже, чем в 2008 году?).

Зачем нужна топология?

Зачем нужна топология?

ИИ-агенты — кошмар для безопасности? Разбираемся с OpenClaw

ИИ-агенты — кошмар для безопасности? Разбираемся с OpenClaw

Одно изображение стоит NxN слов | Диффузионные трансформаторы (ViT, DiT, MMDiT)

Одно изображение стоит NxN слов | Диффузионные трансформаторы (ViT, DiT, MMDiT)

Why Your AI Agent Fails and Your Bills Skyrocket

Why Your AI Agent Fails and Your Bills Skyrocket

GLM-5 УНИЧТОЖИЛА DeepSeek! Бесплатная нейросеть БЕЗ ограничений. Полный тест 2026

GLM-5 УНИЧТОЖИЛА DeepSeek! Бесплатная нейросеть БЕЗ ограничений. Полный тест 2026

Искусственный интеллект атаковал человека.

Искусственный интеллект атаковал человека.

7 навыков работы с ИИ, о которых не знает 99% людей, но о которых следовало бы знать.

7 навыков работы с ИИ, о которых не знает 99% людей, но о которых следовало бы знать.

Выставка Потребительской Электроники США Инновации Патенты Интересно 2026

Выставка Потребительской Электроники США Инновации Патенты Интересно 2026

Генеративный ИИ в разработке ПО: Введение

Генеративный ИИ в разработке ПО: Введение

Why LLMs Aren’t Deterministic (Even at Temperature 0) – And How to Fix It

Why LLMs Aren’t Deterministic (Even at Temperature 0) – And How to Fix It

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ