EP115: Dr.LLM brings dynamic depth to AI

Автор: Bookworm

Загружено: 2026-03-08

Просмотров: 2

Описание: The paper introduces Dr.LLM (Dynamic Routing of Layers for LLMs), a retrofittable framework designed to improve both the efficiency and accuracy of Large Language Models (LLMs) without altering their base weights.

Typically, LLMs process every token through a fixed stack of transformer layers, which wastes computation on simple queries and lacks the depth needed for complex reasoning. While prior adaptive-depth methods have attempted to address this, they often degrade accuracy, require expensive inference-time searches, or demand large-scale retraining and architectural changes.

Dr.LLM overcomes these limitations by equipping a frozen, pretrained LLM with lightweight, per-layer routers that dynamically decide whether to skip, execute, or repeat a specific transformer block.

Key highlights of the paper include:

• Methodology: The routers are trained using explicit supervision derived from an offline Monte Carlo Tree Search (MCTS). The MCTS discovers optimal execution paths that preserve or improve accuracy under a compute budget, creating a compact dataset of 4,000 examples to train the routers.
• Design: To ensure stable routing decisions on long contexts and manage class imbalances, Dr.LLM utilizes windowed mean-pooling and focal loss with class-rebalancing weights.
• In-Domain Results: On reasoning-heavy tasks like ARC (logic) and DART (math), Dr.LLM improves accuracy by up to +3.4 percentage points while saving an average of 5 layers of computation per example.
• Out-of-Domain Robustness: The trained routers generalize well to out-of-domain tasks (such as MMLU, GSM8k, and TruthfulQA) with only a minimal 0.85 percentage point drop in accuracy while retaining their computational efficiency.

Overall, Dr.LLM successfully demonstrates that explicitly supervised routing can retrofit frozen LLMs to achieve budget-aware, accuracy-driven inference.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

EP115: Dr.LLM brings dynamic depth to AI

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Не продавайте автоматизацию на основе ИИ, продавайте вместо этого рои OpenClaw (вся стратегия).

Не продавайте автоматизацию на основе ИИ, продавайте вместо этого рои OpenClaw (вся стратегия).

EP121: How ToolLLaMA mastered 16000 real world APIs

EP121: How ToolLLaMA mastered 16000 real world APIs

Профессор Цзян Сюэцинь сделал мрачный прогноз: мир движется к хаосу и нестабильности.

Профессор Цзян Сюэцинь сделал мрачный прогноз: мир движется к хаосу и нестабильности.

Ray Dalio: Stop Buying These 5 Things Before 2027

Ray Dalio: Stop Buying These 5 Things Before 2027

Вся Правда о Zorin OS: Linux Который Заменит Windows?

Вся Правда о Zorin OS: Linux Который Заменит Windows?

Как поезда остаются на рельсах? — Ответ, который поразил студентов Фейнмана

Как поезда остаются на рельсах? — Ответ, который поразил студентов Фейнмана

ИИ-агент для ресерча YouTube: Anti-Gravity + NotebookLM

ИИ-агент для ресерча YouTube: Anti-Gravity + NotebookLM

Гениальная самоделка Ирана: Самое ненавистное оружие 21 века, которое переписало правила войны

Гениальная самоделка Ирана: Самое ненавистное оружие 21 века, которое переписало правила войны

Массовый забой скота. Протестам в России быть? Зачем Трампу Иран. Максим Шевченко: Особое мнение

Массовый забой скота. Протестам в России быть? Зачем Трампу Иран. Максим Шевченко: Особое мнение

Промпт McKinsey, который приносит акционеру МИЛЛИОНЫ| Игорь Никитин

Промпт McKinsey, который приносит акционеру МИЛЛИОНЫ| Игорь Никитин

Илон Маск: Оптимус 3 уже на подходе, рекурсивное самосовершенствование уже здесь, и Сингулярность...

Илон Маск: Оптимус 3 уже на подходе, рекурсивное самосовершенствование уже здесь, и Сингулярность...

Забудьте про готовые VPN. ИИ-агент настроит вам личный за 10 минут!

Забудьте про готовые VPN. ИИ-агент настроит вам личный за 10 минут!

EP117: AI agents learn through textual reflection

EP117: AI agents learn through textual reflection

Самые странные тайны Израиля, о которых почти никто не говорит

Самые странные тайны Израиля, о которых почти никто не говорит

EP108: GPT-5 Can Lie and Play Dumb

EP108: GPT-5 Can Lie and Play Dumb

Цзян Сюэцин: Война с Ираном губит империю США — наступает новый мировой порядок

Цзян Сюэцин: Война с Ираном губит империю США — наступает новый мировой порядок

EP122: The Four Pillars of LLM Autonomous Agents

EP122: The Four Pillars of LLM Autonomous Agents

EP107: DeepMind’s SIMA 2 Masters Unseen Video Games

EP107: DeepMind’s SIMA 2 Masters Unseen Video Games

10 Новых фильмов 2026 (Трейлеры)

10 Новых фильмов 2026 (Трейлеры)

Контроль над нефтью: риски для финансовой системы доллара - Пепе Эскобар

Контроль над нефтью: риски для финансовой системы доллара - Пепе Эскобар