How large language models expand conceptual memory during pretraining?

Автор: Xiaol.x

Загружено: 2026-02-03

Просмотров: 61

Описание: Representation = Trajectory? Why Modern LLMs Are Missing the Point

We are entering a new era of AI architecture. It's not just about scaling Transformers anymore—it's about "The Physics of Thought."

In this video, we visualize the lifecycle of a Concept Circuit and the proposal for a "Trillion Dollar Architecture" that fuses RWKV (Linear Attention), DeepEmb (Trajectory Memory), and Engram (Static Memory).

Most embeddings today are just a final destination—a lossy compression of a complex journey. But what if we kept the "Geodesic"—the path the model took to get there?

By combining the efficiency of Linear RNNs with the causal history of DeepEmb, we turn the internal "process" of thinking into storable "data."

Breakdown:
0:00 - The Lifecycle of a Concept Circuit
0:15 - Phase 1: Expansion (The "Big Bang" of Learning)
0:40 - Phase 2: Compression (Pruning for Modularity)
1:10 - The Trillion Dollar Architecture Intro
1:35 - Step 1: The Engram Memory Bank (Static Energy)
1:55 - Step 2: ShortConv & Momentum (The Physics)
2:15 - Step 3: RWKV State Channel Activation
2:40 - Step 4: Circuit-Aware DeepEmb
2:55 - THE ENDING: Why "Representation = Trajectory"

This visualization was generated entirely with Manim (Mathematical Animation Engine) and Python.

#AI #MachineLearning #RWKV #Transformers #DeepLearning #Manim #Visualization #ConceptCircuits #DeepEmb

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

How large language models expand conceptual memory during pretraining?

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Новое инженерное решение - неограниченный контекст и предсказуемые рассуждения - Recursive LM.

Новое инженерное решение - неограниченный контекст и предсказуемые рассуждения - Recursive LM.

Новая геометрия интеллекта #ai

Новая геометрия интеллекта #ai

Что такое эмбеддинги? Объяснение векторных представлений

Что такое эмбеддинги? Объяснение векторных представлений

Роботы, Которых Никто Не Ожидал Увидеть на CES 2026

Роботы, Которых Никто Не Ожидал Увидеть на CES 2026

Вложенное обучение: иллюзия архитектур глубокого обучения

Вложенное обучение: иллюзия архитектур глубокого обучения

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Scientists Trapped 1000 AIs in Minecraft. They Created A Civilization.

Scientists Trapped 1000 AIs in Minecraft. They Created A Civilization.

У атомов нет ни твердой поверхности, ни формы. Как такое возможно? Объясняю

У атомов нет ни твердой поверхности, ни формы. Как такое возможно? Объясняю

Как происходит модернизация остаточных соединений [mHC]

Как происходит модернизация остаточных соединений [mHC]

От остаточных связей к гиперсвязям с ограничениями на многообразии: архитектура нейронных сетей

От остаточных связей к гиперсвязям с ограничениями на многообразии: архитектура нейронных сетей

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ расшифровал ДНК 0 группы крови, результат поразил мир…

ИИ расшифровал ДНК 0 группы крови, результат поразил мир…

Что происходит с таблицей Менделеева на ячейке 137?

Что происходит с таблицей Менделеева на ячейке 137?

Как Гений Математик разгадал тайну вселенной

Как Гений Математик разгадал тайну вселенной

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

То, что Китай строит прямо сейчас, лишит вас дара речи

То, что Китай строит прямо сейчас, лишит вас дара речи

Преобразование Фурье: лучшее объяснение (для начинающих)

Преобразование Фурье: лучшее объяснение (для начинающих)

Возможно ли создать компьютеры с техпроцессом меньше 1 нм

Возможно ли создать компьютеры с техпроцессом меньше 1 нм