Модели мира и нейронные активы: механика моделирования ИИ
Автор: Martin Andrews
Загружено: 2025-10-25
Просмотров: 1214
Описание:
Модели изображений выходят за рамки статической генерации, превращаясь в нечто гораздо более мощное: интерактивные симуляторы мира. Как научить ИИ понимать объекты, физику и принципы сохранения? В этом видео рассматривается механизм этого скачка, от «нейронных ресурсов» к полноценным «моделям мира».
Мы разбираем методы, которые делают современные модели изображений такими эффективными, например, продвинутые синтетические субтитры, используемые в DALL-E 3 и Qwen-Image. Затем мы углубимся в статью о «нейронных ресурсах» – умном методе обучения моделей на видеоданных для понимания и управления объектами в сцене.
Наконец, мы рассмотрим архитектуру и процесс обучения моделей мира, начиная с фундаментальных исследований, таких как VPT от OpenAI и Dreamer от Google, и заканчивая невероятными интерактивными возможностями GENIE 3 от DeepMind. Чтобы всё это стало понятно, мы проведём практическую демонстрацию TinyWorlds – модели мира с открытым исходным кодом, которую вы можете запустить и использовать самостоятельно.
Это видео предназначено для архитекторов ИИ, которые хотят понять фундаментальные механизмы, лежащие в основе генеративного ИИ следующего поколения.
---
*Документы и ресурсы*
*Интерактивная демонстрация:*
Поиграйте с моделью мира TinyWorlds в этом [бесплатном блокноте Colab](https://colab.research.google.com/dri...)
*Основные понятия:*
[Нейронные ресурсы: Синтез многообъектных сцен с поддержкой 3D](https://arxiv.org/abs/2406.09292)
[OpenAI VPT: Обучение действию с помощью просмотра немаркированных онлайн-видео](https://arxiv.org/abs/2206.11795)
[Dreamer v4: Обучение агентов в масштабируемых моделях мира](https://danijar.com/project/dreamer4/)
[Запись в блоге DeepMind GENIE 3](https://deepmind.google/discover/blog...)
[TinyWorlds (модель мира с открытым исходным кодом)](https://github.com/AlmondGod/tinyworlds)
*Использованные методы:*
[DALL-E 3: Улучшение генерации изображений с помощью качественных подписей](https://cdn.openai.com/papers/dall-e-...)
[Доклад о стабильной диффузии 3](https://arxiv.org/abs/2403.03206)
[CogVLM: Visual Expert для предобученных языковых моделей](https://arxiv.org/abs/2311.03079)
---
ГЛАВЫ
00:00:00 — Введение: От моделей изображений к моделям мира
00:01:10 — Секрет создания лучших моделей изображений: расширенные субтитры
00:06:39 — Объяснение метода «нейронных активов»
00:10:26 — Что такое модели мира?
00:12:08 — Как обучить модель мира (VPT и DreamerV4 от OpenAI)
00:15:06 — Современное состояние дел: GENIE 3 от DeepMind
00:16:53 — TinyWorlds: модель мира с открытым исходным кодом
00:18:31 — Практическая демонстрация: запуск TinyWorlds в Colab
00:23:15 — Заключение и основные выводы
---
*О КАНАЛЕ*
Мой канал создан для «строителей ИИ»: разработчиков, экспериментаторов и энтузиастов-практиков. Мы не ограничиваемся заголовками, а понимаем *механизмы*, лежащие в основе новейших исследований, позволяя вам строить будущее. От лаборатории до вашего ноутбука.
GitHub: https://github.com/mdda
LinkedIn: / martinandrews
X/Twitter: https://x.com/mdda123
#ИИ #LLM #MachineLearning #WorldModels #NeuralAssets #AIExplained #DeepMind #OpenAI #TinyWorlds
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: