Yelaman Abdullin -Energy-Based Transformers are Scalable Learners and Thinkers [DSML Reading Club#5]
Автор: DSMLKZ - Data Science Kazakhstan
Загружено: 2025-07-18
Просмотров: 97
Описание:
В этом выпуске Еламан Абдуллин расскажет об Energy-Based Transformers (EBT) как о масштабируемых и способных к мышлению моделях. Обсудим основы Energy-Based Models (EBMs), их преимущества, проблемы и последние достижения в этой области. Отдельное внимание уделяется применению EBT для причинно-следственного авторегрессионного моделирования, их масштабированию и возможностям мышления, включая self-verification. Также проводится сравнение EBT с другими генеративными моделями, такими как Diffusion и GAN. Завершается обзор сессией вопросов и ответов, где обсуждаются практические аспекты EBMs и возможности их применения в различных сценариях.
Paper: https://energy-based-transformers.git...
Speaker & host: https://www.dsml.kz/users/Yela
[00:00] - Вступление и информация о Reading Club
[02:24] - Обзор структуры презентации и обсуждение маркетинга статьи, включая мнение Яна Лекуна.
[06:06] - Подробная структура статьи и оценка распределения вероятностей данных.
[08:47] - Проблема построения сложных генеративных моделей, формализация проблемы и решения для их создания.
[12:41] - Что такое Energy-Based Models (EBMs), их функция энергии, и связь с вероятностными моделями.
[17:39] - Типы EBMs.
[22:55] - Проблемы EBMs, последние достижения в этой области и вопрос о функции энергии в задачах классификации.
[30:28] - Как модели учатся на неконтролируемом обучении, использование EBMs, и EBT для причинно-следственного авторегрессионного моделирования.
[34:47] - Energy-Based Transformers (EBT) и их возможности мышления.
[42:47] - Заключение и преимущества EBT перед GAN.
[45:53] - Вопросы и обсуждение: ценность градиента, расчет шагов (N steps) и яркие case study для EBM.
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: