«Мамба» — замена «Трансформерам»?
Автор: Samuel Albanie
Загружено: 2023-12-08
Просмотров: 259963
Описание:
«Мамба» — это новая архитектура нейронной сети, предложенная Альбертом Гу и Три Дао.
Тайм-коды:
00:00 — «Мамба» — замена «Трансформерам»?
00:19 — Тест на дальние расстояния в Arena
01:20 — Блоки памяти Лежандра
02:07 — HiPPO: Рекуррентная память с оптимальными полиномиальными проекциями
02:38 — Сочетание рекуррентных, сверточных и непрерывных во времени моделей с линейными слоями пространства состояний
03:28 — Эффективное моделирование длинных последовательностей с использованием структурированных пространств состояний (S4)
05:46 — Аннотированный S4
06:13 — Mamba: Моделирование линейных во времени последовательностей с использованием селективных пространств состояний
07:42 — Мотивация: Зачем нужен отбор
09:59 — S5
12:00 — Эмпирическая оценка
Статья доступна по ссылке: https://arxiv.org/abs/2312.00752
Темы: #mamba #foundation
Ссылки на статьи, упомянутые в видео, можно найти здесь на
https://samuelalbanie.com/digests/202...
Похожие материалы:
Twitter: / samuelalbanie
личная веб-страница: https://samuelalbanie.com/
YouTube: / @samuelalbanie1
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: