DiffusionGemma: новая открытая модель генерирует 1000 токенов в секунду
Автор: AI Stack Engineer
Загружено: 2026-06-11
Просмотров: 3123
Описание:
Google выпустила DiffusionGemma, экспериментальную модель с открытыми весами, которая генерирует текст с помощью диффузии, а не потокового предсказания. В этом видео я рассказываю о том, как она работает, о полном семействе Gemma 4, реальных результатах бенчмарков, требованиях к оборудованию (она помещается в 18 ГБ видеопамяти) и о том, как запустить её с Transformers и vLLM на вашей собственной видеокарте.
Официальное объявление: https://blog.google/innovation-and-ai...
Весы модели: https://huggingface.co/google/diffusi...
Руководство для разработчиков: https://developers.googleblog.com/en/...
#DiffusionGemma #Gemma4 #GoogleAI #LocalLLM #opensourceai
⏱️ Разделы
00:00 Новости
00:36 Gemma 4
01:51 Диффузионный сдвиг
02:52 Блоки шумоподавления
03:52 Внутреннее устройство модели
05:36 Компромисс качества
07:30 Аппаратная реальность
09:12 Где это находится
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: