Google нашла способ обойти аппаратные ограничения ИИ

Автор: Tim Carambat

Загружено: 2026-06-09

Просмотров: 22377

Описание: Gemma 4 12B опровергает слухи о новой промежуточной модели между их мобильными (E2B, E4B) и более аппаратными моделями (26B MoE, 31B), но значительно улучшает ситуацию благодаря QAT (Quantization Aware Training — обучение с учетом квантизации).

Это в дополнение к поддержке MTP (Multi-Token Processing) для этих моделей! Gemma 4 — это серьезный шаг вперед в возможностях и производительности локальных моделей в целом.

Приятно видеть хотя бы некоторую конкуренцию со стороны других лабораторий, поскольку Qwen в последнее время активно продвигает локальный ИИ по всей индустрии!

*Ссылки*:
AnythingLLM: https://anythingllm.com/
AnythingLLM GitHub: https://github.com/Mintplex-Labs/anyt...
Gemma 12B: https://huggingface.co/google/gemma-4...
Gemma 12B QAT GGUF: https://huggingface.co/unsloth/gemma-...

*Разделы*:
0:00 Поговорим о Gemma 4 12B
0:34 Краткая история Gemma 4
3:06 Gemma 12B — долгожданное дополнение
6:59 Qwen3.5 или Gemma 12B
8:18 Что такое QAT (Quantization Aware Training)
10:24 QAT НЕ совсем Bitnet, но близок к нему
11:35 Тестирование Gemma 12B в AnythingLLM
17:05 Заключительные мысли: Gemma 12B на 100% заслуживает внимания.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Google нашла способ обойти аппаратные ограничения ИИ

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео