Ollama 0.30 — Запуск ЛЮБОЙ модели GGUF + ускорение производительности на 20%
Автор: Prompt Engineer
Загружено: 2026-06-08
Просмотров: 1188
Описание:
Ollama выпустила версию 0.30. Вот что нового — протестировано на моём ноутбуке с RTX 4060.
✅ Что изменилось:
• До 20% более высокая пропускная способность NVIDIA (протестировано на Gemma 4 26B, Q4_K_M)
• Поддержка экосистемы GGUF: запуск LFM, Prism и тонкая настройка Unsloth в нативном режиме
• Ускорение Vulkan GPU теперь включено по умолчанию — видеокарты AMD и Intel работают без проблем
🔧 Демонстрация в этом видео:
• Создание модели Ollama из необработанного файла LFM 2.5 8B GGUF (3-строчный файл модели)
• Автоматическое определение возможностей: инструменты + размышление + завершение
• Реальный бенчмарк: ~160 tok/s на ноутбуке RTX 4060 8GB
📌 Мое честное мнение:
Плюсы: Любой файл HuggingFace GGUF за 30 секунд, сохранение вызовов инструментов, Vulkan выравнивает шансы
Минусы: 20% прирост измерен на RTX 5090 при высокой параллельности — однопотоковый режим Прирост производительности на старых видеокартах будет меньше. Не все GGUF загружаются корректно. В моих тестах LFM 2.5 испытывал трудности со сложным кодом.
🔗 Скачать Ollama 0.30: https://ollama.com/download
⏱️ Разделы:
00:00 Что изменилось в Ollama 0.30
00:12 Три ключевых улучшения
00:33 Демонстрация рабочего процесса GGUF
00:45 Запись файла модели
00:56 Возможности ollama create +
01:07 Запуск модели в реальном времени
01:15 Демонстрация отклика модели
01:32 Реальный тест скорости: ~160 ток/с
01:54 Vulkan GPU по умолчанию
02:09 Новые семейства моделей: LFM, Prism, Unsloth
02:09 Честные плюсы
02:42 Честные минусы
03:03 Как обновиться
🔗 Свяжитесь со мной:
Ko-fi → https://ko-fi.com/promptengineer
Patreon → / promptengineer975
Записаться на звонок → https://calendly.com/prompt-engineer4...
GitHub → https://github.com/PromptEngineer48
Twitter/X → / prompt48
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: