ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Ollama 0.30 — Запуск ЛЮБОЙ модели GGUF + ускорение производительности на 20%

Автор: Prompt Engineer

Загружено: 2026-06-08

Просмотров: 1188

Описание: Ollama выпустила версию 0.30. Вот что нового — протестировано на моём ноутбуке с RTX 4060.

✅ Что изменилось:
• До 20% более высокая пропускная способность NVIDIA (протестировано на Gemma 4 26B, Q4_K_M)
• Поддержка экосистемы GGUF: запуск LFM, Prism и тонкая настройка Unsloth в нативном режиме
• Ускорение Vulkan GPU теперь включено по умолчанию — видеокарты AMD и Intel работают без проблем

🔧 Демонстрация в этом видео:
• Создание модели Ollama из необработанного файла LFM 2.5 8B GGUF (3-строчный файл модели)
• Автоматическое определение возможностей: инструменты + размышление + завершение
• Реальный бенчмарк: ~160 tok/s на ноутбуке RTX 4060 8GB

📌 Мое честное мнение:
Плюсы: Любой файл HuggingFace GGUF за 30 секунд, сохранение вызовов инструментов, Vulkan выравнивает шансы
Минусы: 20% прирост измерен на RTX 5090 при высокой параллельности — однопотоковый режим Прирост производительности на старых видеокартах будет меньше. Не все GGUF загружаются корректно. В моих тестах LFM 2.5 испытывал трудности со сложным кодом.

🔗 Скачать Ollama 0.30: https://ollama.com/download

⏱️ Разделы:
00:00 Что изменилось в Ollama 0.30
00:12 Три ключевых улучшения
00:33 Демонстрация рабочего процесса GGUF
00:45 Запись файла модели
00:56 Возможности ollama create +
01:07 Запуск модели в реальном времени
01:15 Демонстрация отклика модели
01:32 Реальный тест скорости: ~160 ток/с
01:54 Vulkan GPU по умолчанию
02:09 Новые семейства моделей: LFM, Prism, Unsloth
02:09 Честные плюсы
02:42 Честные минусы
03:03 Как обновиться

🔗 Свяжитесь со мной:
Ko-fi → https://ko-fi.com/promptengineer
Patreon →   / promptengineer975  
Записаться на звонок → https://calendly.com/prompt-engineer4...
GitHub → https://github.com/PromptEngineer48
Twitter/X →   / prompt48  

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Ollama 0.30 — Запуск ЛЮБОЙ модели GGUF + ускорение производительности на 20%

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]