ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

QWEN3 TTS в ComfyUI: руководство по локальной и бесплатной генерации голоса

Автор: Vasudev Menon

Загружено: 2026-02-02

Просмотров: 22

Описание: #премьера #rtx4070super #текствречь #egpu #thinkpad #amd #amdryzen #windows11 #windows

Всем привет! В этом видео я покажу, как настроить клонирование голоса Qwen 3 TTS с параметрами 0,6 млрд и 1,6 млрд, а также пользовательские голосовые модели, используя шаблон рабочего процесса ComfyUI. Я также покажу различия в сгенерированном TTS-выводе между моделями с параметрами 0,6 и 1,6 млрд, работающими на eGPU RTX 4070 Super.

Из-за меньшего объема видеопамяти я настроил автоматическую выгрузку моделей из памяти после генерации вывода, независимо от успеха или неудачи.

Я хочу поблагодарить @theAIsearch за создание подробного видео, а также Qwen3, flybridxx и сообщество ComfyUI за создание качественных моделей и шаблонов рабочих процессов, которые делают их доступными для запуска полностью локально на своих видеокартах.

Ссылки:
ComfyUI Portable: https://docs.comfy.org/installation/c...
Qwen3-TTS: https://github.com/QwenLM/Qwen3-TTS
ComfyUI Workflow: https://github.com/flybirdxx/ComfyUI-...
Видео AI Search:    • Elevenlabs just got wrecked. This free AI ...  

Временные метки:
00:00 Начало
00:09 Настройка теста (NVIDIA или Apple MLX)
01:09 Благодарности AI Search и ComfyUI Qwen3 Workflow
01:58 Добавление пользовательского рабочего процесса
02:32 Запуск с nvidia fp16 Fast Accumulation
02:48 Установка зависимостей для Qwen3 TTS
03:34 Успешная установка пакета
03:43 Требуются Sage и Flash Attention CUDA SDK. Я использую версию PyTorch.
04:13 Я расскажу о клонировании голоса и пользовательских моделях дикторов.
04:37 Активация шаблона рабочего процесса.
05:43 Запуск рабочего процесса клонирования голоса.
08:22 Клонирование модели голоса 0,6 млрд.
09:18 Запуск клонирования модели голоса 1,6 млрд.
09:20 Расположение модели Qwen3.
09:45 Результат клонирования голоса 1,6 млрд.
10:12 Тестовый запуск 2 с 1,6 млрд. с информацией об акценте.
10:29 Обход узлов для отключения ненужного рабочего процесса.
10:41 Запуск пользовательского голоса Qwen3.
11:25 Временно сгенерированное аудио.
11:38 Артефакты старых ресурсов.
12:34 Результат пользовательского голоса Эрика 1,6 млрд.
13:18 Сравнение пользовательской модели голоса 1,6 млрд. и 0,6 млрд.
14:12 Завершение
14:20 Конец

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
QWEN3 TTS в ComfyUI: руководство по локальной и бесплатной генерации голоса

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Автоматизация Баз Данных с Database Connectivity Toolkit | State Machine | Global Variable Feedback

Автоматизация Баз Данных с Database Connectivity Toolkit | State Machine | Global Variable Feedback

Burnout Paradise Mission-14 #burnoutparadise #nvidia #shadowplay #shotwithgeforce #windows #gaming

Burnout Paradise Mission-14 #burnoutparadise #nvidia #shadowplay #shotwithgeforce #windows #gaming

ИГРОВОЙ ПК с OZON за 63 тысячи рублей

ИГРОВОЙ ПК с OZON за 63 тысячи рублей

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Как сделать Afro Latin в FL Studio 25?

Как сделать Afro Latin в FL Studio 25?

Музыка с лирикой на русском локально в ComfyUI: лучшие новые модели

Музыка с лирикой на русском локально в ComfyUI: лучшие новые модели

Если стереть информацию, исчезнет ли реальность?

Если стереть информацию, исчезнет ли реальность?

OpenClaw — Свой ИИ-агент 24/7, работает пока ты спишь

OpenClaw — Свой ИИ-агент 24/7, работает пока ты спишь

Повысил скорость загрузки на 40% и снизил пинг на 50% за 5 минут!

Повысил скорость загрузки на 40% и снизил пинг на 50% за 5 минут!

Как изолировать приложения на Android с Shelter: Полная защита данных (2025)

Как изолировать приложения на Android с Shelter: Полная защита данных (2025)

Как пользоваться ComfyUI. Гайд по установке и использованию для абсолютных новичков

Как пользоваться ComfyUI. Гайд по установке и использованию для абсолютных новичков

Новое инженерное решение - неограниченный контекст и предсказуемые рассуждения - Recursive LM.

Новое инженерное решение - неограниченный контекст и предсказуемые рассуждения - Recursive LM.

БЕЗУМНАЯ ИГРА с РАФФОМ в экстремальной ситуации в StarCraft 2

БЕЗУМНАЯ ИГРА с РАФФОМ в экстремальной ситуации в StarCraft 2

Инструменты траблшутинга WiFi на MikroTik

Инструменты траблшутинга WiFi на MikroTik

Запускаю DeepSeek на домашнем сервере с видеокартой. Подписка на Chat GPT больше не нужна.

Запускаю DeepSeek на домашнем сервере с видеокартой. Подписка на Chat GPT больше не нужна.

Суверенному Рунету — быть: что будет с VPN, WhatsApp и Telegram? ФСБ отключит связь. MAX наступает

Суверенному Рунету — быть: что будет с VPN, WhatsApp и Telegram? ФСБ отключит связь. MAX наступает

Самая быстрая передача файлов МЕЖДУ ВСЕМИ ТИПАМИ УСТРОЙСТВ 🚀

Самая быстрая передача файлов МЕЖДУ ВСЕМИ ТИПАМИ УСТРОЙСТВ 🚀

KDE без хаоса: Dolphin и тайлинг для комфортной работы

KDE без хаоса: Dolphin и тайлинг для комфортной работы

Запуск нейросетей локально. Генерируем - ВСЁ

Запуск нейросетей локально. Генерируем - ВСЁ

Погладь кота! Оживляем Ягуар XF 2014г.

Погладь кота! Оживляем Ягуар XF 2014г.

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]