Qwen TTS - обучение, клонирование, кастомизация голоса
Автор: StableDif
Загружено: 2026-02-01
Просмотров: 614
Описание:
Qwen TTS - это модель для преобразования текста в речь. Qwen TTS имеет лучшее качество, высокую скорость и низкое потребление VRAM (7 ГБ на старшей модели). Качество сравнимо с платными аналогами ElevenLabs и MiniMax. В этом видео вы узнаете: как преобразовать текст в речь, как клонировать голос, как кастомизировать голос, как записать голос и даже как обучить модель Qwen TTS (fine-tune qwen tts). Все это будет работать в comfyui.
МЕНЮ
00:00 - Что такое Qwen TTS
00:40 - Обзор Qwen TTS
02:45 - Установка Qwen 3 TTS в ComfyUI
03:32 - Базовые схемы Qwen TTS
04:32 - Клонирование голоса с Qwen3 TTS
08:00 - Коллекция голосов Qwen TTS
10:46 - Disign Voice - создание своего голоса
11:45 - Multi speaker - озвучка с несколькими спикерами
20:05 - Обучение модели Qwen TTS - Fine tune model
21:36 - Wisper для транскрибации аудио - audio to text
33:56 - Выводы
Сборку ComfyUI можно скачать бесплатно тут:
https://boosty.to/stabledif/posts/c64...
🔥 Мой структурированный курс по "ComfyUI" с моей поддержкой на сайте https://stabledif.ru/comfyui
🔥 Мой структурированный курс по "AUTOMATIC 1111" с моей поддержкой на сайте https://stabledif.ru
🔑 Все ссылки и файлы доступны на Boosty:
https://boosty.to/stabledif/posts/0c3...
✔️Телеграм-канал: https://t.me/stabledif_lesson
✔️ Telegram ЧАТ: https://t.me/stable_dif
✔️VK Prompts: https://vk.com/stabledif
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: