ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Review of HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis

Автор: Olewave

Загружено: 2023-04-21

Просмотров: 4225

Описание: Abstract:
Several recent work on speech synthesis have employed generative adversarial networks (GANs) to produce raw waveforms. Although such methods improve the sampling efficiency and memory usage, their sample quality has not yet reached that of autoregressive and flow-based generative models. In this work, we propose HiFi-GAN, which achieves both efficient and high-fidelity speech synthesis. As speech audio consists of sinusoidal signals with various periods, we demonstrate that modeling periodic patterns of an audio is crucial for enhancing sample quality. A subjective human evaluation (mean opinion score, MOS) of a single speaker dataset indicates that our proposed method demonstrates similarity to human quality while generating 22.05 kHz high-fidelity audio 167.9 times faster than real-time on a single V100 GPU. We further show the generality of HiFi-GAN to the mel-spectrogram inversion of unseen speakers and end-to-end speech synthesis. Finally, a small footprint version of HiFi-GAN generates samples 13.4 times faster than real-time on CPU with comparable quality to an autoregressive counterpart.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Review of HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

A Review of Deepmind's WaveNet for TTS/Audio Synthesis (Does it look like GPT to you?)

A Review of Deepmind's WaveNet for TTS/Audio Synthesis (Does it look like GPT to you?)

Магистратура по речевым технологиям: модели, которые слушают и отвечают

Магистратура по речевым технологиям: модели, которые слушают и отвечают

Математика, лежащая в основе генеративно-состязательных сетей, объяснена наглядно!

Математика, лежащая в основе генеративно-состязательных сетей, объяснена наглядно!

Поймите математику и теорию GAN примерно за 10 минут

Поймите математику и теорию GAN примерно за 10 минут

ИИ-агент для ресерча YouTube: Anti-Gravity + NotebookLM

ИИ-агент для ресерча YouTube: Anti-Gravity + NotebookLM

Residual Vector Quantization for Audio and Speech Embeddings

Residual Vector Quantization for Audio and Speech Embeddings

ИИ-ПУЗЫРЬ скоро лопнет? Реальные факты про нейросети от специалиста по кибербезопасности.

ИИ-ПУЗЫРЬ скоро лопнет? Реальные факты про нейросети от специалиста по кибербезопасности.

Как Гений Математик разгадал тайну вселенной

Как Гений Математик разгадал тайну вселенной

Speech features intro 3: Mel-scale spectrogram

Speech features intro 3: Mel-scale spectrogram

С утра началось 7-минут назад срочно! Скотт Риттер

С утра началось 7-минут назад срочно! Скотт Риттер

Симпсоны: Будущее, Которое Поражает!

Симпсоны: Будущее, Которое Поражает!

С.В. Савельев - Реальность парадоксов

С.В. Савельев - Реальность парадоксов

Mel-спектрограмма и MFCC | Лекция 72 (Часть 1) | Прикладное глубокое обучение

Mel-спектрограмма и MFCC | Лекция 72 (Часть 1) | Прикладное глубокое обучение

СУПЕРбыстрая транскрипция речи в текст в реальном времени с помощью ИИ — Faster Whisper / Python

СУПЕРбыстрая транскрипция речи в текст в реальном времени с помощью ИИ — Faster Whisper / Python

GPT-5.4 обзор, Gemini в Google Docs и новый AI от Anthropic для программистов

GPT-5.4 обзор, Gemini в Google Docs и новый AI от Anthropic для программистов

Пространство существует. И это проблема

Пространство существует. И это проблема

Провал плана США: Возможна ли наземная война с Ираном - Щелин и Дудник

Провал плана США: Возможна ли наземная война с Ираном - Щелин и Дудник

125 - What are Generative Adversarial Networks (GAN)?

125 - What are Generative Adversarial Networks (GAN)?

Understanding GANs (Generative Adversarial Networks)

Understanding GANs (Generative Adversarial Networks)

Учёные СКОПИРОВАЛИ Реальный Мозг и он ЗАРАБОТАЛ сам по себе! Обучение Больше НЕ НУЖНО!

Учёные СКОПИРОВАЛИ Реальный Мозг и он ЗАРАБОТАЛ сам по себе! Обучение Больше НЕ НУЖНО!

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]