ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Alexander C.S. Hendorf: Speech Synthesis with Tacotron2 and PyTorch | PyData Amsterdam 2019

Автор: PyData

Загружено: 2019-06-24

Просмотров: 5201

Описание: Computer generated speech has existed for a while, parameters being painfully engineered by hand. Deep Learning models can be efficient at learning inherent features of data - how well does this work out for audio?

There are different DL-models as WaveNet, SampleRNN and Tacotron2. After a quick overview, I'm going to focus on Tacotron2 - how it works, it's benefits and how to implement it with PyTorch.

With Tacotron2 we make no assumption what features should be passed to the vocoder. All there is required are audio-snippets and corresponding text. Non-English language audio datasets are hard to get. I had to generate my own dataset. This talk will also cover how I have created my own dataset in a semi-automatic efficiently with tools like audiotok and methods as Speaker diarisation.

The talks will feature synthesised speech audio demos. I will also cover some failures and reason about them.

Alexander C.S. Hendorf is an independent AI strategy consultant with over 20 years of experience in digitalization and data-driven transformation. Through his commitment as a speaker and chair of various international conferences, he is a proven expert in the field of data intelligence. He has extensive experience in the practical application, introduction and communication of data and AI-driven strategies and decision-making processes.
https://hendorf.com

www.pydata.org

PyData is an educational program of NumFOCUS, a 501(c)3 non-profit organization in the United States. PyData provides a forum for the international community of users and developers of data analysis tools to share ideas and learn from each other. The global PyData network promotes discussion of best practices, new approaches, and emerging technologies for data management, processing, analytics, and visualization. PyData communities approach data science using many languages, including (but not limited to) Python, Julia, and R.

PyData conferences aim to be accessible and community-driven, with novice to advanced level presentations. PyData tutorials and talks bring attendees the latest project features along with cutting-edge use cases. 00:00 Welcome!
00:10 Help us add time stamps or captions to this video! See the description for details.

Want to help add timestamps to our YouTube videos to help with discoverability? Find out more here: https://github.com/numfocus/YouTubeVi...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Alexander C.S. Hendorf: Speech Synthesis with Tacotron2 and PyTorch | PyData Amsterdam 2019

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Alex Hanna: Responsible AI Practices: Fairness in ML | PyData Miami 2019

Alex Hanna: Responsible AI Practices: Fairness in ML | PyData Miami 2019

AI Dev Day // 15 марта 2026

AI Dev Day // 15 марта 2026

PyData Boston -  Beyond Embedding RAG (Griffin Bishop)

PyData Boston - Beyond Embedding RAG (Griffin Bishop)

Zack Akil -

Zack Akil - "Lights, camera, AI!" - Automated sports videography

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

FDAP Stack: High-Performance Data Architecture based on Apache Arrow

FDAP Stack: High-Performance Data Architecture based on Apache Arrow

Lily Xu-Traditional AI + LLMs to Automate Complex and Critical Docs in Healthcare-PyData Boston 2025

Lily Xu-Traditional AI + LLMs to Automate Complex and Critical Docs in Healthcare-PyData Boston 2025

Tariq Rashid- Safe Fair and Ethical AI A Practical Framework| PyData Global 2020

Tariq Rashid- Safe Fair and Ethical AI A Practical Framework| PyData Global 2020

Массовый забой скота. Протестам в России быть? Зачем Трампу Иран. Максим Шевченко: Особое мнение

Массовый забой скота. Протестам в России быть? Зачем Трампу Иран. Максим Шевченко: Особое мнение

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Цифровой Узбекистан 2030 - миф или реальность?

Цифровой Узбекистан 2030 - миф или реальность?

PyData Boston - Traditional AI and LLMs for Automation in Healthcare (Lily Xu)

PyData Boston - Traditional AI and LLMs for Automation in Healthcare (Lily Xu)

Наглядная Разница между AWD vs 4X4 vs 4WD: Какой полный привод лучше?

Наглядная Разница между AWD vs 4X4 vs 4WD: Какой полный привод лучше?

GPT-5.4 обзор, Gemini в Google Docs и новый AI от Anthropic для программистов

GPT-5.4 обзор, Gemini в Google Docs и новый AI от Anthropic для программистов

Вся Правда о Zorin OS: Linux Который Заменит Windows?

Вся Правда о Zorin OS: Linux Который Заменит Windows?

Что скрывает дно океана? Существа, о которых мы НИЧЕГО не знаем. Александр Осадчиев

Что скрывает дно океана? Существа, о которых мы НИЧЕГО не знаем. Александр Осадчиев

Leonardo Ferreira - Create your Health Research Agent - PyData Boston 2025

Leonardo Ferreira - Create your Health Research Agent - PyData Boston 2025

Bridging AI and the Physical World: Running Earth Observation Models at Scale with RasterFlow

Bridging AI and the Physical World: Running Earth Observation Models at Scale with RasterFlow

КЛАССИЧЕСКАЯ МУЗЫКА ДЛЯ ВОССТАНОВЛЕНИЯ НЕРВНОЙ СИСТЕМЫ🌿 Нежная музыка успокаивает нервную систему 22

КЛАССИЧЕСКАЯ МУЗЫКА ДЛЯ ВОССТАНОВЛЕНИЯ НЕРВНОЙ СИСТЕМЫ🌿 Нежная музыка успокаивает нервную систему 22

Chang She, Lance DB The New Data Lake Format for Multimodal AI

Chang She, Lance DB The New Data Lake Format for Multimodal AI

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]