ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Connectionist Temporal Classification (CTC) From Scratch

Автор: Priyam Mazumdar

Загружено: 2025-08-01

Просмотров: 2053

Описание: Code: https://github.com/priyammaz/PyTorch-...

Great Article about CTC: https://distill.pub/2017/ctc/
All Credit for Code: https://github.com/vadimkantorov/ctc/...

Today we will implement a crucial part of many Automatic Speech Recognizers, the CTC Loss. The problem with speech recognition is there is no one-to-one relationship between the audio and its corresponding transcript. This means we have to learn the alignment of our text to that audio, and this is exactly what CTC does. It leverages dynamic programming (forward algorithm) to find the total probability of all possible alignments to then learn the best one! We explore today both a little bit of the theory in CTC and then make a full PyTorch implementation for it!

Timestamps:
00:00:00 - Introduction
00:01:08 - Why do we use CTC?
00:11:06 - Dynamic Programming for Efficiency
00:14:43 - Some Rules for Transitions
00:25:35 - Start CTC Implementation
00:32:29 - Setup of t_a_r_g_e_t_s
00:37:11 - Check for Valid Transitions
00:44:19 - Gather Log Probs for Targets
00:51:39 - Initialize Log Alphas
01:02:34 - Dynamic Programming
01:15:30 - Aggregate Valid End Tokens
01:24:25 - Compare to PyTorch CTC

Socials!
X   / data_adventurer  
Instagram   / nixielights  
Linkedin   / priyammaz  
Discord   / discord  
🚀 Github: https://github.com/priyammaz
🌐 Website: https://www.priyammazumdar.com/

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Connectionist Temporal Classification (CTC) From Scratch

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Intro to Audio Processing for Deep Learning

Intro to Audio Processing for Deep Learning

Automatic Speech Recognition (ASR) From Scratch w/ DeepSpeech2

Automatic Speech Recognition (ASR) From Scratch w/ DeepSpeech2

Predictive Coding or Just Feature Discovery?

Predictive Coding or Just Feature Discovery?

EnCodec From Scratch: Lets Build a Neural Audio Codec!!

EnCodec From Scratch: Lets Build a Neural Audio Codec!!

HifiGAN From Scratch: Building a Neural Vocoder for Speech Synthesis

HifiGAN From Scratch: Building a Neural Vocoder for Speech Synthesis

NotebookLM на максималках. Как изучать всё быстрее чем 99% пользователей

NotebookLM на максималках. Как изучать всё быстрее чем 99% пользователей

Connectionist Temporal Classification (CTC) Explained

Connectionist Temporal Classification (CTC) Explained

Explained - Machine Learning

Explained - Machine Learning

C5W3L09 SpeechRecog

C5W3L09 SpeechRecog

F18 Упражнение 8: Коннекционистская временная классификация (CTC)

F18 Упражнение 8: Коннекционистская временная классификация (CTC)

Почему AI генерит мусор — и как заставить его писать нормальный код

Почему AI генерит мусор — и как заставить его писать нормальный код

Я сэкономил 1460 часов на обучении (NotebookLM + Gemini + Obsidian)

Я сэкономил 1460 часов на обучении (NotebookLM + Gemini + Obsidian)

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Building awesome Speech To Text Transformers from scratch - One line of Pytorch at a time!

Building awesome Speech To Text Transformers from scratch - One line of Pytorch at a time!

Connectionist Temporal Classification | Lecture 72 (Part 2) | Applied Deep Learning

Connectionist Temporal Classification | Lecture 72 (Part 2) | Applied Deep Learning

ВЗЛОМАЛ колонку и заменил Алису на своего ассистента: 5 лет на получение root и модификацию прошивки

ВЗЛОМАЛ колонку и заменил Алису на своего ассистента: 5 лет на получение root и модификацию прошивки

S18 Lecture 14: Connectionist Temporal Classification (CTC)

S18 Lecture 14: Connectionist Temporal Classification (CTC)

Masked AutoEncoders (MAE) Implementation From Scratch | Self-Supervised Image Pretraining!

Masked AutoEncoders (MAE) Implementation From Scratch | Self-Supervised Image Pretraining!

AI агенты в 2026: всё что работает прямо сейчас (Claude Code, n8n, RAG, OpenClaw, Agent Teams)

AI агенты в 2026: всё что работает прямо сейчас (Claude Code, n8n, RAG, OpenClaw, Agent Teams)

ВСЕ ЧТО НУЖНО ЗНАТЬ ПРО LINUX

ВСЕ ЧТО НУЖНО ЗНАТЬ ПРО LINUX

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]