Explicando o Multi-head Attention no modelo Transformer | Deep Learning e NLP | Leonardo Ribeiro
Автор: Aprendiz do Futuro
Загружено: 2020-10-27
Просмотров: 3980
Описание:
Transformer 🤖 é uma arquitetura neural 🧠 de extrema importância para os modelos mais recentes de Deep Learning 💻.
O modelo foi desenvolvido em 2017 e revolucionou áreas como Processamento de Linguagem Natural 📚. Várias aplicações modernas em deep learning 🧠 utilizam algum componente do Transformer 🤖 em suas arquiteturas neurais.
Veja a parte 1 antes de assistir a esse vídeo:
Parte 1: • Modelo Transformer | Mecanismo de atenção:...
Neste vídeo entenda como o Transformer 🤖 aprende diferentes relações semânticas entre palavras utilizando o multi-head attention. Também aprenda outros detalhes importantes da arquitetura, como as conexões residuais e normalização de camada.
🚀 Aprendiz do Futuro é um canal para descomplicar Deep Learning / Aprendizado Profundo. A ideia é provocar o pensamento e aguçar o interesse no conhecimento! 🦾
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: