ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Что такое MaxOut в глубоком обучении?

Автор: Deep Learning with Yacine

Загружено: 2024-06-26

Просмотров: 1336

Описание: 👨‍💻 Чтобы начать работу с разработкой ИИ, ознакомьтесь с этим курсом Scrimba: https://scrimba.com/the-ai-engineer-p...

MaxOut — это метод, представленный Яном Гудфеллоу в 2013 году, который позволяет изучать различные функции активации в каждом из своих модулей.

В этом руководстве мы рассмотрим, что такое сеть MaxOut и как она устроена, а также проверим её соответствие более современной архитектуре.

Содержание
Что такое Drop Out: 0:00
Drop Out против стохастического градиентного спуска: 0:52
Что такое MaxOut?: 1:27
MaxOut может обучаться функциям активации: 2:45
MaxOut — универсальный аппроксиматор: 4:02
Производительность MaxOut в бенчмарках: 4:41
MaxOut против выпрямителей: 5:50
Заключение: 8:08

Чтобы узнать больше о MaxOut, вот несколько интересных ссылок:
📌 [Статья] Сети MaxOut: https://arxiv.org/abs/1302.4389
📌 [Код] Очень простая для чтения реализация Pytorch: https://github.com/paniabhisek/maxout...
📌 [Статья] MaxOut против Relu на нескольких наборах данных: Оценка активаций maxout в глубоком обучении в нескольких областях больших данных: https://journalofbigdata.springeropen...

Аннотация:
«Мы рассматриваем задачу проектирования моделей, использующих недавно представленный метод приближенного усреднения модели, называемый dropout.

Мы определяем простую новую модель, называемую maxout (названную так потому, что ее выход представляет собой максимум набора входных данных, и потому, что она является естественным дополнением к dropout), предназначенную как для упрощения оптимизации с помощью dropout, так и для повышения точности быстрого метода приближенного усреднения модели, используемого dropout.

Мы эмпирически подтверждаем, что модель успешно справляется с обеими этими задачами. Мы используем maxout и dropout для демонстрации передовой эффективности классификации на четырех эталонных наборах данных: MNIST, CIFAR-10, CIFAR-100 и SVHN».

----
Присоединяйтесь к Discord для общего обсуждения:   / discord  

----
Подписывайтесь на меня здесь:

Twitter:   / yacineaxya  
GitHub: https://github.com/yacineMahdid
LinkedIn:   / yacinemahdid  
___

Хорошей недели! 👋

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Что такое MaxOut в глубоком обучении?

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Что такое тензоры в глубоком обучении?

Что такое тензоры в глубоком обучении?

Muon Optimizer for Dense Linear Layer Explained | Newton-Schulz + Momentum

Muon Optimizer for Dense Linear Layer Explained | Newton-Schulz + Momentum

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Предел развития НЕЙРОСЕТЕЙ

Предел развития НЕЙРОСЕТЕЙ

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

AdamW Optimizer from Scratch in Python

AdamW Optimizer from Scratch in Python

Activation Functions | ReLU, SeLU, Sigmoid, ELU, TanH | EXPLAINED! | Deep Learning

Activation Functions | ReLU, SeLU, Sigmoid, ELU, TanH | EXPLAINED! | Deep Learning

Что происходит с нейросетью во время обучения?

Что происходит с нейросетью во время обучения?

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Neural Networks Part 5: ArgMax and SoftMax

Neural Networks Part 5: ArgMax and SoftMax

Continuous Thought Machine Deep Dive | Temporal Processing + Neural Synchronisation

Continuous Thought Machine Deep Dive | Temporal Processing + Neural Synchronisation

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

Просят у США защиты от демона

Просят у США защиты от демона

What are RLVR environments for LLMs? | Policy - Rollouts - Rubrics

What are RLVR environments for LLMs? | Policy - Rollouts - Rubrics

Choosing an Activation Function for Deep Learning

Choosing an Activation Function for Deep Learning

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Самый важный алгоритм в истории [Veritasium]

Самый важный алгоритм в истории [Veritasium]

Как создаются степени магистра права?

Как создаются степени магистра права?

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]