Инженерия систем машинного обучения: От основ до развертывания на Edge-устройствах

Автор: Ai хорош

Загружено: 2025-11-01

Просмотров: 1

Описание: Введение в Инженерию систем машинного обучения (ML Systems Engineering)
Это видео предлагает глубокий обзор фундаментальных принципов и практических методов проектирования систем машинного обучения, основанных на материалах учебника профессора Виджая Джанапа Редди (Prof. Vijay Janapa Reddi)
.
Многие инженеры знают, как обучать модели ИИ, но лишь немногие понимают, как создавать системы, которые действительно работают в реальных производственных условиях
. Наш подход помогает увидеть целостную архитектуру ML-систем, а не только отдельные компоненты
.
Что такое ML-система? Система машинного обучения определяется как интегрированная вычислительная система, включающая три основных компонента:
1. Данные, которые направляют алгоритмическое поведение
.
2. Алгоритмы обучения, которые извлекают паттерны из этих данных
.
3. Вычислительная инфраструктура, которая обеспечивает как процесс обучения (тренировку), так и применение полученных знаний (инференс/обслуживание)
.
Ключевые темы, которые мы рассматриваем:
1. Жизненный цикл ИИ (AI Workflow) и данные ML-системы отличаются от традиционного программного обеспечения своей циклической и итеративной природой, основанной на механизмах обратной связи
. Вы узнаете о шести основных этапах жизненного цикла, от Определения проблемы до Мониторинга и обслуживания
.
Мы подробно разбираем Инженерию данных — систематическую дисциплину, необходимую для преобразования исходной информации в надежные, готовые для ML наборы данных
. Критически важные концепции включают:
• Четыре столпа (Качество, Надежность, Масштабируемость, Управление) для оценки решений по данным
.
• Обеспечение согласованности тренировки и обслуживания (Training-Serving Consistency) для предотвращения основной причины сбоев в производственных ML-системах
.
• Различные подходы к разметке данных, включая автоматизированную разметку, как в случае с системой Распознавания ключевых слов (KWS)
.
2. Архитектуры глубокого обучения (DNN Architectures) Мы анализируем, как выбор архитектуры определяет вычислительную сложность и требования к памяти
. В обзоре представлены:
• Сверточные нейронные сети (CNN): Используют локальную связность и совместное использование параметров (parameter sharing) для эффективной обработки пространственных данных, таких как изображения
.
• Трансформеры (Transformers): Архитектуры, полностью построенные на механизмах внимания (attention mechanisms), позволяющие динамически определять важные взаимосвязи в данных, независимо от их положения
.
3. Оптимизация для эффективности и развертывания Поскольку системы ИИ часто ограничены ресурсами (памятью, энергопотреблением)
, мы детально рассматриваем три ключевых метода оптимизации моделей
:
• Прунинг (Pruning): Удаление ненужных весов или структур (нейронов/фильтров), что может сократить модель в 10–100 раз
.
• Квантование (Quantization): Снижение численной точности (например, с FP32 до INT8), что в 4 раза уменьшает размер модели и ускоряет вывод на специализированном оборудовании
.
• Дистилляция знаний (Knowledge Distillation): Передача знаний от большой "учительской" модели к меньшей "студенческой" для сохранения высокой точности при меньшем количестве параметров
.
Мы анализируем различные парадигмы развертывания ML
, включая Cloud ML (центры обработки данных), Edge ML (локальные серверы), Mobile ML (смартфоны) и Tiny ML (микроконтроллеры). Гибридные системы (Hybrid ML) объединяют эти парадигмы для использования их комплементарных преимуществ
.
4. Практические лабораторные работы (Hands-On Labs) Учебник предлагает практические упражнения для реализации всего, что вы изучили, от систем на базе микроконтроллеров до Edge-платформ
. Лабораторные работы включают:
• Классификацию изображений (Image Classification)
.
• Распознавание ключевых слов (KWS)
.
• Классификацию движения и обнаружение аномалий с использованием инерциальных измерительных модулей (IMU)
.
• Работа с платформами, такими как Arduino Nicla Vision
и Raspberry Pi
.

--------------------------------------------------------------------------------
Ресурсы и Поддержка
Этот проект был разработан в результате совместной работы в Гарвардском университете (курс CS249r)
и является открытым ресурсом
.
• Поддержите миссию: Учебник находится в открытом доступе. Вы можете поддержать нашу миссию, поставив звезду на репозитории GitHub: [github.com/harvard-edge/cs249r_book]
.
• Онлайн-обучение: На сайте mlsysbook.ai доступен ИИ-помощник SocratiQ, который предлагает интерактивные викторины и персонализированные объяснения
.
• AI Podcast: Послушайте подкаст, который предлагает доступный обзор ключевых идей и тем книги
.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Инженерия систем машинного обучения: От основ до развертывания на Edge-устройствах

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

Я проверил самый ДЕШЁВЫЙ круиз в России... (3 дня ада)

Я проверил самый ДЕШЁВЫЙ круиз в России... (3 дня ада)

Ночные пробуждения в 3–4 часа: как найти причину и вернуть глубокий сон.

Ночные пробуждения в 3–4 часа: как найти причину и вернуть глубокий сон.

Как считает квантовый компьютер? Самое простое объяснение!

Как считает квантовый компьютер? Самое простое объяснение!

Чем отличаются ML engineer, data analyst, data engineer и data scientist | Виктор Кантор

Чем отличаются ML engineer, data analyst, data engineer и data scientist | Виктор Кантор

Самое простое объяснение нейросети

Самое простое объяснение нейросети

Gemini 3, кванты и плоть. Странное будущее искусственного интеллекта.

Gemini 3, кванты и плоть. Странное будущее искусственного интеллекта.

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Нейронка, которая УНИЧТОЖИЛА ChatGPT 5! / Обзор бесплатной нейросети и ее возможности

Нейронка, которая УНИЧТОЖИЛА ChatGPT 5! / Обзор бесплатной нейросети и ее возможности

Я удалил ВЕСЬ ВЕБ в Windows 11. Что из этого вышло?

Я удалил ВЕСЬ ВЕБ в Windows 11. Что из этого вышло?

Япония запускает новую тенденцию в области робототехники | Лучшие технологии на выставке IREX Expo

Япония запускает новую тенденцию в области робототехники | Лучшие технологии на выставке IREX Expo

Найден 80-ти летний самолет в арктическом льду, то что нашли внутри, шокирует вас…

Найден 80-ти летний самолет в арктическом льду, то что нашли внутри, шокирует вас…

20 ЛУЧШИХ НЕЙРОСЕТЕЙ для учёбы и саморазвития (по мнению тысяч студентов)

20 ЛУЧШИХ НЕЙРОСЕТЕЙ для учёбы и саморазвития (по мнению тысяч студентов)

КЛАССИЧЕСКАЯ МУЗЫКА ДЛЯ ВОССТАНОВЛЕНИЯ НЕРВНОЙ СИСТЕМЫ🌿 Нежная музыка успокаивает нервную систему 22

КЛАССИЧЕСКАЯ МУЗЫКА ДЛЯ ВОССТАНОВЛЕНИЯ НЕРВНОЙ СИСТЕМЫ🌿 Нежная музыка успокаивает нервную систему 22

«Сыграй На Пианино — Я Женюсь!» — Смеялся Миллиардер… Пока Еврейка Не Показала Свой Дар

«Сыграй На Пианино — Я Женюсь!» — Смеялся Миллиардер… Пока Еврейка Не Показала Свой Дар

Находка внутри Сфинкса, власти попытались запретить раскопки, только взгляните

Находка внутри Сфинкса, власти попытались запретить раскопки, только взгляните

Как мыслит неграмотный человек? | Эксперимент

Как мыслит неграмотный человек? | Эксперимент

Битва за извлечение данных OCR или LLMs? n8n

Битва за извлечение данных OCR или LLMs? n8n

Искусственный интеллект для ПРОЕКТИРОВЩИКА: наш опыт

Искусственный интеллект для ПРОЕКТИРОВЩИКА: наш опыт