Wyamo research - EMMA model (Oct'2024): self driving car that thinks in words

Автор: Kevin Lui

Загружено: 2025-12-13

Просмотров: 23

Описание: The video introduces EMMA (End-to-End Multimodal Model for Autonomous Driving - https://arxiv.org/pdf/2410.23262), a system built upon a foundation model like Google's Gemini that treats the Large Language Model (LLM) as a central component. EMMA is designed as a generalist model that processes raw camera video and textual commands to directly produce outputs for multiple driving tasks, including motion planning, 3D object detection, road graph estimation, and scene understanding. A key feature of EMMA is the integration of chain-of-thought reasoning, which enhances both the model's performance and its ability to explain its driving rationale by articulating its decisions. The research demonstrates that co-training EMMA on multiple tasks can improve performance across individual tasks, although the authors acknowledge limitations such as the current lack of native LiDAR/radar input fusion and the computational challenges associated with deploying large models in real-time autonomous systems.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Wyamo research - EMMA model (Oct'2024): self driving car that thinks in words

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Запуск нейросетей локально. Генерируем - ВСЁ

Запуск нейросетей локально. Генерируем - ВСЁ

Offsec Proving Grounds Walkthrough - Interface

Offsec Proving Grounds Walkthrough - Interface

Новое расширение Claude для Chrome: секретное оружие, которое должен использовать каждый

Новое расширение Claude для Chrome: секретное оружие, которое должен использовать каждый

Понимание вибрации и резонанса

Понимание вибрации и резонанса

Гренландия: остров китов, нищеты и алкоголизма | Интервью с местными, снег, лед и хаски

Гренландия: остров китов, нищеты и алкоголизма | Интервью с местными, снег, лед и хаски

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

Основы ПЛК: релейная логика

Основы ПЛК: релейная логика

Цепи Маркова — математика предсказаний [Veritasium]

Цепи Маркова — математика предсказаний [Veritasium]

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Как я учусь в 10 раз быстрее: Система с AI, Perplexity и NotebookLM

Как я учусь в 10 раз быстрее: Система с AI, Perplexity и NotebookLM

20 концепций искусственного интеллекта, объясненных за 40 минут

20 концепций искусственного интеллекта, объясненных за 40 минут

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

От нуля до вашего первого ИИ-агента за 25 минут (без кодирования)

От нуля до вашего первого ИИ-агента за 25 минут (без кодирования)

Илон Маск ошеломил Джо Рогана: «Что произойдет, когда искусственный интеллект будет управлять всем?»

Илон Маск ошеломил Джо Рогана: «Что произойдет, когда искусственный интеллект будет управлять всем?»

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

Почему нейросети постоянно врут? (и почему этого уже не исправить)

Почему нейросети постоянно врут? (и почему этого уже не исправить)