[Podcast] Robot Learns by Watching

Автор: Vinh Nguyen

Загружено: 2026-01-26

Просмотров: 9

Описание: Cosmos Policy: Fine-Tuning Video Models for Robotic Control

https://www.alphaxiv.org/abs/2601.16163

Cosmos Policy is a sophisticated robotics framework that adapts the NVIDIA Cosmos video foundation model into a versatile tool for visuomotor control and planning. By employing a technique called latent frame injection, the system integrates robot actions, proprioception, and state values directly into the video model's existing architecture without needing structural modifications. This unified approach allows the model to function simultaneously as a policy, world model, and value function, enabling it to "imagine" future outcomes and select the most successful actions. Experimental results demonstrate that Cosmos Policy achieves state-of-the-art performance in both simulated benchmarks and real-world bimanual manipulation tasks. Furthermore, the model can be refined through policy rollouts, significantly improving its ability to perform high-precision tasks by learning from its own physical experiences.

#ai #nvidia #robot #robotics #standford #research #cosmos #reinforcementlearning

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

[Podcast] Robot Learns by Watching

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Mastering Claude Code: Best Practices and Advanced Workflows

Mastering Claude Code: Best Practices and Advanced Workflows

Роботы, Которых Никто Не Ожидал Увидеть на CES 2026

Роботы, Которых Никто Не Ожидал Увидеть на CES 2026

OpenAI Just Dropped PRISM: The AI That Changes Science Forever

OpenAI Just Dropped PRISM: The AI That Changes Science Forever

China’s Next AI Shock Is Hardware

China’s Next AI Shock Is Hardware

Конец света на Украине: Подстанции 750 кВ. ПОЛНЫЙ РАЗБОР

Конец света на Украине: Подстанции 750 кВ. ПОЛНЫЙ РАЗБОР

[Podcast] Mastering Cursor: Best Practices for Coding with Agents

[Podcast] Mastering Cursor: Best Practices for Coding with Agents

AI and the Future of Planetary Intelligence

AI and the Future of Planetary Intelligence

OPENAI БАНКРОТ: ФИНАЛЬНАЯ ТОЧКА! Маск Вскрыл Ужасные Цифры! Дарио Амодей В Панике!Альтман Жгёт Бабло

OPENAI БАНКРОТ: ФИНАЛЬНАЯ ТОЧКА! Маск Вскрыл Ужасные Цифры! Дарио Амодей В Панике!Альтман Жгёт Бабло

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

[Podcast] Mastering Claude Code: Best Practices and Advanced Workflows

[Podcast] Mastering Claude Code: Best Practices and Advanced Workflows

ЧТО СКРЫВАЮТ РАДИОВОЛНЫ?

ЧТО СКРЫВАЮТ РАДИОВОЛНЫ?

Золото продолжает удивлять | Никогда такого не было, и вот опять | статья | Валентин Катасонов

Золото продолжает удивлять | Никогда такого не было, и вот опять | статья | Валентин Катасонов

Экстренное заседание мировой элиты, или Что скрывается за пафосом | Хохлова | Боглаев

Экстренное заседание мировой элиты, или Что скрывается за пафосом | Хохлова | Боглаев

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

[Podcast] Kimi K2.5: Visual Agentic Intelligence and Agent Swarms

[Podcast] Kimi K2.5: Visual Agentic Intelligence and Agent Swarms

[Podcast] DeepSeek-OCR 2: AI Reading Like A Human

[Podcast] DeepSeek-OCR 2: AI Reading Like A Human

[Podcast] The Performance Playbook

[Podcast] The Performance Playbook

Япония построила поезд будущего за $14 млрд. Почему весь мир отказывается его повторять?

Япония построила поезд будущего за $14 млрд. Почему весь мир отказывается его повторять?

Как раскусить любого | 14 хитростей Макиавелли

Как раскусить любого | 14 хитростей Макиавелли