ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

How We Trained a Robot to Do 50 Household Tasks in Simulation (BEHAVIOR Challenge 1st place)

Автор: Ilia

Загружено: 2026-01-23

Просмотров: 2924

Описание: 🏆 BEHAVIOR Challenge (NeurIPS 2025) Winner Deep Dive

Recently, me and my teammates Gleb and Akash won 1st place in the BEHAVIOR Challenge organized by Stanford Vision and Learning Lab (NeurIPS 2025). We already open-sourced the full solution: code, technical report, blog post with rollouts, and all pretrained weights. In this video, I go through the solution in more detail.

BEHAVIOR Challenge is a large-scale robotics benchmark: you get 50 household tasks in high-quality simulation (OmniGibson + NVIDIA Isaac Sim) and 1,200+ hours of teleoperation data. This is the scale where modern VLA policies start to really benefit from transfer learning and generalization. I’ll explain what the challenge is, what we built (architecture, training, inference), and show a lot of real autonomous rollouts (successes and failures).

🎯 What you’ll learn in this video:
✅ What BEHAVIOR is (robot, simulator, dataset, evaluation)
✅ Why we started from Pi0.5 and what we changed (architecture, training, inference):
Task embeddings instead of language prompts
A simple deterministic System 2 progress tracker
Gripper retry heuristic
Correlated noise for flow matching
Trainable VLM layer mixing for the action expert attention
Inference tricks: soft chunk inpainting + action compression
✅ Results: leaderboard, per-task patterns, and failure analysis

🎯 Chapters:
00:00 Intro
01:12 BEHAVIOR overview
04:00 Dataset + task examples
10:57 Solution overview
15:58 System 2
29:01 Actions correlation and flow matching
45:49 Trainable mixed-layer attention
58:12 Inference optimization
1:04:23 Results and autonomous rollouts
1:25:43 Summary and outro

🔗 Open-Source Solution & Resources:
• Code: https://github.com/IliaLarchenko/beha...
• Pretrained Weights: https://huggingface.co/IliaLarchenko/...
• Technical Report: https://arxiv.org/abs/2512.06951
• Blog Post: https://robot-learning-collective.git...

🔗 Main Challenge Info:
• Official Website: https://behavior.stanford.edu/challenge/
• Official Repo: https://github.com/StanfordVL/BEHAVIO...
• Teleoperation Hardware: https://behavior-robot-suite.github.io/

📚 Additional References:
• Pi0: https://www.pi.website/blog/pi0
• Pi0.5: https://www.pi.website/blog/pi05
• Real-Time Action Chunking: https://www.pi.website/research/real_...
• Dot Policy (action speedup): https://github.com/IliaLarchenko/dot_...
• Figure AI: Helix (Sport Mode): https://www.figure.ai/news/helix-logi...
• Russ Tedrake talk (timestamp normalization):    • Stanford Seminar - Multitask Transfer in T...  
• Isaac GR00T: https://github.com/NVIDIA/Isaac-GR00T
• SmolVLA: https://huggingface.co/blog/smolvla
• Attention is All You Need (Transformer): https://arxiv.org/abs/1706.03762
• Mixture of Experts: https://arxiv.org/abs/1701.06538

👥 Team:
• Ilia Larchenko: https://x.com/IliaLarchenko
• Gleb Zarin: https://x.com/zaringleb
• Akash Karnatak: https://x.com/akashkarnatak

---

Some footage and images in this video are from or generated by Stanford VL Lab / BEHAVIOR / OmniGibson / NVIDIA Isaac Sim, used for educational purposes. All rights remain with the original creators.

💬 Have questions or suggestions? Drop them in the comments, I read everything!
⭐ Enjoyed the video? Please like & subscribe if you like this content

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
How We Trained a Robot to Do 50 Household Tasks in Simulation (BEHAVIOR Challenge 1st place)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Pi0 - generalist Vision Language Action policy for robots (VLA Series Ep.2)

Pi0 - generalist Vision Language Action policy for robots (VLA Series Ep.2)

Натриевые батарейки работают… Так почему же они выходят из строя?

Натриевые батарейки работают… Так почему же они выходят из строя?

Episode 2: Why Is It So Hard to Get a Job in Cyber Right Now?

Episode 2: Why Is It So Hard to Get a Job in Cyber Right Now?

$1 vs $1,000,000,000 Футуристических Технологий!

$1 vs $1,000,000,000 Футуристических Технологий!

LLMs Meet Robotics: What Are Vision-Language-Action Models? (VLA Series Ep.1)

LLMs Meet Robotics: What Are Vision-Language-Action Models? (VLA Series Ep.1)

Decoding The World's First Solid State Battery

Decoding The World's First Solid State Battery

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

Meet LimX COSA|The First Physical-world-native Agentic OS for Humanoid Robots

Meet LimX COSA|The First Physical-world-native Agentic OS for Humanoid Robots

Я создал звуковой лазер

Я создал звуковой лазер

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

The World's Most Important Machine

The World's Most Important Machine

ONE YEAR of Work for TEN SECONDS of Film

ONE YEAR of Work for TEN SECONDS of Film

Насколько мы близки к созданию твердотельных батарей?

Насколько мы близки к созданию твердотельных батарей?

21 Coolest Tech at CES 2026

21 Coolest Tech at CES 2026

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Controlling the robot with VLA policy: Pi0.5 explained (FAST, System 1/2, KI, RTC) (VLA Series Ep.3)

Controlling the robot with VLA policy: Pi0.5 explained (FAST, System 1/2, KI, RTC) (VLA Series Ep.3)

Падение OnePlus будут изучать

Падение OnePlus будут изучать

NVIDIA’s New Voice AI is Absolutely WILD! (PersonaPlex)

NVIDIA’s New Voice AI is Absolutely WILD! (PersonaPlex)

But how do AI images and videos actually work? | Guest video by Welch Labs

But how do AI images and videos actually work? | Guest video by Welch Labs

На меня напали… Розыгрыш в спортзале «Анатолий» пошел не так… | Притворился уборщиком

На меня напали… Розыгрыш в спортзале «Анатолий» пошел не так… | Притворился уборщиком

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]