全面解析“世界模型”:定义、路线、实践与AGI的更近一步
Автор: 硅谷101
Загружено: 2026-03-05
Просмотров: 96996
Описание:
2026年,全球顶尖AI实验室和科技巨头们都在押注研发一个新算法路径:世界模型。随着大语言模型(LLM)的Scaling Law面临发展质疑,Yann LeCun、李飞飞等顶尖学者以及OpenAI、谷歌等科技巨头们都在追问:AI要想真正智能,能“预测世界”是否是必须项?由此,“世界模型”被视为是AI的下一个十年最重要的研究方向之一。
这期视频我们将深入拆解世界模型的核心定义、三层研发结构,以及最主流的几条技术路线:视频生成、3D空间智能、智能体训练、JEPA抽象预测。
当AI不仅能“看见”世界,还能“推演”世界,机器人、自动驾驶、内容产业、甚至人机关系将被怎样颠覆?当AI的“梦境”越来越真实,我们又将面临怎样的新风险?
时间轴:
00:00 AI看似全能却不懂世界?世界模型成全球巨头新宠
01:44 什么是世界模型? 观察、预测并内部世界中学习行动
07:43 世界模型 vs 大语言模型:一个预测词,一个预测未来
09:45 LLM遇到瓶颈了吗?Yann LeCun直言“路线错了”
13:44 为什么是现在?多模态成熟+具身智能需求爆发
14:41 世界模型的“三层结构”:思想与范式、“表现形式”和智能体行动
16:46 构建世界模型的第一步:世界生成即是外壳也是入口
18:08 视频生成路线:Sora“播放世界”+Genie 3“探索世界”
23:18 3D生成(空间智能)路线:李飞飞的World Labs选择“建世界”
27:42 谷歌SIMA:把游戏当训练场,让AI在虚拟世界里学会真实行动
29:49 Yann LeCun的JEPA:不画世界,直接学习抽象结构
35:32 世界模型会改写哪些关键行业?
35:35 具身智能:降低仿真到现实的迁移能力门槛
37:32 自动驾驶:不只是识别+反应,更能像人一样预判
39:41 下一代穿戴式设备:从“信息终端”变成随身的“世界理解引擎”
40:41 内容生成、游戏与影视制作:创作方式的重写
42:47 AI Agent:提供可训练、可试错、接近真实的“内在世界”
44:49 潜在风险:模糊虚拟与现实的边界,更会影响真实世界
47:27 AI的下一段旅程:世界模型是通往AGI的钥匙吗?
【关于硅谷101】
我们是由海内外一线媒体记者/主持人创办的栏目,深度解析硅谷创新趋势,以轻松的风格分享科技行业的最新动态。我们采过顶级科技大佬,积累了数万小时的媒体经验,做过调查性报道,操盘过千万级传播量的知名深度稿,引发全国讨论和微博热搜;致力于将最专业的媒体素养和信息搜集能力转化为易传播的新媒体力量。
旗下同名播客栏目: / @valley101podcast
关注我们,从这里驶向未来。
联系我们:[email protected]
【往期精彩视频】
• 人类会被困在1nm吗?深度解析光刻机与芯片制程的未来【深度】
• 傲慢、短视、扼杀创新,垄断巨头英特尔是如何走向倒塌的?【深度】
• 揭秘春晚小品机器人:与松延动力聊对戏、空翻、仿生背后的技术进化|机器人系列
• AppLovin撕开巨头裂缝的1000天:AI审判、被做空与Underdog的“弱者...
• 好莱坞的诅咒与Netflix的十年征服史,深扒华纳兄弟收购案始末|传媒巨头系列
• 数据中心上太空?新的泡沫,还是下一个金矿?
• 算法选中的“绿色黄金”:抹茶全球爆火背后的商业逆袭史
• CES 2026:探展50个AI项目背后的泡沫、野心与非共识
• 机器人“大脑”60年进化史:基础模型的五代进化与三大闭源流派|机器人系列
• 脑机接口大盘点:从科幻到现实,谁在引领这场“读心术”革命?
• 2025年,人形机器人走到哪一步了?|机器人系列|具身智能年度盘点
• 派拉蒙百年兴衰史:80亿卖身甲骨文背后的传媒帝国大洗牌|传媒巨头系列
• Swatch危机:瑞士钟表的昔日骄傲与美国“野蛮人”
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: