AI的下一步:强化学习是正确的AGI解法吗?|硅谷101年度线下大会|Alignment 2025
Автор: 硅谷101
Загружено: 2025-11-19
Просмотров: 45536
Описание:
【硅谷101年度线下大会回放】2016年,AlphaGo击败围棋世界冠军,让强化学习一战成名。如今,从推荐算法到自动驾驶,强化学习已成为推动AI向AGI进化的第二引擎。然而,其效率低下与自身缺陷等问题,也遭到了包括OpenAI联合创始人Andrej Karpathy等专家们的质疑。
今年的硅谷101 Alignment大会的强化学习专题论坛上,我们邀请到了来自OpenAI、亚马逊、前Meta以及LinkedIn的四位重量级嘉宾,围绕RLVR(基于可验证奖励的强化学习)、人类反馈数据的“黄金标准”、探索与抽象以及被称为“强化学习之父”的 “OaK” 架构等前沿议题,展开了一场极其坦诚、也极其硬核的讨论。他们眼中强化学习的极限在哪里?最终,AI能否凭借强化学习,走向真正的知识创新?
硅谷101于2025年10月5日在硅谷线下举办的Alignment2025年度科技大会上,不少演讲嘉宾分享了极具价值的观点,我们将会把一些重要观点逐渐整理上线。我们的线下大会是全英文,嘉宾的分享将用中文字幕的方式呈现。
圆桌嘉宾:
朱哲清(主持人):Pokee.ai创始人、前Meta AI应用强化学习负责人
Lihong Li:亚马逊高级首席科学家
Alborz Geramifard:LinkedIn杰出科学家
Zheng Wen:OpenAI技术团队成员、斯坦福大学兼任讲师
你会看到:
00:00 - 05:01 AI时代转折点:强化学习是救命稻草还是低效路径
05:01 - 08:59 RLVR的潜力与局限: 可验证奖励能否突破数学与编程领域
08:59 - 14:24 黄金标准难题:如何平衡低质的人类数据与昂贵的专家标注
14:24 - 19:22 探索的平衡:预训练和后训练如何分工,才能让AI更高效思考
19:22 - 28:18 强化学习之父的OaK架构:将复杂任务拆解成子任务
28:18 - 38:26 强化学习只能在框架内探索,无法创造新的理论
38:26 - 39:45 未来展望:“抽象”与“分层”是强化学习近期的突破口
【关于硅谷101】
我们是由海内外一线媒体记者/主持人创办的栏目,深度解析硅谷创新趋势,以轻松的风格分享科技行业的最新动态。我们采过顶级科技大佬,积累了数万小时的媒体经验,做过调查性报道,操盘过千万级传播量的知名深度稿,引发全国讨论和微博热搜;致力于将最专业的媒体素养和信息搜集能力转化为易传播的新媒体力量。
旗下同名播客栏目: / @valley101podcast
关注我们,从这里驶向未来。
联系我们:[email protected]
【往期精彩视频】
• 失衡的乌托邦:Meta的开源AI路线是如何遭遇滑铁卢的
• 专访前FAIR研究总监田渊栋:Meta裁员之后,对AI的一些遗憾与思考【对话】
• 失衡的乌托邦:Meta的开源AI路线是如何遭遇滑铁卢的
• LMArena:谁是AI之王,凭什么这个评测说了算?
• 英伟达“两个儿子”之战:AI算力的杠杆游戏与潜在泡沫【深度】|Coreweave|N...
• 当机器人学会开可乐:深聊灵巧手的“不可能三角”与六大技术门派|机器人系列
• 从Perplexity对Chrome发起收购要约,深聊新一轮AI浏览器大战【101对话】
• 从Perplexity对Chrome发起收购要约,深聊新一轮AI浏览器大战【101对话】
• 失控的芬太尼:药物滥用背后的权力、金钱与死亡【深度】
• 人类会被困在1nm吗?深度解析光刻机与芯片制程的未来【深度】
• 金钱堆出的“象牙塔”:美国大学,怎么成了一门生意?【深度】
• 从Circle火爆IPO,看稳定币与美元霸权的现代化金融战【深度】
• 镜像世界、手机消失、人类爱上AI:“硅谷精神之父”凯文·凯利的2049预言【专访】
• 从追缉本·拉登到AI战争,解密Palantir的崛起之路【深度】
• 枪声背后的信任危机:“病不起”的美国人【深度】
• 关税大棒下的苹果:一场全球供应链的迁徙风暴【深度】
• 再聊黄仁勋“量子春晚”:只有混战、没有共识的量子计算界【深度】
• 没人能救大众?燃油车霸主转型困局背后的“德国病”【深度】
• “再造一个CUDA”:英伟达的第二护城河与“超级碗”阳谋【深度解析GTC 2025】
• AI Agent爆发前的黎明:Manus不够好,但天快亮了【深度】
• 硅谷视角深聊:DeepSeek的颠覆、冲击、争议和误解【深度】
• 傲慢、短视、扼杀创新,垄断巨头英特尔是如何走向倒塌的?【深度】
• 自动驾驶的”端到端“AI新春天:依然分裂、冲突、孤注一掷
• 千亿美元的喧嚣与寒冬后,无人驾驶终于要落地了?
• Bill Hwang被判18年:复盘“上帝之手”Archegos的百亿世纪大爆仓【深度】
• 谎言、打压、逐利与权力游戏,波音是如何失去制造骄傲的?
• 【深度】世纪骗局落幕:“加密货币之王”SBF的疯狂人生与FTX帝国的崩塌
• ARM风云史:软银帝国的最后王牌与孙正义的AI“新饼”
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: