通义千问技术负责人离职,阿里HR捅了多大篓子?
Автор: 课代表立正
Загружено: 2026-03-04
Просмотров: 4158
Описание:
AI课程/风水宝地: https://www.superlinear.academy/ai-bu...
两小时完整版: • 查晟:大模型训练的真相、NVIDIA 的护城河、以及为什么大厂做不好 AI
为什么 DeepSeek 能以 1% 的成本训练出顶尖模型,而拥有海量资源的硅谷巨头却步履维艰?训练大模型到底是玄学还是科学?
本期视频,我们邀请到了 Amazon AGI 资深经理(Senior Manager)查晟。他曾与 Alex Smola、李沐等 AI 巨匠共事,深度参与了亚马逊第一代大模型的研发以及目前 Frontier 模型的训练。他将从技术路线、实验方法论、基础设施以及人才密度等维度,带你揭开大模型训练背后的真实挑战。
你将在这段视频中获得:
避坑指南:为什么模型在小规模实验时效果很好,Scale Up 之后却突然“崩了”?
内部策略:为什么一个高产的团队应该追求 50% 的失败率?如何通过“信息增益”优化研发?
硬核工程:GPU 功率激增为何会导致数据中心宕机?“静默数据损坏”如何毁掉一个模型?
行业真相:公开榜单(Benchmarks)是如何被刷分的?为什么大厂必须拥有“秘密评测集”?
未来判断:AI 自我进化的临界点在哪?当初级岗位消失,科技从业者该如何转型?
这是一场拒绝空谈、直面工程细节的深度对谈。无论你是 AI 从业者,还是对技术变革感到焦虑的观察者,查晟的视角都会为你提供极具价值的参考。
00:00 开场
01:14 嘉宾介绍:查晟与Amazon AGI
02:23 大模型训练的基本原理与为什么这么难
07:47 反直觉的实验方法:为什么要做失败率50%的事
09:05 训练大模型需要哪些团队协作
15:15 数据质量:微波炉社区、SEO垃圾与合成数据的边界
21:04 Evaluation为什么是最重要也最容易出错的环节
29:57 团队如何衡量研发进度(cost-to-accuracy框架)
36:01 人才缺口与NVIDIA的护城河
39:26 未来趋势:模型自主学习将改变什么
45:33 AI时代的职业与经济冲击
53:33 结语
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: