Open Pretrained Transformers - Susan Zhang | Stanford MLSys #77

Автор: Stanford MLSys Seminars

Загружено: 2023-03-01

Просмотров: 20505

Описание: Episode 77 of the Stanford MLSys Seminar “Foundation Models Limited Series”!

Speaker: Susan Zhang

Talk: Trials of developing OPT-175B

Abstract: LLM development at scale is an extraordinarily resource-intensive process, requiring compute resources that many do not have access to. The experimentation process will also appear rather haphazard in comparison, given limited compute-time to fully ablate all architectural / hyperparameter choices. In this talk, we will walk through the development lifecycle of OPT-175B, covering infrastructure and training convergence challenges faced at scale, along with methods of addressing these issues going forward.

Bio: Susan Zhang is a research engineer at Meta focused on the development of large-scale language models. Previously, she worked on designing photonic chips at Luminous Computing, scaling reinforcement learning systems at OpenAI, and building large-scale data infrastructure systems at Unity Technologies.

Check out our website for the schedule: http://mlsys.stanford.edu
Join our mailing list to get weekly updates: https://groups.google.com/forum/#!for...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Open Pretrained Transformers - Susan Zhang | Stanford MLSys #77

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Common Sense as Dark Matter - Yejin Choi | Stanford MLSys #78

Common Sense as Dark Matter - Yejin Choi | Stanford MLSys #78

Сжатие для AGI — Джек Рэй | Stanford MLSys #76

Сжатие для AGI — Джек Рэй | Stanford MLSys #76

Как тонкая настройка программ LLM с открытым исходным кодом решает проблему внедрения GenAI в про...

Как тонкая настройка программ LLM с открытым исходным кодом решает проблему внедрения GenAI в про...

AI in Business: Investments and Opportunities for Value Creation

AI in Business: Investments and Opportunities for Value Creation

Появляется новый тип искусственного интеллекта, и он лучше, чем LLMS?

Появляется новый тип искусственного интеллекта, и он лучше, чем LLMS?

Как крутят нейронки на периферийных устройствах / База по Edge Computing от инженера из Qualcomm

Как крутят нейронки на периферийных устройствах / База по Edge Computing от инженера из Qualcomm

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Build a small language model from scratch: Data pre-processing

Build a small language model from scratch: Data pre-processing

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Прогноз Сергея Гуриева. Что будет с войной, экономикой и россиянами в 2026?

Прогноз Сергея Гуриева. Что будет с войной, экономикой и россиянами в 2026?

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87

Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87

Notes on AI Hardware - Benjamin Spector | Stanford MLSys #88

Notes on AI Hardware - Benjamin Spector | Stanford MLSys #88

Build a Small Language Model (SLM) From Scratch

Build a Small Language Model (SLM) From Scratch

Следующий 100x — Гэвин Уберти | Stanford MLSys #92

Следующий 100x — Гэвин Уберти | Stanford MLSys #92

ИИ создаст 2 мира, GPT 5.1 - добрый и зря, OpenAI теряет бизнес

ИИ создаст 2 мира, GPT 5.1 - добрый и зря, OpenAI теряет бизнес

Monarch Mixer: Making Foundation Models More Efficient - Dan Fu | Stanford MLSys #86

Monarch Mixer: Making Foundation Models More Efficient - Dan Fu | Stanford MLSys #86

Scaling Up “Vibe Checks” for LLMs - Shreya Shankar | Stanford MLSys #97

Scaling Up “Vibe Checks” for LLMs - Shreya Shankar | Stanford MLSys #97

«Путинской России не будет через несколько лет»: Зыгарь о распаде СССР, причинах и будущем войны

«Путинской России не будет через несколько лет»: Зыгарь о распаде СССР, причинах и будущем войны

How to Pick the Right AI Foundation Model

How to Pick the Right AI Foundation Model