ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Open Pretrained Transformers - Susan Zhang | Stanford MLSys #77

Автор: Stanford MLSys Seminars

Загружено: 2023-03-01

Просмотров: 20505

Описание: Episode 77 of the Stanford MLSys Seminar “Foundation Models Limited Series”!

Speaker: Susan Zhang

Talk: Trials of developing OPT-175B

Abstract: LLM development at scale is an extraordinarily resource-intensive process, requiring compute resources that many do not have access to. The experimentation process will also appear rather haphazard in comparison, given limited compute-time to fully ablate all architectural / hyperparameter choices. In this talk, we will walk through the development lifecycle of OPT-175B, covering infrastructure and training convergence challenges faced at scale, along with methods of addressing these issues going forward.

Bio: Susan Zhang is a research engineer at Meta focused on the development of large-scale language models. Previously, she worked on designing photonic chips at Luminous Computing, scaling reinforcement learning systems at OpenAI, and building large-scale data infrastructure systems at Unity Technologies.

Check out our website for the schedule: http://mlsys.stanford.edu
Join our mailing list to get weekly updates: https://groups.google.com/forum/#!for...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Open Pretrained Transformers - Susan Zhang  | Stanford MLSys #77

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Common Sense as Dark Matter - Yejin Choi  | Stanford MLSys #78

Common Sense as Dark Matter - Yejin Choi | Stanford MLSys #78

Сжатие для AGI — Джек Рэй | Stanford MLSys #76

Сжатие для AGI — Джек Рэй | Stanford MLSys #76

Как тонкая настройка программ LLM с открытым исходным кодом решает проблему внедрения GenAI в про...

Как тонкая настройка программ LLM с открытым исходным кодом решает проблему внедрения GenAI в про...

AI in Business: Investments and Opportunities for Value Creation

AI in Business: Investments and Opportunities for Value Creation

Появляется новый тип искусственного интеллекта, и он лучше, чем LLMS?

Появляется новый тип искусственного интеллекта, и он лучше, чем LLMS?

Как крутят нейронки на периферийных устройствах / База по Edge Computing от инженера из Qualcomm

Как крутят нейронки на периферийных устройствах / База по Edge Computing от инженера из Qualcomm

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Build a small language model from scratch: Data pre-processing

Build a small language model from scratch: Data pre-processing

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Прогноз Сергея Гуриева. Что будет с войной, экономикой и россиянами в 2026?

Прогноз Сергея Гуриева. Что будет с войной, экономикой и россиянами в 2026?

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87

Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87

Notes on AI Hardware - Benjamin Spector | Stanford MLSys #88

Notes on AI Hardware - Benjamin Spector | Stanford MLSys #88

Build a Small Language Model (SLM) From Scratch

Build a Small Language Model (SLM) From Scratch

Следующий 100x — Гэвин Уберти | Stanford MLSys #92

Следующий 100x — Гэвин Уберти | Stanford MLSys #92

ИИ создаст 2 мира, GPT 5.1 - добрый и зря, OpenAI теряет бизнес

ИИ создаст 2 мира, GPT 5.1 - добрый и зря, OpenAI теряет бизнес

Monarch Mixer: Making Foundation Models More Efficient - Dan Fu | Stanford MLSys #86

Monarch Mixer: Making Foundation Models More Efficient - Dan Fu | Stanford MLSys #86

Scaling Up “Vibe Checks” for LLMs - Shreya Shankar | Stanford MLSys #97

Scaling Up “Vibe Checks” for LLMs - Shreya Shankar | Stanford MLSys #97

«Путинской России не будет через несколько лет»: Зыгарь о распаде СССР, причинах и будущем войны

«Путинской России не будет через несколько лет»: Зыгарь о распаде СССР, причинах и будущем войны

How to Pick the Right AI Foundation Model

How to Pick the Right AI Foundation Model

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]