FlexOlmo: Open Language Models for Flexible Data Use

Автор: Simons Institute for the Theory of Computing

Загружено: 2026-02-25

Просмотров: 36

Описание: Sewon Min (UC Berkeley)
https://simons.berkeley.edu/talks/sew...
Learning from Heterogeneous Sources

Large language models are often limited by data, especially when valuable datasets are distributed across institutions or cannot be shared. We introduce FlexOlmo, a new class of Mixture-of-Experts (MoE) models designed for flexible, modular data use. In FlexOlmo, expert modules are trained independently on separate datasets and later merged seamlessly into a single model. This enables distributed training without data sharing, supports the use of closed datasets, and allows data to be opt-in or opt-out at inference time. We scale FlexOlmo to 37B parameters (20B active) and evaluate on 31 diverse downstream tasks. FlexOlmo significantly outperforms models trained on public data only and approaches the performance of an upper-bound model trained on all datasets. By enabling modular integration of closed data while respecting data ownership and control, FlexOlmo offers a practical path toward collaborative, continuous model development.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

FlexOlmo: Open Language Models for Flexible Data Use

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Federated, Synthetic, Personalized: Heterogeneity Here or There?

Federated, Synthetic, Personalized: Heterogeneity Here or There?

Лекция от легенды ИИ в Стэнфорде

Лекция от легенды ИИ в Стэнфорде

Rare Earth Minerals- Mr Carl Delfeld

Rare Earth Minerals- Mr Carl Delfeld

Computer Architecture 101 and its Future

Computer Architecture 101 and its Future

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

066. Как AI меняет роль архитектора

066. Как AI меняет роль архитектора

Exact Unlearning of Finetuning Data via Model Merging at Scale

Exact Unlearning of Finetuning Data via Model Merging at Scale

Сосредоточьтесь, как генеральный директор в своем пентхаусе - Музыка для работы, обеспечивающая с...

Сосредоточьтесь, как генеральный директор в своем пентхаусе - Музыка для работы, обеспечивающая с...

Machine-Checked Proofs and the Rise of Formal Methods in Mathematics | Theoretically Speaking

Machine-Checked Proofs and the Rise of Formal Methods in Mathematics | Theoretically Speaking

Разработка, кибербезопасность и парадокс интеллекта — Ивар ft. Григорий Сапунов | Мыслить как ученый

Разработка, кибербезопасность и парадокс интеллекта — Ивар ft. Григорий Сапунов | Мыслить как ученый

Understanding Outer Optimizers in Local SGD: Learning Rates, Momentum, and Acceleration

Understanding Outer Optimizers in Local SGD: Learning Rates, Momentum, and Acceleration

Chill Mood Music 🎧 – French Relaxing Playlist

Chill Mood Music 🎧 – French Relaxing Playlist

Шульман: Почему держится режим в Иране, был ли Хаменеи легитимным и Трамп vs Вестфальская система

Шульман: Почему держится режим в Иране, был ли Хаменеи легитимным и Трамп vs Вестфальская система

Это самый глубокий уровень материи?

Это самый глубокий уровень материи?

Privacy of Decentralized Machine Learning

Privacy of Decentralized Machine Learning

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Federated Learning in the Generative AI Era

Federated Learning in the Generative AI Era

The Statistical Fairness-Accuracy Frontier

The Statistical Fairness-Accuracy Frontier

SpaceX Unveils Insane New Product

SpaceX Unveils Insane New Product

On continual learning with gradient descent for neural networks

On continual learning with gradient descent for neural networks