Адаптация многодоменной языковой модели с использованием синтетической генерации данных — Shell @...
Автор: Weights & Biases
Загружено: 2025-12-05
Просмотров: 146
Описание: В этом докладе на конференции Fully Connected London Инджи Сархан (исследователь естественного языка) и Аваниндра Сингх (старший научный сотрудник) из Shell рассказывают о том, как они раскрывают институциональные знания, накопленные после выхода экспертов на пенсию. Стандартные LLM не понимают предметно-ориентированный язык Shell, поэтому они создали помощника по исследованиям для тонкой настройки моделей для более эффективных исследований. Они подробно описывают свой конвейер обработки данных в предметной области с использованием NVIDIA Nemo Curator и W&B Weave, охватывая предварительную обработку данных, адаптацию к предметной области, настройку инструкций и оценку. Команда демонстрирует, как LLM, адаптированные к предметной области, достигают предметно-ориентированного мышления и повышают фактическую точность, подчеркивая, как LLM-система W&B Weave «как судья» и циклы обратной связи позволили сопоставить результаты ручных и автоматически сгенерированных бенчмарков.
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: