Nov 18, 2025 - PredictaBoard: Benchmarking LLM Score Predictability
Автор: BlueDot AI Safety Evals Reading Group
Загружено: 2026-02-09
Просмотров: 9
Описание:
Author presentation by Lorenzo Pacchiardi for BlueDot Evals Reading Group: https://evalsreadinggroup.com
Paper is here: https://arxiv.org/abs/2502.14445
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: