ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

EP047: Bootstrapping AI With Self-Generated Instructions

Автор: Bookworm

Загружено: 2026-02-28

Просмотров: 0

Описание: SELF-INSTRUCT: Aligning Language Models with Self-Generated Instructions (https://arxiv.org/abs/2212.10560) introduces a novel framework for improving the instruction-following capabilities of pretrained language models using minimal human-labeled data.


Large language models typically depend heavily on human-written instruction datasets to learn how to follow prompts zero-shot. However, creating this human-annotated data is costly and often lacks the diversity and creativity needed to cover a wide variety of tasks, which bottlenecks the model's ability to generalize.


To solve this, the authors propose SELF-INSTRUCT, a semi-automated pipeline that bootstraps instruction data directly from the language model itself. The process begins with a small seed pool of 175 human-written tasks and uses the model to iteratively execute four steps:

1. Instruction Generation: The model generates new task instructions based on a sample of existing ones.
2. Classification Task Identification: The model determines if the new instruction requires a classification output or not.
3. Instance Generation: The model generates input-output instances for the task using either an input-first approach (for non-classification tasks) or an output-first approach (to prevent biased labels in classification tasks).
4. Filtering: Heuristics are used to filter out invalid, low-quality, or highly repetitive instructions before adding the successful tasks back into the pool.

Key Results:By applying this pipeline to a vanilla GPT-3 model, the researchers generated a diverse synthetic dataset of over 52,000 instructions and 82,000 instances. When GPT-3 was finetuned on this self-generated data (creating a model called GPT3SELF-INST), its zero-shot performance on the SUPER-NATURALINSTRUCTIONS benchmark improved by 33% over the original model. Furthermore, human evaluations on a newly curated set of 252 complex, user-oriented tasks showed that GPT3SELF-INST outperformed models trained on other public instruction datasets and performed nearly on par with InstructGPT001, which relies on private user data and expensive human annotations.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
EP047: Bootstrapping AI With Self-Generated Instructions

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

EP115: Dr.LLM brings dynamic depth to AI

EP115: Dr.LLM brings dynamic depth to AI

Новая Nano Banana Pro: с нуля до ПРО. Полный курс по Nano Banana Pro 2

Новая Nano Banana Pro: с нуля до ПРО. Полный курс по Nano Banana Pro 2

Массовый забой скота. Протестам в России быть? Зачем Трампу Иран. Максим Шевченко: Особое мнение

Массовый забой скота. Протестам в России быть? Зачем Трампу Иран. Максим Шевченко: Особое мнение

Вся Правда о Zorin OS: Linux Который Заменит Windows?

Вся Правда о Zorin OS: Linux Который Заменит Windows?

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

EP117: AI agents learn through textual reflection

EP117: AI agents learn through textual reflection

Полный гайд по Claude: как выжать максимум из этой нейросети

Полный гайд по Claude: как выжать максимум из этой нейросети

Страшна ли тёмная энергия | Интервью с физиком-ядерщиком Борисом Бояршиновым

Страшна ли тёмная энергия | Интервью с физиком-ядерщиком Борисом Бояршиновым

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

Я разобрал всю ИИ-экосистему Google — 7 ключевых инструментов

Я разобрал всю ИИ-экосистему Google — 7 ключевых инструментов

EP112: GPT 5.4 Outperforms Human Professionals

EP112: GPT 5.4 Outperforms Human Professionals

30 видео за 5 минут: ИИ-агент делает ресерч ВМЕСТО вас

30 видео за 5 минут: ИИ-агент делает ресерч ВМЕСТО вас

Что нашли в глубинах океана? Существа, о которых мы НИЧЕГО не знаем. Александр Осадчиев

Что нашли в глубинах океана? Существа, о которых мы НИЧЕГО не знаем. Александр Осадчиев

Время не существует – объяснение Фейнмана меняет всё

Время не существует – объяснение Фейнмана меняет всё

EP116: Why AI struggles with empathy and interruptions

EP116: Why AI struggles with empathy and interruptions

EP001: How Transformers Smashed the Sequential Bottleneck

EP001: How Transformers Smashed the Sequential Bottleneck

EP108: GPT-5 Can Lie and Play Dumb

EP108: GPT-5 Can Lie and Play Dumb

EP109: The Rise of Agentic Reasoning

EP109: The Rise of Agentic Reasoning

EP118: The AI Memory Wall Crisis

EP118: The AI Memory Wall Crisis

EP114: FlashAttention-4 Solves Blackwell Hardware Bottlenecks

EP114: FlashAttention-4 Solves Blackwell Hardware Bottlenecks

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]