ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

REALM: Retrieval-Augmented Language Model Pre-Training (Research Paper Walkthrough)

Автор: TechViz - The Data Science Guy

Загружено: 2021-06-06

Просмотров: 1463

Описание: #languagemodel #realm #nlproc
⏩ Abstract: Language model pre-training has been shown to capture a surprising amount of world knowledge, crucial for NLP tasks such as question answering. However, this knowledge is stored implicitly in the parameters of a neural network, requiring ever-larger networks to cover more facts. To capture knowledge in a more modular and interpretable way, we augment language model pre-training with a latent knowledge retriever, which allows the model to retrieve and attend over documents from a large corpus such as Wikipedia, used during pre-training, fine-tuning and inference. For the first time, we show how to pre-train such a knowledge retriever in an unsupervised manner, using masked language modeling as the learning signal and backpropagating through a retrieval step that considers millions of documents. We demonstrate the effectiveness of Retrieval-Augmented Language Model pre-training (REALM) by fine-tuning on the challenging task of Open-domain Question Answering (Open-QA). We compare against state-of-the-art models for both explicit and implicit knowledge storage on three popular Open-QA benchmarks, and find that we outperform all previous methods by a significant margin (4-16% absolute accuracy), while also providing qualitative benefits such as interpretability and modularity.

Please feel free to share out the content and subscribe to my channel :)
⏩ Subscribe -    / @techvizthedatascienceguy  

⏩ OUTLINE:
0:00 - Background and Overview of REALM
04:07 - REALM's generative process
04:55 - Knowledge Retriever
07:02 - Knowledge-Augmented Encoder
09:07 - Understanding Pre-training and Fine-tuning Pictorially
10:44 - Training Challenges
12:03 - Maximum Inner Product Search (MIPS) working
14:07 - What does the retriever learn?
15:38 - Salient Span Masking
16:34 - Null Document
17:01 - Prohibiting trivial retrievals
17:48 - Initialization and Inverse Cloze Task

⏩ Paper Title: REALM: Retrieval-Augmented Language Model Pre-Training
⏩ Paper: https://arxiv.org/abs/2002.08909
⏩ Author: Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang
⏩ Organisation: Google Research

Research Paper Summaries:    • Simple Unsupervised Keyphrase Extraction u...  
Text Summarization Papers Playlist:    • Text Summarization of COVID-19 Medical Art...  
Evaluating Text Generation Systems Playlist:    • Evaluation of Text Generation: A Survey | ...  

*********************************************
If you want to support me financially which totally optional and voluntary ❤️
You can consider buying me chai ( because i don't drink coffee :) ) at https://www.buymeacoffee.com/TechvizC...

*********************************************
⏩ Youtube -    / techvizthedatascienceguy  
⏩ LinkedIn -   / prakhar21  
⏩ Medium -   / prakhar.mishra  
⏩ GitHub - https://github.com/prakhar21
⏩ Twitter -   / rattller  
*********************************************

Tools I use for making videos :)
⏩ iPad - https://tinyurl.com/y39p6pwc
⏩ Apple Pencil - https://tinyurl.com/y5rk8txn
⏩ GoodNotes - https://tinyurl.com/y627cfsa

#techviz #datascienceguy #naturllanguageprocessing #opendomain_qa #researchpaper #arxiv
About Me:
I am Prakhar Mishra and this channel is my passion project. I am currently pursuing my MS (by research) in Data Science. I have an industry work-ex of 3 years in the field of Data Science and Machine Learning with a particular focus on Natural Language Processing (NLP).

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
REALM: Retrieval-Augmented Language Model Pre-Training (Research Paper Walkthrough)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

RAPTOR: Рекурсивная абстрактная обработка для поиска в древовидной структуре (краткое содержание ...

RAPTOR: Рекурсивная абстрактная обработка для поиска в древовидной структуре (краткое содержание ...

REALM: Retrieval-Augmented Language Model Pre-Training (Paper Explained)

REALM: Retrieval-Augmented Language Model Pre-Training (Paper Explained)

Объяснение BERT: обучение, вывод, BERT против GPT/LLamA, тонкая настройка, токен [CLS]

Объяснение BERT: обучение, вывод, BERT против GPT/LLamA, тонкая настройка, токен [CLS]

Объяснение статьи QLoRA (Эффективная тонкая настройка квантованных LLM)

Объяснение статьи QLoRA (Эффективная тонкая настройка квантованных LLM)

T5: Exploring Limits of Transfer Learning with Text-to-Text Transformer (Research Paper Walkthrough)

T5: Exploring Limits of Transfer Learning with Text-to-Text Transformer (Research Paper Walkthrough)

Tree of Thoughts: Deliberate Problem Solving with Large Language Models (Full Paper Review)

Tree of Thoughts: Deliberate Problem Solving with Large Language Models (Full Paper Review)

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Supervised Contrastive Learning

Supervised Contrastive Learning

Что такое стек ИИ? Магистратура LLM, RAG и аппаратное обеспечение ИИ

Что такое стек ИИ? Магистратура LLM, RAG и аппаратное обеспечение ИИ

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Может ли у ИИ появиться сознание? — Семихатов, Анохин

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

REALM: Retrieval-Augmented Language Model Pre-Training | NLP Journal Club

REALM: Retrieval-Augmented Language Model Pre-Training | NLP Journal Club

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Трансформеры и самовосприятие (DL 19)

Трансформеры и самовосприятие (DL 19)

Google Gemini — это новая Siri. Что это значит для владельцев техники Apple? Техно новости недели

Google Gemini — это новая Siri. Что это значит для владельцев техники Apple? Техно новости недели

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

NotebookLM: большой разбор инструмента (12 сценариев применения)

NotebookLM: большой разбор инструмента (12 сценариев применения)

REALM: Retrieval-Augmented Language Model Pre-Training

REALM: Retrieval-Augmented Language Model Pre-Training

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]