REALM: Retrieval-Augmented Language Model Pre-Training (Research Paper Walkthrough)

Автор: TechViz - The Data Science Guy

Загружено: 2021-06-06

Просмотров: 1463

Описание: #languagemodel #realm #nlproc
⏩ Abstract: Language model pre-training has been shown to capture a surprising amount of world knowledge, crucial for NLP tasks such as question answering. However, this knowledge is stored implicitly in the parameters of a neural network, requiring ever-larger networks to cover more facts. To capture knowledge in a more modular and interpretable way, we augment language model pre-training with a latent knowledge retriever, which allows the model to retrieve and attend over documents from a large corpus such as Wikipedia, used during pre-training, fine-tuning and inference. For the first time, we show how to pre-train such a knowledge retriever in an unsupervised manner, using masked language modeling as the learning signal and backpropagating through a retrieval step that considers millions of documents. We demonstrate the effectiveness of Retrieval-Augmented Language Model pre-training (REALM) by fine-tuning on the challenging task of Open-domain Question Answering (Open-QA). We compare against state-of-the-art models for both explicit and implicit knowledge storage on three popular Open-QA benchmarks, and find that we outperform all previous methods by a significant margin (4-16% absolute accuracy), while also providing qualitative benefits such as interpretability and modularity.

Please feel free to share out the content and subscribe to my channel :)
⏩ Subscribe -    / @techvizthedatascienceguy

⏩ OUTLINE:
0:00 - Background and Overview of REALM
04:07 - REALM's generative process
04:55 - Knowledge Retriever
07:02 - Knowledge-Augmented Encoder
09:07 - Understanding Pre-training and Fine-tuning Pictorially
10:44 - Training Challenges
12:03 - Maximum Inner Product Search (MIPS) working
14:07 - What does the retriever learn?
15:38 - Salient Span Masking
16:34 - Null Document
17:01 - Prohibiting trivial retrievals
17:48 - Initialization and Inverse Cloze Task

⏩ Paper Title: REALM: Retrieval-Augmented Language Model Pre-Training
⏩ Paper: https://arxiv.org/abs/2002.08909
⏩ Author: Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang
⏩ Organisation: Google Research

Research Paper Summaries:    • Simple Unsupervised Keyphrase Extraction u...
Text Summarization Papers Playlist:    • Text Summarization of COVID-19 Medical Art...
Evaluating Text Generation Systems Playlist:    • Evaluation of Text Generation: A Survey | ...

*********************************************
If you want to support me financially which totally optional and voluntary ❤️
You can consider buying me chai ( because i don't drink coffee :) ) at https://www.buymeacoffee.com/TechvizC...

*********************************************
⏩ Youtube -    / techvizthedatascienceguy
⏩ LinkedIn -   / prakhar21
⏩ Medium -   / prakhar.mishra
⏩ GitHub - https://github.com/prakhar21
⏩ Twitter -   / rattller
*********************************************

Tools I use for making videos :)
⏩ iPad - https://tinyurl.com/y39p6pwc
⏩ Apple Pencil - https://tinyurl.com/y5rk8txn
⏩ GoodNotes - https://tinyurl.com/y627cfsa

#techviz #datascienceguy #naturllanguageprocessing #opendomain_qa #researchpaper #arxiv
About Me:
I am Prakhar Mishra and this channel is my passion project. I am currently pursuing my MS (by research) in Data Science. I have an industry work-ex of 3 years in the field of Data Science and Machine Learning with a particular focus on Natural Language Processing (NLP).

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

REALM: Retrieval-Augmented Language Model Pre-Training (Research Paper Walkthrough)

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

RAPTOR: Рекурсивная абстрактная обработка для поиска в древовидной структуре (краткое содержание ...

RAPTOR: Рекурсивная абстрактная обработка для поиска в древовидной структуре (краткое содержание ...

REALM: Retrieval-Augmented Language Model Pre-Training (Paper Explained)

REALM: Retrieval-Augmented Language Model Pre-Training (Paper Explained)

Объяснение BERT: обучение, вывод, BERT против GPT/LLamA, тонкая настройка, токен [CLS]

Объяснение BERT: обучение, вывод, BERT против GPT/LLamA, тонкая настройка, токен [CLS]

Объяснение статьи QLoRA (Эффективная тонкая настройка квантованных LLM)

Объяснение статьи QLoRA (Эффективная тонкая настройка квантованных LLM)

T5: Exploring Limits of Transfer Learning with Text-to-Text Transformer (Research Paper Walkthrough)

T5: Exploring Limits of Transfer Learning with Text-to-Text Transformer (Research Paper Walkthrough)

Tree of Thoughts: Deliberate Problem Solving with Large Language Models (Full Paper Review)

Tree of Thoughts: Deliberate Problem Solving with Large Language Models (Full Paper Review)

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Supervised Contrastive Learning

Supervised Contrastive Learning

Что такое стек ИИ? Магистратура LLM, RAG и аппаратное обеспечение ИИ

Что такое стек ИИ? Магистратура LLM, RAG и аппаратное обеспечение ИИ

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Может ли у ИИ появиться сознание? — Семихатов, Анохин

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

REALM: Retrieval-Augmented Language Model Pre-Training | NLP Journal Club

REALM: Retrieval-Augmented Language Model Pre-Training | NLP Journal Club

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Трансформеры и самовосприятие (DL 19)

Трансформеры и самовосприятие (DL 19)

Google Gemini — это новая Siri. Что это значит для владельцев техники Apple? Техно новости недели

Google Gemini — это новая Siri. Что это значит для владельцев техники Apple? Техно новости недели

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

NotebookLM: большой разбор инструмента (12 сценариев применения)

NotebookLM: большой разбор инструмента (12 сценариев применения)

REALM: Retrieval-Augmented Language Model Pre-Training

REALM: Retrieval-Augmented Language Model Pre-Training