ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

XGen-7B: Long Sequence Modeling with (up to) 8K Tokens. Overview, Dataset & Google Colab Code.

Автор: Venelin Valkov

Загружено: 2023-06-30

Просмотров: 2148

Описание: Are Open LLMs any good when it comes to longer texts?

In this video, we'll XGen-7B for Long Sequence Modeling, an open LLM with 7B parameters by Salesforce. With an impressive 8K input sequence length and fine-tuning on public-domain instructional data, XGen-7B promises a competition against state-of-the-art LLMs. We'll look at performance on standard NLP benchmarks, long sequence modeling tasks, and code generation.

I'll take you through the process of loading the instruction model in a Google Colab Notebook and demonstrate its capabilities through various prompts. From answering simple questions to generating code and comprehending documents. How good this model is?

Discord:   / discord  
Prepare for the Machine Learning interview: https://mlexpert.io
Subscribe: http://bit.ly/venelin-subscribe

XGen blog post: https://blog.salesforceairesearch.com...
XGen HuggingFace repository: https://huggingface.co/Salesforce/xge...

Join this channel to get access to the perks and support my work:
   / @venelin_valkov  

00:00 - Introduction
00:55 - XGen Model
04:00 - Pre-training Data
06:20 - Training Methods
08:58 - Evaluation Results
11:57 - HuggingFace Repository
12:16 - Google Colab Setup
14:55 - Prompting XGen
19:43 - Writing Jokes
21:20 - Investing Advice
22:18 - Coding
23:40 - QA over Text
26:07 - Conclusion

Image by pch-vector

#chatgpt #gpt4 #llms #artificialintelligence #promptengineering #chatbot #transformers #python #pytorch

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
XGen-7B: Long Sequence Modeling with (up to) 8K Tokens. Overview, Dataset & Google Colab Code.

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Learn Apache Airflow in 10 Minutes | High-Paying Skills for Data Engineers

Learn Apache Airflow in 10 Minutes | High-Paying Skills for Data Engineers

Китай выигрывает войну в сфере искусственного интеллекта? | Состояние ИИ в 2025 году от OpenRouter

Китай выигрывает войну в сфере искусственного интеллекта? | Состояние ИИ в 2025 году от OpenRouter

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

MuleSoft Keynote on AI, APIs, and Integration Breakthroughs | Dreamforce 2024

MuleSoft Keynote on AI, APIs, and Integration Breakthroughs | Dreamforce 2024

Ronan @Trelis Research  - Arc Prize, Getting Started with AI, Agentic Coding | The AI Builders #00

Ronan @Trelis Research - Arc Prize, Getting Started with AI, Agentic Coding | The AI Builders #00

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Тонкая настройка LLM на пользовательском наборе данных с одним графическим процессором (полное ру...

Тонкая настройка LLM на пользовательском наборе данных с одним графическим процессором (полное ру...

Exploring Limitation and Risks of LLM-based GEC for Indigenous Languages

Exploring Limitation and Risks of LLM-based GEC for Indigenous Languages

Kubernetes Simplified (The Hotel Analogy!) + Full FastAPI Deployment to Azure AKS

Kubernetes Simplified (The Hotel Analogy!) + Full FastAPI Deployment to Azure AKS

Преобразуйте любой документ в знания уровня LLM с помощью Docling и Ollama (100% локальная разраб...

Преобразуйте любой документ в знания уровня LLM с помощью Docling и Ollama (100% локальная разраб...

XGen 7B: Salesforce's 8k LLM for long sequence modeling

XGen 7B: Salesforce's 8k LLM for long sequence modeling

16 AI-инструментов, которые реально работают в 2026 (честный рейтинг)

16 AI-инструментов, которые реально работают в 2026 (честный рейтинг)

Automated Prompt Engineering with DSPy | Prompt Optimization for Financial News Semantic Analysis

Automated Prompt Engineering with DSPy | Prompt Optimization for Financial News Semantic Analysis

Расширенный алгоритм RAG-разбивки на смысловые блоки: контекстная и структурная разбивка с исполь...

Расширенный алгоритм RAG-разбивки на смысловые блоки: контекстная и структурная разбивка с исполь...

Building a summarizer using XGen-7b: Fully open source LLM by Salesforce

Building a summarizer using XGen-7b: Fully open source LLM by Salesforce

Все стратегии RAG объясняются за 13 минут (без лишних слов)

Все стратегии RAG объясняются за 13 минут (без лишних слов)

Running Gemma using HuggingFace Transformers or Ollama

Running Gemma using HuggingFace Transformers or Ollama

Лучший Гайд по Kafka для Начинающих За 1 Час

Лучший Гайд по Kafka для Начинающих За 1 Час

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Feed Your OWN Documents to a Local Large Language Model!

Feed Your OWN Documents to a Local Large Language Model!

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]