Учебное пособие по AWS Bedrock: RAG с использованием OpenSearch и Titan Embeddings
Автор: Analytics Vidhya
Загружено: 2026-03-12
Просмотров: 45
Описание:
Описание
В этой части нашей серии GenAI мы подробно рассмотрим ядро конвейера RAG: базы знаний AWS Bedrock.
Вы узнаете, как автоматизировать сложную работу по генерации данных с дополненной реальностью (Retrieval-Augmented Generation, RAG), подключив Amazon S3 к векторной базе данных без написания сложных скриптов для загрузки данных.
В этом видео мы рассмотрим:
Создание базы знаний: настройка Bedrock в регионе Мумбаи (ap-south-1).
Загрузка данных: подключение корзин S3 и настройка стратегий парсинга.
Логика разбиения на фрагменты: как разбить документы на фрагменты по 300 токенов для оптимального поиска.
Настройка векторной базы данных: автоматическое выделение ресурсов Amazon OpenSearch Serverless.
Встраивание Titan v2: использование новейших моделей встраивания Amazon для преобразования текста в числовые форматы.
Процесс синхронизации: взгляд изнутри на то, как Bedrock анализирует, разбивает на фрагменты и хранит данные.
Интеграция приложений: поиск и использование идентификатора вашей базы знаний в файле .env.
Эта настройка упрощает весь процесс RAG, обрабатывая все, от хранения документов до поиска похожих элементов, в фоновом режиме.
🛠 Технологический стек:
Amazon Bedrock
Amazon OpenSearch Serverless
Amazon Titan Text Embeddings v2
Amazon S3
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: