RAG выдает куски! Новый стандарт jMRI сохраняет токены!
Автор: J. Gravelle
Загружено: 2026-03-10
Просмотров: 1415
Описание:
Предполагается, что агенты ИИ должны быть интеллектуальными помощниками.
Но на самом деле большинство из них тратят огромное количество токенов на чтение целых файлов, чтобы найти лишь небольшой фрагмент информации.
Это скрытая проблема многих современных инструментов ИИ:
«копание токенов в мусорных контейнерах».
Вместо того чтобы извлекать именно ту функцию или раздел документации, которые им нужны, агенты сканируют огромные файлы кода и длинные страницы документации, заполняя контекстное окно нерелевантными данными и увеличивая затраты на API.
В этом видео мы представляем jMRI (jMunch Retrieval Interface) — открытый стандарт извлечения данных для MCP-серверов, разработанный для устранения этой неэффективности.
Вместо того чтобы перебирать файлы методом перебора, jMRI позволяет агентам:
• обнаруживать индексированные источники знаний
• искать релевантные символы или разделы документации
• извлекать точную единицу знаний по ID
• измерять экономию токенов в каждом ответе
Эта архитектура уже доказала свою эффективность в реальном мире благодаря jCodeMunch и jDocMunch, которые вместе сэкономили миллиарды токенов в ходе сессий разработчиков.
СПЕЦИФИКАЦИЯ
В тестах на реальных кодовых базах, таких как FastAPI, поиск с помощью jMRI сократил количество запросов с ~950 000 токенов до всего лишь ~480 токенов, достигнув при этом более высокой точности, чем системы RAG на основе фрагментов.
блог-пост
Вместо того чтобы рассматривать файлы как единицу знаний, jMRI извлекает структурированные семантические единицы, такие как функции, классы и разделы документации.
Это означает:
• более быстрые агенты ИИ
• значительно более низкие затраты на API
• более высокая точность поиска
• гораздо больше полезных контекстных окон
Вывод прост:
Не платите своим агентам за чтение.
Платите им за знания.
🔗 Ресурсы
Спецификация поиска jMRI
https://github.com/jgravelle/mcp-retr...
JCodeMunch MCP
https://github.com/jgravelle/jcodemun...
JDocMunch MCP
https://github.com/jgravelle/jdocmunc...
Установка jCodeMunch
uvx jcodemunch-mcp
Установка jDocMunch
uvx jdocmunch-mcp
🧠 Что вы узнаете
• Почему большинство агентов ИИ тратят токены впустую
• Почему RAG на основе фрагментов нарушает семантическую структуру
• Архитектура точного поиска
• Как jMRI стандартизирует серверы поиска MCP
• Как измеряется экономия токенов с помощью телеметрии _meta
• Почему структурированный поиск превосходит перебор файлов
⏱ Разделы
0:00 Маленький грязный секрет агентов ИИ
0:35 Сэкономлены миллиарды токенов
0:55 Почему наивное чтение файлов тратит токены
1:20 Несоответствие между файлами и единицами знаний
1:47 jCodeMunch и jDocMunch
2:30 Реализация jMRI
3:00 Почему важен стандарт поиска
3:23 Четыре операции jMRI
3:50 Телеметрия экономии токенов _meta
4:15 Почему RAG с блоками не работает
4:40 Результаты бенчмарка
5:19 Преимущества для независимых разработчиков
5:36 Преимущества для предприятий
6:05 Создание экосистемы поиска
6:40 Будущее точного поиска
RAG, генерация с дополненной реальностью для поиска, руководство по RAG, альтернативы RAG, архитектура поиска ИИ, интерфейс поиска jMRI, оптимизация токенов ИИ, эффективность токенов LLM, агенты ИИ, агенты кодирования ИИ, Код Клода, серверы MCP, протокол контекста модели, инструменты разработчика ИИ, инфраструктура ИИ, оптимизация стоимости LLM, оптимизация контекстного окна, проблемы RAG для фрагментов, семантический поиск в ИИ, проектирование контекста в ИИ, инструменты программирования ИИ, рабочий процесс разработчика ИИ, методы повышения эффективности ИИ, архитектура LLM, системы поиска в ИИ, альтернативы векторным базам данных, инструменты помощника кодирования в ИИ, jCodeMunch MCP, jDocMunch MCP, открытый стандарт поиска
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: