RAG выдает куски! Новый стандарт jMRI сохраняет токены!

Автор: J. Gravelle

Загружено: 2026-03-10

Просмотров: 1415

Описание: Предполагается, что агенты ИИ должны быть интеллектуальными помощниками.

Но на самом деле большинство из них тратят огромное количество токенов на чтение целых файлов, чтобы найти лишь небольшой фрагмент информации.

Это скрытая проблема многих современных инструментов ИИ:
«копание токенов в мусорных контейнерах».

Вместо того чтобы извлекать именно ту функцию или раздел документации, которые им нужны, агенты сканируют огромные файлы кода и длинные страницы документации, заполняя контекстное окно нерелевантными данными и увеличивая затраты на API.

В этом видео мы представляем jMRI (jMunch Retrieval Interface) — открытый стандарт извлечения данных для MCP-серверов, разработанный для устранения этой неэффективности.

Вместо того чтобы перебирать файлы методом перебора, jMRI позволяет агентам:

• обнаруживать индексированные источники знаний
• искать релевантные символы или разделы документации
• извлекать точную единицу знаний по ID
• измерять экономию токенов в каждом ответе

Эта архитектура уже доказала свою эффективность в реальном мире благодаря jCodeMunch и jDocMunch, которые вместе сэкономили миллиарды токенов в ходе сессий разработчиков.

СПЕЦИФИКАЦИЯ

В тестах на реальных кодовых базах, таких как FastAPI, поиск с помощью jMRI сократил количество запросов с ~950 000 токенов до всего лишь ~480 токенов, достигнув при этом более высокой точности, чем системы RAG на основе фрагментов.

блог-пост

Вместо того чтобы рассматривать файлы как единицу знаний, jMRI извлекает структурированные семантические единицы, такие как функции, классы и разделы документации.

Это означает:

• более быстрые агенты ИИ
• значительно более низкие затраты на API
• более высокая точность поиска
• гораздо больше полезных контекстных окон

Вывод прост:

Не платите своим агентам за чтение.

Платите им за знания.

🔗 Ресурсы

Спецификация поиска jMRI
https://github.com/jgravelle/mcp-retr...

JCodeMunch MCP
https://github.com/jgravelle/jcodemun...

JDocMunch MCP
https://github.com/jgravelle/jdocmunc...

Установка jCodeMunch
uvx jcodemunch-mcp

Установка jDocMunch
uvx jdocmunch-mcp

🧠 Что вы узнаете

• Почему большинство агентов ИИ тратят токены впустую
• Почему RAG на основе фрагментов нарушает семантическую структуру
• Архитектура точного поиска
• Как jMRI стандартизирует серверы поиска MCP
• Как измеряется экономия токенов с помощью телеметрии _meta
• Почему структурированный поиск превосходит перебор файлов

⏱ Разделы

0:00 Маленький грязный секрет агентов ИИ
0:35 Сэкономлены миллиарды токенов
0:55 Почему наивное чтение файлов тратит токены
1:20 Несоответствие между файлами и единицами знаний
1:47 jCodeMunch и jDocMunch
2:30 Реализация jMRI
3:00 Почему важен стандарт поиска
3:23 Четыре операции jMRI
3:50 Телеметрия экономии токенов _meta
4:15 Почему RAG с блоками не работает
4:40 Результаты бенчмарка
5:19 Преимущества для независимых разработчиков
5:36 Преимущества для предприятий
6:05 Создание экосистемы поиска
6:40 Будущее точного поиска

RAG, генерация с дополненной реальностью для поиска, руководство по RAG, альтернативы RAG, архитектура поиска ИИ, интерфейс поиска jMRI, оптимизация токенов ИИ, эффективность токенов LLM, агенты ИИ, агенты кодирования ИИ, Код Клода, серверы MCP, протокол контекста модели, инструменты разработчика ИИ, инфраструктура ИИ, оптимизация стоимости LLM, оптимизация контекстного окна, проблемы RAG для фрагментов, семантический поиск в ИИ, проектирование контекста в ИИ, инструменты программирования ИИ, рабочий процесс разработчика ИИ, методы повышения эффективности ИИ, архитектура LLM, системы поиска в ИИ, альтернативы векторным базам данных, инструменты помощника кодирования в ИИ, jCodeMunch MCP, jDocMunch MCP, открытый стандарт поиска

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

RAG выдает куски! Новый стандарт jMRI сохраняет токены!

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Как я на самом деле использую Opencode, будучи старшим инженером.

Как я на самом деле использую Opencode, будучи старшим инженером.

Дайте мне 15 минут и я сделаю вас опасно уверенным в себе

Дайте мне 15 минут и я сделаю вас опасно уверенным в себе

Evolution of Digital Marketing (From Banner Ads To Ai)

Evolution of Digital Marketing (From Banner Ads To Ai)

Your Local LLM Is 3x Slower Than It Should Be

Your Local LLM Is 3x Slower Than It Should Be

MCP vs API: Simplifying AI Agent Integration with External Data

MCP vs API: Simplifying AI Agent Integration with External Data

3 reasons sandboxing won't secure your AI agent

3 reasons sandboxing won't secure your AI agent

The RAM War — And the Winners No One Expected

The RAM War — And the Winners No One Expected

Я соврал о том, что копил токены ИИ Клода… и большинство людей к этому относятся спокойно!

Я соврал о том, что копил токены ИИ Клода… и большинство людей к этому относятся спокойно!

Прекратите исправлять свои навыки работы с Клодом. Автоматический поиск сделает это за вас.

Прекратите исправлять свои навыки работы с Клодом. Автоматический поиск сделает это за вас.

НУЛЕВАЯ ТЕРПИМОСТЬ: Израиль провёл ликвидации в Иране

НУЛЕВАЯ ТЕРПИМОСТЬ: Израиль провёл ликвидации в Иране

Кодекс Клода + Автоисследования Карпати = Новая Мета

Кодекс Клода + Автоисследования Карпати = Новая Мета

NVIDIA объявляет о прекращении поддержки OpenClaw (NemoClaw).

NVIDIA объявляет о прекращении поддержки OpenClaw (NemoClaw).

Романенко провёл на станции 326 дней — и сказал врачам то, что они запретили записывать

Романенко провёл на станции 326 дней — и сказал врачам то, что они запретили записывать

С помощью jCodeMunch MCP удалось сэкономить 71 миллиард токенов Claude!

С помощью jCodeMunch MCP удалось сэкономить 71 миллиард токенов Claude!

7 new open source AI tools you need right now…

7 new open source AI tools you need right now…

Что на самом деле происходит с ИИ: мнение эксперта | TheStandup

Что на самом деле происходит с ИИ: мнение эксперта | TheStandup

Огромные контекстные окна — это обман! jCodeMunch сохраняет до 99,7% ваших токенов!

Огромные контекстные окна — это обман! jCodeMunch сохраняет до 99,7% ваших токенов!

Prompt Engineering is dead.

Prompt Engineering is dead.

Don't learn AI Agents without Learning these Fundamentals

Don't learn AI Agents without Learning these Fundamentals

I Ran Claude Code for FREE… Here's How

I Ran Claude Code for FREE… Here's How