ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Self-improving агент: кэш, SWE-bench и первые реальные результаты

Автор: Greg's Journal

Загружено: 2026-03-06

Просмотров: 8

Описание: Во втором выпуске серии продолжаем строить self-improving AI агент: прогоняем каждую из 6 стадий научного цикла в изоляции и добавляем оператор Store — кэширование промежуточных результатов, чтобы не тратить время и деньги на повторные вызовы LLM. Агент самостоятельно выдвинул гипотезу о «focus hints» — собирать список ключевых файлов репозитория перед генерацией патча — и применил улучшение к своему собственному коду. Запускаем обновлённый агент на SWE-bench: три задачи из AstroPy, три патча, ноль успешно применённых — и это хороший повод задуматься, насколько реалистичен полностью автономный режим без человека в цикле.

Моя книга о разработке надёжных Android-приложений доступна для бесплатного скачивания: https://archive.org/details/quality-a...

#AIагенты #SWEbench #самообучение #LLM #FunctionalAI #AgenticAI #кэширование #программирование #OpenAI #SoftwareEngineering

---

In episode two of the self-improving AI agent series, we pick up right where we left off: running each of the 6 scientific-loop stages in isolation and wiring in a Store operator to cache intermediate results — no more paying twice for the same LLM call. The agent independently hypothesized that pre-collecting "focus hints" (key files in the repo relevant to the issue) would improve patch quality, then rewrote its own forward function to implement it. We run the updated agent on SWE-bench — three AstroPy problems, three patches generated, zero successfully applied — which raises a real question: is fully autonomous self-improvement realistic yet, or does the loop need a human in it?

My book on building reliable Android applications at scale is available for free download: https://archive.org/details/quality-a...

#AIAgents #SelfImprovingAI #SWEbench #AgenticAI #LLM #FunctionalProgramming #Caching #SoftwareEngineering #MachineLearning #OpenAI

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Self-improving агент: кэш, SWE-bench и первые реальные результаты

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

6 лет тачка выносила мозг! А причина оказалась банальной...

6 лет тачка выносила мозг! А причина оказалась банальной...

ChatGPT против Gemini – решающее противостояние в мире искусственного интеллекта.

ChatGPT против Gemini – решающее противостояние в мире искусственного интеллекта.

Террорист Дуров, Anthropic против Пентагона и лучший мессенджер без цензуры | 2Weekly #45

Террорист Дуров, Anthropic против Пентагона и лучший мессенджер без цензуры | 2Weekly #45

Пишу агента, который улучшает сам себя — живой эксперимент

Пишу агента, который улучшает сам себя — живой эксперимент

Арестович & Латынина: Украина против всех.

Арестович & Латынина: Украина против всех.

Мир меняется БЫСТРЕЕ, чем мы думаем. Что нас ждет в ближайшие 10 лет? Маргулан Сейсембаев

Мир меняется БЫСТРЕЕ, чем мы думаем. Что нас ждет в ближайшие 10 лет? Маргулан Сейсембаев

Ричард Фейнман: Почему невозможно вернуться на Землю с Марса

Ричард Фейнман: Почему невозможно вернуться на Землю с Марса

Ормузский пролив закрыт — цены на нефть спасут Путина?

Ормузский пролив закрыт — цены на нефть спасут Путина?

Массовые задержания в Москве. Спектакль для Путина на 8 марта. Иран и нефть. Удар по Крыму | ВОЗДУХ

Массовые задержания в Москве. Спектакль для Путина на 8 марта. Иран и нефть. Удар по Крыму | ВОЗДУХ

Михаил Врубель: Все его демоны / Истории кумиров / МИНАЕВ

Михаил Врубель: Все его демоны / Истории кумиров / МИНАЕВ

Безопасность AI или контроль? Что происходит внутри крупнейших AI-компаний

Безопасность AI или контроль? Что происходит внутри крупнейших AI-компаний

Как Илон Маск построит город на Марсе 🚀: Внутри главного плана выживания SpaceX

Как Илон Маск построит город на Марсе 🚀: Внутри главного плана выживания SpaceX

Qualifying Highlights | 2026 Australian Grand Prix

Qualifying Highlights | 2026 Australian Grand Prix

Почему война в Иране “плохая новость” для Путина. И сценарии войны в Украине от Александра Морозова

Почему война в Иране “плохая новость” для Путина. И сценарии войны в Украине от Александра Морозова

500 часов провёл в Claude Code. Вот 6 функций о которых никто не говорит

500 часов провёл в Claude Code. Вот 6 функций о которых никто не говорит

Почему свои IT-продукты выгоднее, чем работа в найме / Диалоги на кухне #4

Почему свои IT-продукты выгоднее, чем работа в найме / Диалоги на кухне #4

#4 Глубокое понимание LLM: Архитектура трансформеров на пальцах | LLM: Прямой эфир через restream.su

#4 Глубокое понимание LLM: Архитектура трансформеров на пальцах | LLM: Прямой эфир через restream.su

Кто остановит бандитов в Американских домах? Один Дома в Концерте

Кто остановит бандитов в Американских домах? Один Дома в Концерте

⚡️ГАЛЛЯМОВ: Срочно! ПЕРВАЯ РЕАКЦИЯ Ирана на атаку Азербайджана. БРЕД и УГРОЗЫ: Путин теряет КОНТРОЛЬ

⚡️ГАЛЛЯМОВ: Срочно! ПЕРВАЯ РЕАКЦИЯ Ирана на атаку Азербайджана. БРЕД и УГРОЗЫ: Путин теряет КОНТРОЛЬ

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]