ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

SWE-Explore: Benchmark for Coding Agent Exploration

AI Research

Benchmarking

Code Generation

Coding Agents

Deep Learning

Developer Tools

LLMs

Machine Learning

Podcast

Repository Exploration

SWE-Explore

SWE-bench

Software Engineering

Автор: AI Research Roundup

Загружено: 2026-06-08

Просмотров: 26

Описание: In this AI Research Roundup episode, Alex discusses the paper: 'SWE-Explore: Benchmarking How Coding Agents Explore Repositories' Holistic benchmarks like SWE-bench often conflate exploration, bug localization, and patch generation, making it difficult to isolate why coding agents fail. To solve this, the authors introduce SWE-Explore, a new benchmark that isolates repository exploration as a ranked, line-level context-selection task. The benchmark covers 848 issues across 10 programming languages and 203 repositories, using a trajectory-grounded approach to establish ground-truth code regions. Evaluation of these explorers proves that upstream metrics like context efficiency and recall strongly track downstream patch success. Ultimately, SWE-Explore provides a fine-grained evaluation framework to understand and improve how LLM agents navigate complex codebases. Paper URL: https://arxiv.org/abs/2606.07297 #AI #MachineLearning #DeepLearning #CodingAgents #SoftwareEngineering #LLMs #SWEbench

Resources:
GitHub: https://github.com/Qiushao-E/SWE-Expl...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
SWE-Explore: Benchmark for Coding Agent Exploration

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]