Microsoft Fara-7B: агент «Computer Use», работающий на вашем ноутбуке
Автор: AI TL;DR
Загружено: 2025-11-25
Просмотров: 487
Описание:
Microsoft только что прекратила разработку Fara-7B — миниатюрной модели с 7 миллиардами параметров, которая может управлять вашей мышью и клавиатурой, автоматизируя реальную работу. В отличие от ChatGPT, который просто даёт советы, Fara-7B фактически выполняет задачу — нажимает кнопки, прокручивает страницы и заполняет формы. Мы подробно рассмотрим архитектуру «Pixel-In, Action-Out», которая позволяет Fara-7B «видеть» ваш экран и предсказывать координаты мыши с человеческой точностью, работая локально на вашем устройстве для полной конфиденциальности.
Ключевые выводы:
Навигация по пикселям: почему Fara-7B игнорирует сложный HTML-код и учится «видеть» элементы пользовательского интерфейса (кнопки, строки поиска) так же, как человек.
Бенчмарк «Action»: Визуализация того, как эта модель 7B превосходит агентов на основе GPT-4o в таких бенчмарках, как WebVoyager, благодаря своей специальной разработке для взаимодействия с пользовательским интерфейсом.
Конфиденциальность на устройстве: Огромное преимущество локального запуска агента «Computer Use» — ваши снимки экрана и данные никогда не попадают на облачный сервер.
FaraGen Pipeline: Как Microsoft сгенерировала 145 000 синтетических «идеальных» веб-взаимодействий, чтобы обучить эту модель экспертному навигатору.
Убийца задержек: Почему локальный вывод делает рабочие процессы «Agent» быстрыми, а не медленными.
Хештеги:
#MicrosoftAI #Fara7B #ComputerUse #AIAgents #EdgeAI #LocalLLM #MagenticOne #Automation #FutureOfWork #TechNews
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: