GPT-5.5 против Opus 4.7: OpenAI наконец-то сократила разрыв.
Автор: Matt Maher
Загружено: 2026-04-28
Просмотров: 11079
Описание:
В ходе моего теста планирования GPT-5.5 достиг того же практического предела, что и Opus 4.7. Именно тогда я перестал относиться к нему как к очередной заметке о релизе.
Настоящий вопрос возник после оценки: смогу ли я с ним действительно работать?
Я тестировал GPT-5.5 на задачах, требующих решения сложных, многоэтапных задач, которые я обычно выполняю с помощью Opus: планирование на основе подробных требований, структура сценария, синтез повествования, длительные рабочие процессы с участием агентов, а также странная задача по созданию слайд-шоу в стиле эпохи Возрождения/Просвещения на основе отчета о глубоком исследовании.
Результат теста был важен, потому что он доказал, что GPT-5.5 способен сохранять замысел до его реализации. Но более интересной была его повседневная работа: как он передает информацию, какой контекст содержит, где ему все еще нужны более сильные глаголы и почему изменения по сравнению с GPT-5.4 или Opus больше, чем может показать график.
Это особенно актуально, если вы работаете с Codex, Claude Code, моделями OpenAI, Claude Opus, инструментами программирования ИИ, планировочными процессами или любой другой творческой/технической системой, в которой большое количество моделей играет важную роль, и вопрос заключается не просто в том, «какая модель показала лучшие результаты?», а в том, «какой модели я действительно могу доверить работу?».
Ссылки:
Определение эталонного теста планирования: https://github.com/bladnman/planning_...
Результаты/панель мониторинга эталонного теста планирования: https://github.com/bladnman/planning_...
Оценщик/каталог эталонного теста планирования: https://github.com/bladnman/planning_...
Релиз GPT-5.5: https://openai.com/index/introducing-...
Цены на API OpenAI: https://openai.com/api/pricing/
Claude Opus 4.7: https://www.anthropic.com/news/claude...
#GPT55 #OpenAI #Claude #AICoding #AIWorkflow
00:00 - Вступление
01:05 - Примечания к релизу
02:21 - Сравнительный анализ
03:11 - Результаты сравнительного анализа
05:21 - Больше, чем просто оценка
08:07 - Создание повествования
09:34 - Слайды
12:56 - Написание сценария?
14:09 - Настольные компьютеры!
14:38 - Это требует времени
15:35 - Заключение
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: