GPT-5.5 вышел: OpenAI снова возглавляет гонку frontier-моделей
Каждый, кто хоть раз составлял квартальный бюджет на LLM, знает это чувство тревоги, когда вендор выпускает «более умную» модель по двойной цене через две недели после согласования мощностей. Именно в такой ситуации оказались многие руководители платформенных команд на этой неделе. OpenAI выпустил GPT-5.5, внутри компании получивший кодовое имя «Spud», и соотношение цены и производительности для AI-интенсивных рабочих нагрузок было пересмотрено.
Что произошло
23 апреля 2026 года OpenAI представил GPT-5.5, как сообщил VentureBeat, в двух вариантах: стандартный GPT-5.5 и GPT-5.5 Pro, ориентированный на юридические исследования, анализ данных и продвинутую бизнес-аналитику. Амелия Глиз, вице-президент по исследованиям OpenAI, заявила журналистам, что это «определённо наша самая сильная модель в области программирования», основываясь на бенчмарках и отзывах партнёров.
Грег Брокман, сооснователь и президент OpenAI, выстроил запуск вокруг концепции автономности. «Особенность этой модели в том, насколько больше она может сделать с меньшим количеством указаний», — сказал он. «Она может взглянуть на неясную задачу и понять, что нужно сделать дальше». Брокман добавил, что модель «исключительно хороша в программировании» и сильна в «более широкой компьютерной работе, управлении компьютером, научных исследованиях».
Сэм Альтман дополнил это публикацией о философии бренда в X: «Мы хотим, чтобы наши пользователи имели доступ к лучшим технологиям и чтобы у каждого были равные возможности».
Загвоздка — в дистрибуции. GPT-5.5 доступен подписчикам ChatGPT Plus за $20 в месяц, ChatGPT Pro за $100–$200 в месяц, а также на тарифах Business и Enterprise. GPT-5.5 Pro доступен начиная с уровня Pro и выше. Доступ к API для обоих вариантов пока недоступен. OpenAI заявляет, что он появится «очень скоро», добавив, что «развёртывание через API требует других защитных мер, и мы тесно сотрудничаем с партнёрами и клиентами по вопросам безопасности для обслуживания в масштабе».
Релиз вышел ровно через неделю после того, как Anthropic выпустил Claude Opus 4.7. Гонка на переднем крае сократилась до вопроса недель, а не кварталов.
Техническая анатомия
Инженерная история за маркетингом интереснее, чем просто таблица бенчмарков. GPT-5.5 работает на системах NVIDIA GB200 и GB300 NVL72. OpenAI использовал специальные эвристические алгоритмы, написанные самим AI, для разделения и балансировки нагрузки между ядрами GPU. Скорость генерации токенов выросла более чем на 20%, а задержка на токен соответствует GPT-5.4. Это нетривиальный результат. Более крупные модели почти всегда платят за возможности задержкой. Эта — нет.
Для старших backend-инженеров ключевой цифрой является именно это 20%-ное увеличение пропускной способности, а не показатели бенчмарков. При рабочей нагрузке с расходом $500 тыс. в квартал на инференс такая пропускная способность — это разница между выделением новых мощностей и пережиданием пиков с имеющимися ресурсами. Это примерно бюджет двух инженеров в команде из 10 человек, возвращённый за счёт оптимизации, а не сокращения штата.
По возможностям картина смешанная, но реальная. GPT-5.5 набрал 82,7% на Terminal-Bench 2.0, обогнав Claude Opus 4.7 с 69,4%, Gemini 3.1 Pro с 68,5% и незначительно превзойдя ещё не выпущенный Claude Mythos Preview с 82,0%. На GDPval GPT-5.5 показал 84,9% побед или ничьих против 80,3% у Opus 4.7 и 67,3% у Gemini 3.1 Pro. ARC-AGI-2 Verified: 85,0% против 75,8% и 77,1%. FrontierMath Tier 4: 35,4% против 22,9% и 16,7%.
Это не безоговорочная победа. На SWE-bench Pro Public лидирует Opus 4.7 с 64,3% против 58,6% у GPT-5.5, а закрытый Claude Mythos Preview показывает 77,8%. На Humanity's Last Exam без инструментов GPT-5.5 Pro набрал 43,1% против 46,9% у Opus 4.7 и 56,8% у Mythos Preview. BrowseComp достаётся Mythos с 86,9%, Gemini 3.1 Pro с 85,9% опережает GPT-5.5 с 84,4%.
Отдельно стоит упомянуть Expert-SWE — внутренний бенчмарк OpenAI для долгосрочного программирования со средним временем выполнения человеком 20 часов. GPT-5.5 набрал 73,1% и превзошёл GPT-5.4, используя значительно меньше токенов. Вот что важно для агентных нагрузок: лучшие результаты, меньше токенов, та же задержка.
Кто пострадает
Наиболее уязвимая группа — все, кто выстраивал дорожную карту в расчёте на устойчивое семидневное преимущество Anthropic. Opus 4.7 был публичным лидером ровно одну неделю. Команды, подтвердившие планы миграции в прошлую пятницу, теперь объясняют своему CTO, почему сравнительная таблица уже устарела.
Вторая уязвимая группа — сторонние разработчики, ожидающие API. «Очень скоро» несёт большую смысловую нагрузку в блог-посте OpenAI. Судя по производственным инцидентам во время предыдущих релизов OpenAI, «очень скоро» может растянуться на недели, пока завершается red-teaming. Если ваша продуктовая дорожная карта предполагала GPT-5.5 в API к следующему спринту — сдвиньте этот milestone. GPT-5.4 остаётся доступным по половине API-цены преемника, что является реалистичным планом для любой latency-чувствительной нагрузки до конца Q2.
Третья группа — корпоративные закупщики. GPT-5.5 Pro явно ориентирован на юридические исследования, анализ данных и продвинутую бизнес-аналитику. Это прямое позиционирование против корпоративных предложений, которые Anthropic и Google продвигали месяцами. Запросы на тендер, составленные в марте, потребуют обновления.
Моя оценка: скрытая угроза — для компаний, платящих $100–$200 в месяц за место на ChatGPT Pro. Теперь у них есть доступ к GPT-5.5 Pro внутри чат-продукта раньше, чем конкуренты смогут вызвать его из собственного программного обеспечения. Это меняет соотношение «строить vs. покупать» для внутренних инструментов. Если команда юридических ассистентов может выполнять моделирование уровня инвестиционного банка в ChatGPT (88,5% на внутреннем бенчмарке OpenAI по IB, 54,1% на OfficeQA Pro против 43,6% у Opus 4.7), аргументы в пользу собственного внутреннего копилота ослабевают ещё на квартал.
Командам по кибербезопасности также стоит следить внимательно. GPT-5.5 набрал 81,8% на CyberGym и 88,1% на внутренних Capture-the-Flags соревнованиях. Anthropic классифицировал Claude Mythos Preview как стратегический оборонительный актив именно из-за высоких киберрисков. Frontier-модели теперь являются реальными инструментами для наступательных операций, независимо от того, распространяют ли их вендоры широко.
План действий для AI-разработки
Конкретные шаги на ближайшие две недели:
Заморозьте планы по API. Пока OpenAI не опубликует реальную дату API, не включайте GPT-5.5 в критический производственный путь. Сохраняйте GPT-5.4 как основной контрактный компонент. Ежедневно проверяйте документацию платформы на предмет объявления о доступе и ценах — стандартная модель стоит вдвое дороже GPT-5.4 через API, и эти цифры должны пройти согласование с финансовым отделом.
Запустите свой eval-стенд на этой неделе. Общие бенчмарки интересны. Ваши собственные eval-тесты — вот что важно. Если у вас есть агент для программирования, запустите его через GPT-5.5 внутри ChatGPT Pro вручную и сравните на реальных задачах. Обращайте внимание на потребление токенов, а не только на показатель прохождения. История Expert-SWE (лучшие результаты при меньшем количестве токенов) — это реальный коммерческий выигрыш.
Пересчитайте стоимость агентных нагрузок. Увеличение пропускной способности на 20% при сохранении задержки означает, что существующие GPU-бюджеты растянутся дальше, когда откроется паритетный API. Создайте модель затрат после миграции уже сейчас, чтобы действовать быстро, когда API откроется.
Диверсифицируйте, не мигрируйте. Opus 4.7 по-прежнему лидирует на SWE-bench Pro Public с 64,3%. Mythos остаётся под оборонительной классификацией Anthropic. Неудобный вывод: ни одна модель больше не выигрывает всё, и уровень маршрутизации между OpenAI, Anthropic и Google становится базовым требованием для любого серьёзного AI-продукта. Пересмотрите логику маршрутизации с учётом документации Anthropic и относитесь к vendor lock-in как к главному риску.
Проинформируйте команду безопасности. CyberGym на 81,8% — это не гипотетическая возможность. Обновите модели угроз для AI-ассистированного наступательного инструментария сейчас, а не после выхода API.
Ключевые выводы
- GPT-5.5 возвращает публичное лидерство среди frontier-моделей через семь дней после того, как его занял Claude Opus 4.7. Ожидайте повторения этого цикла в течение 2026 года.
- Увеличение скорости генерации токенов на 20% при задержке уровня GPT-5.4 — самая важная с операционной точки зрения цифра в релизе, а не показатели бенчмарков.
- Доступ к API задерживается. GPT-5.4 остаётся в production для большинства команд по половине стоимости GPT-5.5, пока OpenAI не подтвердит дату.
- GPT-5.5 лидирует на Terminal-Bench 2.0 (82,7%), GDPval (84,9%), ARC-AGI-2 (85,0%) и FrontierMath Tier 4 (35,4%), но уступает Opus 4.7 на SWE-bench Pro Public.
- Мульти-вендорная маршрутизация теперь является архитектурой по умолчанию для любого серьёзного AI-продукта. Ставки на одного вендора наказываются с еженедельной периодичностью.
Часто задаваемые вопросы
В: Когда будет доступен GPT-5.5 API?
OpenAI говорит «очень скоро», но не подтвердил дату. Компания сослалась на необходимость дополнительных защитных мер для работы в масштабе и ведёт переговоры с партнёрами по требованиям безопасности. До тех пор GPT-5.4 остаётся доступным по половине API-цены GPT-5.5.
В: GPT-5.5 действительно лучше Claude Opus 4.7?
Зависит от задачи. GPT-5.5 лидирует на Terminal-Bench 2.0, GDPval, ARC-AGI-2 Verified, FrontierMath и OfficeQA Pro. Opus 4.7 по-прежнему лидирует на SWE-bench Pro Public (64,3% против 58,6%) и Humanity's Last Exam без инструментов (46,9% против 43,1%). Запустите собственные тесты перед принятием решений.
В: Сколько стоит GPT-5.5?
Внутри ChatGPT он включён в Plus за $20 в месяц, Pro за $100–$200 в месяц, а также на тарифах Business и Enterprise. GPT-5.5 Pro требует уровня Pro или выше. Ценообразование API не раскрыто, однако OpenAI отметил, что GPT-5.4 останется по половине API-цены GPT-5.5 после открытия этого канала.
DeepSeek V4 выходит в открытый доступ на Hugging Face
DeepSeek выпустил V4-Pro и V4-Flash на Hugging Face. Флагман на 1,6T параметров MoE, KV-кэш легче на 90% и тихий укол в сторону Claude Opus 4.6.
Взлом Itron вынуждает технических директоров коммунальных служб пересмотреть риски поставщиков
Itron раскрыла информацию о взломе внутренних IT-систем, затрагивающем поставщика, управляющего 112 млн точек учёта. Архитектурные и контрактные последствия глубже, чем следует из 8-K.
Налог в 1 секунду: почему скорость мобильного сайта — это архитектурное решение
Задержка в одну секунду на мобильном снижает конверсию на 20%. Для руководителей платформ — это не баг фронтенда, а решение «build vs buy» на столе у CFO.

