GPT-5.5 releaseOpenAIfrontier modelGPT-5.5 platform planning guideOpenAI GPT-5.5 benchmark score

GPT-5.5 вышел: OpenAI снова возглавляет гонку frontier-моделей

26 апр 20266 мин. чтенияAlex Drover

// В ЭТОЙ СТАТЬЕ

01Что произошло 02Техническая анатомия 03Кто пострадает 04План действий для AI-разработки 05Ключевые выводы 06Часто задаваемые вопросы

Каждый, кто хоть раз составлял квартальный бюджет на LLM, знает это чувство тревоги, когда вендор выпускает «более умную» модель по двойной цене через две недели после согласования мощностей. Именно в такой ситуации оказались многие руководители платформенных команд на этой неделе. OpenAI выпустил GPT-5.5, внутри компании получивший кодовое имя «Spud», и соотношение цены и производительности для AI-интенсивных рабочих нагрузок было пересмотрено.

Что произошло

23 апреля 2026 года OpenAI представил GPT-5.5, как сообщил VentureBeat, в двух вариантах: стандартный GPT-5.5 и GPT-5.5 Pro, ориентированный на юридические исследования, анализ данных и продвинутую бизнес-аналитику. Амелия Глиз, вице-президент по исследованиям OpenAI, заявила журналистам, что это «определённо наша самая сильная модель в области программирования», основываясь на бенчмарках и отзывах партнёров.

Грег Брокман, сооснователь и президент OpenAI, выстроил запуск вокруг концепции автономности. «Особенность этой модели в том, насколько больше она может сделать с меньшим количеством указаний», — сказал он. «Она может взглянуть на неясную задачу и понять, что нужно сделать дальше». Брокман добавил, что модель «исключительно хороша в программировании» и сильна в «более широкой компьютерной работе, управлении компьютером, научных исследованиях».

Сэм Альтман дополнил это публикацией о философии бренда в X: «Мы хотим, чтобы наши пользователи имели доступ к лучшим технологиям и чтобы у каждого были равные возможности».

Загвоздка — в дистрибуции. GPT-5.5 доступен подписчикам ChatGPT Plus за $20 в месяц, ChatGPT Pro за $100–$200 в месяц, а также на тарифах Business и Enterprise. GPT-5.5 Pro доступен начиная с уровня Pro и выше. Доступ к API для обоих вариантов пока недоступен. OpenAI заявляет, что он появится «очень скоро», добавив, что «развёртывание через API требует других защитных мер, и мы тесно сотрудничаем с партнёрами и клиентами по вопросам безопасности для обслуживания в масштабе».

Релиз вышел ровно через неделю после того, как Anthropic выпустил Claude Opus 4.7. Гонка на переднем крае сократилась до вопроса недель, а не кварталов.

Техническая анатомия

Инженерная история за маркетингом интереснее, чем просто таблица бенчмарков. GPT-5.5 работает на системах NVIDIA GB200 и GB300 NVL72. OpenAI использовал специальные эвристические алгоритмы, написанные самим AI, для разделения и балансировки нагрузки между ядрами GPU. Скорость генерации токенов выросла более чем на 20%, а задержка на токен соответствует GPT-5.4. Это нетривиальный результат. Более крупные модели почти всегда платят за возможности задержкой. Эта — нет.

Для старших backend-инженеров ключевой цифрой является именно это 20%-ное увеличение пропускной способности, а не показатели бенчмарков. При рабочей нагрузке с расходом $500 тыс. в квартал на инференс такая пропускная способность — это разница между выделением новых мощностей и пережиданием пиков с имеющимися ресурсами. Это примерно бюджет двух инженеров в команде из 10 человек, возвращённый за счёт оптимизации, а не сокращения штата.

По возможностям картина смешанная, но реальная. GPT-5.5 набрал 82,7% на Terminal-Bench 2.0, обогнав Claude Opus 4.7 с 69,4%, Gemini 3.1 Pro с 68,5% и незначительно превзойдя ещё не выпущенный Claude Mythos Preview с 82,0%. На GDPval GPT-5.5 показал 84,9% побед или ничьих против 80,3% у Opus 4.7 и 67,3% у Gemini 3.1 Pro. ARC-AGI-2 Verified: 85,0% против 75,8% и 77,1%. FrontierMath Tier 4: 35,4% против 22,9% и 16,7%.

Это не безоговорочная победа. На SWE-bench Pro Public лидирует Opus 4.7 с 64,3% против 58,6% у GPT-5.5, а закрытый Claude Mythos Preview показывает 77,8%. На Humanity's Last Exam без инструментов GPT-5.5 Pro набрал 43,1% против 46,9% у Opus 4.7 и 56,8% у Mythos Preview. BrowseComp достаётся Mythos с 86,9%, Gemini 3.1 Pro с 85,9% опережает GPT-5.5 с 84,4%.

Отдельно стоит упомянуть Expert-SWE — внутренний бенчмарк OpenAI для долгосрочного программирования со средним временем выполнения человеком 20 часов. GPT-5.5 набрал 73,1% и превзошёл GPT-5.4, используя значительно меньше токенов. Вот что важно для агентных нагрузок: лучшие результаты, меньше токенов, та же задержка.

Кто пострадает

Наиболее уязвимая группа — все, кто выстраивал дорожную карту в расчёте на устойчивое семидневное преимущество Anthropic. Opus 4.7 был публичным лидером ровно одну неделю. Команды, подтвердившие планы миграции в прошлую пятницу, теперь объясняют своему CTO, почему сравнительная таблица уже устарела.

Вторая уязвимая группа — сторонние разработчики, ожидающие API. «Очень скоро» несёт большую смысловую нагрузку в блог-посте OpenAI. Судя по производственным инцидентам во время предыдущих релизов OpenAI, «очень скоро» может растянуться на недели, пока завершается red-teaming. Если ваша продуктовая дорожная карта предполагала GPT-5.5 в API к следующему спринту — сдвиньте этот milestone. GPT-5.4 остаётся доступным по половине API-цены преемника, что является реалистичным планом для любой latency-чувствительной нагрузки до конца Q2.

Третья группа — корпоративные закупщики. GPT-5.5 Pro явно ориентирован на юридические исследования, анализ данных и продвинутую бизнес-аналитику. Это прямое позиционирование против корпоративных предложений, которые Anthropic и Google продвигали месяцами. Запросы на тендер, составленные в марте, потребуют обновления.

Моя оценка: скрытая угроза — для компаний, платящих $100–$200 в месяц за место на ChatGPT Pro. Теперь у них есть доступ к GPT-5.5 Pro внутри чат-продукта раньше, чем конкуренты смогут вызвать его из собственного программного обеспечения. Это меняет соотношение «строить vs. покупать» для внутренних инструментов. Если команда юридических ассистентов может выполнять моделирование уровня инвестиционного банка в ChatGPT (88,5% на внутреннем бенчмарке OpenAI по IB, 54,1% на OfficeQA Pro против 43,6% у Opus 4.7), аргументы в пользу собственного внутреннего копилота ослабевают ещё на квартал.

Командам по кибербезопасности также стоит следить внимательно. GPT-5.5 набрал 81,8% на CyberGym и 88,1% на внутренних Capture-the-Flags соревнованиях. Anthropic классифицировал Claude Mythos Preview как стратегический оборонительный актив именно из-за высоких киберрисков. Frontier-модели теперь являются реальными инструментами для наступательных операций, независимо от того, распространяют ли их вендоры широко.

План действий для AI-разработки

Конкретные шаги на ближайшие две недели:

Заморозьте планы по API. Пока OpenAI не опубликует реальную дату API, не включайте GPT-5.5 в критический производственный путь. Сохраняйте GPT-5.4 как основной контрактный компонент. Ежедневно проверяйте документацию платформы на предмет объявления о доступе и ценах — стандартная модель стоит вдвое дороже GPT-5.4 через API, и эти цифры должны пройти согласование с финансовым отделом.

Запустите свой eval-стенд на этой неделе. Общие бенчмарки интересны. Ваши собственные eval-тесты — вот что важно. Если у вас есть агент для программирования, запустите его через GPT-5.5 внутри ChatGPT Pro вручную и сравните на реальных задачах. Обращайте внимание на потребление токенов, а не только на показатель прохождения. История Expert-SWE (лучшие результаты при меньшем количестве токенов) — это реальный коммерческий выигрыш.

Пересчитайте стоимость агентных нагрузок. Увеличение пропускной способности на 20% при сохранении задержки означает, что существующие GPU-бюджеты растянутся дальше, когда откроется паритетный API. Создайте модель затрат после миграции уже сейчас, чтобы действовать быстро, когда API откроется.

Диверсифицируйте, не мигрируйте. Opus 4.7 по-прежнему лидирует на SWE-bench Pro Public с 64,3%. Mythos остаётся под оборонительной классификацией Anthropic. Неудобный вывод: ни одна модель больше не выигрывает всё, и уровень маршрутизации между OpenAI, Anthropic и Google становится базовым требованием для любого серьёзного AI-продукта. Пересмотрите логику маршрутизации с учётом документации Anthropic и относитесь к vendor lock-in как к главному риску.

Проинформируйте команду безопасности. CyberGym на 81,8% — это не гипотетическая возможность. Обновите модели угроз для AI-ассистированного наступательного инструментария сейчас, а не после выхода API.

Ключевые выводы

GPT-5.5 возвращает публичное лидерство среди frontier-моделей через семь дней после того, как его занял Claude Opus 4.7. Ожидайте повторения этого цикла в течение 2026 года.
Увеличение скорости генерации токенов на 20% при задержке уровня GPT-5.4 — самая важная с операционной точки зрения цифра в релизе, а не показатели бенчмарков.
Доступ к API задерживается. GPT-5.4 остаётся в production для большинства команд по половине стоимости GPT-5.5, пока OpenAI не подтвердит дату.
GPT-5.5 лидирует на Terminal-Bench 2.0 (82,7%), GDPval (84,9%), ARC-AGI-2 (85,0%) и FrontierMath Tier 4 (35,4%), но уступает Opus 4.7 на SWE-bench Pro Public.
Мульти-вендорная маршрутизация теперь является архитектурой по умолчанию для любого серьёзного AI-продукта. Ставки на одного вендора наказываются с еженедельной периодичностью.

Часто задаваемые вопросы

В: Когда будет доступен GPT-5.5 API?

OpenAI говорит «очень скоро», но не подтвердил дату. Компания сослалась на необходимость дополнительных защитных мер для работы в масштабе и ведёт переговоры с партнёрами по требованиям безопасности. До тех пор GPT-5.4 остаётся доступным по половине API-цены GPT-5.5.

В: GPT-5.5 действительно лучше Claude Opus 4.7?

Зависит от задачи. GPT-5.5 лидирует на Terminal-Bench 2.0, GDPval, ARC-AGI-2 Verified, FrontierMath и OfficeQA Pro. Opus 4.7 по-прежнему лидирует на SWE-bench Pro Public (64,3% против 58,6%) и Humanity's Last Exam без инструментов (46,9% против 43,1%). Запустите собственные тесты перед принятием решений.

В: Сколько стоит GPT-5.5?

Внутри ChatGPT он включён в Plus за $20 в месяц, Pro за $100–$200 в месяц, а также на тарифах Business и Enterprise. GPT-5.5 Pro требует уровня Pro или выше. Ценообразование API не раскрыто, однако OpenAI отметил, что GPT-5.4 останется по половине API-цены GPT-5.5 после открытия этого канала.

Alex Drover

RiverCore Analyst · Dublin, Ireland

// ПОХОЖИЕ СТАТЬИ

Opus 5 от Anthropic снижает стоимость на 50% и меняет логику тарификации

Claude Opus 5 стоит вдвое дешевле Fable 5 и превосходит его в 8 из 13 бенчмарков. Главное — Anthropic превращает безопасность в отдельный уровень продукта.

Workday представил Developer Agent и Agent Passport на DevCon 2026

На DevCon Workday поставил главный вопрос: как дать боту доступ к расчёту зарплат и не сломать бухгалтерию? Инженерный разбор трёх новых инструментов.

FATF ставит «театр децентрализации» DeFi перед сроками соответствия требованиям

FATF сообщает: 93% юрисдикций никогда не применяли правила AML к DeFi-платформам. Этот пробел вот-вот закроется, и счёт выставят идентифицируемым операторам.