GPT-5.5 releaseOpenAIfrontier modelGPT-5.5 platform planning guideOpenAI GPT-5.5 benchmark score

GPT-5.5 вийшов: OpenAI повертає лідерство серед фронтирних моделей

26 кві 20266 хв. читанняAlex Drover

// У ЦІЙ СТАТТІ

01Що сталося 02Технічна анатомія 03Хто постраждає 04План дій для AI-розробки 05Ключові висновки 06Часті запитання

Кожен, хто хоч раз планував квартальні витрати на LLM, знає той жах, коли постачальник випускає «розумнішу» модель вдвічі дорожчу за два тижні після затвердження бюджету. Саме в такій ситуації опинилися цього тижня чимало технічних лідів. OpenAI випустила GPT-5.5, яка внутрішньо має кодову назву "Spud", і математика ціна/продуктивність для AI-навантажень щойно змінилася.

Що сталося

23 квітня 2026 року OpenAI представила GPT-5.5, як повідомив VentureBeat, у двох варіантах: стандартний GPT-5.5 та GPT-5.5 Pro, орієнтований на юридичні дослідження, науку про дані та просунуту бізнес-аналітику. Амелія Глейс, віцепрезидент з досліджень OpenAI, заявила журналістам, що це «безумовно наша найсильніша модель у кодуванні» — спираючись на бенчмарки та відгуки партнерів.

Грег Брокман, співзасновник та президент OpenAI, представив запуск крізь призму автономності. «Справді особливе в цій моделі — наскільки більше вона може робити без детальних інструкцій», — сказав він. «Вона може подивитися на нечітко сформульовану проблему й визначити, що потрібно зробити далі». Брокман додав, що модель «надзвичайно хороша у кодуванні» та сильна у «ширшій роботі з комп'ютером, використанні комп'ютера, наукових дослідженнях».

Сем Альтман підхопив тему публікацією про філософію бренду в X: «Ми хочемо, щоб наші користувачі мали доступ до найкращих технологій і щоб кожен мав рівні можливості».

Але є нюанс із розповсюдженням. GPT-5.5 доступна для підписників ChatGPT Plus за $20 на місяць, ChatGPT Pro за $100–$200 на місяць, а також для рівнів Business та Enterprise. GPT-5.5 Pro починається з рівня Pro і вище. API-доступ до жодного з варіантів наразі недоступний. OpenAI каже, що він з'явиться «дуже скоро», і пояснює: «Розгортання через API потребує додаткових засобів захисту, і ми тісно співпрацюємо з партнерами та клієнтами щодо вимог безпеки для роботи у масштабі».

Реліз вийшов рівно через тиждень після того, як Anthropic випустила Claude Opus 4.7. Гонка на фронтирі звузилась до питання тижнів, а не кварталів.

Технічна анатомія

Інженерна складова за маркетинговою оболонкою цікавіша, ніж будь-яка таблиця бенчмарків. GPT-5.5 запускається на системах NVIDIA GB200 та GB300 NVL72. OpenAI використала власні евристичні алгоритми, написані самим AI, для розподілу та балансування навантаження між ядрами GPU. Швидкість генерації токенів зросла більш ніж на 20%, а затримка на токен відповідає GPT-5.4. Це нетривіальний результат. Більші моделі майже завжди платять за можливості підвищеною затримкою. Ця — ні.

Для досвідчених бекенд-інженерів 20% приріст пропускної здатності — це головна цифра, а не результати бенчмарків. При навантаженні з бюджетом $500 тис. на квартал для інференсу така пропускна здатність — це різниця між виділенням нових потужностей та виживанням у піковий час із тим, що є. Це приблизно бюджет двох інженерів у команді з 10 осіб, повернений завдяки оптимізації, а не скороченню штату.

Щодо можливостей, результати неоднозначні, але реальні. GPT-5.5 набрала 82.7% на Terminal-Bench 2.0, обігнавши Claude Opus 4.7 з 69.4%, Gemini 3.1 Pro з 68.5% та незначно перевершивши нереліз Claude Mythos Preview з 82.0%. На GDPval GPT-5.5 набрала 84.9% перемог або нічиїх проти 80.3% у Opus 4.7 та 67.3% у Gemini 3.1 Pro. ARC-AGI-2 Verified: 85.0% проти 75.8% та 77.1%. FrontierMath Tier 4: 35.4% проти 22.9% та 16.7%.

Це не абсолютна перемога. На SWE-bench Pro Public лідирує Opus 4.7 з 64.3% проти 58.6% у GPT-5.5, а закритий Claude Mythos Preview досягає 77.8%. На Humanity's Last Exam без інструментів GPT-5.5 Pro набрала 43.1% проти 46.9% у Opus 4.7 та 56.8% у Mythos Preview. BrowseComp виграє Mythos з 86.9%, Gemini 3.1 Pro — 85.9%, GPT-5.5 — 84.4%.

Є ще Expert-SWE — внутрішній бенчмарк OpenAI для довгострокового кодування з медіанним часом виконання людиною у 20 годин. GPT-5.5 набрала 73.1% і перевершила GPT-5.4, при цьому використовуючи значно менше токенів. Це той важіль, що має значення для агентних навантажень: кращі результати, менше токенів, та сама затримка.

Хто постраждає

Найбільш уразлива група — ті, хто будував дорожню карту, розраховуючи на стійку семиденну перевагу Anthropic. Opus 4.7 була публічним лідером рівно один тиждень. Команди, що затвердили плани міграції минулої п'ятниці, тепер пояснюють своєму CTO, чому порівняльна презентація вже застаріла.

Друга уразлива група — сторонні розробники, що чекають на API. Фраза «дуже скоро» у блозі OpenAI несе велике навантаження. З виробничих інцидентів під час попередніх розгортань OpenAI я знаю, що «дуже скоро» може розтягнутись на тижні, поки завершується red-teaming. Якщо ваша дорожня карта продукту передбачала GPT-5.5 в API вже у наступному спринті — відкладіть цей мілстоун. GPT-5.4 залишається доступною за половину API-вартості свого наступника, що є реалістичним планом для будь-якого чутливого до затримок навантаження до кінця Q2.

Третя група — корпоративні закупівлі. GPT-5.5 Pro явно орієнтована на юридичні дослідження, науку про дані та просунуту бізнес-аналітику. Це ставить її прямо проти корпоративних пропозицій, які Anthropic та Google просували місяцями. RFP-документи, написані в березні, потребують оновлення.

Моя думка: прихованим ризиком є компанії, що платять від $100 до $200 на місяць за місце на ChatGPT Pro. Вони вже мають доступ до GPT-5.5 Pro у чат-продукті, поки конкуренти не можуть викликати її зі свого програмного забезпечення. Це змінює математику «будувати чи купити» для внутрішніх інструментів. Якщо команда юристів може робити фінансове моделювання рівня інвестиційного банкінгу в ChatGPT (88.5% у внутрішньому бенчмарку IB від OpenAI, 54.1% на OfficeQA Pro проти 43.6% у Opus 4.7), аргумент на користь власного внутрішнього копайлота слабшає ще на квартал.

Командам з кібербезпеки також варто уважно стежити за ситуацією. GPT-5.5 набрала 81.8% на CyberGym та 88.1% на внутрішніх Capture-the-Flag змаганнях. Anthropic класифікувала Claude Mythos Preview як стратегічний оборонний актив саме через високі ризики у сфері кібербезпеки. Фронтирні моделі вже є реальними наступальними інструментами — незалежно від того, чи постачальники широко їх поширюють.

План дій для AI-розробки

Конкретні кроки на найближчі два тижні:

Заморозьте свої плани щодо API. Доки OpenAI не оголосить реальну дату API, не вводьте GPT-5.5 у критичний виробничий шлях. Тримайте GPT-5.4 як основу. Перевіряйте документацію платформи щодня для отримання оголошення про доступ і ціни, оскільки стандартна модель коштує вдвічі більше за GPT-5.4 через API і ця математика має пройти фінансовий відділ.

Перезапустіть свій eval-харнес цього тижня. Загальні бенчмарки цікаві. Ваші власні оцінки — ось що має значення. Якщо у вас є агент кодування, запустіть його через GPT-5.5 у ChatGPT Pro вручну та порівняйте на реальних завданнях. Зверніть увагу на споживання токенів, а не лише на показник успішності. Результат Expert-SWE (кращі результати при меншій кількості токенів) — це справжня комерційна перевага.

Перерахуйте вартість своїх агентних навантажень. Приріст пропускної здатності на 20% при незмінній затримці означає, що наявні GPU-бюджети стануть ефективнішими, щойно з'явиться API. Будуйте модель витрат після міграції вже зараз, щоб діяти швидко, коли API відкриється.

Диверсифікуйте, а не мігруйте. Opus 4.7 досі лідирує на SWE-bench Pro Public з 64.3%. Mythos залишається закритою за оборонною класифікацією Anthropic. Незручний висновок: жодна єдина модель більше не перемагає в усьому, і рівень маршрутизації між OpenAI, Anthropic та Google стає базовою вимогою для будь-якого серйозного AI-продукту. Перегляньте свою логіку маршрутизації відповідно до документації Anthropic та розглядайте прив'язку до одного постачальника як реальний ризик.

Проінформуйте команду безпеки. CyberGym з 81.8% — це не гіпотетична можливість. Оновіть свої моделі загроз для AI-допомоги в наступальних інструментах зараз, а не після виходу API.

Ключові висновки

GPT-5.5 повертає публічне лідерство серед фронтирних моделей через сім днів після того, як його взяла Claude Opus 4.7. Очікуйте, що цей цикл повторюватиметься протягом 2026 року.
20% приріст швидкості генерації токенів при збереженні затримки GPT-5.4 — найважливіша операційна цифра запуску, а не результати бенчмарків.
API-доступ затримується. GPT-5.4 залишається у виробництві для більшості команд за половину вартості GPT-5.5, доки OpenAI не підтвердить дату.
GPT-5.5 лідирує на Terminal-Bench 2.0 (82.7%), GDPval (84.9%), ARC-AGI-2 (85.0%) та FrontierMath Tier 4 (35.4%), але поступається Opus 4.7 на SWE-bench Pro Public.
Мультипостачальницька маршрутизація тепер є архітектурою за замовчуванням для будь-якого серйозного AI-продукту. Ставки на одного постачальника зазнають покарання щотижня.

Часті запитання

П: Коли буде доступний API GPT-5.5?

OpenAI каже «дуже скоро», але не підтвердила дату. Компанія зазначила, що для роботи у масштабі потрібні додаткові засоби захисту, і працює з партнерами над вимогами безпеки. GPT-5.4 тим часом залишається доступною за половину API-вартості GPT-5.5.

П: GPT-5.5 справді краща за Claude Opus 4.7?

Це залежить від навантаження. GPT-5.5 лідирує на Terminal-Bench 2.0, GDPval, ARC-AGI-2 Verified, FrontierMath та OfficeQA Pro. Opus 4.7 досі лідирує на SWE-bench Pro Public (64.3% проти 58.6%) та Humanity's Last Exam без інструментів (46.9% проти 43.1%). Запускайте власні оцінки перед тим, як робити висновки.

П: Скільки коштує GPT-5.5?

У ChatGPT вона включена в Plus за $20 на місяць, Pro за $100–$200 на місяць, а також у рівні Business та Enterprise. GPT-5.5 Pro потребує рівня Pro або вищого. Ціни на API не розголошувалися, але OpenAI зазначила, що GPT-5.4 залишатиметься за половину API-вартості GPT-5.5, коли цей канал відкриється.

Alex Drover

RiverCore Analyst · Dublin, Ireland

// СХОЖІ СТАТТІ

Anthropic знижує вартість Opus 5 на 50% і переписує математику рівнів

Claude Opus 5 коштує вдвічі менше за Fable 5 і перевершує його у 8 з 13 тестів. Головна інтрига — як Anthropic перетворює безпеку на окремий рівень продукту.

Workday представив Developer Agent та Agent Passport на DevCon 2026

Головна ставка Workday на DevCon: найскладніше в агентному AI — не швидкість, а дозволити боту торкатися зарплатної відомості без руйнування балансу.

FATF Ставить DeFi «Театр Децентралізації» на Лічильник Комплаєнсу

FATF: 93% юрисдикцій ніколи не застосовували AML до DeFi. Цей розрив незабаром закриється, і рахунок отримають ідентифіковані оператори.