Skip to content
RiverCore
PointFive залучає $60 млн для контролю витрат на хмарний AI
AI cloud cost optimizationcloud spendAI infrastructurereduce enterprise AI cloud billsLLM cost management tools

PointFive залучає $60 млн для контролю витрат на хмарний AI

10 чер 20267 хв. читанняAlex Drover

Кожен платформний лід, який за останній рік запустив будь-яку LLM-функцію, дивився один і той самий фільм жахів: панель у Grafana показує витрати токенів, що ростуть по прямій, тоді як вплив на продукт залишається незмінним. PointFive Inc. щойно залучила $60 мільйонів, роблячи ставку на те, що тисячі фінансових команд ось-ось почнуть ставити незручні запитання щодо цього графіка. Раунд очолив Accel, а стартап із Нью-Йорка отримав оцінку $500 мільйонів.

Що сталося

PointFive закрила раунд на $60 мільйонів під керівництвом Accel за участю Index Ventures, Entre Capital, Perpetual Growth, Vesey Ventures, Sheva Ventures та Salesforce Ventures. Як повідомляє SiliconANGLE, угода доводить загальний обсяг фінансування до $96 мільйонів, а оцінка компанії становить $500 мільйонів — рівно половина до статусу єдинорога. Назва PointFive є натяком на твердження компанії, що вона може скоротити хмарні рахунки клієнтів вдвічі.

Компанія заснована у 2023 році Ароном Арватцом, Галем Бен Давідом та Аміром Хозезом — командою, яка добре знайома з корпоративним програмним забезпеченням. Раніше вони розробили IntSights Cyber Intelligence, яку Rapid7 придбала приблизно за $335 мільйонів у 2021 році. PointFive вони заснували після того, як спостерігали марнотратні хмарні витрати під час інтеграції IntSights у Rapid7.

Показники зростання, які вони оприлюднили, — саме такі, від яких венчурні капіталісти підписують угоди без роздумів. Річний повторюваний дохід зріс у шість разів за останній рік. Наявні клієнти в середньому подвоїли свої витрати. Арватц каже, що компанія на шляху до п'ятикратного зростання доходів цього року. Серед клієнтів — німецька енергетична компанія E.ON, бразильський необанк Nubank та Fanatics, американський оператор спортивних товарів і ставок. За повідомленнями, Nubank відшкодував власні витрати на PointFive впродовж десяти днів.

Разом із фінансуванням, 8 червня PointFive запустила TokenShift — сервіс для відстеження та контролю використання внутрішніх AI-інструментів. Нові кошти спрямовуються на розширення в Європі та Ізраїлі, а також на найм приблизно 40 нових співробітників у маркетингу та R&D. Показово, що початковий план передбачав 80 найманих працівників — його скоротили вдвічі, оскільки компанія використовує власні AI-інструменти всередині.

Технічна анатомія

Категорія FinOps переповнена гравцями, тому цікаве питання — що PointFive робить принципово інакше. Судячи з опису компанії, платформа інтегрується безпосередньо з хмарними середовищами клієнтів і безперервно сканує інфраструктуру для виявлення марнотратства. Звичні підозрювані: простоюючі сервери, невикористане сховище, завеликі інстанси. Але AI-специфічна складова робить пропозицію значно гострішою.

Важливі два патерни. Перший — роздуття пам'яті та контексту. Команди намагаються запхати дедалі більші контекстні вікна в кожен запит, бо більший контекст здається надійнішим. Насправді — ні. Завеликий контекст погіршує затримку та лінійно спалює токени пропорційно до розміру вхідних даних. Цінність PointFive тут — це по суті аудит пайплайнів промптів і пошуку на предмет марнотратства, так само як APM-інструмент помічає N+1-запити до бази даних. Кожен, хто запускав RAG у продакшні, знає спокусу засунути всю базу знань у контекст замість налаштування пошуку. Ця звичка відображається у рахунку.

Другий патерн — постійно активні агенти. Фонові агенти, які опитують, моніторять або попередньо обчислюють, — це нові cron-задачі, з тією різницею, що кожен тік може коштувати реальних грошей через виклики API до провайдерів на кшталт OpenAI або Anthropic. Продакшн-інциденти зі запланованими задачами майже завжди сходяться до того, що хтось забув про їхнє існування. З агентами це забуття супроводжується лічильником токенів.

Рушій рекомендацій PointFive також нібито пропонує дешевші моделі для конкретних завдань. Це замаскована проблема маршрутизації. Не кожна класифікація потребує передової моделі. Добре налаштована менша модель або навіть дообчена модель з відкритими вагами з Hugging Face може скоротити вартість одного виклику на порядок. Складна частина — зрозуміти, які виклики можна безпечно знизити в класі без погіршення точності. Саме тут позиціонування як "тренера з ефективності" виправдовує себе — якщо рекомендації є точними.

Новий продукт TokenShift атакує сторону внутрішніх інструментів: відстежує, які співробітники та які робочі процеси споживають токени. Філіп Боттері з Accel називає корінну проблему "tokenmaxxing" — компанії підвищують витрати, споживаючи AI-токени без чіткого ROI. CTO Meta Ендрю Босворт відкрито висловився про це у квітневому меморандумі до персоналу: "ніхто не повинен використовувати AI-інструменти просто заради використання. Будь-який рух — це ще не прогрес, а кількість токенів сама по собі не є мірою ефективності будь-якого роду."

Хто зазнає збитків

Найбільш вразливі зараз — компанії середнього масштабу, які активно впроваджували AI скрізь протягом останніх 18 місяців без моделі розподілу витрат. Інженери підключили Copilot, підтримка — автовідповідач на LLM, маркетинг — контентні пайплайни, і ніхто не є власником рахунку. На момент, коли фінансовий відділ запитує, хто авторизував шестизначний щомісячний рахунок Anthropic, відповідь — "усі, більш-менш."

Оператори iGaming є особливо вразливими. Двигуни персоналізації, скоринг шахрайства, підсумовування KYC і боти підтримки клієнтів — усі вони звертаються до одних і тих самих провайдерських акаунтів, часто без атрибуції за командами. Команди, з якими я працював у європейських операторів, мали чисте розподілення витрат на базу даних і Kubernetes, але всі виклики моделей зводили до одного спільного API-ключа. Це сліпа пляма в бюджеті розміром з невеликий продуктовий підрозділ.

Fintech — наступна вертикаль, яка це відчує. Історія Nubank про окупність за десять днів швидко розповсюдиться в мережах CFO. Якщо необанк із сильною інженерною дисципліною все одно мав стільки марнотратства для відновлення, кожен роздрібний банк, що проводить пілоти, сидить на ще більших втратах. Арватц зазначив, що деякі великі компанії щорічно витрачають мільйони на непотрібні ресурси. Це бюджет двох старших інженерів щомісяця — на інфраструктуру, якою ніхто реально не користується.

Незручний висновок: сама категорія FinOps ось-ось стрімко переповниться. PointFive добре фінансується і має реальні логотипи клієнтів, але кожен гіперскейлер випустить нативну AI-аналітику витрат у своїх консолях впродовж дванадцяти місяців. Вікно для стартапів — найближчі два роки. Після цього це стане функцією, а не продуктом, якщо TokenShift та аналогічні інструменти не знайдуть захищену нішу в міжхмарній, міжпровайдерній атрибуції.

Моя думка: рішення PointFive щодо найму говорить про ринок більше, ніж сам раунд фінансування. Скорочення запланованого найму з 80 до 40 осіб завдяки власним AI-інструментам — це або справжня історія продуктивності, або хеджування проти того самого пом'якшення попиту, з яким вони борються. Мабуть, і те, і інше.

Стратегія для AI-розробки

Якщо ви керуєте AI-продуктом, зробіть три кроки цього тижня — ще до оцінки будь-якого вендора.

По-перше, позначте кожен API-ключ провайдера за командою та функцією. Один спільний ключ для всієї організації — це FinOps-еквівалент запуску root у продакшні. Ви не можете оптимізувати те, чому не можете приписати авторство. Якщо ваш провайдер підтримує ключі з областю видимості проекту, використовуйте їх уже сьогодні.

По-друге, проведіть аудит контекстних вікон. Візьміть тиждень продакшн-промптів і виміряйте середню кількість вхідних токенів відносно мінімального необхідного контексту. Більшість команд виявляє, що відправляє у два-п'ять разів більше контексту, ніж потребує завдання. Скорочення цього — безкоштовні гроші без зміни моделі.

По-третє, проінвентаризуйте своїх агентів і заплановані AI-задачі. Кожен постійно активний агент потребує власника, вимикача та щомісячного перегляду. Якщо ніхто не може пояснити, що агент робить цього кварталу, вимкніть його та подивіться, хто поскаржиться. Продакшн-інциденти з покинутими фоновими задачами слідують одному патерну: дешево ігнорувати, поки це не перестає бути дешевим.

Для платформних лідів, що оцінюють PointFive або конкурентів: вимагайте пілоту, який окупається за 90 днів — письмово. Твердження Nubank про десять днів задає планку. Все, що повільніше, означає, що вендор продає дашборди, а не економію. І перед підписанням запитайте, чи охоплює інструмент міжпровайдерну маршрутизацію або лише одного гіперскейлера. FinOps для одного хмарного провайдера у світі з кількома моделями — це половина рішення.

Ключові висновки

  • PointFive залучила $60 мільйонів при оцінці $500 мільйонів, довівши загальне фінансування до $96 мільйонів на тлі 6-кратного зростання ARR.
  • Проблема "tokenmaxxing" реальна: підприємства щорічно витрачають мільйони на простоюючий контекст, завеликі моделі та постійно активних агентів без власника.
  • Повідомлена окупність Nubank за десять днів встановлює новий орієнтир для ROI-заяв у FinOps. Вимагайте аналогічних умов від будь-якого вендора.
  • Скорочення запланованого найму з 80 до 40 через внутрішнє використання AI — найбільш переконлива продуктова демонстрація, яку могла б представити PointFive.
  • Гіперскейлери поглинуть базову AI-аналітику витрат протягом року. Захищена гра — міжпровайдерна атрибуція та маршрутизація, і саме там TokenShift має перемагати.

Часті запитання

Q: Що насправді робить PointFive?

PointFive інтегрується з хмарними середовищами та безперервно сканує їх на предмет марнотратних витрат, включно з простоюючими серверами, невикористаним сховищем, завеликими AI-контекстними вікнами та неефективним вибором моделей. Після цього вона надає рекомендації з оптимізації, позиціонуючи себе як "тренера з ефективності" для інженерних команд. Нещодавно запущений продукт TokenShift відстежує та контролює використання внутрішніх AI-інструментів.

Q: Чому витрати на AI-інфраструктуру раптово стали проблемою на $60 мільйонів?

Підприємства активно впроваджували AI протягом останніх двох років без атрибуції витрат за командами, що призвело до того, що партнер Accel Філіп Боттері називає "tokenmaxxing". CTO Meta Ендрю Босворт порушив цю ж проблему внутрішньо у квітні, попередивши персонал не використовувати AI-інструменти просто заради цього. Зростання витрат випередило управління в більшості великих організацій.

Q: Чи захищена PointFive від нативних FinOps-інструментів гіперскейлерів?

У короткостроковій перспективі — так, оскільки дашборди витрат AWS, Azure та Google Cloud залишаються слабкими щодо AI-специфічного марнотратства і не охоплюють різних провайдерів. У довгостроковій — захищена ніша полягає в міжхмарній, між-модельній атрибуції та рекомендаціях з маршрутизації. Якщо TokenShift та аналогічні інструменти це забезпечать, PointFive залишиться актуальною. Якщо ні — стане ціллю для поглинання.

AD
Alex Drover
RiverCore Analyst · Dublin, Ireland
ПОДІЛИТИСЯ
// RELATED ARTICLES
ГоловнаРішенняПроєктиПро насКонтакт
Новини06
Дублін, Ірландія · ЄСGMT+1
LinkedIn
🇺🇦UK