PointFive привлекла $60 млн для контроля расходов на облачный ИИ
Каждый технический руководитель, запустивший LLM-функцию за последний год, смотрел один и тот же фильм ужасов: панель Grafana с графиком расходов на токены, которая идёт вверх по прямой, пока влияние на продукт остаётся нулевым. PointFive Inc. только что привлекла $60 миллионов, поставив на то, что тысячи финансовых команд вот-вот начнут задавать неудобные вопросы об этом графике. Раунд возглавила Accel, оценив нью-йоркский стартап в $500 миллионов.
Что произошло
PointFive закрыла раунд на $60 миллионов под руководством Accel; в нём также приняли участие Index Ventures, Entre Capital, Perpetual Growth, Vesey Ventures, Sheva Ventures и Salesforce Ventures. Как сообщил SiliconANGLE, сделка доводит общий объём финансирования до $96 миллионов, а оценка компании составляет $500 миллионов — ровно половину пути до статуса единорога. Название PointFive — отсылка к заявлению компании о том, что она способна сократить облачные счета клиентов вдвое.
Основанная в 2023 году Ароном Арватцем, Галем Бен Давидом и Амиром Хозезом, команда не новичок в корпоративном программном обеспечении. Прежде трое из них создали IntSights Cyber Intelligence, которую Rapid7 приобрела примерно за $335 миллионов в 2021 году. PointFive они основали после того, как наблюдали расточительные облачные расходы в ходе интеграции IntSights в Rapid7.
Показатели роста, которыми они поделились, — из тех, что заставляют венчурных инвесторов подписывать быстро. Годовой регулярный доход вырос в шесть раз за последний год. Существующие клиенты в среднем удвоили свои расходы. Арватц говорит, что компания на пути к пятикратному росту выручки в этом году. Среди клиентов — немецкая энергетическая компания E.ON, бразильский необанк Nubank и Fanatics, американский оператор спортивного мерчандайза и гемблинга. По имеющимся данным, Nubank окупила расходы на PointFive за десять дней.
Вместе с объявлением о финансировании 8 июня PointFive запустила TokenShift — сервис для отслеживания и контроля использования внутренних ИИ-инструментов. Новый капитал направлен на расширение в Европе и Израиле, а также на найм около 40 новых сотрудников в маркетинг и R&D. Примечательно, что изначально планировалось нанять 80 человек. Это число сократили вдвое, потому что компания использует собственные ИИ-инструменты внутри.
Техническая сторона
Категория FinOps переполнена, поэтому интересный вопрос — что именно PointFive делает иначе. Судя по описанию компании, платформа интегрируется напрямую с облачными средами клиентов и работает непрерывно, сканируя инфраструктуру для выявления потерь. Стандартный набор: простаивающие серверы, неиспользуемое хранилище, избыточные инстансы. Специфика для ИИ — там питч становится острее.
Важны два паттерна. Первый — раздувание памяти и контекста. Команды заталкивают всё более широкие контекстные окна в каждый запрос, потому что больше контекста кажется надёжнее. Это не так. Избыточный контекст ухудшает задержку и сжигает токены линейно с размером входных данных. Ценность PointFive здесь — фактически аудит пайплайнов промптов и извлечения данных на предмет потерь, так же как APM-инструмент отмечает N+1 запросы к базе данных. Любой, кто запускает RAG в продакшне, знает соблазн впихнуть всю базу знаний в контекст вместо того, чтобы настраивать retrieval. Эта привычка отражается в счёте.
Второй паттерн — агенты в постоянном режиме работы. Фоновые агенты, которые опрашивают, наблюдают или предвычисляют, — это новые cron-задачи, только каждый тик может стоить реальных денег через API-вызовы к провайдерам вроде OpenAI или Anthropic. Производственные инциденты с запланированными задачами, которые я видел, почти всегда восходят к тому, что кто-то забыл об их существовании. С агентами это забвение сопровождается счётчиком токенов.
Механизм рекомендаций PointFive также предположительно предлагает более дешёвые модели для конкретных задач. Это замаскированная задача маршрутизации. Не каждая классификация требует фронтирной модели. Хорошо настроенная меньшая модель или даже файнтюненная open-weight модель с Hugging Face может снизить стоимость одного вызова на порядок. Сложная часть — знать, какие вызовы можно безопасно понизить, не потеряв в точности. Вот где фрейминг «тренера по эффективности» оправдывает себя — если рекомендации точны.
Новый продукт TokenShift атакует сторону внутренних инструментов: отслеживает, какие сотрудники и какие рабочие процессы потребляют токены. Филипп Боттери из Accel называет лежащую в основе проблему «tokenmaxxing» — компании разгоняют затраты, потребляя токены ИИ без чёткого ROI. Технический директор Meta Эндрю Босворт открыто высказался об этом в апрельском меморандуме для сотрудников: «никто не должен использовать ИИ-инструменты ради самого использования. Не всякое движение есть прогресс, и использование токенов само по себе не является мерой какого-либо результата».
Кто несёт потери
Сильнее всего сейчас рискуют компании среднего масштаба, которые за последние 18 месяцев внедрили ИИ повсеместно, не выстроив модель распределения затрат. Инженеры включили Copilot, поддержка подключила LLM-автоответчик, маркетинг наладил контент-пайплайны — и никто не владеет счётом. Когда финансовый отдел спрашивает, кто санкционировал шестизначный ежемесячный счёт от Anthropic, ответ звучит как «все, в каком-то смысле».
Операторы iGaming особенно уязвимы. Движки персонализации, скоринг мошенничества, суммаризация KYC и чат-боты поддержки — все они тянут из одних и тех же аккаунтов провайдеров, зачастую без атрибуции по командам. Команды, с которыми я работал у европейских операторов, имели чёткое распределение затрат на базы данных и Kubernetes, но сваливали все вызовы моделей в один общий API-ключ. Это бюджетное слепое пятно размером с небольшую продуктовую команду.
Следующая вертикаль, которая это почувствует, — финтех. История Nubank с окупаемостью за десять дней быстро разойдётся по сетям финансовых директоров. Если необанк с сильной инженерной культурой всё равно имел столько потерь для возврата, каждый розничный банк, запускающий пилоты, сидит на ещё более крупных утечках. Арватц отметил, что некоторые крупные компании тратят миллионы ежегодно на ненужные ресурсы. Это бюджет двух старших инженеров каждый месяц — на инфраструктуру, которую никто на самом деле не использует.
Неудобное прочтение ситуации: категория FinOps сама по себе вот-вот стремительно переполнится. PointFive хорошо профинансирована и имеет реальных клиентов, но каждый гиперскейлер в течение двенадцати месяцев встроит нативную аналитику затрат на ИИ в свои консоли. Окно для стартапа — следующие два года. После этого всё превратится в функцию, а не в продукт — если только TokenShift и подобные инструменты не найдут защищённую нишу в кросс-облачной, кросс-провайдерной атрибуции.
Моё мнение: решение PointFive по найму говорит о рынке больше, чем сам раунд финансирования. Сокращение запланированных вакансий с 80 до 40 потому, что собственные ИИ-инструменты взяли на себя эту работу, — либо подлинная история о производительности, либо хедж против того самого охлаждения спроса, против которого они продают своё решение. Скорее всего, и то и другое.
Инструкция для ИИ-разработчиков
Если вы управляете продуктом с ИИ, сделайте три шага на этой неделе — прежде чем оценивать любого вендора.
Первое: пометьте каждый API-ключ провайдера по команде и функции. Один общий ключ на всю организацию — это FinOps-эквивалент запуска root в продакшне. Нельзя оптимизировать то, что нельзя атрибутировать. Если ваш провайдер поддерживает ключи с ограниченным областью действия проекта, используйте их уже сегодня.
Второе: проверьте свои контекстные окна. Возьмите неделю продакшн-промптов и измерьте средний размер входного токена по сравнению с минимально необходимым контекстом. Большинство команд обнаруживают, что отправляют в два-пять раз больше контекста, чем требует задача. Сократить это — бесплатные деньги без изменения модели.
Третье: составьте инвентарь своих агентов и запланированных ИИ-задач. Каждый постоянно работающий агент нуждается в ответственном, кнопке отключения и ежемесячном ревью. Если никто не может объяснить, что делает агент в этом квартале, выключите его и посмотрите, кто пожалуется. Производственные инциденты с осиротевшими фоновыми задачами, которые я видел, следуют одному паттерну: дёшево игнорировать, пока не перестаёт быть дёшево.
Для технических руководителей, оценивающих PointFive или конкурентов: требуйте пилот, который окупится за 90 дней — письменно. Заявление Nubank про десять дней задаёт планку. Всё медленнее означает, что вендор продаёт дашборды, а не экономию. И перед подписанием спросите, охватывает ли инструмент кросс-провайдерную маршрутизацию или только одного гиперскейлера. FinOps для одного облака в мире множества моделей — это половина решения.
Ключевые выводы
- PointFive привлекла $60 миллионов при оценке $500 миллионов, доведя общее финансирование до $96 миллионов на фоне шестикратного роста ARR.
- Проблема «tokenmaxxing» реальна: предприятия ежегодно сжигают миллионы на простаивающем контексте, избыточных моделях и агентах, которые никому не принадлежат.
- Заявленная десятидневная окупаемость Nubank задаёт новый ориентир для заявлений о ROI в FinOps. Требуйте аналогичных условий от любого вендора.
- Сокращение плановых вакансий с 80 до 40 благодаря внутреннему использованию ИИ — это самая убедительная демонстрация продукта, которую PointFive могла бы показать.
- Гиперскейлеры поглотят базовую аналитику затрат на ИИ в течение года. Защищённая позиция — кросс-провайдерная атрибуция и маршрутизация, именно там TokenShift должен победить.
Часто задаваемые вопросы
В: Что конкретно делает PointFive?
PointFive интегрируется с облачными средами и непрерывно сканирует их на предмет расточительных расходов, включая простаивающие серверы, неиспользуемое хранилище, избыточные контекстные окна ИИ и неэффективный выбор моделей. Затем она предлагает оптимизации, позиционируя себя как «тренер по эффективности» для инженерных команд. Недавно запущенный продукт TokenShift отслеживает и контролирует использование внутренних ИИ-инструментов.
В: Почему затраты на ИИ-инфраструктуру внезапно стали проблемой на $60 миллионов?
Предприятия активно внедряли ИИ в последние два года без атрибуции затрат по командам, что привело к тому, что партнёр Accel Филипп Боттери называет «tokenmaxxing». Технический директор Meta Эндрю Босворт затронул ту же проблему внутри компании в апреле, предупредив сотрудников не использовать ИИ-инструменты ради самого использования. В большинстве крупных организаций рост затрат опередил систему управления ими.
В: Устойчива ли PointFive перед нативными FinOps-инструментами гиперскейлеров?
В краткосрочной перспективе — да, потому что дашборды затрат AWS, Azure и Google Cloud остаются слабыми в части специфических для ИИ потерь и не охватывают несколько провайдеров. В долгосрочной перспективе защищённая ниша — кросс-облачная, кросс-модельная атрибуция и рекомендации по маршрутизации. Если TokenShift и подобные инструменты это обеспечат, PointFive останется актуальной. Если нет — станет объектом поглощения.
Ключевой разработчик кастомных чипов OpenAI уходит в Anthropic перед IPO
Клайв Чан, второй нанятый в программу кастомных чипов OpenAI, ушёл в Anthropic. Момент — за несколько недель до IPO — не случаен.
Gemma 4 QAT: модель E2B занимает 1 ГБ — математика ИИ на устройстве изменилась
Google DeepMind выпустила QAT-чекпоинты для Gemma 4: модель E2B теперь занимает 1 ГБ. Расчёт «строить или покупать» для ИИ на устройстве изменился.
Pinterest делает ставку на $4 млрд в AWS Silicon для своего ИИ-будущего
Pinterest подписал сделку на $4 млрд с AWS на шесть лет, сделав ставку на кастомные чипы для визуального поиска и нового разговорного ассистента. Разбираемся, что реально покупает эта сделка.



