З'явилися повідомлення про перехід IREN на AI-інфраструктуру, але вихідна сторінка не містила корисного контенту. Ось на що інженерам слід насправді звернути увагу.
Subquadratic запустився із $29M та контекстним вікном на 12M токенів, заявляючи про зниження вартості інференсу у 300 разів порівняно з Claude Opus. Ось що зміниться, якщо це справді запрацює.
Microsoft додала цілий гігават потужностей за один квартал і планує подвоїти свій ШІ-слід до 2028 року. Математика capex розповідає справжню історію.
Демо TT-Deploy від Moreh розподілило LLM prefill на Tenstorrent Wormhole, залишивши decode на GPU, досягнувши показників рівня DGX A100 без витрат на HBM.
Єдине доступне джерело про Claude Code — це сторінка перевірки браузера без жодних фактів. Ось що ця відсутність говорить покупцям AI-інструментів.
Заголовок про те, що Anthropic обігнав OpenAI за часткою доходів LLM, поширюється мережею, але першоджерело зараз заблоковане браузерною перевіркою. Ось що це означає.
Критична SSRF у функції load_image() LMDeploy: від публічного розкриття до активної експлуатації — лише 13 годин. Sysdig зафіксував атаки на AWS IMDS та Redis у реальних AI-стеках.