Субсидируют ли тебя ИИ-подписки? Посчитал на 28 млн токенов
Уже несколько раз натыкаюсь на эту картинку с воплями: ИИ-подписки массово субсидируют, и на самом деле всё стоит в разы дороже. Логика простая. Берём лимиты твоего тарифа, пересчитываем по ценам API, и выходит, что за $20 в месяц ты теоретически можешь «выжать» на $400. А на топовом плане OpenAI вообще на $14 000 при цене $200. Вывод подаётся как очевидный: тебя кормят в убыток, лавочка скоро закроется, цены взлетят в 20 раз.
Табличка пошла из поста SemiAnalysis в X, а потом разлетелась по r/ClaudeAI.
Та самая табличка. Красивая. И ровно настолько же честная, насколько честно мерить твой месячный счёт за свет по максимальной мощности всех розеток в квартире.
И вот тут во мне просыпается аналитик и тихо выпадает в осадок. Потому что «максимально возможные траты» это ровно тот тип метрики, за который я на ревью отправляю дашборд переделывать.
Грабля №1. Потолок ≠ реальность
«Максимально возможные траты» это потолок, в который почти никто не упирается. Я сам сижу на Max-плане и в лимит залезаю хорошо если пару раз в месяц, под дедлайн. Большинство это джуны, которые спросили «почему джойн не работает», и менеджеры, которые раз в день просят переписать письмо помягче.
Считать экономику сервиса по максимуму выборки всё равно что оценивать буфет по чемпиону, который съел 70 хот-догов. Да, один такой есть. Но провайдер видит не его, а среднее по всей базе, где основная масса не доедает и половину тарелки.
Чтобы вообще упереться в потолок топового тарифа ($8 000), надо за месяц сжечь сотни миллионов токенов вывода. Это уже не «активный пользователь», а маленькая ферма. Обычный человек не доезжает до этой цифры на порядки.
Грабля №2. Цена API это не себестоимость
Главная подмена в этом аргументе: «потолок» считают по прайсу API, как будто это и есть то, во что токены обходятся провайдеру. Но прайс API это не себестоимость, это цена со встроенной маржой, на которой компания зарабатывает.
Зайду со своей старой профессии, я раньше варил пиво. Пинта в меню стоит, скажем, 400 рублей. Солод, хмель и вода в ней рублей 40. Остальное в ценнике это аренда, зарплата бармена, маржа. Цена в меню это не себестоимость. И «ценность» выпитого, посчитанная по меню, ничего не говорит о том, во что оно реально обошлось бару.
С токенами так же. «$400 по API» из таблицы это цена с маржой, а не себестоимость. Реальная маржинальная стоимость ответа это электричество и амортизация уже купленного железа; в часы простоя обслужить ещё один запрос почти бесплатно. Сколько именно, мы не знаем. И в исходном посте тоже не знают: там просто взяли цену API за «правду» и испугались собственного умножения.
А честно, надо считать гибридно
Тут меня справедливо поправят, и я сам себя поправлю. Выше я считал «по выводу», по $25 за миллион. Так нагляднее, но это упрощение. На деле счёт гибридный:
- вход (твои промпты, контекст, файлы, история), $5 за миллион;
- выход (то, что модель генерит), $25 за миллион, впятеро дороже входа;
- кэш (повторно скормленный контекст), ещё на 60–80% дешевле входа.
Соль в том, что микс у всех разный, и разброс огромный. В поиске по базе и у автономных агентов, которые на каждом шаге перечитывают контекст, доминирует вход: на него уходит от ~70% до почти всех токенов. А в тяжёлой генерации, когда модель пишет много кода или текста, перевешивает дорогой выход, как у меня (соотношение входа к выходу примерно 1 к 6). Плюс кэш режет цену повторного входа в разы, поэтому свести всё к «$ ÷ $25» нельзя: реальная цена зависит от твоего конкретного микса. «Максимально возможные траты» это не цифра, а размытое облако, посчитанное по самой дорогой ставке и под полную выборку квоты.
Проверим на мне, теперь точно
Не на сферическом юзере в вакууме, а на себе. Я гоняю Claude каждый день (собрал на нём даже этот сайт) и упираюсь будь здоров: 28,5 млн токенов за месяц, любимая модель Opus 4.8. Трекер ехидно считает, что это в 231 раз больше, чем весь «Хоббит». Аппетит явно не средний, на нём и проверим.
Главное: есть разбивка вход/выход по моделям, а значит, можно посчитать не вилкой, а точно.
У меня доминирует вывод: на Opus 4.8 аж 17 млн токенов выхода против 3 млн входа. Так что «дорогого вывода всегда мало» точно не про меня.
Считаем по ценам OpenRouter, каждую модель по своей ставке:
| Модель ($вход / $выход) | Вход | Выход | Итого |
|---|---|---|---|
| Opus 4.8 ($5/$25) | 3,0M → $15 | 17,0M → $425 | $440 |
| Sonnet 4.6 ($3/$15) | 40k → ~$0 | 3,3M → $50 | $50 |
| Opus 4.7 ($5/$25) | 13k → ~$0 | 2,7M → $68 | $68 |
| Fable 5 ($10/$50) | 358k → $4 | 1,8M → $90 | $94 |
| Haiku 4.5 ($1/$5) | 154k → ~$0 | 255k → ~$1 | $1 |
| Всего | ≈ $650 / мес |
Конкретные ~$650 за месяц по API-прайсу. А тариф у меня Max-5x, плачу $100, и его «потолок» по той самой таблице $2 000. Сложим всё вместе.
Плачу $100, по API было бы ~$650, а «потолок» $2 000. Даже я, прожорливый, выбрал лишь треть потолка.
Отсюда два честных вывода, оба против истерики:
- «Потолок» это не про реальность. Даже я с моим аппетитом беру лишь треть от $2 000 своего тарифа. Средний юзер проценты. Считать всю базу по максимуму квоты просто неверно.
- Субсидируют ли меня, и насколько? Даже по их же логике (по прайсу API) я «стою» $650 против своих $100. Это в разы меньше тех ×40, которыми пугают. А с поправкой на граблю №2 ($650 это цена с маржой, а не себестоимость) реальная субсидия ещё меньше. Может, провайдер на мне вообще не в минусе.
А если субсидия и есть, это не благотворительность и не признак краха, а кросс-субсидия: тяжёлых вроде меня вытягивает лёгкое большинство, которое жжёт в десятки и сотни раз меньше. Ровно как абонемент в спортзал: те, кто почти не ходит, оплачивают качалку завсегдатаям. Провайдеру это ок: средний чек по базе сходится, а он играет в долю рынка. Это не «все убыточны, скоро всё подорожает в 20 раз», это обычная экономика подписки.
Грабля №3. У подписки свои цели
Подписка с лимитом это не «фирма работает себе в убыток ради тебя». Это классический SaaS, у которого свои механики:
- Предсказуемая выручка. Стабильный ежемесячный доход со всей базы для компании ценнее, чем непредсказуемый поток разовых API-платежей.
- Кросс-субсидия внутри тарифа. Лёгкие пользователи доплачивают за тяжёлых. Работает, пока тяжёлых меньшинство.
- Доля рынка сейчас, деньги потом. Захватить пользователя и его привычку важнее сиюминутной маржи, это захват рынка, а не милостыня. У OpenAI вообще под миллиард бесплатных пользователей, и ничего, концы с концами сходятся.
- Сглаживание нагрузки. Об этом подробнее ниже, как раз с картинкой.
Последний пункт стоит раскрыть. У подписки есть лимиты: пятичасовое окно и недельный потолок. Они не дают отдельным пользователям долбить по железу как попало и ровно размазывают нагрузку по времени. В API такого нет, там ты платишь за каждый токен и жмёшь сколько влезет. Так что лимиты в подписке это не жадность, а ровно тот механизм, который и позволяет держать для тебя фиксированную цену.
Те самые лимиты: пятичасовые окна и недельный потолок. В API их нет, плати за токены и жми без ограничений.
То есть даже если на верхнем 1% хардкорщиков провайдер реально уходит в минус, на уровне пула это осознанная стратегия, а не дыра в бюджете.
А как же «нейролабы убыточны»?
Тут честно: да, передовые ИИ-компании в целом жгут деньги. Но жгут в основном на обучении моделей и R&D, сотни миллионов на тренировочные кластеры. А обслуживание готовой модели (inference), то, чем пользуешься ты, несравнимо дешевле.
И вот где подмена. «Компания убыточна в целом» превращают в «твоя подписка дыра, скоро всё рухнет». Одно из другого не следует. Да, тяжёлого юзера inference-пул подсубсидирует, мы это посчитали выше. Но это устойчивая кросс-субсидия лёгким большинством, а не та самая «дыра»: большие минусы лабораторий сидят в обучении моделей, а не в том, что ты сегодня нагенерил на $650.
Что с этим делать тебе
Ничего драматичного. Бери план под свой реальный профиль, а не под чужой максимум:
- упираешься в лимиты раз в месяц, тебе и не нужен план дороже;
- живёшь в инструменте по 8 часов, считай не теоретический потолок трат, а сколько он экономит тебе времени. Вот это и есть твоя настоящая экономика, а не цифры из чужой таблицы.
А байку про «скоро всё подорожает в 20 раз» отложи до момента, когда у нас на руках будет реальная себестоимость токена. Пока её нет, это гадание, а не анализ.
Ловил такие «страшные» метрики у себя в работе, когда цифра вроде большая, а смысла под ней ноль? Расскажи в комментариях, разберём.
P.S. Иронично, но сам этот разбор я навайбкодил с Клодом за вечер, те самые токены и потратил.
Частые вопросы
Правда ли, что ИИ-подписки работают в убыток?
Лаборатории в целом жгут деньги, но в основном на обучении моделей и R&D, а не на обслуживании твоей подписки. «Компания пока убыточна» и «лично тебя субсидируют» это разные утверждения: первое про обучение, второе про inference.
Почему нельзя просто поделить лимит тарифа на цену API?
Потому что цена API это прайс с маржой, а не себестоимость. И счёт гибридный: вход $5/млн, выход $25/млн, кэш ещё дешевле. Реальная стоимость токена зависит от микса вход/выход и кэша и ниже, чем по верхней ставке.
Что такое max possible spend?
Это сколько ты теоретически потратил бы по ценам API, если бы выбрал всю квоту тарифа под ноль по самой дорогой ставке. Потолок, в который почти никто не упирается, поэтому как оценка реальной экономики он бесполезен.
Какой план выбрать, чтобы не переплачивать?
Бери под свой реальный профиль, а не под чужой максимум. Упираешься в лимит пару раз в месяц, более дорогой план не нужен. Живёшь в инструменте целыми днями, считай не теоретический потолок, а сколько он экономит тебе времени.