Экономика AI-сервисов для простых смертных — Многие знают из стрима, что мы готовим к релизу AI в SingularityApp. Можно будет сказать: «назначь мне встречу с Иваном Ивановичем, выпить водки, подбери подходящее время на завтра», и получить готовое расписание. Ну и куча интересных кейсов. Основные модели, которые мы используем — от OpenAI. Фоллбэк на других провайдеров (и даже на локальные модели Ollama) уже предусмотрен. Данные все же очень чувствительные, чего их буржуям отправлять? Дело движется, код пишется. Дошло дело до экономики. Сели, расчехлили калькуляторы... и зависли. На несколько часов. В общем, расклад выглядит так: 1️⃣ API оплачивается за токены — это кусочки слов, которые понимает или генерирует GPT. Вы видели, как он отвечает по слогам «тыг-дыг-дык» — вот это, грубо говоря, и есть токены. Мы платим и за входящие токены (сколько данных послали), и за выходящие (сколько «наболтала» нейронка). Это база и это знают все, кто хоть немного в теме. 2️⃣ Разные модели стоят по-разному. Хорошие и «умные» модели стоят сильно дороже «глупых». В разы. Но от глупых больше вреда, чем пользы. 3️⃣ Используя API, можно легко и быстро сжечь $20, $50, $100 и больше не то что за дни, а даже за несколько часов. Все зависит от сложности запросов и объема контекста. Например, условный “миллион” токенов (миллион — звучит круто же!) можно спалить просто на расшифровку часового видео в Gemini 2.5, даже не заметив это. «Черное зеркало», или хитрая экономика AI-сервисов Сервисы, активно использующие GPT с большой аудиторией, похоже, «договариваются» с провайдерами моделей на скидки. Нам тут сильно сложнее. А дальше начинается 7 сезон «Черного зеркала» (2025 года), серия 1: 1. Сначала вас за относительно-дешево заманивают на базовый тариф. 2. Потом вы «подсаживаетесь», но базового тарифа быстро перестает хватать. Следующий тариф стоит x10 (или более). 3. При интенсивном использовании его тоже перестает хватать. Дальше можно покупать «бусты». Например, по скорости (что говорит о том, что интенсивное использование GPT приводит к деградации скорости ответа — ее начинают резать, причем сильно). Похоже, по этому пути пошел Microsoft в Copilot, когда сделал пару месяцев назад агентов бесплатными и, видимо, столкнулся с лютой нагрузкой. 4. В итоге, при очень интенсивном использовании хороших моделей вы кроме абонентки все равно попадаете на интенсивную оплату токенов. Как продают AI пользователям? Два подхода Существует 2 принципиальных подхода: 1. “Открытый” — честно показывать пользователю, что он платит за токены. — Плюсы: можно прозрачно вести экономику. — Минусы: пользователи далеко не всегда понимают, что такое «токен» и что за кота в мешке он купил. Можно давать пробные периоды (тот самый миллион токенов) и показывать расход токенов. Но гарантированно найдется кто-то, кто будет недоволен результатом генерации и начнет «бу-бу-бу, какая-то фигня, за что только ДЕНЬГИ плачу!». Второй минус — стоимость токенов разная у разных моделей, что просто взрывает башку неподготовленному пользователю. 2. “Хитрожопый” — продавать «запросы»**. — Тут вместо токенов пользователям продают «запросы» или что-то еще синтетическое. Но делают оговорку: «Иногда сложный запрос это не один запрос, а три». Я не выдумываю, я изучил несколько соглашений от разных сервисов) — Из описания и практики считывается, что запросы на «подписочной» модели будут «замедляться», ставиться в очереди и т.д. Хочешь быстрее — покупай «бусты» или плати за токены. — А какая именно модель (умная или тупая, от которой больше вреда, чем пользы) будет использована — не факт, что вам скажут. Похоже, что общий подход: дать на старте поиграться с хорошей моделью, чтобы клиент «втянулся». А потом начать играть в игры с понижением скорости, бустами и прочим шлаком. Тут заканчивается инженерия и начинается богомерзкий “маркетинг”.
Экономика AI-сервисов для простых смертных — Многие знают из стрима, что мы…
Источник
https://t.me/sibirix/656Канал Владимир Завертайлов | Управление digital-проектами и продуктами · опубликовано 24 июл. 2025 г.
Из этого канала
- #657Почему все так сложно? В большинстве сервисов, использующих GPT, очень хитрые…
Почему все так сложно? В большинстве сервисов, использующих GPT, очень хитрые пользовательские соглашения.
- #658Синдром фрактального уродства Из старой книжки Брукса I will contend that…
Синдром фрактального уродства Из старой книжки Брукса I will contend that conceptual integrity is the most important consideration in system design.
- #659✅ SingularityApp, что нового? Помните, недавно мы запускали бета-тестирование?…
✅ SingularityApp, что нового? Помните, недавно мы запускали бета-тестирование? В специальные версии приложения вошли разные функции, мы получили обратную связь…
- #655К нам на аэродром поселился вот такой вот пайпер. Покраска новая. Из Германии.…
К нам на аэродром поселился вот такой вот пайпер. Покраска новая. Из Германии. Немец решил подарить самолёт своей подружке.
- #654Порталов, которые освещают выставки по всему миру — много, а такой, как наш…
Порталов, которые освещают выставки по всему миру — много, а такой, как наш свежий проект Expoclub — один.