API ECONOMY

Экономика контекста: Сколько стоит твоя рутина?

Выходные токены (генерация кода) в 3–5 раз дороже входных (чтение репозитория). Каждый раз, когда ты задаешь вопрос в старый чат, модель заново перечитывает 100% истории. Редактируй старые промпты через кнопку «карандаша», декомпозируй задачи и используй Prompt Caching в Claude Code — это срезает до 90% стоимости повторных запросов.

K tokens
~15-20 исходных файлов проекта
K tokens
Генерируемый код, фиксы и тесты
Стоимость одной итерации (запроса):
Claude Code Prompt Caching
$0.0000
Claude 3.5 Sonnet Base API
$0.0000
GPT-4o ChatGPT API
$0.0000
Gemini 1.5 Pro Google API
$0.0000
Что ты получишь на условный депозит в $10?
0
Чистых диалогов в Claude Code
0
Таких же диалогов в GPT-4o

* Расчет диалога ведется с учетом того, что при грамотном использовании кэша в Claude Code каждая последующая итерация внутри контекста обходится в копейки.

CODEBASE METRICS

Что такое токен в мире кода?

Нейросеть видит проект не словами и не строчками. Она разбивает текст на токены — это куски слов, отдельные символы, скобки, пробелы и знаки пунктуации.

РАЗГОВОРНЫЙ ЯЗЫК
1 токен ≈ 3-4 симв.
В обычном тексте или ТЗ токены расходуются экономно, так как слова длинные, а знаков препинания мало.
ПРОГРАММИРОВАНИЕ
1000 токенов ≈ 90 строк
В коде токены улетают мгновенно из-за обилия синтаксических конструкций { }, =>, function и отступов.
Золотое правило для исходного кода:
1 000 токенов 4 000 символов 80–100 строк кода

Каждые 100 строк твоего скрипта — это гарантированно около 1 000 токенов входного контекста, за которые спишется оплата.

Быстрая проверка своего файла:
lines
Примерно символов: 11 250
Вес в контексте ИИ: ~2 800 токенов

Как считается Prompt Caching (Экономика цепочки файлов)

Интерактивная симуляция отправки 3 файлов один за другим
📄 File_1.cwr
1 000 строк ≈ 10 000 токенов
📄 File_2.local
3 000 строк ≈ 30 000 токенов
📄 File_3.skills
5 000 строк ≈ 50 000 токенов
Claude
API
⚡ File_1 (В памяти)
⚡ File_1 + File_2
⚡ Все 3 файла в кэше
ДЕТАЛИЗАЦИЯ ИТЕРАЦИЙ И СТОИМОСТИ (Тариф Opus) Input: $5/MTok | Write: $6.25/MTok | Read: $0.50/MTok
1. Отправка File_1 (10K токенов) Write (Запись) 10 000 × $6.25 / 1M = $0.0625
2. Отправка File_2 (30K токенов). Старый File_1 читается из памяти! Read + Write (10K × $0.50) + (30K × $6.25) / 1M = $0.1925
3. Отправка File_3 (50K токенов). File_1 и File_2 уже в памяти! Read + Write (40K × $0.50) + (50K × $6.25) / 1M = $0.3325
ИТОГО ЗА ВСЮ СЕССИЮ (90 000 токенов контекста): $0.0000
Статус: Готов к симуляции. Нажмите зеленую кнопку.
Пошаговый дебаг: Как считает модель
> Нажмите на итерации, чтобы увидеть процесс накопления контекста
Входной массив данных (Контекст) Вес: 150 токенов
llm-compute-engine
// Результат математического расчета вероятностей:
Модель обрабатывает весь массив слева и генерирует ровно одно следующее слово:
МАТРИЦА ЧТЕНИЯ: 100% Контекста
ОПЕРАЦИЯ: Расчет Токена