Tokens - Claude Code

API ECONOMY

Экономика контекста: Сколько стоит твоя рутина?

Выходные токены (генерация кода) в 3–5 раз дороже входных (чтение репозитория). Каждый раз, когда ты задаешь вопрос в старый чат, модель заново перечитывает 100% истории. Редактируй старые промпты через кнопку «карандаша», декомпозируй задачи и используй Prompt Caching в Claude Code — это срезает до 90% стоимости повторных запросов.

Объем кодовой базы (Input) тыс. токенов

K tokens

~15-20 исходных файлов проекта

Длина ответа ИИ (Output) тыс. токенов

K tokens

Генерируемый код, фиксы и тесты

Стоимость одной итерации (запроса):

Claude Code Prompt Caching

$0.0000

Claude 3.5 Sonnet Base API

$0.0000

GPT-4o ChatGPT API

$0.0000

Gemini 1.5 Pro Google API

$0.0000

Что ты получишь на условный депозит в $10?

Чистых диалогов в Claude Code

Таких же диалогов в GPT-4o

* Расчет диалога ведется с учетом того, что при грамотном использовании кэша в Claude Code каждая последующая итерация внутри контекста обходится в копейки.

Anthropic pricing ↗ OpenAI pricing ↗ Gemini pricing ↗

CODEBASE METRICS

Что такое токен в мире кода?

Нейросеть видит проект не словами и не строчками. Она разбивает текст на токены — это куски слов, отдельные символы, скобки, пробелы и знаки пунктуации.

РАЗГОВОРНЫЙ ЯЗЫК

1 токен ≈ 3-4 симв.

В обычном тексте или ТЗ токены расходуются экономно, так как слова длинные, а знаков препинания мало.

ПРОГРАММИРОВАНИЕ
1000 токенов ≈ 90 строк
В коде токены улетают мгновенно из-за обилия синтаксических конструкций { }, =>, function и отступов.

Золотое правило для исходного кода:

1 000 токенов ≈ 4 000 символов ≈ 80–100 строк кода

Каждые 100 строк твоего скрипта — это гарантированно около 1 000 токенов входного контекста, за которые спишется оплата.

Быстрая проверка своего файла:

Сколько строк в твоем файле?

lines

Примерно символов: 11 250

Вес в контексте ИИ: ~2 800 токенов

Как считается Prompt Caching (Экономика цепочки файлов)

Интерактивная симуляция отправки 3 файлов один за другим

📄 File_1.cwr

1 000 строк ≈ 10 000 токенов

📄 File_2.local

3 000 строк ≈ 30 000 токенов

📄 File_3.skills

5 000 строк ≈ 50 000 токенов

Claude
API

⚡ File_1 (В памяти)

⚡ File_1 + File_2

⚡ Все 3 файла в кэше

ДЕТАЛИЗАЦИЯ ИТЕРАЦИЙ И СТОИМОСТИ (Тариф Opus) Input: $5/MTok | Write: $6.25/MTok | Read: $0.50/MTok

1. Отправка File_1 (10K токенов) Write (Запись) 10 000 × $6.25 / 1M = $0.0625

2. Отправка File_2 (30K токенов). Старый File_1 читается из памяти! Read + Write (10K × $0.50) + (30K × $6.25) / 1M = $0.1925

3. Отправка File_3 (50K токенов). File_1 и File_2 уже в памяти! Read + Write (40K × $0.50) + (50K × $6.25) / 1M = $0.3325

ИТОГО ЗА ВСЮ СЕССИЮ (90 000 токенов контекста): $0.0000

Статус: Готов к симуляции. Нажмите зеленую кнопку.

Пошаговый дебаг: Как считает модель

> Нажмите на итерации, чтобы увидеть процесс накопления контекста

Входной массив данных (Контекст) Вес: 150 токенов

llm-compute-engine

// Результат математического расчета вероятностей:

Модель обрабатывает весь массив слева и генерирует ровно одно следующее слово:

МАТРИЦА ЧТЕНИЯ: 100% Контекста

ОПЕРАЦИЯ: Расчет Токена

Что нужно объяснить ребятам на этом примере: Нейросеть — это не обычная программа. У неё нет ячейки памяти, куда она может сохранить строку `fastify.post` и просто дописывать к ней символы. Посмотрите на шаги: на Итерации №2 для того, чтобы написать простое слово `async`, модель вынуждена **заново прочитать** и ваш вопрос, и то слово `fastify.post`, которое она сама написала секунду назад. Контекст растет как снежный ком с каждым словом, и ложится тяжелой нагрузкой на сервера.

Экономика контекста: Сколько стоит твоя рутина?

Что такое токен в мире кода?

Как считается Prompt Caching (Экономика цепочки файлов)

Подберу решение для вашего бизнеса