Российские LLM оказались в десятки раз дороже зарубежных: исследование Nodul

Компания Nodul рассчитала, сколько стоит автоматизация профессиональных задач с помощью ИИ-агентов: от перевода и копирайтинга до анализа резюме и сводных отчетов. Все расчеты приведены в рублях за выполнение одной задачи. В основе сравнения лежит стоимость токенов, на которых работают большие языковые модели (LLM). Об этом CNews сообщили представители Nodul.

Исследование охватывает девять типовых сценариев: переводчик (1 тыс. знаков), копирайтер (10 тыс. знаков), оператор поддержки (одно обращение), документооборот (один шаблонный документ), секретарь (5 минут разговора), менеджер по холодным продажам (SDR, обработка лида), супервайзер кол-центра (час слушает звонки), HR-менеджер (анализ одного резюме) и аналитик (сводный отчет по продажам из 10 разных документов).

Для каждого кейса Nodul рассчитала, сколько токенов нужно модели на ввод и вывод данных, и перевела эту нагрузку в рубли по действующим тарифам конкретных LLM. В обзор попали российские модели — YandexGPT (Lite и Pro), GigaChat (Lite и Pro) — и зарубежные — DeepSeek, GPT-mini, GPT-5, Claude Sonnet.

Практически во всех сценариях самой дорогой моделью оказалась GigaChat PRO, а самой дешевой — DeepSeek. Разница между ними значительная: при копирайтинге 10 тыс. знаков стоимость отличается в 208 раз (154,5 руб. против 0,74 руб.); при работе оператора поддержки — в 204 раза (15,8 руб. против 0,08 руб.); в документообороте — в 160 раз (22,5 руб. против 0,14 руб.); при переводе текстов — в 161 раз (1,6 руб. против 0,009 руб.); при анализе одного резюме без учета парсинга источников — в 184 раза (2,7 руб. против 0,01 руб.); при обработке входящего лида в отдел продаж — в 160 раз (2,25 руб. против 0,01 руб.).

Под российскими LLM чаще всего подразумеваются не модели, созданные с нуля, а дообученные версии открытых моделей мировых вендоров: LLaMA, Qwen, Mistral и др. Российские разработчики адаптируют их под локальные данные и разворачивают на собственных серверах.

Главная причина высокой стоимости таких решений — инфраструктура. Из-за санкций доступ к современным графическим процессорам GPU ограничен и закупка оборудования идет через посредников с наценкой. Использование зарубежных облачных сервисов ограничено из-за запрета передачи персональных данных за границу (№ 152-ФЗ «О персональных данных»). В результате российским провайдерам приходится поддерживать собственные дата-центры. Сервер для обслуживания 1000 пользователей стоит порядка 55 млн руб., не считая расходов на электроэнергию и обслуживание.

Даже при наличии оборудования себестоимость зависит от загрузки. Чтобы токен (минимальная единица текста, которую обрабатывает нейросеть) стоил разумно, процессоры должны работать на 80–90%. Но внутренний спрос на корпоративные LLM пока невысок, что делает генерацию текстов и запросов значительно дороже.

На итоговой стоимости сказываются особенности тарификации. Российские провайдеры часто устанавливают одинаковую цену на входящие и исходящие токены, тогда как у зарубежных генерация ответа стоит дороже ввода. Для сценариев с длинными промптами и короткими ответами — типичных для ИИ-агентов — это означает кратный рост стоимости. В результате использование российских моделей обходится в десятки раз дороже, чем зарубежных.

В Nodul считают, что компании, которые планируют активно внедрять агентов, должны сформулировать ИИ-стратегию. В этом документе описывается, какие модели и на каких этапах автоматизации будут использованы, чтобы достичь оптимального соотношения качества, стоимости и безопасности. Почти все агенты состоят из связанных подпроцессов: одни из них выгоднее выполнять на базовых моделях, другие — на продвинутых. При генерации сложных текстов или сценариев лучше использовать мощные LLM, а для просмотра контента и оценки его статуса подойдут более простые.