Разделы

Цифровизация Импортонезависимость Искусственный интеллект

Российские LLM оказались в десятки раз дороже зарубежных: исследование Nodul

Компания Nodul рассчитала, сколько стоит автоматизация профессиональных задач с помощью ИИ-агентов: от перевода и копирайтинга до анализа резюме и сводных отчетов. Все расчеты приведены в рублях за выполнение одной задачи. В основе сравнения лежит стоимость токенов, на которых работают большие языковые модели (LLM). Об этом CNews сообщили представители Nodul.

Исследование охватывает девять типовых сценариев: переводчик (1 тыс. знаков), копирайтер (10 тыс. знаков), оператор поддержки (одно обращение), документооборот (один шаблонный документ), секретарь (5 минут разговора), менеджер по холодным продажам (SDR, обработка лида), супервайзер кол-центра (час слушает звонки), HR-менеджер (анализ одного резюме) и аналитик (сводный отчет по продажам из 10 разных документов).

Для каждого кейса Nodul рассчитала, сколько токенов нужно модели на ввод и вывод данных, и перевела эту нагрузку в рубли по действующим тарифам конкретных LLM. В обзор попали российские модели — YandexGPT (Lite и Pro), GigaChat (Lite и Pro) — и зарубежные — DeepSeek, GPT-mini, GPT-5, Claude Sonnet.

Практически во всех сценариях самой дорогой моделью оказалась GigaChat PRO, а самой дешевой — DeepSeek. Разница между ними значительная: при копирайтинге 10 тыс. знаков стоимость отличается в 208 раз (154,5 руб. против 0,74 руб.); при работе оператора поддержки — в 204 раза (15,8 руб. против 0,08 руб.); в документообороте — в 160 раз (22,5 руб. против 0,14 руб.); при переводе текстов — в 161 раз (1,6 руб. против 0,009 руб.); при анализе одного резюме без учета парсинга источников — в 184 раза (2,7 руб. против 0,01 руб.); при обработке входящего лида в отдел продаж — в 160 раз (2,25 руб. против 0,01 руб.).

Под российскими LLM чаще всего подразумеваются не модели, созданные с нуля, а дообученные версии открытых моделей мировых вендоров: LLaMA, Qwen, Mistral и др. Российские разработчики адаптируют их под локальные данные и разворачивают на собственных серверах.

Главная причина высокой стоимости таких решений — инфраструктура. Из-за санкций доступ к современным графическим процессорам GPU ограничен и закупка оборудования идет через посредников с наценкой. Использование зарубежных облачных сервисов ограничено из-за запрета передачи персональных данных за границу (№ 152-ФЗ «О персональных данных»). В результате российским провайдерам приходится поддерживать собственные дата-центры. Сервер для обслуживания 1000 пользователей стоит порядка 55 млн руб., не считая расходов на электроэнергию и обслуживание.

Николай Голов, Postgres Professional: Разрабатывая Tengri Data, мы смотрели на продукт как аналитики
Цифровизация

Даже при наличии оборудования себестоимость зависит от загрузки. Чтобы токен (минимальная единица текста, которую обрабатывает нейросеть) стоил разумно, процессоры должны работать на 80–90%. Но внутренний спрос на корпоративные LLM пока невысок, что делает генерацию текстов и запросов значительно дороже.

На итоговой стоимости сказываются особенности тарификации. Российские провайдеры часто устанавливают одинаковую цену на входящие и исходящие токены, тогда как у зарубежных генерация ответа стоит дороже ввода. Для сценариев с длинными промптами и короткими ответами — типичных для ИИ-агентов — это означает кратный рост стоимости. В результате использование российских моделей обходится в десятки раз дороже, чем зарубежных.

В Nodul считают, что компании, которые планируют активно внедрять агентов, должны сформулировать ИИ-стратегию. В этом документе описывается, какие модели и на каких этапах автоматизации будут использованы, чтобы достичь оптимального соотношения качества, стоимости и безопасности. Почти все агенты состоят из связанных подпроцессов: одни из них выгоднее выполнять на базовых моделях, другие — на продвинутых. При генерации сложных текстов или сценариев лучше использовать мощные LLM, а для просмотра контента и оценки его статуса подойдут более простые.