Обмен данными для ИИ в нефтегазовой отрасли России под угрозой срыва из-за скрытности компаний
Российские нефтегазовые компании не стали делиться данными друг с другом из-за коммерческих тайн. Обмен информацией нужен для создания ИТ-платформы, чтобы анализировать ИТ-инциденты, связанные с отказом оборудования или авариями, когда данных в отдельно взятой компании не так много. Ни один из участников рынка в 2025 г. не готов делиться конфиденциальными данными с коллегами для обучения нейронной сети.
Трудности при создании общеотраслевой ИТ-платформы
Нефтегазовые компании не стали делиться данными друг с другом, пишут «Ведомости». Обмен информацией нужен для обучения и функционирования генеративного искусственного интеллекта (ИИ) в отрасли.
В 2024 г. «Выгон консалтинг» совместно с «Газпром нефтью» предложили создать общеотраслевую ИТ-платформу на базе ИИ в рамках мероприятий индустриальных центров компетенций (ИЦК) «Нефтегаз, нефтехимия и недропользование». ИЦК были сформированы в 2022 г. по инициативе премьер-министра России Михаила Мишустина как консорциумы индустриальных заказчиков и ИТ-компаний для разработки отечественного программного обеспечения (ПО) взамен зарубежного.
Как сообщил 11 сентября 2025 г. генеральный директор консалтинговой компании «Выгон консалтинг» Григорий Выгон, компании нефтегазового сектора отказались от совместного создания ИТ-платформы на базе генеративного ИИ. Ни один игрок рынка не готов обмениваться конфиденциальной информацией с конкурентами для обучения нейронных сетей.
Однако идея отраслевой ИТ-платформы до сих пор не получила поддержки от участников ИЦК, подчеркнул Григорий Выгон. ИТ-платформа была представлена как один из методов решения инженерных задач в отрасли — реверс-инжиниринга и генеративного проектирования при разработке новых материалов и технологий.
Данные для ИТ-плафтормы
Разработка ИТ-решений на основе генеративного ИИ обходится дорого для одной компании, поэтому и возникла идея совместной ИТ-платформы, пояснил Григорий Выгон «Ведомостям». Для дообучения базовых языковых ИИ-моделей и создания ИТ-решений под конкретные отраслевые задачи необходима соответствующая ИТ-инфраструктура. Прежде всего, по словам эксперта, требуются видеокарты, мультимодальные исходные данные, датасеты для обучения и тестирования, открытые репозитории, а также, возможно, коммерческие большие языковые модели (LLM) и прототипы ИТ-решений.
По словам Григория Выгона, обмен информацией необходим в первую очередь для анализа ИТ-инцидентов, связанных с отказами оборудования или авариями, когда данных одной компании недостаточно. В таких случаях дообучить ИИ-модель и создать качественное ИТ-решение сложно, поэтому приходится использовать синтетические данные.
Генеративные ИИ-модели от «Яндекса», Сбербанка или Open Source решения нельзя напрямую применять для задач нефтегазовой отрасли. Например, геолог должен знать методику расчета запасов по российской или международной классификации, быть в курсе актуальной нормативной базы и процедур экспертизы в государственных органах. Для этого нужно подобрать актуальные материалы, многие из которых недоступны публично. Это пример относительно простой задачи персонализации в процессах делопроизводства, характерной для крупной нефтяной компании. Господин Выгон отмечает, что в одном функциональном блоке таких задач могут быть десятки, а в бизнес-блоках они еще сложнее, поэтому объединение усилий для ИТ-разработки их прототипов было бы целесообразным.
Необходимо настроить процесс регулирования
Представитель «Сибура» отметил «Ведомостям», что компания заинтересована в разработке эффективных отраслевых ИТ-решений и готова рассматривать любые инициативы. Однако для этого необходима регуляторная база в России, обеспечивающая безопасные механизмы взаимодействия и защиту конфиденциальных данных, уточнил он.
Публичное акционерное общество (ПАО) «Сибур Холдинг» — одна из крупнейших интегрированных нефтегазохимических компаний России. ИТ-компания зарегистрирована в Тобольске по месту нахождения ключевой производственной площадки, управляющая компания расположена в Москве.
«Сибур» активно исследует возможности генеративного ИИ. «Мы тестируем пилотные ИТ-решения для ключевых направлений бизнеса, включая отдел исследований и разработок, финансы, закупки, а также внедряем интеллектуальных помощников для всех сотрудников», — сообщил представитель компании. Параллельно «Сибур» развивает собственные компетенции в создании специализированных ИИ-моделей, адаптированных под бизнес-процессы. 16 сентября 2025 г. ИТ-компания разворачивает ИТ-инфраструктуру LLM во внутреннем контуре, что позволит расширить применение генеративного ИИ в ключевых процессах, сохраняя при этом стандарты информационной безопасности (ИБ).
Моя прелесть т.е. собственность
Теоретически данные российских нефтегазовых компаний можно объединить на единой ИТ-платформе и разработать отечественный аналог IHS EDIN — одного из ключевых ИТ-ресурсов, содержащих информацию по геологоразведке, добыче и транспортировке углеводородов в разных регионах мира, — считает менеджер практики «Стратегия» компании «Рексофт консалтинг» Сергей Ермилов. Например, по его словам, в «Газпром нефти» существует хорошо структурированная внутренняя база данных, которая собирает информацию по российским активам (месторождениям) в сегменте upstream (сектор нефтяной индустрии включающий поиск потенциальных мест залегания нефти, бурение разведочных и эксплуатационных скважин) с детализацией до отдельных скважин.
Российские вертикально интегрированные нефтегазовые компании (ВИНК) охватывают всю производственную цепочку: от разведки и добычи до транспортировки, переработки и реализации продукции конечным потребителям, поясняет Сергей Ермилов. За годы работы ВИНК накопили обширные массивы данных о нефтегазоносных провинциях России, включая детальную информацию о геолого-технических условиях месторождений, их примерной стоимости и требованиях к разработке. По мнению эксперта, нефтяная компания не увидит выгоды в предоставлении доступа к своим внутренним ИТ-системам другим участникам рынка, если итоговый ИТ-продукт будет иметь такую же детализацию и охват, как уже имеющиеся у нее данные. Объединить данные ВИНК на единой ИТ-платформе возможно только при наличии политической воли у российских властей, например, со стороны Министерства энергетики (Минэнерго) России, считает Ермилов.

Технический директор MD Audit (группы компаний (ГК) Softline) Юрий Тюрин предлагает ИТ-решение в виде защищенных дата-спейсов, где данные анонимизируются или агрегируются, что позволяет использовать их в обезличенном виде для обучения ИИ, сохраняя их ценность, но не раскрывая конфиденциальную информацию.
Нефтегазовые компании пока осторожно относятся к внедрению генеративного ИИ в высокорисковые процессы из-за рисков некорректных ответов и предпочитают тестировать точечные решения в непроизводственных функциях, отмечает Сергей Ермилов. В сентябре 2023 г. «Татнефть» и Санкт-Петербургский государственный университет информационных технологий (ИТМО) представили цифрового помощника «Акела» — чат-бота, который помогает получать инструкции по бизнес-процессам, искать корпоративные данные и тестировать специалистов с проверкой ответов. В 2024 г. «Газпром нефть» совместно с Университетом Иннополис и Nedra Digital разрабатывает ИИ-платформу для геомеханического моделирования, предназначенную для оценки запасов, продуктивности и выбора методов разработки.
В мире существуют примеры внедрения генеративного ИИ в процессы, охватывающие геологию, моделирование резервуаров, переработку углеводородов и реализацию, отмечает Господин Ермилов. Например, Saudi Aramco разработала и внедрила геологическую модель Aramco Metabrain AI, которая предоставляет рекомендации по оптимальным методам разработки и проектирования скважин. Британская Shell использует ИТ-платформу предиктивного обслуживания для мониторинга оборудования на добывающих платформах, которая заранее выявляет потенциальные проблемы и предлагает решения по их устранению. Однако, как подчеркнул партнер и лидер практики технологического консультирования компании Деловые Решения и Технологии (ДРТ) Тимофей Хорошев, крупные нефтегазовые компании активно инвестируют в цифровизацию, включая процессы до добычи, но чаще всего это реализуется через продвинутую аналитику данных, машинное обучение (ML) и предиктивный анализ, а не исключительно с помощью генеративного ИИ.