В крупных компаниях количество документов исчисляется миллионами. Искусственный интеллект сокращает время их обработки в десятки рази со стороны может выглядеть идеальным решением. Однако внедрение ИИ-технологий связано с целым рядом рисков и сложностей, а вложения окупаются не всегда. О том, как можно решать проблемы, возникающие при внедрении ИИ в области документооборота, и эффективно использовать его возможности, CNews рассказал Алексей Борщов, менеджер по продуктам искусственного интеллекта группы «Корус Консалтинг».
Алексей Борщов«Корус Консалтинг»
CNews: Для решения каких задач используют ИИ в документообороте?
Алексей Борщов: В крупных компаниях, где в основном используются системы, аналогичные нашей («Авандок»), весь поток документов можно разделить на три группы: входящие, исходящие и внутренние. Самые большие сложности возникают с входящим потоком. Это разнородные документы из разных источников, требующие разной степени внимания к ним: от предложений с просьбой поучаствовать в каких-то проектах до срочных требований от налоговой инспекции. Их нужно разделить по степени важности, типу, отправителю, получателю, содержанию и ряду других признаков, отправить дальше по маршруту и проконтролировать дальнейший путь каждого документа. На эту работу сотрудники специальных отделов тратят очень много времени и усилий.
И здесь на помощь приходит главная способность современного искусственного интеллекта — понимание текстов. Даже простые модели ИИ уже умеют многое: извлекать содержание и суть, определять, какие действия нужно совершить с документом. Причем ИИ справляется даже с рукописными текстами, распознавая их содержание и переводя в электронный формат. Сильная сторона и одновременно аспект, который оказывает самое большое влияние на развитие современного документооборота — это классификация и маршрутизация с помощью ИИ.
Второе умение ИИ больше востребовано в обработке исходящей и внутренней документации. Это способность определить качество документа по его содержанию. И здесь самый яркий пример применения искусственного интеллекта — работа с договорами. У крупных, и даже средних компаний объем договорного документооборота очень большой. Это сложные тексты, где далеко не всегда соблюдается единообразие формулировок. Чтобы выделить суть и ключевые условия, привлекают юристов, а это довольно дорогие специалисты. В этом случае могут помочь ИИ-инструменты. Так, интеллектуальный помощник, встроенный в платформу «Авандок», который анализирует тексты и дает свои рекомендации, касающиеся как содержания документа, так и его юридической составляющей, например, рисков, которые могут возникнуть при определенных формулировках.
CNews: Можно ли выделить какие-то критически важные для бизнеса задачи, в решении которых помогает ИИ?
Алексей Борщов: Здесь следует учитывать и значимость задачи для бизнеса, и возможности искусственного интеллекта. ИИ может ошибаться: у него бывают так называемые «галлюцинации», неточные ответы. Поэтому чем большее значение задача или процесс имеют для бизнеса, тем осторожнее следует применять ИИ-инструменты. Но есть и третий фактор — объем операций. И с этой точки зрения классификация документов очень важна. Это не самая сложная задача, она не влияет на бизнес критически, но с учетом количества документов, времени и усилий, которые затрачиваются на их обработку, применение ИИ может принести значительную выгоду.
Что же касается задач, критически важных для бизнеса, то здесь, образно говоря, ИИ пока не автопилот, а второй пилот: он помогает, подсказывает, но окончательное решение принимает человек. На текущем уровне развития ИИ можно использовать эти инструменты для решения рутинных задач, которых в крупных компаниях очень много. Например, на проверку пятистраничного документа у юриста уйдет час или два. А если таких документов несколько? И все они срочные? В какой-то момент человек начнет уставать и ошибаться. А ИИ тот же документ проверит за две минуты и сможет обработать еще сколько угодно.
CNews: Не приведет ли это к тому, что ИИ начнет лишать людей работы?
Алексей Борщов: Здесь можно вспомнить о том, что стало с гужевым транспортом после появления поездов и автомобилей. Профессия извозчика постепенно исчезла, но появились другие. На сегодняшний день речь идет об освобождении сотрудников от рутины, которая приводит к усталости и выгоранию, и замене ее на другие задачи, более сложные и интересные.
CNews: С какими сложностями связано внедрение ИИ и больших языковых моделей?
Алексей Борщов: Их можно разделить на три блока. Первый связан с защитой данных. Большие языковые модели часто хранятся у вендоров на облачных серверах и отсылать туда данные на обработку многие компании категорически не готовы. Особенно учитывая, что зачастую речь идет о передаче данных за границу. Серверы Anthropic, Claude, OpenAI и ChatGPT находятся за рубежом. В России есть качественные языковые модели, которые предоставляют крупные игроки, такие как «Яндекс» и «Сбер», но во многих компаниях запрещено отправлять данные даже им. Отсюда следует необходимость разворачивать языковые модели внутри компании.
Здесь мы переходим ко второму блоку. При внедрении ИИ вопрос безопасности тесно связан с производительностью. Чтобы развернуть языковую модель, нужно хорошее мощное оборудование. Стоимость GPU-серверов для нейросетей может достигать десятков миллионов рублей. А кроме оборудования необходима еще и поддержка — в частности, специалисты, которые будут контролировать его работу. При этом заранее оценить, насколько эти вложения целесообразны, удается не всегда. Задача усложняется тем, что необходимо найти баланс между объемом документов и экономией времени на их обработку, которую обеспечивает ИИ. Если документов десять, экономия не так уж велика. Если документов десятки миллионов, а именно с такими объемами мы работаем в нашей системе «Авандок», она существенна. Однако при этом возрастает нагрузка на оборудование и, соответственно, его стоимость. На больших объемах мы получаем выгоду, но должны обеспечить производительность дорогим «железом».
Также пока не полностью решен вопрос с качеством, точностью и стабильностью работы больших языковых моделей.
CNews: В случаях, когда компания принимает решение в пользу внедрения ИИ, какие сложности могут возникнуть при использовании этих технологий?
Алексей Борщов: Примерно те же. Основная проблема — защита данных. Система включает не только языковую модель, но и целую цепочку сопутствующих сервисов. Документы нужно распознать, извлечь из них текстовые данные, проверить по различным параметрам и так далее. На каждом этапе данные должны быть надежно защищены. Одновременно возникает проблема теневого ИИ, когда сотрудники используют языковые модели за пределами контроля компании. Получая доступ, например в GigaChat через чат в Telegram-боте, сотрудник часто не думает о том, что вместе с документом в облако уходят важные данные. Эти процессы требуют постоянного контроля.
CNews: Как вы решаете эти проблемы при реализации ваших проектов?
Алексей Борщов: Наш метод состоит в поэтапном подходе. В первую очередь мы определяем, в чем ценность внедрения ИИ. Затем проводим эксперименты, где его можно внедрить. Находим небольшие участки бизнес-процессов, которые можно автоматизировать прямо сейчас, и тестируем их в рамках пилотного проекта. Уже после проверки безопасности и обоснования экономической выгоды переходим к полномасштабному внедрению.
Ключевой проблемой остается производительность. Как мы уже говорили, вопрос безопасности зависит в том числе от стоимости оборудования. Чтобы ее снизить, мы сокращаем размеры моделей. Но это влияет на скорость и качество ответов, а также способность модели решать сложные задачи. Поэтому мы работаем с настройками системы, добиваясь баланса между размером модели, ее точностью, и скоростью.
Второй ключевой вызов — «зоопарк» документов. Мы решаем множество интересных задач не только с точки зрения LLM, но и с точки зрения данных, которые они обрабатывают. Начиная работу над пилотным проектом, иной раз поражаешься, с какими только документами не работают в крупных компаниях: рукописные тексты, бланки, где сотрудники заполняют поля вручную. И таких документов — бесконечное разнообразие и количество. Так что здесь наша задача — «натренировать» ИИ на работу со всеми этими документами.
CNews: Как именно вы это делаете?
Алексей Борщов: На этапе пилотного проекта мы просим заказчиков дать нам как можно больше разнообразных данных. На каждом датасете документов делаем тестовые прогоны моделей. Пробуем и чередуем разные способы, методы, инструменты, пока не добьемся высокого качества обработки. И только после этого переходим к следующему шагу — тестовой эксплуатации системы у заказчика.
Это не гарантирует, что после запуска мы не встретимся с каким-то новым типом документов, который не попал в пилот. Но для этого есть поддержка и дальнейшая донастройка модели уже в процессе эксплуатации.
Нужно иметь ввиду, что стопроцентная автоматизация встречается редко. Наша задача — решить проблему обработки большей части документооборота. Обработка 90% документов — это огромная экономия времени. В оставшиеся 10% попадают, как правило, новые или редкие типы документов. Некоторое время их обрабатывают вручную, а когда по ним накопится достаточно данных, мы можем добавить их в систему, чтобы тоже обрабатывать автоматически.
CNews: А как вы решаете вопрос безопасности?
Алексей Борщов: Самое простое решение — это полностью встроить систему в закрытый информационный контур компании. Все модели и сопровождающие их сервисы мы разворачиваем на серверах у заказчика. В этом случае мы можем обеспечить максимальный из возможных уровней защищенности, встраиваясь в те процессы обеспечения информационной безопасности, которые в компании уже работают.
На первых этапах возможны гибридные модели, когда пилотные проект реализуется в облачном сервере. В этом случае мы обеспечиваем защиту информации, шифруя и фильтруя трафик, удаляя и подменяя персональные данные.
CNews: Как в течение ближайшего года-двух будет развиваться применение ИИ и LLM в системах документооборота?
Алексей Борщов: Модели не только анализируют и классифицируют информацию. По мере их совершенствования будет развиваться способность генерировать контент. На текущем уровне все еще нередки неточности. Но через год-два, когда модели станут работать лучше, мы сможем поручать им, например, создание новых договоров на основе существующих, что сильно сэкономит время юристам.
Поэтому следующие этапы развития LLM и ИИ — это снижение доли участия человека и создание нового контента на базе накопленных и обработанных данных. К этому я бы добавил изменение модели взаимодействия человека и системы. Например, мы уже привыкли взаимодействовать с той же «Алисой», добиваясь от ИИ выполнения задач через естественный диалог и переход к голосовому взаимодействию уже в ближайшие годы мы сможем увидеть разных сферах., в том числе, когда речь идет о работе с документами.
CNews: В контексте тех сложностей, о которых мы говорили в начале беседы — защиты информации, высокой стоимости внедрения моделей, — что-то изменится?
Алексей Борщов: Модели совершенствуются, становятся эффективнее и «легче» с технической точки зрения. Таким образом, размер необходимых инвестиций в «железо» постепенно снижается. При меньших вложениях мы начинаем получать больше возможностей. При этом уже есть немало примеров, когда в решении определенных задач небольшие модели оказываются более эффективными, чем крупные. Возможно, они не такие «умные» и разноплановые, как та же GPT-5. Но они решают конкретные задачи бизнеса, а стоят гораздо дешевле универсальных.
Значимость защиты информации будет расти. Искусственный интеллект несет и новые возможности, и новые угрозы. Появился новый тип атаки через ИИ. Были случаи, когда модели изначально заражены и дают либо неправильный ответ, либо способствуют утечке данных. Но с развитием угроз совершенствуются и средства информационной безопасности. Это эволюционный процесс, который проходит на протяжении всей истории существования компьютерных технологий.
■ Рекламаerid:2W5zFGtBVc4Рекламодатель: ООО «КОРУС Консалтинг ДМ»ИНН/ОГРН: 7801489026/1097847028432Сайт: www.korusconsulting.ru
