Спецпроекты

На страницу обзора
Игорь Беляк, Directum: Все умеют распознавать документы, но мало кто знает, что с ними делать дальше

Всё больше российских организаций и предприятий решаются на цифровизацию рутинных процессов — в том числе в части работы с документами. На какой уровень развития вышли российские ИИ-технологии? Кто сегодня может позволить себе эту роскошь, и какие задачи доверить искусственному интеллекту? Об этом в интервью CNews рассказал Игорь Беляк, руководитель департамента интеллектуальных решений Directum, российской ИТ-компании, которая разрабатывает программные продукты и сервисы для управления цифровыми бизнес-процессами и документами.

Игорь БелякDirectum

«Импортозамещение остается одним из ключевых двигателей развития ИТ-отрасли»

CNews: На ваш взгляд, как в последнее время изменилась рыночная ситуация в сегменте систем управления цифровыми процессами и документами?

Игорь Беляк: Уход зарубежных вендоров, с одной стороны, стал серьезным вызовом для сфер, в которых было представлено много иностранных компаний. С другой, эта ситуация стимулирует активное импортозамещение в сегменте и играет на руку отечественным вендорам решений. Плюс чувствуется поддержка, которую оказывает ИТ-отрасли Правительство РФ: появляются новые гранты, финансируются нацпроекты, формируются благоприятные условия для работников в сфере информационных технологий.

CNews: Пользователи Directum RX защищены от санкционных рисков?

Игорь Беляк: Система нового поколения Directum RX разработана в России и совместима с отечественным и свободно распространяемым ПО, включена в Единый реестр отечественного ПО. Наш другой продукт Directum Ario One также был включен в реестр импортозамещенного ПО в феврале 2022 г.. То есть мы выполнили самые жесткие требования и исключили все риски для наших пользователей. Это подтверждается последними внедрениями в крупных госкорпорациях, участием в тендерах по 44-ФЗ. Правда, сейчас идут разговоры о том, чтобы смягчить требования к вендорам по внесению их ПО в реестр, но мне кажется, что это будет ошибочным решением. Выполнение условий реестра как раз и дает крупным предприятиям гарантию выбора программных продуктов, не зависящих от санкционных рисков.

Однако есть другой момент, который касается всех — библиотеки, в которых реализованы технологии искусственного интеллекта, опенсорсные. То есть в любой момент доступ к ним для россиян могут закрыть. Если говорить о платформах, получивших широкое применение (DotNet Framework или Core от Microsoft), у них нет прямых отечественных аналогов и в ближайшее время не появится. Но я считаю, что локально нашу страну от этих сервисов отключить будет сложно.

Краткая биография

Игорь Беляк

belyak-crop_180-240.png
  • Руководитель департамента интеллектуальных решений компании Directum
  • Data Scientists, разработчик, владелец продукта Directum Ario — интеллектуальной системы для цифровизации процессов в информационных системах компании. Стоял у истоков создания продукта, принимал участие в первых пилотных проектах внедрения искусственного интеллекта в крупных российских компаниях.
  • Последние 5 лет занимается развитием интеллектуальных возможностей продуктов

CNews: Какие тренды на рынке ИТ вы могли бы выделить?

Игорь Беляк: В числе определяющих тенденций времени я бы назвал low-code/no-code-разработку, которая не требует написания программного кода. С точки зрения минимизации затрат — это отличное решение. Такие системы по-прежнему будут зависеть от прикладной разработки, особенно в части интеграций различных систем между собой. Но за счет перехода на low-code/no-code можно будет существенно снизить трудоемкость и ускорить решение задач без привлечения разработчиков. А настройкой смогут заниматься бизнес-аналитики, которые глубоко погружены в процессы внутри компании.

И, разумеется, искусственный интеллект. Волна хайпа по поводу появления всё новых и новых технологий ИИ прошла. По части из них Directum выходит на плато продуктивности. Мы получаем обратную связь с текущих проектов внедрения нашей интеллектуальной системы и понимаем, какие инструменты применимы в бизнес-процессах, а каким место пока только в научных статьях. Яркий пример технологии, которая уже доказала свою эффективность, это распознавание текстовой информации. В 2021 году Directum как раз вывел на рынок сервис, который совмещает в себе интеллектуальную обработку и верификацию данных через облачных операторов. За счет синергии AI и человека достигается 100%-ная точность распознавания.

«Ключевая особенность — это встраивание технологий ИИ во все процессы системы»

CNews: Действительно, продукты по распознаванию документов пользуются сегодня спросом. Чем сервис 100%-ного распознавания от Directum отличается от аналогичных решений?

Игорь Беляк: Каждый умеет извлекать текстовый слой, но не все знают, что дальше делать с полученными данными. Наше отличие от конкурентов в том, что мы не останавливаемся на извлечении реквизитов и заполнении карточек. Клиент получает не просто услугу распознавания в полном объеме, а бизнес-ценность — вовремя согласованный договор или в срок проведенную оплату.

Заказчики Directum — а это госкомпании, федеральные и региональные органы исполнительной власти, крупные нефтяные, финансовые, страховые компании, банки — ценят комплексный подход.

Банки и страховые, например, хотят быстро обрабатывать информацию по счетам, балансам, взысканиям. Невыполнение задач в срок грозит финансовыми штрафами. А сервис 100%-ного распознавания помогает им оперативно справляться с большим потоком документов, не наращивая при этом штат сотрудников и сокращая потенциальные ошибки обработки. Параллельно с этим другие инструменты ИИ готовят проекты резолюций для руководителей, анализируют договоры для выявления рисков, подсказывают, кому отправлять задачу, какие сроки согласования поставить и т.д.

CNews: Получается, ваше отличие от конкурентов в том, что вы предлагаете комплексное решение?

Игорь Беляк: Да. Ключевая особенность — встраивание искусственного интеллекта во все процессы системы. Бизнесу не интересен просто набор умных инструментов, поэтому мы предоставляем комплексные интеллектуальные процессы.

Работа ИИ начинается с фоновой индексации документов для полнотекстового поиска. Что это такое? В любой информационной системе есть объем документов, у которых отсутствует текстовый слой (изображения, сканы, фотографии и пр.). По слову или фразе найти их невозможно, поэтому приходится искать по реквизитам, а это отнимает много времени. Фоновая индексация автоматически находит и обрабатывает такие документы, делает их доступными для полнотекстового поиска. Сотрудники тратят минимум времени, чтобы найти нужный документ среди десятков одинаковых с похожими реквизитами.

Игорь Беляк, Directum: «Каждый умеет извлекать текстовый слой, но не все знают, что дальше делать с полученными данными»

Еще один важный процесс, в который включается ИИ, это импорт документов с внешнего носителя в информационную систему. В Directum RX есть специальная служба ввода, которая облегчает массовую обработку информации, в том числе с бумажных носителей.С ее помощью документы захватываются со сканера, электронной почты или мобильных устройств, и автоматически импортируются в Directum RX. Здесь интеллектуальные инструменты проводят классификацию, извлекают данные и заполняют карточки документов. Сотруднику остается лишь проверить корректность заполнения.

Очень важный и трудоемкий этап — анализ рисков в договорах. Искусственный интеллект встраивается и в него. Он сравнивает версии договора и проверяет, не вносил ли контрагент изменения в текст, а обнаруженные несоответствия выделяет цветом. также если вторая сторона включила в договор условия, которые явно не пропустит бухгалтерия или юристы, ИИ найдет такие опасные моменты и предупредит сотрудника о них.

CNews: Расскажите, в каких организациях востребованы системы управления цифровыми процессами и документами на основе ИИ?

Игорь Беляк: Как и 3-5 лет назад, основные потребители — это крупный бизнес. И массовый характер ИИ пока не получил. Но мы двигаемся в этом направлении.

Каждая организация сама решает, готова ли использовать технологии искусственного интеллекта. Ведь на разработку ИИ-решений, подготовку репрезентативной выборки, реализацию моделей, проверку гипотез и RnD (Research and development) уходит много времени, да и труд специалистов в этой нише стоит дорого. Чтобы внедрение искусственного интеллекта было выгодно клиенту, проект должен быть основан на большом потоке данных. Только уйдя от рутинных операций, достигаешь высокой экономии ресурсов (временных, финансовых, трудовых).

Логично, что основные заказчики таких технологий — это крупные промышленные предприятия, банки, страховые организаций и др. Словом, все, кто работает с огромными массивами информации и сталкивается со сложными и длительными согласованиями, в результате которых могут появляться ошибки и неточности, что ведет к замедлению самих процессов. А это в свою очередь влечет сокращение доходов, возможные штрафы от контролирующих органов, неустойки со стороны контрагентов и т.д.

«ИИ минимум в 2 раза сокращает длительность согласования договора»

CNews: А какие рутинные операции сейчас можно доверить искусственному интеллекту?

Игорь Беляк: Все операции, связанные с обработкой входящих документов — от классификации и занесения реквизитов в систему до распознавания текста и подготовки проекта резолюции. Механизмы ИИ учитывают всю информацию, которая есть о документе в системе (загрузку сотрудника, историю согласования аналогичных документов) и проверяют корректность его составления, выявляют ошибки или несоответствия, предупреждают сотрудника о них). Также искусственному интеллекту можно передать бухгалтерскую рутину — сопоставление номенклатуры с данными в учетной системе, сверку сумм, связывание документов в комплекты. Сюда же отнесу анализ рисков в договорах, о котором я упоминал выше. Искусственный интеллект минимум в 2 раза сокращает длительность согласования договора просто потому, что заранее обнаруживает неточности и не дает ответственному отправить документ, который точно будет отправлен на доработку.

CNews: Вспомните самых ярких клиентов?

Игорь Беляк: Был сложный, но интересный проект в «Объединенном специализированном депозитарии» по обработке структурированных и неструктурированных документов: различных типов актов, договоров, заявлений и приказов. Вызов для нас заключался в том, что нужно было классифицировать 135 видов документов, а набор данных для обучения классификатора более 20 000. Но наша система умеет обрабатывать даже полностью неструктурированные документы с абсолютно любой формой, составом полей и количеством страниц. Так что итоги тестовой эксплуатации интеллектуальных сервисов Directum в «ОСД» получились вдохновляющими: точность классификации вида документа составила 95%. Благодаря ИИ сотрудники компании экономят сегодня 30% времени на занесении в систему договоров и первичных учетных документов.

Еще один нестандартный проект был реализован в Службе обеспечения деятельности финансового уполномоченного (АНО «СОДФУ»). Организация занимается досудебным урегулированием денежных споров между гражданами и финансовыми компаниями. У «СОДФУ» есть веб-портал, через который граждане подают жалобы на невыполнение обязательств по страховым случаям. Основная боль была в том, что клиенты могли загрузить через веб-портал некорректный скан договора или нечеткую фотографию паспорта либо загружали не все документы. Специалистам службы (причем не всегда сразу) приходилось обращаться к клиентам с просьбой перезалить более качественные копии. В итоге терялось драгоценное время. Сейчас в АНО «СОДФУ» используются интеллектуальные сервисы Directum: они проверяют комплектность документов и их читаемость, подсказывают пользователю, когда скан или снимок ненадлежащего качества.

Есть еще два интересных проекта, расскажу о них коротко. Первый был выполнен в «ОДК-Авиадвигатель» — это классический пример того, как ИИ помогает делопроизводителям готовить проекты резолюций. Входящие письма, поступающие на руководителей, автоматически обрабатываются системой и для них формируется карточка проекта резолюции. Искусственный интеллект сам «вычитывает» текст документа и определяет исполнителей, сроки.

Похожий кейс был в Правительстве Удмуртской республики — здесь мы обрабатывали обращения, которые приходят от граждан в электронном виде. ИИ классифицирует вид обращения (всего более 1000 типов запросов), определяет исполнителей по данному вопросу и формирует поручение — словом, делает всю рутинную и трудоемкую работу за человека.

«Ставка — на семантический анализ»

CNews: Расскажите, какие технологии реализованы в решениях на базе искусственного интеллекта?

Игорь Беляк: В системе Directum RX используются все ключевые технологии искусственного интеллекта. Для предобработки документов применяется компьютерное зрение, что исключает ручную верификацию данных. Автоматически извлекается текст, определяется ориентация, стабилизируется яркость/контрастность, исправляются геометрические искажения.

С помощью обработки естественного языка можно классифицировать документ и извлечь из него именованные сущности, то есть факты — даты, номера, наименования контрагентов, суммы и прочее. Эта технология может быть применена не только к документам, но и к текстам, формируемым внутри системы, например, к текстам задач, заданий, поисковых запросов. Например, запрос на естественном языке «первичка за прошлый квартал по Газпрому» вернет не просто документы, где встречаются такие слова (скорее, даже таких документов и не существует), а перечень финансовых документов с контрагентом ПАО «Газпром», созданных за период с 01.04.2022 по 30.06.2022.

belyak_izm-crop_600-650.png
Игорь Беляк, Directum: «В системе Directum RX используются все ключевые технологии искусственного интеллекта»

Инструменты семантического анализа помогают выявлять необходимые блоки в тексте документов, сравнивать их по содержательной части и семантике. Например, если в договор внесли правки, то технология обнаружит разночтения между версиями и подсветит их.

Отдельным перспективным направлением является анализ процессов на предмет их оптимизации. Например, определение наилучшего состава исполнителей для ускорения согласования договора, анализ текстов задач для раннего выявления проблем в ходе работы, предсказание сроков завершения процесса на основе статистических данных и текущей загрузки исполнителей и т.д.

CNews: Какое направление развития искусственного интеллекта выбрала компания на ближайшие годы?

Игорь Беляк: Наиболее стремительно развивающееся направление на рынке искусственного интеллекта — это семантический анализ. Появляются крупные модели для русского языка, например, от Сбера и «Яндекса», которые в том числе могут применяться для обработки документов. Все эти модели используются для более глубокого понимания смысла документов, семантического анализа, суммаризации текста, то есть автоматического создания краткой выжимки содержания.

Задача семантического анализа документов пока слабо решена у вендоров, поэтому для нашей команды RnD она интересна, и мы ею активно занимаемся. Сейчас формируем выдержки из обращений в службу поддержки компании Directum — на этом датасете мы сможем обучить модели и получить конкретный результат.

Семантический анализ собираемся применять при рассмотрении договорных документов. Так, если в компании много шаблонов договоров (например, более 100), а от контрагента поступает новый документ, нужно ознакомиться с его содержанием и соотнести с одним из шаблонов (от этого зависит, по какому типовому маршруту дальше пойдет документ). Задача непростая и для человека, и для компьютера, но машина с ней справится быстрее.

Кстати, компания Directum подписала Кодекс этики в сфере искусственного интеллекта, и сегодня мы готовы обмениваться информацией о лучших практиках развития технологий ИИ. Открыты к сотрудничеству с коллегами, также разрабатывающими интеллектуальные программы и сервисы, в том числе готовы обмениваться репрезентативной выборкой, не включающей конфиденциальные данные.

Ключевая проблема — отсутствие качественных данных для обучения. В основе все равно лежат документы, представляющие собой коммерческую тайну (договоры, письма и пр.). Работать с ними можно, но при условии подписания с клиентом NDA. Но даже в этом случае нельзя передавать данные на третью сторону, например, в сервисы разметки. Чтобы не подвергать данные клиентов риску быть рассекреченными, мы организовали сервис разметки у себя. Думаю, в скором времени можно будет испытывать современные модели семантического анализа для решения подобных задач — суммаризации текста, поиска схожих по смыслу документов и т.д.

CNews: На чем еще планируете делать акцент?

Игорь Беляк: Ключевое направление — глубокое встраивание интеллекта в Directum RX.

Сейчас мы уже внедрили ИИ в типовые процессы — подготовка проектов резолюции или обработка договорных документов идут уже без участия человека. Дальше собираемся встроить интеллектуальные механизмы в работу со всеми документами, будь то внутренняя организационно-распорядительная документация, служебные записки или проектная документация. И для этого не нужно специально настраивать систему или проводить проекты внедрения: ИИ будет строить работу на основании анализа текущего поведения сотрудников, обучаться на исторических данных, а спустя время начнет делать подсказки и прогнозы. В любой момент пользователь может отключить систему, если она его не устроит, но мы ориентируемся на то, что эти интеллектуальные инструменты будут ненавязчиво помогать и упрощать работу сотрудников.

Еще одно направление, в котором мы в ближайшее время начнем активно работать — это интеграция ИИ с Directum HR Pro, системой для цифровизации кадровых процессов, документов и сервисов. Искусственный интеллект будет помогать на всех этапах: при анализе резюме и отборе соискателей, соответствующих требованиям компании, приеме сотрудника, сборе документов, которые ему необходимо изучить в первые дни после трудоустройства.

CNews: Есть ли спрос на ваши решения в других странах?

Игорь Беляк: Мы уже много лет работаем на зарубежных рынках. У нас есть готовые решения по цифровизации процессов и управлению документами для различных стран. Если говорить об интеллектуальных инструментах Directum, то они умеют распознавать тексты на 150 языках. А что касается последующей обработки, то она языконезависимая.

Продолжаем активно работать с рынком ближнего зарубежья, например, с Белоруссией и Казахстаном. В этих странах есть как готовые проекты внедрения интеллектуальной системы Directum RX, так и находящиеся в стадии пилотирования. В целом интерес к нашему продукту у зарубежных компаний сохраняется, и с годами он только возрастает.