Софья Искандарова: Компьютерное зрение позволило «оживить» архив и строить бизнес на данных
Специалист по продуктам на базе искусственного интеллекта о том, как компьютерное зрение помогает раскрыть скрытые ресурсы компании и почему именно эта технология станет ключом к цифровой трансформации.
Искусственный интеллект уже стал рабочим инструментом, способным приносить прямую выгоду бизнесу. Одним из самых перспективных направлений на стыке этой технологии и бизнеса сегодня становится компьютерное зрение (CV). По оценкам McKinsey, CV в промышленности и операционном управлении данными способно повысить операционную эффективность компании до 30%. Чаще всего технологию применяют в производстве (25,98%) и сфере безопасности (19,25%), говорится в отчете Statista Market. Однако особенно остро значение компьютерного зрения проявляется в направлениях, где работа связана с большим объемом «бумажных» данных, хранимых в архивах — когда их сложно быстро анализировать. Именно с такой проблемой столкнулась одна из крупнейших телекоммуникационных компаний России: десятки тысяч документов, непригодных к анализу, тормозили бизнес и мешали увидеть «полную картину». Решить проблему помогла эксперт в области AI-решений Софья Искандарова. Ее проект на основе компьютерного зрения всего за месяц позволил не просто оцифровать архив компании за 10 лет, а превратил его в аналитический актив, зафиксировав новые бизнес-показатели. Поговорили с Софьей о том, какие возможности открывает CV для бизнеса, в каких областях компьютерное зрение может быть действительно эффективным и как понять, что компании пора применять эту технологию.
CNews: Софья, технологии CV стремительно развиваются, но у многих все еще есть ощущение, что они применимы только для контроля качества производства или видеоаналитики. Насколько широко применение компьютерного зрения на самом деле?
Софья Искандарова: Это действительно распространенное заблуждение. На самом деле компьютерное зрение уже давно вышло за рамки видеоаналитики. Сегодня оно эффективно применяется в таких сферах, как автоматизация документооборота, интеллектуальное извлечение данных, проверка соответствия, аудит и даже в анализе текстов на изображениях. Все, что содержит визуальную информацию — сканы, фото, PDF — может быть преобразовано в структурированные данные. Это открывает огромные возможности для аналитики, управления рисками и повышения качества решений практически в любой отрасли.
CNews: Как понять, что у компании уже есть «сырье» для внедрения CV, а главное — как понять, что пора этим заниматься?
Софья Искандарова: Главный индикатор — объем и тип неструктурированных данных. Если у компании накоплены десятки или сотни тысяч документов, которые регулярно используются, пересылаются, анализируются, то это уже сигнал. Особенно если они в виде сканов, PDF-файлов, с различным оформлением — именно это и есть то самое «сырье». Современные CV-системы способны не просто читать текст. Они могут понять структуру документа, вычленить ключевые поля, логически связать данные. И это дешевле, чем ручная переработка, а главное — это решение можно масштабировать.
CNews: Принципы компьютерного зрения, которые обычно используют для повышения производительности в промышленности, вам удалось применить к сфере управления информацией. Вы создали проект, который позволил крупной компании получить оперативный доступ к данным, которые на бумаге 10 лет буквально пылились в архиве. Какие задачи удалось решить с помощью CV?
Софья Искандарова: Архив компании за 10 лет работы был действительно огромен, и при этом данные документов фактически были недоступны для быстрого поиска и анализа. Я предложила использовать компьютерное зрение, и оно стало идеальным инструментом для решения проблемы «запертости» данных в бумажных и сканированных документах. Мы не просто использовали технологию интеллектуального извлечения данных из этих документов, мы сделали их структурированными и индексированными. Это позволило обеспечить мгновенный поиск, автоматизировать выявление дубликатов и провести глубокий ретроспективный анализ.
CNews: Проектом вы руководили на всех его этапах от технического задания до обучения сотрудников. Что именно вы делали? Какой шаг оказался самым сложным, и как решали?
Софья Искандарова: Самым сложным было адаптировать технологию CV под конкретные нужды и типы документов, которые использовались в подразделении. Документы отличались по качеству сканирования, структуре, наличию пометок. Мое решение заключалось в том, чтобы не просто взять готовую технологию, а четко сформулировать техническое задание для команды разработки и data science, основанное на глубоком анализе этих документов. Я также координировала процесс тестирования и доработки моделей CV. В итоге нам удалось добиться точного распознавания нужных полей и данных именно в наших специфических условиях.
CNews: Ваше решение позволило обработать весь архивный массив данных всего за месяц, а компания фактически совершила качественный скачок в работе с информацией с заделом на годы вперед. Какие неочевидные изменения ваш проект внес в ее работу?
Софья Искандарова: Самое главное — компьютерное зрение позволило «оживить» архив и строить бизнес на данных. Бумажный и неструктурированный архив превратился в активный, рабочий инструмент. Благодаря этому целые отделы в компании получили возможность провести ретроспективный анализ продаж, выявить ранее скрытые закономерности, упорядочить базу данных, удалить дубликаты. По сути, мы дали компании возможность принимать решения, основываясь на полных данных, а не на фрагментарной информации. Также получилось выявить и исправить исторические ошибки в документации, а это прямое влияние на бизнес-процессы и дальнейшее предотвращение рисков.
CNews: Какие технические и логические решения позволили вам добиться такой глубокой интеграции компьютерного зрения в бизнес-процессы? Что сделало выбранный вами подход действительно работающим на практике?
Софья Искандарова: Проработав множество сценариев, мы пришли к целевому видению работы системы — интеллектуальное извлечение и структурирование данных. Ключевым технологическим принципом была адаптация алгоритмов компьютерного зрения под специфику конкретных документов. Мы не просто распознавали текст, а «обучили» систему находить и извлекать конкретные сущности — даты, номера договоров, ФИО, адреса и так далее — и помещать их в структурированном виде в базу данных. Именно этот сценарий позволил реализовать мгновенный поиск по любым параметрам, автоматическое выявление дубликатов и возможность агрегировать данные для анализа. Технология сама готовила информацию к использованию, минимизируя ручной труд и делая интеграцию в рабочие процессы почти бесшовной.
CNews: Ваша система помогает выявлять дубликаты и несоответствия, которые может пропустить человек. Разработка, как мне видится, может быть крайне полезной, например, в медицине, где цена ошибки бывает слишком высока. Насколько, по-вашему, возможно использовать ее в этой области?
Софья Искандарова: Ручная обработка документов в любой сфере неизбежно сопряжена с усталостью, невнимательностью и опечатками. Если провести параллель с медицинской документацией, то ценность автоматизации, конечно, становится еще очевиднее. Представьте систему, которая не просто оцифровывает историю болезни, но и автоматически проверяет совместимость назначенных лекарств, сигнализирует о возможных аллергиях на основе прошлых записей, обеспечивает полноту данных для врача. Это все возможно. Разработка позволяет повысить точность и надежность данных за счет исключения человеческого фактора, что критически важно в любой отрасли, работающей с большими объемами информации.
CNews: Где еще можно применить вашу технологию, и насколько сложно ее масштабировать?
Софья Искандарова: Интеллектуальная оцифровка и извлечение данных из документов с помощью компьютерного зрения — это ядро разработанной технологии, и оно абсолютно универсально и легко масштабируемо. Его можно применять практически в любой отрасли, где существует проблема бумажных данных. Самые очевидные примеры, которые первые приходят на ум: юриспруденция, образование, здравоохранение, госсектор. По сути, везде, где нужно быстро превратить неструктурированные визуальные данные в полезную, структурированную информацию для поиска, анализа и автоматизации, эта технология найдет свое применение. Масштабирование заключается в адаптации моделей CV под специфику документов конкретной отрасли и интеграции с существующими IT-системами заказчика.
CNews: Насколько понимаю, вы планируете развивать идею использования CV в обработке и анализе документов. Каким видите следующий этап? Как будет выглядеть работа с данными в будущем, когда технологии достигнут зрелости?
Софья Искандарова: Мое видение — это переход от поиска документов к получению ответов и инсайтов непосредственно из данных, содержащихся в них. Чтобы превратить это в реальность, необходимо развитие технологий ИИ, особенно в области глубокого понимания естественного языка и семантического анализа. Системы должны научиться не просто находить документы по ключевым словам, но и понимать контекст запроса пользователя, смысл информации в документах, связи между ними. Представьте, вы задаете системе вопрос: какие риски есть в договорах с поставщиками категории X за последний год, и она не просто выдает список файлов, а предоставляет краткий отчет с выделенными пунктами рисков, синтезированный из десятков документов.
Реализация этого потребует интеграции продвинутых моделей NLP, графов знаний и, возможно, проактивных алгоритмов, предсказывающих информационные потребности пользователя. След, который это оставит в цифровой трансформации, будет фундаментальным. Это изменит парадигму работы с информацией: вместо того чтобы человек искал данные, данные будут сами находить человека в нужный момент и в нужном виде. Это освободит колоссальные ресурсы и повысит качество принимаемых решений во всех сферах.