CNews: С какими результатами направление корпоративных продаж Abbyy закончило прошлый год? Если можно, раздельно по валютной и рублевой выручке.
Дмитрий Шушкин:
Дмитрий Шушкин
Почти все проекты, которые делаются на базе наших технологий, дают быструю отдачу, у них ROI от 3 до 12 месяцев

Мы в целом по компании отмечаем стабильное развитие на всех направлениях – и в российских продажах, и в зарубежных. Если говорить о России, то здесь мы выросли на 9% в денежном выражении, причем в сегменте корпоративного направления, который дает две трети дохода, у нас рост 19%.

Зарубежная выручка осталась примерно на уровне 2013 года. Но здесь тоже есть нюанс – сейчас, как вы знаете, идет укрепление доллара по отношению ко всем мировым валютам. И, если оценивать нашу выручку в долларах, – она осталась практически такой же, а если в местных валютах стран, в которых мы работаем, то практически везде мы выросли.

CNews: Что больше повлияло на рост в России – вы поднимали цены или увеличили объем продаж?
Дмитрий Шушкин:

Мы, конечно, сделали определенную корректировку цен, но рост в большей мере связан с тем, что рынок потокового ввода данных, на котором мы работаем, продолжает развиваться – по данным Harvey Spencer Associates, примерно на 7% в мире и, по нашим оценкам, на 12-15% в России. В нашей стране аналитики как таковой нет по этому рынку, поэтому мы пользуемся своими данными. Сейчас, по исследованиям аналитиков IDC, в России нам принадлежат около 60% рынка.

CNews: Сейчас, в кризис, все стараются делать только самые необходимые проекты с быстрым возвратом инвестиций. Это сказалось на масштабах ваших проектов?
Дмитрий Шушкин:

Почти все проекты, которые делаются на базе наших технологий, дают быструю отдачу, у них ROI от 3 до 12 месяцев. Следовательно, в пределах одного финансового года заказчик уже может получить выгоду. К тому же решения для потокового ввода данных повышают эффективность существующих информационных систем и отдачу от инвестиций, уже вложенных в ИТ-решения.

Дмитрий Шушкин:

«Рост бизнеса в большей мере связан с тем, что рынок потокового ввода данных, на котором мы работаем, продолжает развиваться – по данным Harvey Spencer Associates, примерно на 7% в мире и, по нашим оценкам, на 12-15% в России. В нашей стране аналитики как таковой нет по этому рынку, поэтому мы пользуемся своими данными. Сейчас, по исследованиям аналитиков IDC, в России нам принадлежат около 60% рынка».
CNews: Какие секторы рынка показывают самый большой интерес к технологиям Abbyy?
Дмитрий Шушкин:

Прежде всего, госсектор, банки, энергетика и нефтегазовая отрасль. Были у нас определенные ожидания от ритейла, но он показал себя слабо. В розничном секторе сейчас больше озабочены оптимизацией закупок и поставок, чем бизнес-процессов, где мы могли бы участвовать.

Что касается отраслей, в которых наши продажи выросли, то они имеют ряд общих признаков. В крупных организациях, особенно с распределенной структурой, видна тенденция к централизации ряда функций, связанных в основном с принятиями решений. То есть, выделяется одна профессиональная команда, которая быстрее и дешевле делает то, чем раньше занимались отдельные люди в филиалах. Если создаются такие централизованные подразделения – мы называем их «объединенные центры обслуживания», – то появляется и поле для нашей деятельности.

Централизация связана с потоками документов. Те документы, которые заводятся на местах, далеко не всегда появляются в электронном виде, пригодном к использованию в системах автоматизации. Это могут быть юридические документы, кадровые, бухгалтерские. Если у компании или холдинга десятки тысяч сотрудников и сотни контрагентов, это означает огромный документооборот.

Я считаю, что еще 3–5 лет тенденция централизации функций принятия решений будет одним из факторов роста рынка технологий потокового ввода данных и смежных рынков.

CNews: Что вы сейчас предлагаете в области потокового ввода данных?
Дмитрий Шушкин:
Дмитрий Шушкин
Мы всегда были «локомотивом прогресса» на всех рынках, на которых работали

Потоковый ввод нужен везде, где есть большое количество документов, которые необходимо загружать в информационные системы. Я уже упоминал, почему есть такая потребность в крупных холдингах, работающих с множеством контрагентов и обладающих огромным штатом работников. Аналогичная ситуация сложилась в банках. У них есть как документы, связанные с другими юрлицами – на каждое из них набор документов может измеряться сотнями страниц, – так и гигантские потоки заявлений от физических лиц – на выпуск карт, открытие счетов, на предоставление кредита и т.д.

Большую часть этих задач мы решаем с помощью нашего продукта, который называется Abbyy FlexiCapture. Это платформа потокового ввода документов, которая позволяет решать задачи самого разного класса, в том числе помочь сделать распределенную систему принятия решений в организации централизованной. То есть бизнес-процесс меняется, например, таким образом: документ сканируется в месте его получения, затем проходит формальные проверки в центре, возвращается первому сотруднику, обрастает дополнительной информацией – допустим, подписанной клиентом копией, – и снова направляется в центр.

У нас есть примеры реализации. Так, Альфа-Банк традиционно реализует на наших решениях значительную часть логики ВРМ. Мы предоставляем ему платформу обработки документов, извлечения информации и ее проверки на соответствие определенным нормам. Все, что связано с обработкой документов, весь бизнес-процесс, который чаще бывает в ЕCM-системе, делается в Альфа-Банке на наших продуктах. Другой пример – Сбербанк. Во время одного пилотного проекта вместе с нашей системой было задействовано 39 информационных систем. Это говорит о сложности применяемых решений.

CNews: В русле каких мировых и российских технологических трендов вы ведете разработки?
Дмитрий Шушкин:

Мы всегда были «локомотивом прогресса» на всех рынках, на которых работали. Мы поддерживаем своими технологиями все близкие нам тренды, развивающиеся сегодня– ERP, ЕСМ, рынки текстовой аналитики и интеллектуального корпоративного поиска информации…

Все они связаны с необходимостью обрабатывать растущие объемы информации. По оценке IDC 90% данных были созданы в мире за последние два года. Трудно сказать, насколько все они могут быть востребованы в бизнес-процессах, но очевидно, что объем потребляемой информации тоже растет быстрыми темпами. Причем 80% - это неструктурированные данные, с которыми тоже нужно работать.

Важно, что доля неструктурированных данных растет, и ситуация ухудшается, потому что все современные системы аналитической отчетности созданы для работы со структурированными данными. OLAP-кубы, BI и вся прочая аналитика, графики – все это прекрасно работает, когда в систему загружены понятные ей данные. Если же они представлены в неструктурированном виде, то и система с ними не работает, и данные остаются невостребованными – компания теряет деньги.

Abbyy развивала технологии в области управления информацией последовательно и логично. Сначала создали технологию распознавания текста – OCR. После этого возник запрос – нужно в распознанном тексте выделить поля со значениями и создать из этого текста структуру. Так появились решения для потокового ввода данных – data capture. На следующем этапе взялись за еще более сложную задачу: интеллектуальную обработку информации. Теперь мы можем обрабатывать не только структурированные, но и неструктурированные данные. Последнее направление самое интересное из трех на перспективу, и самое сложное.

CNews: Расскажите подробнее об этом направлении.
Дмитрий Шушкин:
Дмитрий Шушкин
Наши семантические технологии позволяют искать по смыслу, а не по ключевым словам

Речь идет о решениях на базе нашей технологии понимания и анализа текстов на естественном языке Compreno. Они могут быть встроены в различные информационные системы, расширяя и дополняя их возможностями извлечения, анализа и поиска информации.

Некоторое время назад мы представили систему интеллектуального поиска, которая усовершенствует корпоративные поисковые системы. Наши семантические технологии позволяют искать по смыслу, а не по ключевым словам, то есть находить информацию, которая может быть выражена другими словами.

Кроме поиска, у нас есть решения по анализу и извлечению информации из неструктурированных документов – это логичное продолжение направления data capture, которое мы представляем сегодня. Как это работает? Можно находить в тексте объекты, связи, атрибуты и работать с ними дальше. Извлекаться могут имена людей, паспортные данные, названия компаний, ИНН и так далее, а также, что важно, связи между ними. И это помогает, в частности, формировать аналитическую отчетность, дополнять уже имеющиеся данные в системах ECM или СЭД. Банки могут снижать риски при выдаче кредитов, получая информацию о заемщиках – юридических и физических лицах. Для оценки рисков нужно искать данные в разных источниках информации, будь это аналитические отчеты, базы данных контрагентов, судебные решения, публикации в интернете и так далее. Часто эта информация ищется и обрабатывается в полуручном режиме, а мы предлагаем это автоматизировать.

Еще интересный пример – работа с проектно-сметной документацией. Один из крупных государственных холдингов обратился к нам с запросом решить задачу анализа этой документации – извлекать из нее данные и сравнивать с тем, что у них есть в САПР. Причем там были реализованы разные сценарии использования. Например, проверять полученные данные на соответствие имеющимся в отрасли нормативно-правовым документам.

Что касается задачи классификации – система может автоматически и на качественно новом уровне распределять по департаментам и ответственным поток входящих документов, например, запросы от населения или письма в техническую поддержку. Важно, что при этом повышается скорость обработки информации.

Дмитрий Шушкин:

«Аналитики говорят, что люди тратят по 4 часа в неделю на поиск нужной в работе информации. Представьте себе – половина рабочего дня. Если мы можем его сократить с помощью наших технологий от четырех часов до хотя бы тридцати минут, то мы работаем не напрасно».
CNews: С кем вы сотрудничаете в своих разработках?
Дмитрий Шушкин:

У нас, как и у многих разработчиков, есть два вида партнеров. С одними у нас технологическое партнерство, с другими мы работаем как с интеграторами. Много компаний используют нас в своих решениях – в мире технологии ABBYY внедряют крупнейшие компании ИТ-рынка (EMC, Dell, Fujitsu, HP, Panasonic, Siemens, Samsung Electronics и другие), а в России – ключевые отечественные производители ECM и СЭД-решений. Есть партнеры среди производителей АБС. Появился интерес и у поставщиков СКУД-систем, потому что у нас есть решения для обработки документов, удостоверяющих личность. Вы, наверное, заметили, что теперь на проходных, на ресепшенах отелей часто не вручную записывают ваши данные, а берут паспорт, сканируют, и либо на вас заводится карточка, либо просто открывается доступ в определенные помещения.

И сейчас мы очень активно развиваем сотрудничество по направлению Compreno и основанных на ней решений. Здесь мы видим интерес со стороны производителей учетных систем, СЭД, DLP и CAD систем. Если говорить о продажах и внедрениях, то и здесь у нас довольно разветвленная партнерская сеть. Массовые продукты мы распространяем преимущественно через дистрибьюторов. На корпоративном рынке работаем почти со всеми ключевыми интеграторами. Я хочу отметить нашего платинового партнера – это компания «Логика бизнеса», входящая в группу компаний «АйТи». Также работаем с такими крупными игроками, как IBS, «Крок», ЛАНИТ, «Систематика» и другие.

CNews: В последнее время все больше компаний заявляют о том, что они разрабатывают технологии искусственного интеллекта. И вы этим традиционно занимаетесь. Какое применение вы видите у систем с искусственным интеллектом, и когда они появятся?
Дмитрий Шушкин:
Дмитрий Шушкин
Мы своими технологиями стараемся всегда помогать людям, облегчать им жизнь, повышать эффективность процессов

Области применения искусственного интеллекта широки и разнообразны. Кто-то считает, что искусственный интеллект – это робот, который умеет думать. На самом деле это вполне реальные технологии, которые уже используются в жизни, в том числе в корпоративной среде.

Возьмем распознавание текста. Мы занимаемся этим уже более 20 лет. Наша система выстраивает целую совокупность гипотез, на основании которых принимает решение, как правильно должны выглядеть сканированные символ или слово. Так мыслят люди. На этой логике построены наши технологии. И в этом смысле они решают задачу искусственного интеллекта.

Или обратимся к такому перспективному направлению, как анализ изображений, на котором мы тоже работаем. Это не просто распознавание лиц, реализованное уже многими вендорами – это аналитика по картинкам. Где она может применяться и какую пользу принесет? Допустим, поставлена задача определить, нет ли на трубопроводе длиной сотни километров незаконных врезок. Делать это обходом неэффективно, поэтому используется аэрофотосъемка. И машина сделает анализ изображения быстрее и качественнее, чем живой человек. На железной дороге можно организовать распознавание номеров и надписей на вагонах.

Подобных задач существует много, и технологический потенциал, накопленный нами за 20 лет, очень велик. Бывают очень интересные и неожиданные применения. Скажем, Real Time OCR (распознавание текста в режиме реального времени), когда вы наводите телефон на объект (например, на вывеску или меню в ресторане) и сразу без подключения к интернету получаете распознанный текст. Тут же, прямо в мобильном приложении, этот текст может быть переведен на другой язык. Еще один сценарий. Хотите получить предварительное одобрение на кредит? Не обязательно ехать в банк. Фотографируете заявку – данные из нужных полей извлекаются и отправляются на рассмотрение. Или даже просто фотографируете свои паспорт, права и справку о доходах. Аналогичный сценарий применим для расчета страховки на автомобиль путем простого фотографирования документов на машину, водительского удостоверения и, допустим, номерного знака автомобиля.

Что еще дает бизнесу искусственный интеллект? К примеру, есть различные системы обработки данных, основанные на статистике и правилах. Решения на базе нашей Сompreno выполняют похожие сценарии, но разница в том, что делают они это на качественно новом уровне, в частности, лучше анализируют информацию, позволяют быстрее запускать проекты, настраиваясь на уникальную предметную область заказчика, и так далее. Технология Compreno понимает и анализирует смысл текстов на естественном языке, сочетает синтаксис, семантику, статистику, создание онтологий и правил извлечения информации.

Занимаясь такой темой, как искусственный интеллект, нужно не просто сделать умную машину. А нужно создать что-то полезное. Мы своими технологиями стараемся всегда помогать людям, облегчать им жизнь, повышать эффективность процессов – это цель, ради которой мы трудимся. Нужно сделать мир лучше. Аналитики говорят, что люди тратят по 4 часа в неделю на поиск нужной в работе информации. Представьте себе – половина рабочего дня. Если мы можем его сократить с помощью наших технологий от четырех часов до хотя бы тридцати минут, то мы работаем не напрасно.

Павел Притула