CNews: Игорь, расскажите о продуктах компании ABBYY. Как развиваются ваши решения?
Игорь Буланов:
Игорь Буланов
Мы помогаем бизнесу не только автоматизировать трудоемкие рутинные процессы с документами и данными, но и анализировать их эффективность, и искать пути для их оптимизации.

Компании ABBYY более 30 лет, и в последнее десятилетие мы сосредоточены на развитии продуктов для крупных корпоративных клиентов. В частности, это такие решения как ABBYY FlexiCapture — универсальная платформа для интеллектуальной обработки информации, и ABBYY FineReader Server — серверное решение для оцифровки любых видов документов. А в прошлом году линейку наших решений пополнила ABBYY Timeline — интеллектуальная платформа для анализа бизнес-процессов. Теперь мы помогаем бизнесу не только автоматизировать трудоемкие рутинные процессы с документами и данными, но и анализировать их эффективность, и искать пути для их оптимизации.

CNews: Сколько пользователей у этих решений?
Игорь Буланов:

Более 50 миллионов. И десятки тысяч крупных заказчиков по всему миру. Среди них такие компании, как Pepsico, Volkswagen, производитель медицинского оборудования Medline, PwC.

CNews: А в России?
Игорь Буланов:

Это, например, «Сбербанк», «Райффайзенбанк», «Триколор ТВ», «ВкусВилл», транспортная группа FESCO и многие другие. В России мы ежегодно реализуем несколько десятков крупных проектов, в 2019 году их количество увеличилось на 19%. Отмечу, что около трети компаний, входящих в рейтинг Fortune Global 500, уже пользуются интеллектуальными решениями ABBYY.

Игорь Буланов:

С помощью наших решений был реализован уникальный проект «Открой историю Большого», в рамках которого с помощью интеллектуальных решений ABBYY и волонтеров были оцифрованы уникальные документы — 120 тысяч программок, 48 тысяч афиш и 100 тысяч фотографий главного театра страны.
CNews: Насколько велики объемы данных, которые обрабатывает компания в рамках проектов по распознаванию текстов и лингвистики?
Игорь Буланов:

Конечно, объемы данных разнятся от проекта к проекту. Это может быть одна отсканированная страница или фотография, которую можно, например, обработать в нашем приложении ABBYY FineScanner. А могут быть десятки миллионов документов, если платформа ABBYY FlexiCapture используется, скажем, для обработки клиентских данных в банке. С помощью наших решений был реализован уникальный проект «Открой историю Большого», в рамках которого с помощью интеллектуальных решений ABBYY и волонтеров были оцифрованы уникальные документы — 120 тысяч программок, 48 тысяч афиш и 100 тысяч фотографий главного театра страны.

CNews: Какое количество данных вам постоянно приходится хранить и какие проблемы возникают при их хранении?
Игорь Буланов:

В первую очередь мы храним данные, которые отдел исследования и разработки использует для создания и развития продуктов компании. Их объем исчисляется сотнями терабайт и стремительно растет. Основная проблема заключалась в том, что при таком количестве данных мы достигли предела масштабируемости использовавшейся на тот момент системы хранения. Нам не хватало ни объема, ни скорости работы. При этом мы понимали, что существуют современные системы, в которых реализованы такие возможности, как сжатие и дедупликация. Они позволят существенно увеличить эффективность хранения данных.

CNews: Поэтому вы обратились в «АйТеко»?
Игорь Буланов:

Это была не первая наша встреча. С группой компаний «АйТеко» у нас уже был опыт успешного сотрудничества. Несколько лет назад специалисты «АйТеко» помогли нам внедрить систему резервного копирования. В этот раз понадобилось современное, гибкое, хорошо масштабируемое решение для хранения данных. Фактически, стояла непростая задача обеспечить хранение большого объема изображений, текстовых документов, результатов ежедневных сборок нескольких десятков продуктов. Также нам было нужно гарантировать бесперебойную работу высоконагруженных баз данных, виртуальных машин и серверных кластеров. И все это необходимо было сделать в жестких бюджетных рамках.

CNews: Сергей, какие задачи перед вами поставили в ABBYY?
Сергей Желонкин:
Сергей Желонкин
Коллеги из ABBYY поставили достаточно серьезные задачи в части требований к надежности, производительности, масштабируемости и функциональности новой системы хранения.

Как ранее сказал Игорь, ежедневно ИТ-подразделению компании приходится хранить и обрабатывать большой объем различной информации, начиная от SQL-баз и специальных вспомогательных данных, требующих от дисковой подсистемы высокой производительности, и заканчивая хранением различных дистрибутивов и изображений, отличающихся высокой уникальностью и низкой дедуплицируемостью. В связи с этим коллеги из ABBYY поставили достаточно серьезные задачи в части требований к надежности, производительности, масштабируемости и функциональности новой системы хранения.

Максим Митрохин:

На самом деле, для «АйТеко», как для одной из ведущих ИТ-компаний, наверное, уже не существует уникальных задач. За долгие годы работы наши специалисты разработали огромное количество решений, которые помогают бизнесу закрывать текущие потребности. Свою роль играет и серьезный проектный опыт, который помогает нам тиражировать успешные кейсы и предлагать максимально эффективные варианты решения встающих перед нами задач. Это позволяет нам соответствовать ожиданиям компаний. Не стал исключением и проект, реализованный для ABBYY.

CNews: А как вы пришли к идее использования HPE Nimble Storage? Почему вы выбрали именно эту систему хранения?
Максим Митрохин:
Максим Митрохин
Финальный выбор в пользу HPE Nimble был сделан не только из-за того, что на сегодняшний день это объективно одна из передовых СХД с технологией искусственного интеллекта в линейке массивов HPE.

У «АйТеко» сложились многолетние прочные партнерские отношения с Hewlett Packard Enterprise. Наши инженеры уверены в решениях HPE, что подтверждено платиновым партнерским статусом, набором специализаций и наград, большим количеством успешно реализованных проектов и высокой степенью удовлетворенности заказчиков.

В этом проекте была достаточно высокая конкуренция между решениями нескольких вендоров. Коллеги из ABBYY серьезно подошли к реализации своих задач и хотели выбрать решение, наиболее удовлетворяющее их требованиям.

А финальный выбор в пользу HPE Nimble был сделан не только из-за того, что на сегодняшний день это объективно одна из передовых СХД с технологией искусственного интеллекта в линейке массивов HPE. Свою роль сыграл и аудит, и виртуальное тестирование возможностей системы на данных ABBYY. Их результаты показали, что HPE Nimble позволит компании организовать процесс хранения данных эффективно, надежно и предсказуемо.

CNews: Что показал аудит дисковых подсистем и данных в компании-заказчике? Насколько большой оказалась нагрузка на них?
Сергей Желонкин:

Перед нами стояла задача обеспечить хранение данных двух видов с абсолютно разным типом нагрузки. В процессе аудита мы определились с требованиями к производительности целевой дисковой подсистемы, а также поняли, насколько эффективно смогут показать себя алгоритмы компрессии и дедупликации данных на примере решения HPE Nimble. Этот подход помог нам снизить требования к физической емкости, что позволило потратить меньше денег на дорогостоящие накопители. Опуская маркетинговые цифры, можно сказать, что мы получили на данных ABBYY среднюю экономию дискового пространства в 35%. Таким образом «АйТеко» удалось предложить решение в виде двух массивов по цене одного: all-flash под базу данных и другие задачи с высокой OLTP-нагрузкой, а также гибридный массив под хранение большого объема файлов разного типа с потоковой нагрузкой и частыми запросами на чтение.

CNews: Игорь, вы были до этого знакомы с решением HPE Nimble Storage?
Игорь Буланов:

Нет, но функциональные возможности системы оптимально подошли под наши требования.

Сергей Желонкин:

Сочетание многих технологий в рамках одного решения HPE Nimble не оставило сомнений в том, какой именно продукт наилучшим образом решит задачи ABBYY.
CNews: Расскажете о технологических особенностях этой СХД? За счет чего обеспечивается ее высокая доступность и эффективность хранения?
Сергей Желонкин:

Технология сжатия «на лету» в HPE Nimble имеет переменный блок и использует алгоритм LZ4, что позволяет поддерживать высокую скорость компрессии, а при необходимости переходить на более слабый алгоритм, чтобы разгрузить ядра центрального процессора. Дедупликацию можно включать и отключать на каждом конкретном томе, что дает значительную экономию ресурсов контроллера, поскольку далеко не все типы файлов одинаково хорошо сжимаются и дедуплицируются. Как раз применение этих технологий и способствовало значительной экономии дискового пространства ABBYY.

Высокая доступность СХД — следствие не только дублирования всех компонентов системы. Оно достигается еще и благодаря использованию платформы встроенной предиктивной аналитики InfoSight, которая позволяет анализировать многочисленные конфигурации и строить прогнозы и тенденции, предотвращая возможные сбои и узкие места на основе собранной статистики.

Сочетание многих технологий в рамках одного решения HPE Nimble не оставило сомнений в том, какой именно продукт наилучшим образом решит задачи ABBYY.

CNews: Насколько востребованы подобные решения у компаний, которые к вам обращаются?
Максим Митрохин:
Максим Митрохин
СХД HPE Nimble помогла коллегам из ABBYY эффективно закрыть вопросы с хранением быстро растущих данных.

Компания HPE известна тем, что постоянно развивает линейку своих продуктов и ищет возможность предложить ИТ-рынку самые инновационные и продвинутые решения. По нашему опыту, бизнес позитивно относится к такому прогрессу и готов использовать эти инновации в решении своих задач. СХД HPE Nimble тут не стала исключением: благодаря своим уникальным особенностям она помогла коллегам из ABBYY эффективно закрыть вопросы с хранением быстро растущих данных.

Отдельно хочу поблагодарить Игоря Буланова и всех его коллег из ABBYY, причастных к этому проекту, за доверие и возможность в очередной раз доказать, что команда «АйТеко» готова и может решать любые задачи своих заказчиков. Надеюсь, в будущем, у нас будет больше поводов для подобных статей!