Спецпроекты

На страницу обзора
Александр Фридман, «Дататех»: Для передовых бизнес-сервисов нужен соответствующий цифровой фундамент

Компания «Дататех» (входит в состав группы «Иннотех») занимается внедрением полного цикла управления данными. «Дататех» специализируется на построении корпоративных хранилищ данных и управлении данными на базе программного обеспечения с открытым кодом. Компания разрабатывает индустриальные решения с использованием методов математического моделирования и технологий ИИ/машинного обучения, а также является официальным партнером компании Arenadata: корпоративной платформы для сбора, хранения и обработки данных. CNews поговорил с Александром Фридманом, первым заместителем генерального директора компании «Дататех», о том, что сегодня в фокусе у компании, обсудил планы по развитию, а также роль больших данных для развития бизнеса и особенностях российского рынка искусственного интеллекта (ИИ).

Александр Фридман«Дататех»

В работе с большими данными роль машинного обучения и ИИ постоянно увеличивается

CNews: Что понимается сегодня под управлением данными, и почему это важно? Какие продукты предлагает «Дататех», на кого они ориентированы, и какие задачи решают? Как организованы обучение и поддержка?

Александр Фридман: Работа с большими данными — обширная область. В первую очередь компании хотят анализировать данные, которые накопили за долгое время. Массивов информации с каждым годом становится больше. Согласно прогнозу IDC, к 2025 году общий объём данных, генерируемых во всем мире, вырастет более чем вчетверо — до 175 зеттабайтов (для сравнения: в 2019 году это значение достигало только 40 зеттабайтов). Сюда входит информация, размещаемая в дата-центрах, на компьютерах, смартфонах, устройствах Интернета вещей, вышках сотовой связи и т.п. Поэтому эта ниша растёт такими быстрыми темпами.

«Дататех» предлагает достаточно широкий спектр решений, начиная от построения технологической платформы вместе с нашим партнёром Arenadata и заканчивая внедрением моделей с использованием машинного обучения и ИИ, которые нацелены на эти задачи. Кроме того, в ближайшее время мы собираемся вывести на рынок ряд продуктов от своего имени. В первую очередь это решения для работы с моделями и платформа предиктивной аналитики.

Эти направления сейчас очень актуальны и востребованы. Для обучения и поддержки мы используем все доступные инструменты, в том числе внешние курсы, оптимизированные для конкретных клиентов, а также занимаемся развитием собственного персонала. Более того, мы сотрудничаем со многими вузами по всей России, а также обучаем студентов старших курсов.

CNews: Какую роль играют сегодня ML/AI в аналитике больших данных? Каковы тенденции?

Александр Фридман: В работе с большими данными роль машинного обучения и ИИ постоянно увеличивается. Это две части целого, поскольку машинное обучение как раз и позволяет создавать и обучать модели, которые используют большие данные. Порядка 50% компаний считают, что они уже применяют системы искусственного интеллекта, и более 80% используют большие данные. Вероятно, эти цифры вскоре превысят 80%.

Рынок ИИ быстро растет и становится все более практическим, появляются реальные примеры использования искусственного интеллекта в самых разных сферах. Применение ИИ помогает компаниям оптимизировать бизнес-процессы и как следствие увеличить прибыль. По данным исследования Аналитического центра, в 2021 году эффект для российской экономики от применения ИИ составил более 300 млрд рублей. Наиболее заметный прирост отмечается в финансовом секторе - 69 млрд рублей и в секторе ИКТ - 55 млрд рублей.

CNews: Есть ли какая-то взаимосвязь между использованием машинного обучения в России и в западных компаниях, какие-то отличия и общие факторы?

Александр Фридман: Конечно, есть. Более того, у нас технологический рынок во многом более продвинутый, чем на Западе. Достаточно посмотреть, какой уровень сервиса наши банки оказывают клиентам. Их задачи и работа с данными во многом превосходят западные аналоги. Например, у нас финансовые организации научились делать предложения вплоть до конкретного клиента. А многие зарубежные игроки до сих пор сегментируют их на уровне групп пользователей по достаточно простым правилам.

Александр Фридман, «Дататех»: Работа с большими данными — обширная область. В первую очередь компании хотят анализировать данные, которые накопили за долгое время

Модели, которые применяются сейчас нашими банками, намного опережают то, что используется в других странах. Но безусловно, какие-то практики нам стоит заимствовать. Например, в области медицины.

CNews: С чем связана технологическая продвинутость российских банков?

Александр Фридман: Прежде всего, с высококонкурентной средой и борьбой за клиента. Например, если когда-то кредитную заявку согласовали до пяти дней, то сейчас это происходит практически в режиме онлайн. Подобные сервисы появляются на рынке, когда активно идет борьба за клиента. Такие продукты повышает удобство использования. Поэтому среди всех факторов я бы выделил высокую конкуренцию. С одной стороны стоит желание руководителей финансовых институтов улучшить продукты, а с другой — пользователи, которым действительно нужны новые сервисы.

CNews: Для работы с большими данными используется более двух десятков технологий интеллектуального анализа данных, ИИ, системы распределенного реестра, квантовых, блокчейн-технологий и др. Какие из них вам кажутся наиболее перспективными?

Александр Фридман: Очень важно применять для решения конкретных задач правильные технологии. То есть не надо использовать, например, блокчейн для тех задач, где они не нужны. То же самое касается анализа информации.

Квантовые вычисления, например, будут очень востребованы, и не только в банковской, но и любой отрасли, будь то ритейл, телеком или фундаментальные научные исследования. Они могут использоваться для построения гипотез и поиска лекарств. Такие задачи требуют обработки огромного массива данных, и технологические возможности позволяют это делать.

CNews: А какие задачи можно решать с помощью больших данных искусственного интеллекта в госструктурах?

Александр Фридман: В правительстве есть люди, курирующие вопросы искусственного интеллекта. Это значит, что запрос на это направление в наших государственных органах будет очень велик.

Например, в МФЦ данные доступны из единого окна. По факту это и есть big data. И следующий возможный шаг — на основании имеющихся данных задействовать предиктивную аналитику, связав несколько государственных систем. Так, например, можно выяснить, что человеку положены какие-то социальные выплаты, про которые он может и не знать. Такие суперсервисы с использованием больших данных и машинного обучения стоят сейчас на повестке дня, а где-то уже даже реализованы.

Должен отметить, что в глобальном рейтинге ООН по развитию электронного правительства (EGDI) в 2020 году Россия заняла 36 место. Индекс EGDI рассчитывается на основе трех показателей каждой из стран: развитие электронных услуг, развитие человеческого капитала и развитие телекоммуникационной инфраструктуры на протяжении двух лет, предшествующих обновлению рейтинга. Это значит, что нам есть к чему стремиться, и учитывая скорость цифровизации нашей страны, мы сможем добиться хороших результатов в ближайшие несколько лет.

CNews: Какие направления фундаментальных исследований в области больших данных представляются вам наиболее важными с точки зрения значимости их результатов для экономического развития России?

Александр Фридман: Большие данные — это обширное поле исследований: поиск новых лекарств, анализ большого количества рентгеновских снимков, который открывает возможности для изучения течения заболевания, задачи ядерного синтеза и пр. Все это требует анализа огромных массивов информации. И с каждым годом возрастают возможности применения новых технологий.

Какую бы отрасль мы бы ни взяли — химическую промышленность, медицину — везде можно использовать методы машинного обучения. Но при этом очень важны качество, целостность, правильный подбор наборов данных.

CNews: А насколько велики риски получить с помощью искусственного интеллекта неправильные выводы?

Александр Фридман: Искусственный интеллект можно использовать как рекомендательную систему. Пример — постановка диагноза в медицине. Система может что-то советовать врачу, а дальше он уже принимает решение на основании своего опыта и рекомендации ИИ.

Или посмотрим на беспилотные автомобили: ими управляет сложный алгоритм. С помощью ИИ он учится самостоятельно действовать в нестандартных ситуациях, набирается опыта. Чем больше будет продолжаться обучение, тем меньше вероятность ошибки. Нужен здоровый баланс и понимание того, что риски тоже нужно просчитывать. Кроме того, существуют опасения по поводу предвзятости и конфиденциальности в работе ИИ, по данным исследования компании Anaconda половина респондентов назвали одну из этих двух тем «самой крупной проблемой», которую необходимо решить в сфере AI/ML.Тем не менее, вызывает беспокойство тот факт, что только 15% респондентов заявили, что их команда в настоящее время активно занимается этой проблемой, и только 15% университетов обучающих ИТ-специалистов включают курсы по этике.

С ростом количества инцидентов роль ИИ в обеспечении безопасности становится всё более важной

CNews: Какую роль играют большие данные в сфере обеспечения безопасности?

Александр Фридман: С ростом количества инцидентов роль ИИ в обеспечении безопасности становится всё более важной. Здесь машина может выявлять отклонения от нормального поведения пользователя. Также идёт работа над системами для автоматического отражения атак, чтобы противодействовать хакерам и внутреннему фроду. Программы становятся всё сложнее, а информации всё больше. В этих условиях нужно применять модели, которые понимают, когда начинается вредоносная активность.

В области физической безопасности получили распространение технологии автоматического распознавания лиц, что должно повышать защищённость граждан. В целом перспективы развития ИИ в области информационной безопасности сейчас очень велики. Например, в банках активно используется умение выявлять внутренний фрод, мошенничество. При помощи ИИ проверяется соответствия суммы платежа установленному лимиту, попадание IP-адреса плательщика в привычный регион пользования, корреляция с ранее выявленными шаблонами клиентского поведения и многое другое. Кроме того, для повышения точности аутентификации владельца карты некоторые антифрод-системы также подключают биометрические модули, чтобы с помощью ML распознавать речь и идентифицировать личность владельца карты. По оценкам экспертов, на 2021 год банки потратили более $217 млрд на внедрение ИИ с целью предотвращения мошенничества и оценки рисков.

CNews: Как и чем можно защитить сами большие данные?

Александр Фридман: Есть стандартный набор средств информационной безопасности, распределение прав доступа, обезличивание данных. Компании, занимающиеся информационной безопасностью, всё чаще исследуют возможности использования машинного обучения для противодействия атакам. Чем больше становится таких инцидентов, тем более «умным» должен быть на них ответ. Чтобы компании могли более эффективно защищать себя от киберугроз, очень важен обмен опытом, накопленным отдельными организациями, а также наличие инструмента для обмена таким опытом, например. На уровне Центрального банка такая работа уже ведётся. Так активно ведётся развитие проекта Цифровой профиль – это расширенная версия личного кабинета на Портале Госуслуг, где будут храниться сведения о гражданах из различных баз данных.

CNews: Какие преимущества большие данные дают потребителям?

Александр Фридман: По прогнозам аналитиков TechTarget, в сфере финансовых услуг объём новых данных в течение 2021 года мог вырасти более чем на 700%. Это даёт банкам много возможностей для оптимизации бизнес-процессов и улучшения клиентского сервиса.

Например, банк с помощью больших данных может составить детальный портрет запросов потребителя, понять, какими продуктами он интересуется. Это может быть, например, ипотека или автокредит. К каждому клиенту банк может подойти индивидуально. Большие данные как раз и позволяют сделать релевантное и своевременное предложение. С точки зрения удобства обслуживания развиваются омниканальные сервисы. А с точки зрения безопасности средств клиентов — это противодействие внутреннему мошенничеству, карточному фроду.

Александр Фридман: С ростом количества инцидентов роль ИИ в обеспечении безопасности становится всё более важной

«Дататех» объединяет команду, которая умеет работать с разными отраслями

CNews: Компания «Дататех» в значительной степени ориентирована на банковскую отрасль. С чем это связано?

Александр Фридман: Наши флагманские продукты, как и решения группы «Иннотех», частью которой мы являемся, были разработаны для банковской сферы. Однако у нас уже сейчас есть клиенты и в телекоме, и в ритейле, и в других секторах экономики. Накоплен определённый опыт решения задач, с которыми изначально сталкивался финтех. И мы распространяем его на другие отрасли.

«Дататех» объединяет команду, которая умеет работать с разными отраслями, тиражировать опыт, полученный в других компаниях с учётом тех продуктов и методов, которыми мы располагаем. Наш подход в работе дает возможность посмотреть на выстроенные каждым клиентом процессы, чтобы их обогатить, объединить и предложить что-то новое. Во многом именно это отличает «Дататех» от наших непосредственных конкурентов.

CNews: Насколько остро сейчас ощущается дефицит кадров, специалистов по работе с данными?

Александр Фридман: Как и в любом направлении ИТ, у нас сейчас острый дефицит кадров. Исследования подтверждают, что специалисты по работе с данными стали третьими в рейтинге специальностей, которые оказывают наибольшее влияние на бизнес-показатели компаний — их отметили 27,2% опрошенных разработчиков.

Мы используем все доступные инструменты, привлекаем молодые кадры, а также ищем на рынке уже подготовленных, опытных специалистов, предлагая им интересные задачи.

Новые направления, такие как ИИ/машинное обучение, сейчас очень востребованы среди молодых талантов, им интересно строить нейронные сети, решать масштабные задачи бизнеса. Мы собрали несколько ведущих команд из зарубежных компаний-вендоров, которые занимались аналитикой данных, работавших с различными индустриями, обогатили их теми знаниями, которые у нас были. Так, в апреле 2022 г. в «Дататех» перешли специалисты по работе с рисками из покинувших наш рынок компаний SAS и Teradata. Мы рады, что к нам переходят целые команды высокопрофессиональных разработчиков. Это позволяет нам обмениваться опытом, повышать уровень наших продуктов, а также улучшать корпоративную культуру. Такая синергия идёт только на пользу компании.

Российский рынок больших данных опережает зарубежные

CNews: Каковы особенности российской индустрии больших данных? Какие тренды для них характерны?

Александр Фридман: Российский рынок больших данных опережает зарубежные. Это очень важно для замещения ранее использовавшихся западных технологических решений, для замены технологического стека, который исторически у нас сложился, защиты нашей критичной инфраструктуры. Появляются отечественные решения очень хорошего качества, которые мы используем в своей работе. Например, нашим партнёром в области обработки данных является компания Arenadata. С другой стороны, мы не можем ограничиваться импортозамещением, необходимо, меняя технологический фундамент, одновременно предлагать бизнесу передовые бизнес-сервисы нового поколения.

CNews: Как вы считаете, в каких направлениях может и должно развиваться регулирование больших данных в России? Есть ли необходимости их регулирования в форме закона, и каких именно данных оно должно касаться?

Александр Фридман: Государство пытается помочь бизнесу, дать нормы закона, чтобы можно было работать с данными. Самое главное — это возможность диалога между бизнесом и государством, регуляторами, чтобы новые технологии можно было применять на практике. Сейчас такой диалог идёт, и многое становится легче и доступнее. Есть Закон о банковской тайне, Закон о связи и другие регулирующие документы. Нужна синергия и возможность услышать друг друга, как со стороны регуляторов, так со стороны бизнеса. В 2021 году были представлены первые в истории глобальные стандарты этических аспектов искусственного интеллекта, принятые государствами-членами ЮНЕСКО в ходе Генеральной конференции. В этом исторически значимом тексте изложены общие ценности и принципы, которые будут определять создание необходимой правовой инфраструктуры для обеспечения здорового развития ИИ. Это показывает, что сейчас идёт диалог о том, что любой инструмент, в том числе анализ больших данных или искусственный интеллект — это всего лишь средство, которое может использоваться как во благо, так и во зло.

На данном этапе приоритет для «Дататех» — вывод на рынок новых собственных продуктов

CNews: Каковы планы «Дататех» на будущее? Какие новые разработки ведет компания, какие появятся новые продукты, на какие рынки они ориентированы?

Александр Фридман: На данном этапе приоритет для «Дататех» — вывод на рынок новых собственных продуктов. А экспертизу, которую мы уже накопили в различных компаниях, мы сможем предложить клиентам в еще большем количестве отраслей.

Кроме того, мы планируем расширение на новые рынки. Например, совсем недавно мы стали официальным дистрибьютором корпоративной платформы для сбора, хранения и обработки данных Arenadata EDP в Узбекистане. Для компании «Дататех» Экономика Узбекистана переживает период бурного роста: в 2021 году рост ВВП превысил 7%, а за последние 4 года экономический рост составил 24%. На этом фоне активно развивается ИТ-сектор: инвестиции в основной капитал в нем, по оценке Центра экономических исследований и реформ, за 4 года увеличились в 4 раза. Таким образом рынок становится очень привлекательным в том числе для международных ИТ-игроков, нацеленных на экспортные возможности. Уверен, уникальные технологии, которые находятся в активе у «Дататех» и Arenadata, помогут локальному бизнесу выйти на новый уровень.