Что тормозит использование искусственного интеллекта
На сегодняшний день, пожалуй, уже не осталось компаний, которые бы не внедрили искусственный интеллект для решения тех или иных задач. Главная задача — правильно расставить приоритеты и сконцентрироваться на решениях, которые принесут реальный экономический эффект. И, конечно, привлекать рядовых сотрудников к использованию технологии. Как выбрать, обучить и запустить ИИ-модель, обсудили участники секции «Искусственный интеллект и большие данные», которая прошла в рамках CNews FORUM Кейсы.
Виталий Ляпер: В крупной компании энтропия и хаос в данных почти неизбежны
За годы автоматизации в компаниях накопилось огромное количество данных. Однако далек не все из них можно использовать — ситуация, когда никто не может сказать, где и в каком виде они хранятся, далеко не редкость. Как навести порядок в данных в крупной компании, рассказал Виталий Ляпер, главный архитектор МТС Web Services.
CNews: Какие проблемы с данными возникают в крупных компаниях?
Виталий Ляпер: Главная проблема в данных практически любой крупной компании — проблема масштаба. Там, где количество данных небольшое, информация о них умещается в голове разработчиков, либо ее можно структурировать в формате документации. В крупной компании энтропия и хаос в данных почти неизбежны – M&A, покупка вендорских решений, годы инхаус разработки, смена нескольких поколений специалистов — все это приводит к тому, что компания рано или поздно оказывается в ситуации, когда знания о данных, где лежит та или иная сущность, какие у нее атрибуты, связи, размываются или оказываются полностью утерянными.
В этой связи не удается полагаться только на базу знаний, она также со временем устаревает. На первый план выходят способы ориентации на значительном ландшафте источников данных, когда сведения о данных получаются в момент обращения к ним и не теряют своей актуальности.
CNews: Как в МТС подошли к решению проблемы качества данных?
Виталий Ляпер: Качество самих данных имеет ключевое влияние на бизнес МТС. Мы хотим предоставлять наших клиентам лучшие сервисы нашей экосистемы проактивно и для этого должны опираться на максимально достоверные и качественные данные.

Как крупная компания, мы столкнулись с типичными проблемами роста, которые привели к размыванию наших знаний о собственных данных в компании, что сильно затруднило контроль их качества. Поэтому мы инвестировали в разработку собственных инструментов ориентации в ландшафте данных — продукта InDatabase, который позволяет нам держать руку на пульсе и всегда получать актуальную информацию о содержимом таблиц и колонок в БД, в автоматическом режиме проводить анализ данных, находить критические данные, неявные связи между данными.
CNews: В чем главные преимущества использования InDatabase?
Виталий Ляпер: Главное преимущество InDatabase — это возможность провести анализ огромного ИТ-ландшафта автоматически и в довольно сжатые сроки. Подключение нового источника для анализа занимает считанные минуты, на описание каждой таблицы уходит около 60 секунд, после чего на выходе аналитик получает информацию, которая достаточна для того, чтобы разрабатывать запросы к данным источника, формулировать проверки качества этих данных, проектировать интеграционные спецификации или процессы ETL. Для сравнения подобный анализ витрины данных вручную занимает у аналитика порядка 6 часов.
Любовь Родионова, Arenadata: Мониторинг СУБД снижает производительность на 10% — мы это исправили

Таким образом с помощью InDatabase мы можем обеспечить сквозной анализ ИТ-ландшафта, на который большинство компаний просто не решаются в силу неподъемной стоимости такой процедуры. Мы сможем заглянуть в legacy-системы, понять, что в них и как организовано, а также сможем контролировать полноту данных, получаемых из нескольких источников, внутри компании.