Статья

Pentaho: Машины не заменят людей в обозримом будущем

data
мобильная версия

Общество постепенно привыкает к мысли о том, что мир стремительно меняется – становится, как говорится, «датацентричным». Практически каждая компания сейчас пересматривает свое отношение к данным, а также к их сбору, хранению и анализу. О том, что будет с людьми, чьи рабочие места займет искусственный интеллект, о проблемах, которые приносят новые технологии, и о цифровой трансформации бизнеса CNews побеседовал с Ваэлом Алрифаем (Wael Elrifai), старшим директором компании Pentaho (входящей в Hitachi Group) в регионе EMEA.

CNews: Какие тренды, обозначенные в начале года, уже подтвердились в сфере больших данных? Каковы ваши прогнозы по развитию этой области в следующем году?

Ваэл Алрифай: В начале года мы сделали очень непривычный прогноз: «Готовьтесь к непредвиденному!» Сейчас происходит множество событий, результаты которых сильно отличаются от ожиданий людей, – взять, к примеру, выборы президента США и «Брексит». В случае со вторым событием эффект неожиданности создала ошибка британских социологов: они использовали устаревшие методы аналитики данных и не задействовали сентимент-анализ всего электората целиком.

Вместо того, чтобы продолжать предсказывать, что произойдет в будущем, мы советуем компаниям незамедлительно начать выстраивать гибкие, устойчивые бизнес- и ИТ-процессы. Еще никогда модернизация инфраструктуры анализа данных не была настолько важной и срочной задачей для организаций: сегодня они могут получить преимущества от сколь угодно большого количества данных, используя не только корпоративную информацию, но и данные с датчиков и устройств, социальные, погодные данные и многое другое.

CNews: Какова роль бизнес-аналитики в процессах цифровой трансформации предприятия?

Ваэл Алрифай: Данные и их анализ должны быть сердцем любой цифровой бизнес-платформы. Это то, что сводит воедино людей, объекты и ИТ-системы. Компании должны мыслить глобально, начинать с малого и быстро масштабироваться, чтобы быть конкурентоспособными. Данные – ключ к преобразованию компании. Большие данные, интернет вещей и машинное обучение уже меняют мир данных – от разрозненной структуры до такой, где все данные связаны, открыты и подвижны. Размываются существующие границы между инфраструктурами, операционными и информационными технологиями, а также между сообществами и странами. В конечном счете, ни одна компания не сможет ориентироваться на рынке без возможности вести бизнес, основанный на данных.

CNews: Какие отрасли, сферы бизнеса более продвинуты в этом отношении и активно используют технологии анализа данных? Почему так происходит?

Ваэл Алрифай: Интересно, что самыми продвинутыми пользователями анализа данных являются более традиционные отрасли промышленности и услуг: финансовые организации, например. Причина в том, что они увидели реальную угрозу в прорывных компаниях цифровой эпохи, которые заявили о себе как о сильных конкурентах. Большая гонка идет в автомобилестроении, например, в создании «умных», безопасных, энергоэффективных машин будущего, которые подключены к услугам страховых компании, служб технической помощи на дороге и так далее. Все системы в таких автомобилях связаны данными.

В качестве другого примера можно привести традиционные банки, которые сталкиваются с серьезными угрозами со стороны новой волны экономичных и гибких финтех-компаний, которые предлагают исключительные онлайн-услуги по конкурентным тарифам. Они к тому же обременены прежней дорогостоящей децентрализованной инфраструктурой и несчетным количеством баз данных и приложений, включая устройства и софт, попавших в компанию по методу «принеси свое». Эти унаследованные данные слишком ценны, чтобы просто отказаться от них, но очень дороги и сложны в управлении. Эти и другие причины объясняют, почему так много финансовых институтов инвестируют в такие технологии анализа данных как, например, наша.

CNews: Расскажите, пожалуйста, о пользовательском опыте, который дают решения Pentaho. Можете проиллюстрировать примерами, какую выгоду извлекают компании от анализа данных: привлечение новых клиентов, выход на новые рынки, рост доходов?

Ваэл Алрифай: На этот счет у меня есть два весьма разных примера, причем из очень традиционных секторов: производство, дистрибьюция и грузоперевозки. Один из наших клиентов – крупный транснациональный производитель и дистрибьютор сахара. На этом рынке успех зависит от того, насколько производство оптимизировано как под предложение, так и под спрос. Чтобы достичь этой цели, клиент построил полностью роботизированную очистную и обрабатывающую линию – от сырья до производства конечного продукта. На каждой стадии производства датчики генерируют массу информации. Особенность производства сахара в том, что его свойства в значительной степени зависят от происхождения продукта: кексы в Перу на вкус гораздо слаще, чем в США. Сложность для этой компании была в том, чтобы не только повысить эффективность в очистке и дистрибуции, но и подстроиться под изменения в качестве сахара. Если сахар, поступивший клиентам, будет на вкус не таким, как ожидалось, у компании будут серьезные проблемы. Успех пришел к компании тогда, когда она смогла объединить качественные данные о типе сырья – географическое происхождение, концентрация сахара, маршрут доставки – с данными датчиков.

Ваэл Алрифай: Вместо того, чтобы продолжать предсказывать, что произойдет в будущем, мы советуем компаниям незамедлительно начать выстраивать гибкие, устойчивые бизнес- и ИТ-процессы

Другой пример - компания Caterpillar Marine Asset Intelligence, которая на протяжении многих лет занимается мониторингом флота ВМС США, оборонных структур и коммерческих судов. Они собирают и анализируют данные с датчиков, установленных на всем критически важном оборудовании корабля. Эти данные помогают предсказывать вероятность поломки оборудования, тем самым делая ремонт судна прогнозируемым: все неисправности устраняются еще до поломки. Оперативные данные предоставляют собой полезную информацию, необходимую владельцам и операторам судна для планирования техобслуживания: она позволяет избегать простоев и задержек. Это классический пример прогнозного обслуживания.

Пару лет назад владельцы судов захотели также сократить расходы на техобслуживание, которые с течением времени возрастали. Они начали пристальнее изучать информацию, поступающую с датчиков о потреблении топлива, сопротивлении и углах, под которыми судно идет по морю. Специалисты, работающие в этом бизнесе, всегда знали о том, что водоросли и моллюски, которые со временем скапливаются на корпусе корабля, создают дополнительное сопротивление при движении. Но только после анализа данных стало ясно, что это сопротивление оказывает слишком большое влияние на расход топлива. Раньше предприятие занималось чисткой кораблей раз в два года. Используя программное обеспечение Asset Intelligence, они удвоили частоту этой процедуры, что сэкономило $10 млн за два года эксплуатации восьми судов.

CNews: Откуда берутся данные на современном цифровом рынке? И какие новые проблемы возникают в мире данных?

Ваэл Алрифай: Сегодня данные генерирует множество источников: приборы учета электроэнергии, машины, различные устройства, двери поездов и так далее, и так далее. Конечно, множество различных типов данных доступны онлайн: история посещений страниц (кликстрим), социальные сети, рейтинги и отзывы, погода, геоданные, сервисы сравнения цен. Социальные сети предоставляют ценные данные для сентимент-анализа, о котором я упоминал ранее. Объединяя сентимент-данные с более традиционными, структурированными наборами данными, вы получаете по-настоящему ценные знания.

По мере того, как мы становимся все более опытными и зрелым в использовании данных, возникают новые вызовы. В недавно опубликованной книге «Будущее интернета вещей: используя переход к датацентричному миру» (The Future of IoT: Leveraging the Shift to a Data Centric World), которую мы написали в соавторстве с Доном ДеЛохом (Don DeLoach) и Эмилем Бертельсеном (Emil Berthelsen), проверено несколько концептуальных идей, связанных с владением данными и архитектурой, которая должна быть полностью переработана, если компании хотят извлечь максимум выгоды от интернета вещей по мере его развития.

CNews: Посоветуйте, пожалуйста, как начать умнее работать с корпоративными данными?

Ваэл Алрифай: На встречах с заказчиками я всегда особо подчеркиваю одну простую вещь: начинайте с задачи. Не путайте технологии с конечной задачей. Нет смысла анализировать данные с датчиков, просто потому что эти датчики существуют, или начинать проект из области интернета вещей, исключительно потому, что это сейчас модно.

Для производства, например, лучше сработает ориентация на промежуточный результат в духе: «Посмотрим, сможем ли мы снизить время простоев через прогноз времени и причины поломки компонента Х, сделанный при помощи новых данных и новых технических навыков». Конечно, если это можно предсказать, у бизнеса будет отправная точка для исключения последующих простоев и снижения операционных расходов.

CNews: Как технология Pentaho связана с интернетом вещей? Какую роль, на ваш взгляд, ИВ сыграет для бизнеса в ближайшем будущем?

Ваэл Алрифай: Модули интеграции и анализа данных Pentaho используют и подготавливают широкий спектр данных для анализа: от корпоративных и реляционных до внешних и онлайн-данных, а также большого количества данных, полученных с датчиков и устройств, из которых и состоит интернет вещей.

Среди заказчиков, которые получают самые ценные знания от использования Pentaho, есть, например, компания BT Assure Cyber: она использует данные интернета вещей совместно с другими типами данных. BT Assure Cyber объединяет событийные данные и данные телеметрии из разнообразных источников, включая бизнес-системы, традиционные системы контроля и безопасности, а также продвинутые инструменты обнаружения. Платформа Pentaho отвечает за то, чтобы заказчики Assure Cyber получали ценные знания из всевозможных данных, реляционных и неструктурированных. Это означает, что уязвимости и инциденты, с которыми расследование и реагирование раньше занимало целые дни и даже недели, сейчас выявляются мгновенно.

В добавок к тем отраслям, про которые я уже говорил – промышленность и финансовые услуги – мы ожидаем большой рост в сфере кибербезопасности. Как в случае с выборами в США, выявление нарушений в области кибербезопасности зависит от понимания сложности человеческого поведения. Так, компания «Морган Стэнли» предсказывала в прошлогоднем отчете, что рынок кибербезопасности вырастет более чем четыре раза в структуре общих ИТ-расходов.

И наконец, Pentaho – дочерняя компания Hitachi. Ни у одной другой компании нет такой комбинации опыта с операционными технологиями и интернетом вещей наряду с существующими технологическими активами и отраслевым опытом, как у Hitachi. Pentaho может использовать ресурсы и знания Hitachi, основанные на 107-летнем опыте в отраслевых технологиях и 58-летнем ИТ-наследии.

CNews: Какую роль играет машинное обучение в работе с данными? Как Pentaho использует эту технологию?

Ваэл Алрифай: Машинное обучение, как следует из названия, это автоматизированная система, которая становится с течением времени умнее за счет того, что «учится». В мире аналитики машинное обучение лучше всего применяется для часто повторяющихся, сложных задач, которые не вполне подходят для обработки человеком: например, для сбора данных.

Недавно мы расширили возможности нашего программного обеспечения за счет включения технологий машинного обучения в бизнес-процессы, что помогает командам специалистов по работе с данными, инженерам и аналитикам разрабатывать, настраивать, тестировать и развертывать предсказательные модели достаточно быстро.

Разработка прогнозных моделей с машинным обучением – это трудоемкая и сложная задача, потому что для каждого источника данных должны быть определены бизнес-процессы. Поэтому большинство моделей обычно не доходят до промышленного использования. Например, если железнодорожный оператор хочет предсказать, где вероятнее всего будет поломка, и имеет 3 000 сенсоров, генерирующих 4 млн единиц данных в секунду, специалистам по работе с данными нужно описать, как минимум, 3 000 рабочих процессов. Теперь Pentaho позволяет специалистам по работе с данными создавать эти бизнес-процессы автоматически, с использованием шаблонов, созданных в визуальном удобном интерфейсе.

CNews: Что вы думаете о растущей роли искусственного интеллекта в бизнесе и этической стороне этой инновации в аспекте человеческой занятости?

Ваэл Алрифай: Машины не заменят людей в обозримом будущем – а возможно, и никогда. Есть задачи, для которых люди хороши, а машины справляются ужасно, и наоборот. Например, в отличие от машин, люди плохо справляются с точными, повторяющимися вычислениями. Компьютеры, как известно, неточны – даже отличные алгоритмы распознавания изображений чаще ошибаются, чем дают правильный ответ, когда речь идет о том, чтобы распознать кошку на фотографии. Тогда как здоровый четырехлетний ребенок всегда точно распознает кошку, несмотря на ее возраст, размер или породу, независимо от того, прячется ли кошка на диване, под столом или на дереве.

Сам характер работы человека определенно изменится, и автоматизированных процессов станет все больше и больше. Однако история учит нас, что кризисы полезны. С ростом эффективности производства у людей появляется больше свободного времени, улучшается здоровье. Мы, как и все общество, поощряем и хотели бы помочь компаниям в разработке прорывных технологий.