Разделы

Big Data

Сколько стоит Big Data?

Технологии Big Data находят все большее применение в мире. Западные исследования показывают, что в 2014 г. внедрение анализа больших данных примет массовый характер. В России пока известны лишь единичные примеры успешных внедрений этих технологий. Отечественные компании присматриваются и прицениваются.

Так как средний срок окупаемости проектов Big Data подсчитать довольно сложно, Федор Прохоров считает целесообразным начинать с небольших краткосрочных пилотных проектов с четкими критериями успеха, которые помогут продемонстрировать эффект от Big Data руководству, чтобы в дальнейшем получить финансирование на более крупные и долгосрочные проекты. По мнению Алексея Благирева, окупаемость инвестиций в технологии Big Data нельзя оценивать с точки зрения только технологического направления, так как эти решения окупаются в первую очередь с точки зрения бизнеса, покрытия бизнес-потребностей.

Дмитрий Кузякин, вице-президент и директор департамента CRM ВТБ24, говоря о дивидендах, приносимых технологиями Big Data отметил: «Для ВТБ24 это стабильные +15% к бизнесу банка».

По мнению руководителя группы перспективных технологий предпроектного консалтинга Oracle СНГ Андрея Пивоварова, в большинстве случаев использование технологий Big Data дает новые возможности не столько по технологическим, сколько по экономическим причинам. «Создание петабайтного хранилища данных в банке при помощи традиционных СУБД технически возможно уже много лет, но затраты на инфраструктуру, лицензии и так далее могут быть несоизмеримы с потенциальным экономическим эффектом. Особенно если большая часть данных, составляющих этот петабайт, состоит из логов веб-сайтов или записей из социальных сетей. Big Data-технологии позволяют для многих задач построить систему, которая будет стоить в десятки раз меньше». В последнее время все больше компаний создают гибридные хранилища данных, построенные с использованием как традиционных технологий, так и технологий больших данных. По мнению Андрея Пивоварова, такие системы могут использовать лучшее из двух миров и являются экономически выгодными.

Антон Заяц считает, что окупаемость зависит от того, для каких задач внедряется решение Big Data. Например, инвестиции в системы хранения окупаются за счет использования данных в других решениях. Инвестиции в инструменты высокопроизводительной визуализации данных – за счет принимаемых с их помощью решений.

Оптимизация расходов

Существуют разные пути оптимизации расходов в проектах Big Data. Сэкономить помогут переговоры с поставщиками о скидках, использование бесплатного программного обеспечения, облачные решения, применение масштабируемых решений, внедрение Big Data сначала с небольших пилотных проектов.

По мнению участников рынка, лицензионная политика многих производителей решений для работы с Big Data архаична или непрозрачна, зачастую не учитывает работу с кластерами. Поэтому многие считают, что торг в переговорах с вендорами уместен. Возможность получить существенную скидку подтверждается практикой. Банку «Открытие», осуществившему, по словам Алексея Благирева, крупнейшее на сегодняшний день внедрение HP Verticaв России, удалось добиться уникальных условий лицензирования.

Очевидным способом оптимизации расходов на Big Data является использование бесплатных программных продуктов, однако специалисты советуют взвешенно относиться к их применению, прежде учитывая имеющуюся экспертизу внутри организации и возможности привлечения экспертизы извне. «Уже сейчас можно построить полное решения для сбора, хранения и анализа данных, не заплатив ни копейки за ПО, при этом все ведущие мировые производители систем хранения анализа и обработки данных поддерживают технологии Big Data в своих продуктах. Я считаю, что можно отработать методологию и накопить опыт на небольших проектах с использованием бесплатного ПО, а потом использовать промышленное решение от производителя существующего хранилища данных организации для промышленной эксплуатации», – рекомендует Федор Прохоров.

Разработчик российской ОС подвел итоги года
Бизнес

Какие действия предпринимает ваша компания
для анализа больших данных?

Источник: IDG Enterprise, 2014

Основную статью расходов – затраты на оборудование – можно снизить за счет облачных решений. Многие вендоры предлагают свои инструменты анализа больших данных в облачной инфраструктуре. Однако не все данные можно анализировать в облаке. «Публичные облачные решения хороши для обработки общедоступной информации, однако для внутренней информации лучше использовать свои ресурсы, – считает Федор Прохоров. – В Citi существует частное облачное решение, позволяющее всем странам использовать общие ресурсы как сервис, не вкладывая значительные средства в построение своих центров обработки данных для Big Data».

Опыта по анализу больших данных на рынке еще очень мало. Пионерам Big Data часто приходится действовать методом проб и ошибок. Велика вероятность, что по ходу проекта цели, задачи и, соответственно, требования к производительности системы будут корректироваться. Поэтому на старте целесообразно для анализа больших данных создавать инфраструктуру, которая будет впоследствии легко масштабироваться.

В тренде мультиоблако — изучаем плюсы и минусы
Облака

Алексей Благирев убежден, что приобретать чисто программные решения значительно выгоднее, нежели аппаратно-программные комплексы: «Купив HP Vertica, мы избавились от связи зависимости стоимости платформы от стоимости «железа». Законы масштабируемости «железа» живут по отдельным правилам и не зависят от политики HP. К тому же мы можем выбрать любую конфигурацию «железа» для нашей платформы. Таким образом, у нас в долгосрочном горизонте времени будет снижаться TCO».

Александра Кирьянова