Статья

Сколько стоит Big Data?

Big Data
мобильная версия

Технологии Big Data находят все большее применение в мире. Западные исследования показывают, что в 2014 г. внедрение анализа больших данных примет массовый характер. В России пока известны лишь единичные примеры успешных внедрений этих технологий. Отечественные компании присматриваются и прицениваются.

Мировой спрос на технологии Big Data неуклонно растет. По данным IDC, объем рынка технологий и услуг Big Data в 2013–2017 гг. будет ежегодно увеличиваться в среднем на 27% и в 2017 г. достигнет $32,4 млрд. Согласно исследованию Gartner, в 2013 г. 64% организаций во всем мире инвестировали или планировали инвестировать в развертывание технологий Big Data в своих бизнес-процессах, 30% уже анализируют большие данные.

Тенденция подтверждается многими экспертами, в частности, согласно исследованию медиакомпании IDG Enterprise, 70% крупных компаний уже используют или планируют внедрить технологии Big Data в 2014 г. В секторе малого и среднего бизнеса эта цифра составляет 56%. Исследование также уточняет, сколько отдельные компании тратят на работу с большими данными.

Бюджет Big Data

По данным IDG, средний бюджет компании на технологии Big Data составляет $8 млн. Эта цифра кажется космической в условиях российской действительности и сопоставима с годовыми ИТ-бюджетами ряда крупных российских компаний. Причина несоответствия, вероятно, кроется в том, что при расчете среднего значения учитывались данные очень крупных мировых корпораций.

Более применима к российской действительности открытая экспертами IDG зависимость объема инвестиций в большие данные от размера совокупных расходов компании. По приведенной таблице можно судить о примерных расходах отечественных компаний на технологии Big Data.

Сколько планирует потратить ваша компания на проекты,
связанные с Big Data, в ближайшие 12 месяцев?

Расходы компании <1000 сотрудников 1000+ сотрудников В среднем по рынку
$ 100 млн и более 0% 5% 2%
$ 50 млн – $ 99,9 млн 1% 3% 2%
$ 10 млн – $ 49,9 млн 2% 9% 5%
$ 5 млн – $ 9,9 млн 3% 12% 7%
$ 1 млн – $ 4,9 млн 10% 17% 13%
$ 100 000 – $ 999 999 31% 24% 28%
Менее $ 100 000 31% 7% 19%
Затрудняюсь ответить 22% 23% 24%

Источник: IDG Enterprise, 2014

Поставщики не раскрывают информацию о стоимости решений для работы с большими данными, объясняя это отсутствием стандартных цен, уникальностью проектов и задач каждой компании. Достоянием общественности становятся очень редкие цифры о стоимости проектов. Так, недавно редакция CNews сообщила, что Пенсионный фонд России внедряет SAP HANA для анализа больших данных и что лицензия на решение обошлась ПФР в 3,6 млн руб.

Одно из недавних внедрений Big Data в России, о котором стало известно рынку, состоялось в банке «Открытие». Стоимость решения составила менее 5% бюджета на развитие ИТ банка. По оценкам CNews, бюджет подобного проекта по внедрению Big Data в банке для ограниченного числа задач, например скоринга, может составлять около $500–1000 тыс. Более комплексные проекты стоят дороже.

Как рассказал Антон Заяц, директор по развитию бизнеса SAS в России и СНГ, на стоимость таких проектов влияет отраслевая специфика заказчика, выбранная конфигурация и способ развертывания решения. Конечная цена также зависит от количества пользователей, способа резервирования, а также от того, какие серверы будут использоваться. Бюджет вырастет, если в рамках проекта понадобится, например, перевод хранилища данных на высокопроизводительную платформу, интеграция решения с другими системами или установка решения для высокопроизводительной визуализации данных.

В 2012 г. аналитики высказывали предположения, что рост спроса на технологии Big Data способен вызвать увеличение ИТ-бюджетов компаний. Однако на текущий момент инвестиции в основной массе не велики, и в России такая тенденция не наблюдается.

Статьи расходов

При реализации проектов Big Data основные расходы идут на оборудование и программное обеспечение, в числе которого платформа хранения и обработки собираемой информации (СУБД), средства интеграции данных ETL и CDC (средства извлечения данных из источников, их преобразования и загрузки, в т.ч. в режиме реального времени), средства проектирования моделей данных и инструментарий для анализа и визуализации данных.

В уже упомянутом внедрении в банке «Открытие», по оценкам его директора по развитию систем аналитики и отчетности Алексея Благирева, расходы по этим статьям распределились следующим образом: около 40% совокупной стоимости владения (Total Cost of Ownership, TCO) ушло на СУБД (HP Vertica); порядка 30% TCO составила стоимость выбранного банком средства захвата данных в реальном времени (Oracle GoldenGate); оставшуюся долю занимают решения анализа данных (около 18–20%) и моделирования (8–10%).

Операционные расходы в проектах по внедрению Big Data могут оказаться весьма существенными в связи с большим дефицитом квалифицированных кадров по аналитике данных на российском рынке и необходимостью обучать сотрудников новым технологиям. Специалисты, обладающие опытом работы в этом направлении, стоят дорого. Привлечение сотрудников из других сфер требует расходов на дополнительное обучение.

По оценкам руководителя управления программного обеспечения корпоративного бизнеса «Ситибанка» Федора Прохорова, затраты на персонал и необходимую экспертизу являются следующей по величине статьей после затрат на оборудование: «На рынке сложно найти готовых специалистов с большим опытом в области Big Data, поэтому в крупных проектах приходится прибегать к услугам консультантов». В операционные расходы также закладывается стоимость работ по настройке системы, которые в подавляющем большинстве случаев отдаются на аутсорсинг.

Как показало исследование IDG, в рамках проектов Big Data компании в первую очередь инвестируют в следующих направлениях: системы хранения (49%), серверы (47%), облачная инфраструктура (44%), исследования и аналитика (43%), приложения (42%).

В каких направлениях инвестирует ваша компания
для анализа больших данных?

Источник: IDG Enterprise, 2014

В ряде случаев отдельной статьей расходов становится приобретение данных у других компаний, социальных сетей. Так, например, американский банк PNC анализировал данные подписчиков медиахолдинга Hearst Media.

Когда вернутся инвестиции

Многие руководители ИТ сталкиваются с проблемой обоснования расходов на технологии больших данных перед руководством. Более четверти компаний, опрошенных IDG, сказали, что развитию проектов Big Data мешают сложности с определением окупаемости инвестиций, и почти половина респондентов в числе факторов, тормозящих внедрение этих технологий, назвала ограниченность бюджета.