Спецпроекты

Сколько стоит Big Data?

Big Data
Технологии Big Data находят все большее применение в мире. Западные исследования показывают, что в 2014 г. внедрение анализа больших данных примет массовый характер. В России пока известны лишь единичные примеры успешных внедрений этих технологий. Отечественные компании присматриваются и прицениваются.

Мировой спрос на технологии Big Data неуклонно растет. По данным IDC, объем рынка технологий и услуг Big Data в 2013–2017 гг. будет ежегодно увеличиваться в среднем на 27% и в 2017 г. достигнет $32,4 млрд. Согласно исследованию Gartner, в 2013 г. 64% организаций во всем мире инвестировали или планировали инвестировать в развертывание технологий Big Data в своих бизнес-процессах, 30% уже анализируют большие данные.

Тенденция подтверждается многими экспертами, в частности, согласно исследованию медиакомпании IDG Enterprise, 70% крупных компаний уже используют или планируют внедрить технологии Big Data в 2014 г. В секторе малого и среднего бизнеса эта цифра составляет 56%. Исследование также уточняет, сколько отдельные компании тратят на работу с большими данными.

Бюджет Big Data

По данным IDG, средний бюджет компании на технологии Big Data составляет $8 млн. Эта цифра кажется космической в условиях российской действительности и сопоставима с годовыми ИТ-бюджетами ряда крупных российских компаний. Причина несоответствия, вероятно, кроется в том, что при расчете среднего значения учитывались данные очень крупных мировых корпораций.

Более применима к российской действительности открытая экспертами IDG зависимость объема инвестиций в большие данные от размера совокупных расходов компании. По приведенной таблице можно судить о примерных расходах отечественных компаний на технологии Big Data.

Сколько планирует потратить ваша компания на проекты,
связанные с Big Data, в ближайшие 12 месяцев?

Расходы компании <1000 сотрудников 1000+ сотрудников В среднем по рынку
$ 100 млн и более 0% 5% 2%
$ 50 млн – $ 99,9 млн 1% 3% 2%
$ 10 млн – $ 49,9 млн 2% 9% 5%
$ 5 млн – $ 9,9 млн 3% 12% 7%
$ 1 млн – $ 4,9 млн 10% 17% 13%
$ 100 000 – $ 999 999 31% 24% 28%
Менее $ 100 000 31% 7% 19%
Затрудняюсь ответить 22% 23% 24%

Источник: IDG Enterprise, 2014

Поставщики не раскрывают информацию о стоимости решений для работы с большими данными, объясняя это отсутствием стандартных цен, уникальностью проектов и задач каждой компании. Достоянием общественности становятся очень редкие цифры о стоимости проектов. Так, недавно редакция CNews сообщила, что Пенсионный фонд России внедряет SAP HANA для анализа больших данных и что лицензия на решение обошлась ПФР в 3,6 млн руб.

Одно из недавних внедрений Big Data в России, о котором стало известно рынку, состоялось в банке «Открытие». Стоимость решения составила менее 5% бюджета на развитие ИТ банка. По оценкам CNews, бюджет подобного проекта по внедрению Big Data в банке для ограниченного числа задач, например скоринга, может составлять около $500–1000 тыс. Более комплексные проекты стоят дороже.

Как рассказал Антон Заяц, директор по развитию бизнеса SAS в России и СНГ, на стоимость таких проектов влияет отраслевая специфика заказчика, выбранная конфигурация и способ развертывания решения. Конечная цена также зависит от количества пользователей, способа резервирования, а также от того, какие серверы будут использоваться. Бюджет вырастет, если в рамках проекта понадобится, например, перевод хранилища данных на высокопроизводительную платформу, интеграция решения с другими системами или установка решения для высокопроизводительной визуализации данных.

В 2012 г. аналитики высказывали предположения, что рост спроса на технологии Big Data способен вызвать увеличение ИТ-бюджетов компаний. Однако на текущий момент инвестиции в основной массе не велики, и в России такая тенденция не наблюдается.

Статьи расходов

При реализации проектов Big Data основные расходы идут на оборудование и программное обеспечение, в числе которого платформа хранения и обработки собираемой информации (СУБД), средства интеграции данных ETL и CDC (средства извлечения данных из источников, их преобразования и загрузки, в т.ч. в режиме реального времени), средства проектирования моделей данных и инструментарий для анализа и визуализации данных.

В уже упомянутом внедрении в банке «Открытие», по оценкам его директора по развитию систем аналитики и отчетности Алексея Благирева, расходы по этим статьям распределились следующим образом: около 40% совокупной стоимости владения (Total Cost of Ownership, TCO) ушло на СУБД (HP Vertica); порядка 30% TCO составила стоимость выбранного банком средства захвата данных в реальном времени (Oracle GoldenGate); оставшуюся долю занимают решения анализа данных (около 18–20%) и моделирования (8–10%).

Операционные расходы в проектах по внедрению Big Data могут оказаться весьма существенными в связи с большим дефицитом квалифицированных кадров по аналитике данных на российском рынке и необходимостью обучать сотрудников новым технологиям. Специалисты, обладающие опытом работы в этом направлении, стоят дорого. Привлечение сотрудников из других сфер требует расходов на дополнительное обучение.

По оценкам руководителя управления программного обеспечения корпоративного бизнеса «Ситибанка» Федора Прохорова, затраты на персонал и необходимую экспертизу являются следующей по величине статьей после затрат на оборудование: «На рынке сложно найти готовых специалистов с большим опытом в области Big Data, поэтому в крупных проектах приходится прибегать к услугам консультантов». В операционные расходы также закладывается стоимость работ по настройке системы, которые в подавляющем большинстве случаев отдаются на аутсорсинг.

Как показало исследование IDG, в рамках проектов Big Data компании в первую очередь инвестируют в следующих направлениях: системы хранения (49%), серверы (47%), облачная инфраструктура (44%), исследования и аналитика (43%), приложения (42%).

В каких направлениях инвестирует ваша компания
для анализа больших данных?

Источник: IDG Enterprise, 2014

В ряде случаев отдельной статьей расходов становится приобретение данных у других компаний, социальных сетей. Так, например, американский банк PNC анализировал данные подписчиков медиахолдинга Hearst Media.

Когда вернутся инвестиции

Многие руководители ИТ сталкиваются с проблемой обоснования расходов на технологии больших данных перед руководством. Более четверти компаний, опрошенных IDG, сказали, что развитию проектов Big Data мешают сложности с определением окупаемости инвестиций, и почти половина респондентов в числе факторов, тормозящих внедрение этих технологий, назвала ограниченность бюджета.


Профиль месяца

Мы помогаем выращивать российское ПО

Андрей Филатов

глава SAP CIS

Взгляд месяца

На хайпе часто можно построить только фейк

Сергей Мацоцкий

основатель и член совета директоров IBS