Как «Подружка» решила проблему потолстевших данных

От производительности системы хранения данных зачастую зависят показатели бизнеса: если СХД не справляется с возрастающими объемами информации, ИТ-системы окажутся недоступными, и работа может остановиться. Торговая сеть «Подружка», включающая более 160 магазинов косметики и парфюмерии, столкнулась с такой угрозой и устранила ее, внедрив СХД на флеш-дисках HPE 3PAR StoreServ 8450. О проекте рассказывают CIO компании Александр Голубев, руководитель проекта Александр Козулин и директор по развитию бизнеса компании «Ай-Теко» Максим Митрохин.

22.05.2017

CNews: Какими были предпосылки проекта?
Александр Голубев:
Александр Голубев
Главным тормозом производительности была дисковая подсистема, поэтому мы собрали массив SSD, проверили его в работе с данными и поняли, что на этой технологии можно получить хороший выигрыш в скорости

Каждый ИТ-менеджер время от времени сталкивается с ситуацией, когда заканчивается свободное место в системах хранения данных, и нужно либо покупать дополнительные диски, либо менять всю систему, если какие-то ее характеристики не отвечают потребностям компании.

Это как раз наш случай: при сохранении существующих темпов развития сети очень скоро объем хранилища и его производительность перестали бы нас устраивать. Как и везде в ритейле, у нас перманентно увеличивается число используемых ИТ-систем. Кроме того, сама торговая сеть «Подружка» экстенсивно растет примерно на 15–20% в год. Оба фактора непосредственно влияют на рост объемов данных.

Специфика нашей работы такова, что часть процессов мы можем запускать только в ночное время, когда магазины и офис закрыты: это различные расчеты данных, экспорт и импорт данных из одной системы в другую. Поскольку процессов становилось все больше, было все труднее успеть завершить все процессы до начала нового рабочего дня. Расширять хранилище данных посредством новых дисков не имело смысла и резона – нам ощутимо нужна была новая, более производительная система.

Максим Митрохин:

Очевидно, такая ситуация характерна не только для ритейла: объемы данных стремительно растут во всех отраслях экономики. Их нужно где-то хранить, надежно защищать, качественно управлять ими, и система хранения должна обеспечивать возможность эффективной работы с данными.

CNews: Какая СХД была у вас установлена?
Александр Голубев:

У нас была классическая трехуровневая система: с флеш-массивом с быстрыми и обычными дисками. Достаточно долго мы шли к тому, чтобы перейти на технологии all-flash. В определенный момент мы убедились, что почти не находится применения медленным дискам в СХД: их можно было использовать, скажем, для тестирования или каких-то других задач с низким приоритетом, но для многих высокоуровневых задач и критически важных для бизнеса процессов уже требовался флеш. Впервые такую систему, созданную собственными силами из еще одной старой СХД, мы испытали в 2014 году: установили в нее промышленные серверные диски Intel и сделали замер производительности в сравнении с предыдущей конфигурацией.

Главным тормозом производительности была дисковая подсистема, поэтому мы собрали массив SSD, проверили его в работе с данными и поняли, что на этой технологии можно получить хороший выигрыш в скорости при решении наших задач.

Александр Козулин:

В конце 2014-го мы брали на тестирование системы HPE 3PAR в разных конфигурациях, от обычных дисков до SSD, а также флеш-массивы NetApp и Oracle. Все они проявили себя по-разному. Например, Oracle показывает прекрасные результаты в предназначенных для него задачах, но у нас в основном используются и многие другие процессы и, значит, требуются другие решения. В итоге мы остановились на HPE 3PAR StoreServ 8450.

CNews: А как вы используете данные, которые храните в СХД? Какие виды бизнес-аналитики у вас есть?
Александр Голубев:
Максим Митрохин
Своя инфраструктура характеризуется предсказуемостью: вы знаете, на что она способна, что от нее ожидать, как поддерживать и развивать

В компании используется единая система отчетности Oracle Business Intelligence. В нее заливаются все данные коммерческого характера, которые затем используются для внутренних целей. С помощью этой системы мы делаем как традиционные отчеты о состоянии различных аспектов бизнеса, так и «экзотические», например, рассылки руководителям бизнес-подразделений информации о том, в какое время их сотрудники приходят на работу и уходят домой – эти данные мы получаем из системы контроля доступа. Но основная задача BI – работа с информацией о бизнесе и о клиентах. Никакой другой инструмент не поддерживает нужные нам виды работ с данными о нескольких миллионах покупателей. Самые «тяжелые» отчеты формировались долго, причиной чему была недостаточная производительность СХД.

CNews: Вы рассматривали возможность перенести часть своей инфраструктуры в облака и получать ее как сервис?
Александр Голубев:

Такие предложения к нам поступали, но проблема заключается в том, что подобная конфигурация ИТ-инфраструктуры зависит от качества и доступности каналов передачи данных, а это – высокий уровень риска. Чтобы обеспечить непрерывную работу офиса с большим объемом данных в центральном офисе компании, нужно иметь два-три, и притом достаточно «широких», канала передачи данных, что неминуемо создаст дополнительную нагрузку на бюджет. Ведь офис компании располагается в бизнес-центре, а все знают, что в таких местах связь дешевой не бывает, особенно если речь идет о прокладке дополнительного выделенного канала.

Максим Митрохин:

Наш опыт интегратора показывает, что приобретение в собственность или в лизинг системы такого класса в пятилетней перспективе оказывается выгоднее аренды ресурсов у провайдера. Кроме того, вы не можете точно знать, на каком оборудовании будут размещены ваши ресурсы. Как правило, в коммерческом ЦОДе не ставят топовое оборудование широко известных производителей. Сервисы виртуализации развернуты на различных версиях Linux и т.п. А своя инфраструктура характеризуется предсказуемостью: вы знаете, на что она способна, что от нее ожидать, как поддерживать и развивать.

На мой взгляд, именно эластичность – одно из главных преимуществ IaaS в ситуации, когда заказчики не могут четко спрогнозировать, сколько именно мощностей им необходимо в тот или иной момент. ИТ-инфраструктура сети «Подружка» организована таким образом, что она не нуждается в высокой гибкости, и у них не возникают ситуации, когда сегодня нужно немного ресурсов, а завтра начинается пиковый период, и срочно требуется добавить вычислительных мощностей, чтобы через неделю от них отказаться.

Александр Голубев:

Отсутствие пиков потребления ресурсов объясняется тем, что магазины «Подружка» не работают напрямую с центральной системой, расположенной в нашем дата-центре. В каждом магазине стоит небольшой сервер, и обмен данными между ними происходит в стандартном режиме в течение всего дня равномерно.

Но мы не отказываемся от самой идеи прибегнуть к услугам коммерческих ЦОДов: в «облако» провайдера есть смысл вывести, например, систему CRM. И если СХД мы брали для использования в основном специалистами центрального офиса, то CRM рассчитана на контакт с сотрудниками магазинов и нашими клиентами. Я не вижу смысла загружать нашу внутреннюю инфраструктуру и расширять каналы данных в центральном офисе, а также увеличивать риски, связанные с информационной безопасностью, чтобы обеспечить к ним всеобщий доступ.

Александр Голубев:

«У нас была классическая трехуровневая система: с флеш-массивом с быстрыми и обычными дисками. В определенный момент мы убедились, что почти не находится применения медленным дискам в СХД: их можно было использовать, скажем, для тестирования или каких-то других задач с низким приоритетом, но для многих высокоуровневых задач и критически важных для бизнеса процессов уже требовался флеш».

Александр Козулин:

«Внедрять all-flash системы легче, чем традиционные дисковые массивы, потому что можно обойтись значительно меньшим числом лицензий. Если раньше было много опций, связанных в первую очередь с применяемыми технологиями в классической трехзвенной системе, то сейчас все нужные лицензии уже включены в базовую поставку».

Максим Митрохин:

«Наш опыт интегратора показывает, что приобретение в собственность или в лизинг системы такого класса в пятилетней перспективе оказывается выгоднее аренды ресурсов у провайдера».

CNews: Как вы выбирали поставщика решения?
Александр Козулин:

Все было очень просто: нас интересовали условия поставки и стоимость, потому что само решение нами было выбрано после тестирования. Любая ИТ-компания, способная соблюсти наши условия поставки и предлагающая минимальную цену, могла стать победителем тендера.

В начале этого этапа компания «Ай-Теко» оказала нам неоценимую помощь, предоставив на тестирование оборудование нескольких вендоров. Если бы на рынке ИКТ не было интеграторов, их стоило бы придумать, иначе нам пришлось бы самим искать производителей и договариваться с ними «через океан». Вряд ли мировые ИТ-гиганты знают, какие компании работают в России, кроме двух-трех самых крупных и известных брендов, поэтому, скорее всего, откажут в тестовом «пробнике» оборудования стоимостью в миллион рублей. Другое дело, когда у ведущего производителя в России есть доверенное лицо – сертифицированный партнер, который берет на себя решение всех вопросов, включая ведение переговоров.

CNews: Расскажите, пожалуйста, о ходе проекта
Александр Голубев:

К началу проекта мы уже четко понимали, что нам нужен flash, и знали, какие системы мы на него перенесем: на флеш должны были мигрировать продакшн-системы, а второстепенные, не нуждающиеся в высокой скорости обработки, – остаться в старой СХД, которую мы тоже сохранили.

Александр Козулин:

Сам проект прошел гладко. Внедрять all-flash системы легче, чем традиционные дисковые массивы, потому что можно обойтись значительно меньшим числом лицензий. Если раньше было много опций, связанных в первую очередь с применяемыми технологиями в классической трехзвенной системе, то сейчас все нужные лицензии уже включены в базовую поставку.

Выбор покупателя по сути ограничивается опциональной лицензией на кластеризацию и моделями дисков. По этому вопросу мы консультировались со специалистами Hewlett Packard Enterprise, которые помогли нам принять верное решение. Можно было взять относительно небольшие, но более надежные, диски или большие, но с меньшей заявленной надежностью. Если раньше на диски давалась безусловная пятилетняя гарантия, то сейчас – безусловная семилетняя, что с лихвой покрывает весь жизненный цикл оборудования. Исходя из этого, а также из расчета цены за терабайт данных, мы сделали выбор в пользу больших дисков объемом 3,84 ТБ. К тому же, через семь лет мир ИКТ в очередной раз изменится: появятся новые задачи, новое оборудование, – это очень большой срок для технологий.

Александр Голубев:
Александр Козулин
С имеющейся производительностью мы гарантированно можем решить любую задачу практически без задержек

Дальше все тоже было просто и без сюрпризов: мы несколько недель подождали, пока привезут оборудование, сертифицированные специалисты «Ай-Теко» установили в нашем дата-центре систему, после чего передали ее нам. К этому времени мы определили оптимальные конфигурации информационных ресурсов и начали перенос сервисов на новую СХД. От поставки оборудования до запуска в промышленную эксплуатацию прошло всего два месяца.

Максим Митрохин:

Реализация этого проекта – во многом заслуга собственной ИТ-службы заказчика, специалисты которой самостоятельно определились с нужной технологией и необходимостью ее внедрения. Наша задача заключалась в помощи выбора конкретного решения. Мы помогли протестировать различные СХД на практике, чтобы коллеги могли понять, какие из тех или иных технологий будут в наибольшей степени удовлетворять их требованиям.

Сегодня клиенты достаточно часто сами выбирают решения, что логично и объяснимо: системы год от года усложняются, что влечет за собой и обусловливает повышение общего уровня компетенции ИТ-служб. При этом не стоит недооценивать роль интегратора как проектного консультанта-партнера. Каждый производитель патриотично и корпоративно считает свое оборудование лучшим, но только партнер, за спиной которого многолетний опыт внедрений различных решений, действительно знает все сильные и слабые стороны разных систем при решении разных задач, какие функциональные возможности играют ключевую роль, и чему следует отдать предпочтение в каждом конкретном случае.

CNews: Какое влияние оказал этот проект на бизнес компании?
Александр Голубев:

Для меня главный результат заключается в том, что время выполнения регламентных «ночных» задач сократилось с девяти до пяти-шести часов. Передача сотен гигабайтов данных из системы в систему непременно должна завершаться до наступления нового рабочего дня. Однако иногда «общение» серверов могло закончиться и после 9 утра, из-за чего простаивали сотрудники, приходящие на работу к 8-ми. Они не могли даже войти в систему, потому что она была заблокирована из-за передачи данных или расчета. Теперь эти процессы заканчиваются до 7 часов утра, что дает мне как минимум пару лет спокойного сна и спокойной работы без апгрейда СХД.

Наиболее интересные результаты после внедрения новой СХД показала наша BI-система. Первыми это заметили пользователи, формирующие большие отчеты: скорость их создания выросла в 2–3 раза, в зависимости от размеров обрабатываемых массивов данных. Но данных становится все больше, и через некоторое время мы перестали бы вписываться в отведенное «окно», если бы не заменили СХД на более производительную.

Примечательно, что all-flash СХД в 2016 году в пересчете на 1 Тб данных обошлась нам примерно в ту же сумму в долларах, что и менее мощная трехзвенная система в 2013-м. Вот насколько доступными стали флеш-решения всего за три года! Это был гигантский прорыв, потому что в 2013-м разница в ценах была просто космической.

Александр Козулин:

Раньше мы при расчете рабочих проектов вычисляли, какая производительность в IOPS нам понадобится для их реализации. Сейчас необходимость в этом отпала: с имеющейся производительностью мы гарантированно можем решить любую задачу практически без задержек.

Павел Притула