Статья

Новый уровень СХД: ориентация на программное хранение

Инфраструктура
мобильная версия

Новой вехой в развитии систем хранения данных (СХД) является создание программно определяемых хранилищ. Речь идет о программной виртуализации хранения информации, причем выносятся не встроенные функции или аппаратные шлюзы, а собственно вычислительные узлы. Как это происходит, можно увидеть на примере HPE StoreVirtual VSA. Новой вехой в развитии систем хранения данных (СХД) является создание программно определяемых хранилищ. Речь идет о программной виртуализации хранения информации, причем выносятся не встроенные функции или аппаратные шлюзы, а собственно вычислительные узлы. Как это происходит, можно увидеть на примере HPE StoreVirtual VSA.

Разбираясь в современных тенденциях в индустрии хранения и обработки данных, нельзя не обратить внимание на технологию SDS — программно определяемые хранилища, например, HPE StoreVirtual VSA.

HPE StoreVirtual VSA является программным продуктом, устанавливаемым на вычислительные узлы виртуального кластера. На текущий момент им поддерживаются такие платформы виртуализации, как VMware vSphere, Microsoft Hyper-V и KVM. К первым двум разработаны плагины интеграции с консолями управления, что создает единую точку входа для руководства всей инфраструктурой.

Для типового развертывания HPE StoreVirtual VSA необходимо 3 узла: два — для отказоустойчивости, и третий — для размещения Quorum Witness, который будет отвечать за согласованность данных на всех узлах в случае разрыва связи. Возможен сценарий с использованием только двух узлов, однако в этом случае необходима независимая NFSv3 общая директория для размещения Quorum Witness.

С точки зрения администратора виртуального кластера, StoreVirtual VSA представляет собой виртуальные машины под управлением Enterprise Linux — по одной на каждый узел кластера. Установка может быть произведена как через специальную форму, так и путем развертывания OVF-образа. В обоих случаях необходимо будет сконфигурировать диск создаваемой виртуальной машины. Его размер будет зависеть от размера блока, указанного при форматировании хранилища данных.

Cравнение традиционной и программно ориентированной вычислительных сред хранения данных

Источник: HPE, 2016

Как и любое ПО, StoreVirtual VSA требуются вычислительные ресурсы процессора и оперативной памяти. Для разработки нового решения (или для проверки совместимости с имеющимся кластером) специалисты HPE выработали ряд рекомендаций.

Соотношение емкости Store Virtual VSA и необходимой памяти


Объем StoreVirtual VSA (общий для всех накопителей) Необходимая память (ГБ), Адаптивная оптимизация или высвобождение пространства не используются Необходимая память (ГБ), Адаптивная оптимизация и/или высвобождение пространства используются
<= 1 TB 4 4
1 - <= 4 TB 5 5
4 - <= 10 TB 7 8
10 - <= 20 TB 9 12
20 - <= 30 TB 12 17
30 - <= 40 TB 15 21
40 - <= 50 TB 18 26

Источник: HPE, 2016


Лицензируется данный продукт по объему, который и презентуется гипервизору в качестве хранилища данных. Важно понимать: это будет «сырой» объем с точки зрения конечного пользователя. В первую очередь, локальные диски серверов будут объединены в RAID-группы на уровне RAID-контроллера узла. Получившийся полезный объем и будет лицензироваться. После запуска каждой отдельной VSA они объединяются в кластер и суммируют дисковое пространство в один общий пул, доступный затем пользователям (серверам) по блочному протоколу (iSCSI).

Что может HPE StoreVirtual VSA

Сегодня недостаточно просто предоставить некую емкость для хранения данных. СХД должна обладать возможностями по защите информации от сбоев, по оптимизации хранения, управления и обработки, и StoreVirtual VSA имеет все основные функции, типичные для аппаратных систем хранения. В их число входят такие технологии, как «thin provisioning» — «тонкие» тома, позволяющие системе выделять пространство по мере фактического наполнения данными; Peer Motion — миграция томов без прерывания доступа к ним; Multi-site SAN — распределенный по двум или трем площадкам единый том — и пр. Также приложение обладает возможностями синхронной и асинхронной репликации; умеет создавать консистентные слепки виртуальных машин (снапшоты) на уровне приложений; строит отказоусточивые схемы на уровне узлов кластера (технология Network RAID), причем кластеры могут быть разнесены географически (Split Site). Адаптивную оптимизацию я уже упоминал.

Управление всеми функциями доступно как через CMC (Centralized Management Console, центральная консоль управления), так и через плагин для консолей управления VMWare/Hyper-V.

Безопасность и репликация

На мой взгляд, наиболее интересной опцией будет являться Network RAID. Это технология, защищающая данные от потери в случае выхода из строя целого узла кластера. По сути, это синхронная репликация между узлами, а уровень RAID регулирует количество копий блоков данных, хранящихся в кластере. 

Характеристики работы Network RAID в HPE StoreVirtual VSA

Источник: HPE, 2016

К примеру, в случае с уровнем Network RAID level 10, рекомендованным производителем в качестве оптимального, в кластере всегда будут храниться 2 копии каждого блока данных. Такая схема резервирования дает гарантированную защиту от потери данных в случае выхода из строя 1-го узла кластера (а при особой удаче — до половины узлов), однако дополнительные ресурсы (overhead) будут составлять 1/2. Это означает, что при покупке лицензии на StoreVirtual VSA 2 ТБ мы получим виртуальное хранилище на 1 Тб полезной емкости.

Следующий уровень защиты — Network RAID level 10+1. В кластере хранится 3 копии каждого блока данных. Допустимый уровень «потерь» — 2 узла. Дополнительный ресурс будет составлять 1/3. Именно алгоритм резервирования Network RAID 10+1 лежит в основе технологии SplitSite, позволяя создавать кластер на трех географически удаленных площадках. Самое примечательное в этой технологии то, что в отличие от классической репликации аппаратных СХД тут отсутствуют такие понятия, как основная и второстепенная площадки. Приложению не важно, на какой из площадок в данный момент располагается обрабатываемый блок. В случае выхода из строя узла и обращения к дублирующему блоку на другой площадке программа не замечает разницы и, как следствие, отсутствует время простоя. С другой стороны, это накладывает жесткие требования на качество канала, соединяющий площадки между собой. Задержка в передаче данных не должна превышать 5 мс.

Уровень Network RAID level 10+2 создает копии блоков на всех узлах кластера, что позволяет потерять n-1 узлов, но при этом запасной ресурс будет равняться 1/n (где n — количество узлов в кластере). При этом минимально поддерживаемая конфигурация — от 3-х узлов, что, на мой взгляд, является чрезмерным и неприменимо в реальных архитектурах.

По аналогии с аппаратными рейдами имеются уровни резервирования с контрольными суммами: Network RAID level 5 и 6. В этих архитектурах появляются блоки с контрольными суммами, которые равномерно распределены по всем узлам кластера. Такая схема резервирования является наиболее экономичной с точки зрения overhead (n-1 для level 5 и n-2 для level 6), а уровень отказоустойчивости равен level 10 и level 10+1 соответственно. Однако необходимость считать контрольные суммы вызывают ощутимое снижение вычислительной производительности всего кластера, вследствие чего эти уровни резервирования не рекомендуются для применения при работе с высоконагруженными приложениями (самый явный пример — базы данных). 

Позиционирование

Продукт StoreVirtual VSA входит в семейство решений гиперконвергентных систем. И, как и любая другая софтверная составляющая подобных решений, он является бюджетным аналогом своего аппаратного оригинала — выделенной СХД. Основная задача данного ПО — создание отказоустойчивого защищенного хранилища для виртуализированного кластера без покупки дополнительного оборудования. При этом не стоит недооценивать функционал Network RAID, позволяющий реализовывать синхронную репликацию между узлами кластера, в том числе и географически разнесенными.

Как можно увидеть из описанного выше функционала, решение можно назвать функционально самостоятельным, дающим своим пользователям возможности аппаратного хранилища начального уровня за достаточно скромные деньги.

Алексей Козьмин,
инженер компании Treolan