Разделы

Бизнес Интеграция Импортонезависимость Техника

IBM ушла, архив остался: как организовать длительное хранение данных

В наше неспокойное время проблема сохранности данных становится особенно актуальной. Ленточные библиотеки остаются наиболее экономичным и безопасным вариантом, который требует очень мало энергии и позволяет хранить данные в течение длительного времени, а также является важным компонентом в борьбе с киберугрозами. Эти устройства стали ключевой частью облачных и гипермасштабируемых инфраструктур, они соответствуют требованиям хранения цифрового контента и архивирования данных. В результате крупнейшие центры обработки данных широко используют ленточные библиотеки.

Эта технология является ключевой для хранения неактивных данных. Лента зарекомендовала себя как лидер по минимальным затратам на резервное копирование и архивирование, и вряд ли это положение изменится в ближайшее время. Благодаря значительному увеличению емкости с каждым новым поколением носителей стоимость ленточного хранилища в расчете на гигабайт продолжает снижаться, а это означает, что даже те компании, где рост данных опережает бюджеты, могут использовать преимущества магнитной ленты для резервного копирования и архивирования. Поэтому всегда стоит рассматривать возможность внедрения ленточной технологии в рамках общей стратегии хранения данных для резервного копирования и архивирования.

В последнем девятом поколении LTO емкость на картридж выросла на 50% относительно своего предшественника LTO-8 и достигла 18 ТБ. Как ожидается, в LTO-10 она вырастет до 36, в LTO-11 — до 72, а в LTO-12— до 144 ТБ. При использовании методов сжатия 2к1, объем записываемых данных увеличивается в два раза. Несмотря на увеличение объемов данных, совершенствование ленточных технологий позволяет конечным пользователям поспевать за этим ростом.

Сервис архивирования ArcTape

Осенью 2017 г. компании RCloud by 3data, Fujifilm и «Мастертел» запустили «иерархический» облачный сервис ArcTape для длительного резервного и архивного хранения данных. Он основывается на использовании масштабируемой роботизированной ленточной библиотеки IBM TS3500 Tape Library с картриджами Fujifilm и программного обеспечения IBM Spectrum Storage Suite. Ленточная библиотека расположена в дата-центре облачной платформы RCloud by 3data. Оператор «Мастертел» предоставляет защищенные каналы и волоконно-оптические линии для доступа к сервису. Что собой представляет этот сервис сегодня, и как он будет работать без IBM?

Осенью 2017 г. компании RCloud by 3data, Fujifilm и «Мастертел» запустили «иерархический» облачный сервис ArcTape для длительного резервного и архивного хранения данных

Как отмечают разработчики, услуга ArcTape ориентирована, в первую очередь, на компании, которым необходимо хранить большие архивы данных и резервные копии в максимально безопасных условиях. Она может понадобиться организация здравоохранения для создания архивов медицинских снимков, архитектурным бюро, производителям мультимедиа-контента, госструктурам и многим другим заказчикам. Магнитная лента является не только лучшим решением для этих задач, но и самым дешевым вариантом, уверены создатели сервиса.

Благодаря простому пользовательскому интерфейсу, написанному разработчиками облачной платформы RCloud by 3data, и программному обеспечению IBM SpectrumScale & Spectrum Archive для реализации прозрачного доступа к данным, преимуществами сервиса хранения данных могут воспользоваться даже небольшие компании, у которых часто нет опыта работы с ленточными библиотеками. Ранее высоконадежное иерархическое хранение, как правило, развертывалось в крупных организациях.

Ленточная библиотека IBM TS3500 — это масштабируемое автономное устройство, обеспечивающее автоматизированную обработку и хранение ленточных картриджей

Ленточная библиотека TS3500 состоит из одного базового шкафа и содержит до 15 шкафов расширения — до 192 ленточных накопителей, до 224 слотов ввода/вывода и более 20 000 ленточных картриджей LTO. Уровень доступности данных и скорость обмена повышают два независимых канала ввода/вывода. Шифрование данных ленточных накопителей и использование картриджей типа WORM обеспечивают защиту архивов. Система поддерживает удаленное управление с помощью веб-браузера или интерфейса командной строки и удаленный мониторинг с использованием протокола Simple Network Management Protocol (SNMP).

Программное обеспечение IBM Spectrum Archive призвано облегчить простую эксплуатацию ленточных библиотек. Это ПО предоставляет пользователям возможность управлять данными на ленточных накопителях с помощью удобного графического интерфейса, а также повышает производительность работы при поиске метаданных.

Диски или лента?

Скорость доступа к данным и плотность записи у ленточных библиотек продолжают расти. По скорости записи новейшие ленточные картриджи LTO обогнали жесткие диски. Гарантированный срок хранения для картриджей Fujifilm — 30 лет. Долгосрочное хранение данных на ленте обходится намного дешевле дисков. Кроме того, ленточные картриджи не потребляют электроэнергию, занимают меньше места, а так называемый «воздушный зазор» защищает хранимые данные от хакерских атак.

«Корпоративные решения на ленте по стоимости владения на несколько порядков дешевле дисковых систем, построенных на гибридном принципе (HDD + SSD) или флэш-массивов. Самое существенное вложение — это ПО», — подчеркивают разработчики сервиса.

Осуществляется миграция данных на картриджи новых поколений. Как правило, устройства LTO новых поколений читают данные с носителей на два поколения младше, пишут и читают — на одно поколение младше (то есть система с LTO-7 читает LTO-5 и может читать и писать на картриджи LTO-6).

«При наличии софта и грамотной стратегии хранения данных существенных проблем при смене поколений быть не должно. С дисковыми накопителями может возникнуть больше проблем: с переходом на новый протокол дисковой подсистемы и придется покупать новый контроллер с дисковыми полками и новые носители», — считают в RCloud by 3data.

Максимальное время загрузки и перемотки картриджа не превышает минуты. Часто запрашиваемые (активные) данные ArcTape хранит на отдельном устройстве, которое играет роль кэша чтения/записи. Данные в нем хранятся на накопителях SSD, что обеспечивает оперативный доступ к ним.

Ленточные хранилища обычно используются для хранения архивов данных, видеоматериалов и резервных копий.

В общем случае скорость копирования данных в ArcTape зависит от нескольких факторов. В их числе — метод организации канала связи между системой хранения и площадкой заказчика, очередь на запись на СХД и структура файлов. Если ориентироваться на средний показатель при организации оптического канала между ЦОД с системой ArcTape и площадкой заказчика, то скорость копирования данных на флэш-массив составит около 2 ГБ\с.

В результате заказчики ArcTape получают высокую производительность, масштабируемость и безопасность хранения данных при значительно более низких затратах по сравнению с использованием дисковых накопителей. При этом им не нужно самим осваивать новую технологию, тратить деньги на новое оборудование, размещать его в ЦОД и нанимать квалифицированный ИТ-персонал. Гораздо выгоднее использовать готовую коммерческую услугу. Сервис ArcTape можно задействовать для хранения больших объемов данных, не требующих оперативного доступа для скачивания.

Не только архивы

Сервис ArcTape предназначен не только для архивирования, но и для хранения резервных копий данных. Бэкапы на ленте — это «последний оплот» всех имеющихся резервных копий. Он используется только в том случае, если невозможно восстановить данные из локальных резервных копий. Тем не менее, у решения ArcTape есть все необходимое, чтобы конкурировать с системами локального хранения резервных копий: высокая надежность и скорость доступа.

Каждый узел системы ArcTape зарезервирован, и в случае выхода из строя одного узла будет автоматически задействован резервный. Время ввода в строй резервного узла — около 15 минут.

В целом показатель надежности систем хранения данных определяется совокупностью трех характеристик:

  • Доступность — промежуток времени, в течение которого данные доступны для работы с ними. Доступность сервиса ArcTape за 2021 год составила 99,2%
  • RPO — объем потерянных при аварии данных (в часах). Синхронизация СХД с лентой происходит раз в сутки.
  • RTO — время восстановления сервиса (доступа к данным) после аварии. Благодаря резервным узлам системы (СХД, сервер управления ленточным хранилищем, коммутаторы и резервные стримеры для записи) время восстановления системы до полного функционирования — около 15 минут.

Таким образом, для записи и чтения данных используется схема «СХД-лента». При записи на магнитную ленту все данные сначала загружаются на флэш-массив с высокой скоростью чтения\записи по оптическим каналам, а потом, в порядке очереди, записываются на магнитную ленту. Скорость чтения\записи у ленточного картриджа составляет около 300 МБ\с, что равноценно скорости HDD-накопителей.

«Узкое место» в скорости восстановления с ленты — наличие свободных стримеров для чтения данных с ленточного картриджа. В последнем обновлении системы доступно уже семь таких стримеров. Поэтому, если локальные резервные копии по какой-то причине испорчены или скомпрометированы, то восстановление с ленты может оказаться не только актуальнее, но и пройдет быстрее.

Многоуровневое хранение позволяет предоставить клиентам максимальную скорость записи и высокую сохранность данных, а также избежать задержек и очередей при записи. Благодаря быстрой флэш-системе, на которую первоначально записываются данные, заказчик пользуется системой как собственной сетевой СХД. Общая емкость системы сейчас составляет примерно 24 ПБ. Сервисом пользуются порядка 20 заказчиков.

Без IBM

К сожалению, уход IBM c российского рынка внес определенные коррективы в планы развития данного сервиса. Отсутствие обновлений может негативно сказаться на безопасности и стабильности работы всего комплекса. Чтобы избежать потенциальных проблем, предварительно было обновлено все программное обеспечение до последних версий продуктов, закуплены необходимые комплектующие в ЗИП, в том числе оборудование для расширения комплекса.

«Такими превентивными мерами мы выиграли примерно год. Надеемся, что по истечению данного срока ситуация изменится, и мы сможем продолжить успешное развитие нашего продукта на рынке, — отмечают разработчики сервиса. — У нас есть специалисты, которые способны осуществлять обслуживание и обновление данных систем в оперативном режиме. На данный момент мы не планируем менять свою базовую платформу».

За последние годы разработчики провели большую работу по модернизации аппаратной и программной части комплекса, включая обновление сетевой части и систем хранения данных, повышение стабильности и отказоустойчивости. «Из пилотного проекта сервис развился до полноценной и качественной услуги. В данный момент ведутся работы по интеграции системы в облачную инфраструктуру проекта RCloud для предоставления всем заказчикам облачных решений простой, надежной и качественной услуги архивного хранения данных», — отмечают в компании RCloud by 3data. Формат сервиса станет еще более удобным для клиентов.

Сергей Орлов