Спецпроекты

Как построить систему резервного копирования от Калининграда до Владивостока

Интеграция Внедрения

Когда речь идет о резервном копировании в масштабах всей страны, стандартные подходы почти не применимы. Решения для крупного бизнеса со множеством филиалов должны работать с существующими каналами связи, «не мешать» бизнес-системам и при этом обеспечивать высокую защищенность данных. Проект на промышленном предприятии, описанный в этой статье, доказал, что даже для крупных ИТ-ландшафтов высокая надежность и легкое управление резервным копированием вполне реальны.

Корпоративные стандарты настаивают на постоянном резервном копировании и максимальной доступности данных и информационных систем. Но в территориально распределенных компаниях даже критически важные элементы инфраструктуры часто недостаточно защищены от потерь.

«В своей практике мы постоянно встречаемся с разрозненными ИТ-ландшафтами крупных предприятий. Например, некоторые из них образовались в итоге слияний и поглощений, а потому «стыковались» разные ИТ-инфраструктуры и процессы.

«В то же время нередко даже в рамках одной компании применяются разные подходы к организации резервного копирования, — объясняет Дмитрий Кострюков, руководитель отдела проектирования СХД/СРК компании «Инфосистемы Джет». — Это оборачивается сложным администрированием, высокой стоимостью содержания «зоопарка» систем резервного копирования (СРК) и, что хуже всего, недостаточным уровнем защиты данных от потери».

Экономика подобных СРК также далека от эталона, потому как поддержка обходится дорого.

Использование разномастных СРК делает практически невозможным соблюдение корпоративных регламентов. Сложно планировать бюджеты на развитие разрозненных систем и масштабирование. Поэтому нередко в филиалах резервное копирование «покрывает» не все необходимые системы, создавая риски для бизнеса.

С точки зрения контроля и унификации процесса любой компании хочется получить централизованную СРК для всей инфраструктуры, что называется «от Калининграда до Владивостока». Но добиться этого не просто: СРК зависит от каналов связи, которые могут быть перегружены или давать сбои.

Как построить идеальную СРК для территориально распределенной компании

Создание централизованной СРК в географически распределенных компаниях помогает добиться сохранности данных по единым правилам. Оптимальный подход предполагает внедрение СРК с единым интерфейсом управления, но c элементами автономного обеспечения в филиалах. В этом случае получается одним выстрелом поразить несколько целей: выполнять единые регламенты, исключить влияние каналов связи на резервное копирование и успешно развивать СРК, то есть масштабировать ее и планировать бюджет.

Такую систему команда «Инфосистемы Джет» внедрила в этом году на предприятии, в состав которого входит более 80 территориально распределенных подразделений, а штат насчитывает свыше 70 тыс. сотрудников.

В компании прошел ИТ-аудит, информационные системы были разделены на классы критичности. В итоге стало очевидно, что администраторы на местах не понимают для каких систем необходимо более эффективное резервное копирование, а главное — какими инструментами это нужно делать. А еще по новым требованиям безопасности требовалось внедрить ролевую модель доступа и двухфакторную аутентификацию. Все это стало мощным стимулом к созданию централизованной СРК.

В рамках проекта защищались шесть дата-центров в трех регионах, соединенных друг с другом по схеме «звезда». Каждый ЦОД соединен с центром, а также с резервным ЦОД в том же регионе. СРК было решено разворачивать на основе ПО Veritas NetBackup. Выбор был сделан по ряду критериев: поддержка всех используемых заказчиком платформ и приложений, собственные высокоэффективные решения по дедупликации, понятные средства управления жизненным циклом резервных копий, развитые средства защиты внутренней БД (каталога NetBackup) и возможность применить Linux под серверами СРК. Еще одним преимуществом СРК стала возможность построить ее на стандартном оборудовании без применения дорогостоящих специализированных устройств.

В каждом из шести ЦОД был создан автономный домен NetBackup. В рамках региона средствами NetBackup AIR обеспечили репликацию резервных копий систем высоких классов критичности. Данные между ЦОД стали передаваться в дедуплицированном формате, что снизило нагрузку на каналы передачи данных.

Портал NetBackup OpsCenter, установленный в центральном офисе, обеспечил единую точку контроля за всеми доменами СРК. В регионах администраторы в ЦОД теперь работают через управляющую консоль NetBackup, а руководители из головной организации ведут мониторинг через OpsCenter.

Что было сделано на уровне площадок

На уровне региона была создана экосистема резервного копирования, которая подразумевает копирование данных на дисковые устройства хранения с дедупликацией, а уже с дисков — миграцию на ленточные библиотеки. При этом продолжают поддерживаться устаревшие системы, например, старые версии AIX и Oracle. Для них просто применяются ранние версии клиентов NetBackup. Такое решение не оптимально, и заказчик понимает необходимость апгрейда своих ИТ-систем.

На каждой площадке установлен выделенный физический мастер-сервер и по два медиа-сервера. Чтобы обеспечить отказоустойчивость мастер-сервера предлагался вариант с развертыванием в виртуальной среде. Но заказчик предпочел ограничиться сервером холодного резерва, на который выполняется восстановление каталога NetBackup из резервной копии в случае его потери или повреждения.

Эталонный подход в действии: результаты проекта

Построение единой СРК заняло около года. Предприятие придерживается централизованного подхода к контролю и управлению. Этому не противоречат шесть созданных автономных доменов СРК, которые работают независимо от состояния каналов связи.

«Масштабирование и добавление новых ИС в СРК стали типовыми процедурами и больше не вызывают сложностей. Специалисты головного офиса могут в любой момент вмешаться в работу СРК, запустить или остановить какой-либо процесс. Однако большая часть работ ведется на местах, так как в ходе проекта были документированы бизнес-процессы РК, определены политики и устройства хранения, созданы инструкции по постановке на бэкап, а также разработаны DR-планы для самой СРК», — рассказывает о результатах проекта Дмитрий Кострюков.

На всех площадках реализована ролевая модель доступа на серверы СРК. Вход происходит через терминальный сервер с двухфакторной аутентификацией, а в качестве дополнительного уровня безопасности используются аппаратные USB-токены, необходимые для входа в аккаунты администраторов. В системе активировано логирование попыток доступа в СРК, и теперь все попытки входа автоматически отображаются в системе мониторинга в головном офисе.

Новая система резервного копирования гарантирует необходимую защиту данных и возможности восстановления после сбоя. Централизованное управление унифицирует процессы РК по всей компании, и риски потери данных сведены к минимуму. Поскольку предприятие перешло от фрагментарного резервного копирования к централизованной схеме, это снизило нагрузку на персонал.

Решение полностью документировано, а для создания резервных копий разработаны регламенты и правила. Теперь у компании есть возможность самостоятельно обслуживать и развивать свою СРК в соответствии с реальными объемами данных и потребностями бизнеса.