Статья

Секрет вечной жизни. Как обеспечить бесперебойную работу ИТ-инфраструктуры

мобильная версия

Современный мир все больше полагается на автоматизированные системы в самых разных областях человеческой деятельности. Растет число приложений, к непрерывной работе которых выдвигаются повышенные требования. Специалисты НПП «Родник» представляют коробочное решение Stratus everRun Enterprise, которое поможет быстро и просто обеспечить бесперебойную работу программного решения или сервиса.

По мере того как ИТ-системы становятся все более привычными, возрастают ожидания к их надежности — все меньше пользователей готовы мириться с простоями или отказами сервисов, от которых ожидаешь непрерывной работы. Для простых информационных или справочных систем отключение на небольшое время не слишком важно. Но для систем, ориентированных на работу и обслуживание пользователей, или корпоративных сервисов для сотрудников это уже менее терпимо.

Далее по степени критичности идут «служебные» системы, например, системы видеонаблюдения и обеспечения безопасности, системы управления зданиями или контроля и наблюдения за производством. Если подобные подсистемы отключатся из-за отказа управляющего ПО, это может привести к дорогостоящим, опасным и даже угрожающим жизни последствиям. С нефункциональной системой нет никакого способа узнать о возникновении чрезвычайной ситуации или оповестить сотрудников об обязательной эвакуации. Возможны и экономические потери от простоя подобных информационных систем, а иногда и юридические обязательства. В этом случае на надежности и отказоустойчивости лучше не экономить.

И, наконец, основные «производственные» процессы. В зависимости от предметной области (банковские системы, управление технологическими процессами, торговые системы и управление продажами и т.п.), такие решения могут быть разными по сложности и стоимости и обычно являются узкоспециальными. Обеспечение их непрерывной работы — важнейшая задача, и может решаться разными способами, в зависимости от масштаба систем и их взаимосвязанности.

Доступный сервис

С целью классификации компьютерные системы обычно разделяют по времени непрерывной работы, в процентах от общей длительности работы. Зачастую доступность сервиса или системы характеризуется параметром в 99–99,9% времени, и число «99,9» выглядит очень надежно. Но на практике это означает до 90 часов простоя в течение года, или же до полутора часов в неделю. Для восстановления работы такой системы обычно используется ее перезапуск, или восстановление из резервной копии.

Недостатки такого способа очевидны — эта процедура требует времени, что не всегда допустимо. Современные сервисы чаще всего работают на виртуальных машинах (ВМ), которые в случае сбоя требуется перезапустить.

Системы высокой доступности работоспособны 99,95–99,99% времени. Здесь используются кластерные системы и технологии, в которых выполнено то или иное запараллеливание сервисов и систем. «Высокая доступность», тем не менее, может означать до нескольких часов простоя в течение года. В зависимости от решения, дублирующий сервис или система могут находиться в так называемом «холодном» резерве, в этом случае для ее запуска требуется какое-то время. Также следует отметить сложность кластерных технологий и повышенные требования к квалификации ИТ-персонала. Кластеры сложны и отнимают много времени на развертывание, требуют тестирования и непрерывного административного контроля. Программное обеспечение обычно приходится лицензировать для каждого из серверов кластера. В результате в случае роста кластерной системы общая стоимость владения быстро растет.

Основные области применения Stratus everRun:
• Системы видеонаблюдения и контроля доступа
• Cиловые структуры
• Финансы и банковские услуги
• Телекоммуникации
• Медицина
• Государственный сектор
• Производство
• Транспорт и логистика

Непрерывная доступность (англ. fault tolerance) – до 99,999% времени. Такой уровень надежности системы достигается специализированными программными и аппаратными решениями. В зависимости от предметной области (управление технологическими процессами, банковские системы), такие комплексы могут быть очень разными по сложности и стоимости.
Но, как отмечалось выше, есть и менее требовательные сферы применения, от которых ожидается непрерывная работа. Сюда можно отнести системы управления зданиями, системы внешнего контроля (видеонаблюдения), системы контроля доступа, и тому подобные. Вряд ли пользователи будут счастливы, если пропадет сигнал со всех видеокамер и датчиков, или система вентиляции цеха или здания остановит работу.

Готовое решение

Специализированные ИТ-системы, как правило, сложны, требуют настройки и высокой квалификации персонала. Но если они пользуются успехом, то установка и обслуживание со временем упрощаются. Появляются готовые к развертыванию комплексы, не требующие повышенного внимания.

Для систем непрерывной доступности одним из таких решений является программный пакет everRun Enterprise компании Stratus. Он специально спроектирован так, чтобы обеспечить сохранение данных даже при аппаратных или программных сбоях.

Преимущества решения

При использовании everRun Enterprise приложение «живет» в двух ВМ на двух физических серверах. Если одна ВМ выходит из строя, приложение продолжает работать на другом сервере без перерывов или потери данных. Это достигается за счет постоянного считывания состояния работающей виртуальной машины и сохранения ее параметров. В случае сбоя последнее состояние системы переносится на параллельно работающую ВМ, так что выполнение приложений не прерывается. Серверы системы могут быть географически разнесены для повышения надежности.

Программное обеспечение Stratus everRun предназначено для того, чтобы обеспечить непрерывную работу служебных приложений и целостность собираемых данных. При этом система, разумеется, обладает функционалом и для быстрого аварийного восстановления в случае крупного отказа. Решения Stratus everRun базируются на использовании стандартного оборудования, и защищают любые приложения для MS Windows Server и Linux от отказов и сбоев в работе аппаратной части серверов.

Как отмечает представитель компании-интегратора «Родник» Иван Кириллов, «внедрение everRun Enterprise позволяет избежать построения сложной сетевой инфраструктуры, развертывания и настройки дополнительного управляющего ПО, а также затрат на обучение персонала, которые требуются при эксплуатации традиционных кластерных систем».

Как everRun Enterprise обеспечивает непрерывную работу и сохранение данных приложений, развернутых на виртуальных машинах


Источник: НПП «Родник», 2016

Кроме того, everRun Enterprise можно использовать для быстрого развертывания изолированных или отдельно работающих систем, которые не обязательно увязывать в корпоративную сеть компании или организации.

Примеры применения everRun Enterprise

Приведем несколько примеров из разных отраслей, в которых уже применяют ПО Stratus everRun, чтобы обеспечить непрерывную работу программных решений (точные названия компаний не указаны из соображений безопасности).

Крупный аэропорт. Система контроля доступа для зданий работает на базе everRun. По правилам регулирующих органов, простои такой системы недопустимы, и было выбрано решение Stratus, вместо обычных кластерных решений.

Отделение полиции использует решение everRun для работы диспетчерского ПО, регистрации инцидентов, ведения дел сотрудников полиции и т.п. Ранее использовалось решение с резервным сервером, и в случае сбоя требовалось несколько часов, чтобы восстановить работу.

Крупный университет. Под everRun работают системы управления зданиями. В том числе обеспечивается и выдерживается микроклимат в лабораториях, выставочных площадях и т.п. Один из ИТ-инженеров высказался так: «Я уже забыл, когда меня будили звонком ночью или в выходные, чтобы я срочно восстановил работу серверов. Система просто работает сама по себе».

Нефтедобывающая компания. Решение Stratus everRun используется для работы пакета RSMACC по управлению ПО промышленных систем на добывающих площадках.

Полезные ссылки: Семейство ПО Stratus everRun Enterprise для создания отказоустойчивых виртуальных серверов.

Программное обеспечение Stratus everRun Express для обеспечения высокой доступности информационных систем.

Компания НПП «Родник» - системный интегратор решений Stratus.                                                                                  

                                                                        Технический эксперт компании "Родник" Виктор Осьмов