Почему аварийное восстановление для сети и ИТ имеет значение

Специалисты по информационным технологиям (ИТ) признали важность аварийное восстановление на протяжении десятилетий. Известные интернет-черви, стихийные бедствия и другие серьезные нарушения безопасности служат напоминанием о необходимости надлежащего планирования аварийного восстановления и других проблем с непрерывностью бизнеса.

Аварийное восстановление применяется в основном к корпорациям и другим крупным организациям, но те же основные принципы применимы и к домашним сетям.

Что такое аварийное восстановление?

Аварийное восстановление включает ряд действий, которые необходимо предпринять в случае значительных незапланированных отключений, чтобы минимизировать их неблагоприятные последствия. В сети бедствия могут возникнуть в результате таких событий, как

  • Компьютерная вредоносная программа
  • Сбои электропитания
  • Хакерские атаки
  • Подземный кабель порезы или сбои
  • Пожар, наводнение, землетрясение и другие стихийные бедствия на объекте
  • Ошибки в системном администрировании

Соответствующая концепция непрерывности бизнеса подразумевает, что критические бизнес-процессы организации, в том числе использующие ИТ-системы, могут поддерживаться в случае аварии.

Почему аварийное восстановление важно

При правильном выполнении процедуры аварийного восстановления экономят большие суммы денег. Финансовое воздействие на корпорации, вызванное потерей даже нескольких часов сети и подключением к Интернету, легко исчисляется миллионами долларов. Аварийное восстановление также может улучшить качество жизни людей и даже спасти жизни. Потеря контакта по мобильному телефону с друзьями и семьей становится чрезвычайно разрушительной во время чрезвычайных ситуаций.

С учетом всего сказанного, инвестиции в непрерывность бизнеса должны быть сбалансированы с практическими соображениями стоимости и сложности подготовки к неизвестному будущему:

  • стоимость — комплексное аварийное восстановление слишком дорого
  • тестируемость — планы аварийного восстановления, которые отлично смотрятся на бумаге, но технически недоказаны, скорее всего потерпят неудачу на практике
  • чрезмерный акцент на бэк-офисе — легко увлечься решениями для серверной комнаты, но без адекватных условий для людей и клиентской инфраструктуры непрерывность бизнеса не произойдет

Домашним сетям не хватает дорогостоящего оборудования крупного бизнеса, но сохранение данных и коммуникаций может быть не менее важным.

Планирование аварийного восстановления

Лучший подход к аварийному восстановлению фокусируется в первую очередь на планировании и предотвращении. В то время как землетрясения и теракты обычно трудно предвидеть, многие другие сценарии бедствий могут быть проанализированы подробно.

Для тех событий, которые не могут быть предотвращены, план аварийного восстановления ИТ учитывает необходимость

  • Обнаружение перебоев или других последствий стихийных бедствий как можно быстрее
  • Уведомить любые затронутые стороны, чтобы они могли принять меры
  • Изолируйте затронутые системы, чтобы ущерб не мог распространиться
  • Восстановите критически уязвимые системы, чтобы возобновить работу

Все вместе они называются управлением рисками или действиями по снижению риска.

Методы аварийного восстановления

Все хорошие ИТ-планы аварийного восстановления учитывают три основных компонента операций: данные, системы и персонал.

С технической точки зрения большинство организаций полагаются на некоторую форму избыточности, чтобы сделать возможным восстановление данных и систем. Избыточность позволяет в кратчайшие сроки вводить в эксплуатацию вторичные данные или системные ресурсы, если первичные ресурсы выходят из строя или иным образом становятся недоступными. Организации могут реплицировать серверы и другое критически важное оборудование в нескольких местах для защиты от какой-либо одной точки отказа.

Хотя традиционное зеркалирование дисков обеспечивает высокую доступность данных в обычных ситуациях, оно работает только на коротких расстояниях. Резервные копии позволяют делать снимки данных в удаленных местах. Например, традиционные стратегии сетевого резервного копирования периодически архивируют копии важных данных, чтобы при необходимости их можно было восстановить позже. Если резервные копии хранятся на месте или только в одном месте, их значение для аварийного восстановления низкое. Более крупные организации инвестируют в технологии сетей хранения данных (SAN) для более широкого распространения данных по своим внутренним сетям. Некоторые также используют сторонние услуги хостинга для облачного хранения.

Домашние сети могут также использовать преимущества решений для резервного копирования и облачного хранения данных, чтобы лучше управлять своими рисками.

Другие распространенные методы поддержки планов аварийного восстановления включают в себя:

  • Назначение людей в организации, выполняющих особые роли в случае бедствия, и предоставление им необходимой подготовки 
  • Выполнение упражнений по аварийному восстановлению, в которых используются конкретные сценарии восстановления.
Ссылка на основную публикацию