Что такое RAID? (Избыточный массив недорогих дисков)

RAID — это решение, изначально разработанное для рынка сетевых серверов, как средство создания большого хранилища при меньших затратах. По сути, потребуется несколько недорогих жестких дисков и их объединение через контроллер для обеспечения одного диска большей емкости. Вот что означает RAID: избыточный массив недорогих дисков или дисков. Для этого требовалось специализированное программное обеспечение и контроллеры для управления данными, распределяемыми между различными дисками. В итоге вычислительная мощность вашей стандартной компьютерной системы позволила функциям проникнуть на рынок персональных компьютеров.

Теперь хранилище RAID может быть программным или аппаратным, и может использоваться для трех разных целей. К ним относятся емкость, безопасность и производительность. Емкость является простой, которая обычно используется почти во всех типах настроек RAID. Например, два жестких диска могут быть связаны вместе как один диск с операционной системой, что делает виртуальный диск в два раза больше. Производительность является еще одной ключевой причиной использования RAID-настроек на персональном компьютере. В том же примере двух дисков, используемых в качестве одного диска, контроллер может разделить блок данных на две части, а затем поместить каждую из этих частей на отдельный диск. Это эффективно удваивает производительность записи или чтения данных в системе хранения. Наконец, RAID можно использовать для защиты данных. Это делается путем использования некоторого пространства на дисках для клонирования данных, которые записываются на оба диска. Еще раз, с двумя накопителями мы можем сделать так, чтобы данные записывались на оба накопителя. Таким образом, если один диск выходит из строя, другой все еще имеет данные.

В зависимости от целей массива хранения, который вы хотите собрать для своей компьютерной системы, вы будете использовать один из различных уровней RAID для достижения этих трех целей. Для тех, кто использует жесткие диски в своем компьютере, производительность, вероятно, будет больше проблемой, чем емкость. С другой стороны, тем, кто использует твердотельные накопители, вероятно, понадобится способ взять меньшие накопители и связать их вместе, чтобы создать один более крупный накопитель. Итак, давайте посмотрим на различные уровни RAID, которые можно использовать с персональным компьютером.

RAID 0

Это самый низкий уровень RAID и фактически он не обеспечивает какой-либо формы избыточности, поэтому он относится к уровню 0. По сути, RAID 0 использует два или более дисков и объединяет их для создания диска большей емкости. Это достигается с помощью процессора, называемого чередование. Блоки данных разбиваются на порции данных и затем записываются по порядку на диски. Это обеспечивает повышенную производительность, поскольку данные могут быть одновременно записаны на диски контроллером, эффективно увеличивая скорость дисков. Ниже приведен пример того, как это может работать на трех дисках:

Диск 1Диск 2Драйв 3
Блок 1123
Блок 2456
Блок 3789

Для того чтобы RAID 0 работал эффективно для повышения производительности системы, вам нужно попробовать использовать подходящие диски. Каждый диск должен иметь одинаковую емкость и характеристики. Если этого не произойдет, то емкость будет ограничена кратным наименьшего количества дисков, а производительность — самым медленным из дисков, так как он должен ждать записи всех полос перед тем, как перейти к следующему набору. Можно использовать несовпадающие диски, но в этом случае установка JBOD может быть более эффективной.

JBOD — это просто набор дисков, и фактически это просто набор дисков, к которым можно обращаться независимо друг от друга, но которые представляются операционной системой как один накопитель. Обычно это достигается наличием промежутка данных между дисками. Часто это называется SPAN или BIG. По сути, операционная система видит их всех как один диск, но блоки будут записываться на первый диск до его заполнения, затем переходить на второй, затем на третий и т. Д. Это полезно для добавления дополнительной емкости в существующую компьютерную систему и с дисками разных размеров, но это не увеличит производительность массива дисков.

Самая большая проблема с настройками RAID 0 и JBOD — это безопасность данных. Поскольку у вас есть несколько дисков, вероятность повреждения данных увеличилась, поскольку у вас больше точек сбоя. Если какой-либо диск в массиве RAID 0 выходит из строя, все данные становятся недоступными. В JBOD сбой диска приведет к потере любых данных, которые оказались на этом диске. В результате, для тех, кто хочет использовать этот метод хранения, лучше всего иметь какие-либо другие средства для резервного копирования своих данных.

RAID 1

Это первый настоящий уровень RAID, поскольку он обеспечивает полный уровень избыточности для данных, хранящихся в массиве. Это делается с помощью процесса, который называется зеркалированием. Фактически все данные, которые записываются в систему, копируются на каждый диск в массиве уровня 1. Эта форма RAID обычно выполняется только с парой дисков, так как добавление большего количества дисков не добавит дополнительной емкости, а только увеличит избыточность. Чтобы лучше привести пример этого, вот диаграмма, которая показывает, как это будет записано на два диска:

Диск 1Диск 2
Блок 111
Блок 222
Блок 333

Для максимально эффективного использования конфигурации RAID 1 система снова будет использовать согласованные диски, которые имеют одинаковую емкость и производительность. Если используются несовпадающие диски, то емкость массива будет равна наименьшей емкости диска в массиве. Например, если в массиве RAID 1 использовался полутерабайтный и один терабайтный диск, емкость этого массива в системе составила бы всего один терабайт.

Этот уровень RAID очень эффективен для защиты данных, потому что два диска фактически одинаковы. Если один из двух дисков выходит из строя, то у другого есть полные данные другого. Проблема с этим типом установки обычно заключается в определении того, какой из дисков вышел из строя, потому что часто хранилище становится недоступным при сбое одного из двух и не может быть восстановлено должным образом, пока новый диск не будет вставлен вместо отказавшего и восстановления процесс запущен. Как упомянуто ранее, от этого также нет никакого увеличения производительности. На самом деле произойдет небольшая потеря производительности из-за накладных расходов контроллера для RAID.

RAID 1 + 0 или 10

Это несколько сложная комбинация уровней RAID 0 и 1. По сути, контроллеру потребуется как минимум четыре диска для работы в этом режиме, потому что он собирается создать две пары дисков. Первый набор дисков представляет собой зеркальный массив клонов данных между ними. Второй набор дисков также зеркальный, но настроен на полосу первого. Это обеспечивает как избыточность данных, так и прирост производительности. Ниже приведен пример того, как данные будут записываться на четыре диска с использованием этого типа настройки:

Диск 1Диск 2Драйв 3Драйв 4
Блок 11122
Блок 23344
Блок 35566

Если честно, это не желательный режим RAID для работы в компьютерной системе. Хотя он и обеспечивает некоторое повышение производительности, он действительно не так хорош из-за огромных накладных расходов в системе. Кроме того, это огромная трата пространства, поскольку массив дисков будет занимать не более половины емкости всех дисков вместе взятых. Если используются несовпадающие диски, производительность будет ограничена самым медленным из дисков, а емкость будет только вдвое меньше самого маленького диска.

RAID 5

Это самый высокий уровень RAID, который можно найти в потребительских компьютерных системах, и это гораздо более эффективный метод увеличения емкости и избыточности. Это достигается путем чередования данных с четностью. Для этого необходимо минимум три диска, так как данные разбиты на полосы на нескольких дисках, но затем один блок поперек полосы выделяется для проверки на четность. Чтобы лучше это объяснить, давайте сначала посмотрим, как данные могут быть записаны на три диска:

Диск 1Диск 2Драйв 3
Блок 112п
Блок 23п4
Блок 3п56

По сути, контроллер дисковода берет кусок данных для записи на все диски в массиве. Первый бит данных помещается на первый диск, а второй — на второй. Третий диск получает бит четности, который по сути представляет собой сравнение двоичных данных на первом и втором. В двоичной математике у вас есть только 0 и 1. Логический математический процесс выполняется для сравнения битов. Если эти два числа в сумме составляют четное число (0 + 0 или 1 + 1), тогда бит четности будет равен нулю. Если они складываются в нечетное число (1 + 0 или 0 + 1), тогда бит четности будет равен единице. Причина этого заключается в том, что в случае отказа одного из дисков контроллер может выяснить, что представляют собой отсутствующие данные. Например, если происходит сбой первого диска, оставляя только два и три диска, а на втором диске блок данных равен единице, а на третьем диске — блок четности один, то отсутствующий блок данных на первом диске должен быть равен нулю.

Это обеспечивает эффективную избыточность данных, которая позволяет восстановить все данные в случае сбоя диска. Теперь для большинства пользовательских настроек сбой все равно приведет к тому, что система не будет работать, потому что она не находится в рабочем состоянии. Для обеспечения работоспособности системы необходимо заменить неисправный диск на новый. Затем необходимо выполнить процесс восстановления данных на уровне контроллера, который затем выполнит обратную логическую функцию для воссоздания данных на отсутствующем диске. Это может занять некоторое время, особенно для накопителей большей емкости, но, по крайней мере, его можно восстановить.

Теперь емкость массива RAID 5 зависит от количества дисков в массиве и их емкости. Еще раз, массив ограничен наименьшей емкостью диска в массиве, поэтому лучше использовать согласованные диски. Эффективное пространство хранения равно числу дисков минус один раз минимальной емкости. Таким образом, с точки зрения математики, это (n-1) * Capacitymin. Итак, если у вас есть три диска по 2 ГБ в массиве RAID 5, общая емкость составит 4 ГБ. Другой массив RAID 5, использующий четыре диска по 2 ГБ, будет иметь емкость 6 ГБ.

Теперь производительность для RAID 5 немного сложнее, чем для некоторых других форм RAID из-за логического процесса, который необходимо выполнить для создания бита четности при записи данных на диски. Это означает, что производительность записи будет меньше, чем у массива RAID 0 с тем же количеством дисков. С другой стороны, производительность чтения не страдает так сильно, как запись, потому что логический процесс не выполняется, потому что он читает прямые данные с дисков.

Большая проблема со всеми настройками RAID

Мы обсудили различные плюсы и минусы каждого из уровней RAID, которые можно использовать на персональных компьютерах, но есть еще одна проблема, которую многие люди не понимают, когда речь идет о создании настроек RAID-дисков. Прежде чем использовать настройку RAID, она должна быть сначала создана программным обеспечением аппаратного контроллера или программным обеспечением операционной системы. Это по существу инициализирует специальное форматирование, необходимое для правильного отслеживания того, как данные будут записываться и читаться на диске.

Вероятно, это не похоже на проблему, но это если вам даже нужно изменить настройки RAID-массива. Например, скажем, у вас мало данных и вы хотите добавить дополнительный диск для массива RAID 0 или RAID 5. В большинстве случаев вы не сможете сначала перенастроить RAID-массив, который также удалит все данные, хранящиеся на этих дисках. Это означает, что вам необходимо полностью выполнить резервное копирование данных, добавить новый диск, перенастроить массив дисков, отформатировать этот диск и затем восстановить исходные данные обратно на диск. Это может быть чрезвычайно болезненным процессом. В результате убедитесь, что вы действительно настроили массив так, как вам хочется, при первом запуске.

Ссылка на основную публикацию