Гетерогенный RAID против гомогенного
Массивы RAID кажутся простыми, но, в зависимости от конфигурации, они могут стать довольно сложными, требуя от ИТ-администраторов пристального внимания к “железу” и настройкам. Впрочем, есть одна тема, с которой обычно соглашаются все специалисты в области систем хранения: жёсткие диски в массиве RAID должны быть идентичны, желательно, чтобы и прошивки у винчестеров совпадали. Использование одинаковых жёстких дисков обычно является критичным вопросом для крупных корпораций, которому производители и интеграторы уделяют много времени и энергии, чтобы протестировать и предложить другое “железо”, если система будет работать так, как и должна. Однако малому и среднему бизнесу приходится надеяться только на свои силы. Кажется вполне логичным совместить старые жёсткие диски с новыми, что мы и сделали в нашей статье.
Хотя цены на жёсткие диски существенно снизились за последние годы, накопители продолжают занимать существенную долю в ИТ-бюджете каждой компании. И значимость накопителей растёт, поскольку приходится работать со всё большими объёмами данных, используя всё большее количество продуктов и носителей. По мере перехода от задачи организации личных данных до управления корпоративной информацией такие проблемы, как избыточность хранения, производительность, надёжность, управляемость, масштабируемость, сложность компонентов и цены, приводят к решению весьма сложного уравнения.
Массивы на основе технологии RAID являются ключевыми элементами в любой ответственной системе, которая требует высокой надёжности и бесперебойной работы. RAID может работать на нескольких или на множестве жёстких дисков, в простых или избыточных массивах.
Существует много вариантов RAID. Можно выбирать между аппаратной поддержкой RAID с мощными процессорами ввода/вывода, или host-реализацией RAID, когда за вычисление информации избыточности RAID отвечает центральный процессор ПК. Затем можно выбирать интерфейс: им может быть как SAS (Serial Attached SCSI), так и SATA (Serial ATA). Профессиональные SAS-контроллеры поддерживают винчестеры SAS и SATA, а SATA-контроллеры могут работать только с жёсткими дисками SATA. После того, как выбор сделан, нужно решить, хотите ли вы получить возможность подключать внешние жёсткие диски через eSATA или SAS-расширители и многоканальные кабели. Есть и другие опции: добавление запасных жёстких дисков для замены вышедших из строя (hot spare), использование кэш-памяти на контроллере и, наконец, резервное питание кэша с помощью аккумулятора (BBU) на RAID-контроллере. Возможности бесконечны, но администраторы обычно для RAID используют одинаковые жёсткие диски, чтобы уменьшить сложность системы.
Обычно это правило относится и к версиям прошивки, которые должны быть одинаковыми для оптимальной производительности. Мы согласны с этим, когда дело касается специализированных и оптимизированных RAID-массивов, где максимальная производительность ввода/вывода критична для выполнения задачи. Однако мы пожелали узнать, каков же смысл в этих словах на самом деле. Поэтому мы собрали одну конфигурацию RAID на четырёх идентичных 320-Гбайт жёстких дисках SATA Samsung и ещё одну на двух винчестерах Samsung, одном Seagate и одном Western Digital.
RAID или не RAID?
Интеграция базовой логики для поддержки RAID в чипсет позволила легко и просто создавать простые массивы RAID 0 и RAID 1 до шести жёстких дисков (почти каждый чипсет AMD, nVidia или Intel поддерживает RAID в категориях верхнего сегмента массового рынка и high-end сегмента), однако всегда важно внимательно рассмотреть основной вопрос – имеет ли смысл устанавливать массив RAID или нет? В данном отношении мы бы хотели подчеркнуть разницу избыточного хранилища на технологии RAID и регулярного резервирования данных, чтобы защитить информацию от намеренного или случайного удаления, а также от таких опасностей, как сбои в энергоснабжении, пожар, наводнение, землетрясение и другие стихийные бедствия. RAID, что расшифровывается как массив недорогих/независимых дисков с избыточностью (redundant array of independent drives), ни в коей мере не заменяет резервирование данных, поскольку массив используется только для ускорения доступа к данным или для хранения их в избыточной конфигурации. Основная задача RAID заключается именно в избыточном хранении, чтобы данные не терялись в случае выхода из строя одного жёсткого диска.
RAID или нет, но данные следует защищать от катастрофы. Пользователи, работающие с массивами RAID, могут случайно испортить или удалить данные, да и любое из стихийных бедствий, перечисленное выше, легко уничтожит ваши данные за считанные секунды. По этой причине очень важно хранить важные данные на других носителях, причём копировать их регулярно. А избыточное хранилище – это уже второй шаг. Как только вы разработаете стратегию резервирования (и протестируете, поскольку резервирование имеет смысл, только если восстановление работает), настало время выбрать RAID-хранилище.
Каждая система, которая должна работать в режиме 24/7, должна использовать массив с избыточностью. В большинстве случаев RAID 1 является наилучшим решением, поскольку содержимое одного жёсткого диска зеркалируется на второй в реальном времени. Если один жёсткий диск выйдет из строя, то система останется рабочей. В отличие от других режимов RAID, RAID 1 не влияет на производительность. RAID 0 нельзя назвать “настоящим” режимом RAID, поскольку он распределяет данные по всем доступным жёстким дискам, поэтому и избыточность как таковая отсутствует. Более сложные режимы RAID 5 и 6 могут сочетать множество жёстких дисков, поэтому они позволяют создавать действительно большие массивы, обеспечивая одинарную и двойную избыточность. В RAID 5 для хранения информации избыточности используется один жёсткий диск, а у RAID 6 уже два. Но RAID 5 и RAID 6 требуют, минимум, три и четыре жёстких диска, соответственно, а на вычисление информации избыточности требуется немалая вычислительная мощность. Если вы хотите, чтобы массивы RAID5/6 работали с высокой скоростью, то без скоростного RAID-контроллера не обойтись. Нужно устанавливать и большее число винчестеров, чем минимальное, поскольку RAID 5 на трёх или четырёх жёстких дисках обычно уступает одному винчестеру в некоторых тестах.
Спросите себя: где вы хотите хранить данные избыточно и какой уровень RAID оправдывает себя с точки зрения вложений и производительности? Если простои системы недопустимы, то следует выбрать решение RAID. В других случаях вполне можно удовлетвориться одним жёстким диском, замену которому можно найти в ближайшем магазине, и реализовать регулярное резервирование данных.
Детали нашего массива
Мы решили использовать только четыре жёстких диска, поскольку такое количество наиболее широко распространено. Интеграция большего числа жёстких дисков увеличивает производительность, но также и теоретический шанс выхода из строя одного винчестера. В случае с шестью или семью жёсткими дисками вероятность, что один выйдет из строя, выше. Мы не стали использовать винчестеры с высокой ёмкостью, хотя сегодня доступны модели вплоть до 1 Тбайт, поскольку большинство наших тестов требуют значительного времени для выполнения, если раздел слишком большой.
Мы проводили тесты в RAID 0 и в RAID 5, чтобы получить представление как о максимальной производительности, так и о скорости массива с избыточностью.
Гомогенный RAID
Мы использовали четыре винчестера Samsung HD321KJ, на которых построили гомогенный RAID-массив. Эти жёсткие диски имеют интерфейс SATA/300 и оснащены 16 Мбайт кэш-памяти, а скорость вращения шпинделя составляет 7 200 об/мин. Линейка Spinpoint T166 доступна в моделях до 500 Гбайт. Мы использовали 320-Гбайт версии и рекомендуем выбрать более скоростную линейку Spinpoint F1, если вы решите остановиться на винчестерах Samsung. Но мы использовали жёсткие диски именно такой небольшой ёмкости, поскольку наши тесты в данном случае выполняются быстрее. Если вы планируете устанавливать в сервер SATA-винчестеры, то мы рекомендуем выбрать модели, сертифицированные под работу 24/7. Среди возможных вариантов Hitachi Ultrastar A7K1000, Seagate Barracuda ES или Western Digital RAID Edition. Все они построены на вариантах для настольных ПК, но отрегулированы для сценариев рабочей станции.
Гетерогенный RAID
Наш гетерогенный массив RAID состоит из двух винчестеров Samsung, упомянутых выше. Чтобы сделать смесь максимально разной, мы выбрали два других 320-Гбайт винчестера от двух разных производителей с разными техническими спецификациями. Третий жёсткий диск – Seagate Barracuda 7200.10 ST3320620AS, а четвёртый – Western Digital Caviar SE WD3200JD. В отличие от накопителей Samsung и Seagate, винчестер WD основан не на двух, а на трёх пластинах. Samsung Spinpoint F1 хранит 320 Гбайт на одной пластине, а другие жёсткие диски всё ещё ограничены плотностью записи в 250 Гбайт на пластину. Винчестер WD имеет ещё меньшую плотность записи на пластину, он использует SATA/150 вместо SATA/300 и всего 8 Мбайт кэша, но для наших сценариев он подошёл, поскольку мы хотели использовать три совершенно разных жёстких диска.
Тестовая конфигурация
Системное аппаратное обеспечение | |
Процессоры | 2x Intel Xeon (ядро Nocona), 3,6 ГГц, FSB800, 1 Мбайт кэша L2 |
Платформа | Asus NCL-DS (Socket 604), чипсет Intel E7520, BIOS 1005 |
Память | Corsair CM72DD512AR-400 (DDR2-400 ECC, reg.), 2x 512 Мбайт, задержки CL3-3-3-10 |
Системный жёсткий диск | Western Digital Caviar WD1200JB, 120 Гбайт, 7 200 об/мин, кэш 8 Мбайт, UltraATA/100 |
Контроллеры накопителей | Intel 82801EB UltraATA/100 (ICH5) Promise SATA 300TX4 Promise FastTrak TX4310 Драйвер 2.06.1.310 |
Сеть | Broadcom BCM5721 встроенная 1 Гбит/с |
Видеокарта | Встроенная ATI RageXL, 8 Мбайт |
Тесты | |
Тесты производительности | c’t h2benchw 3.6 |
PCMark05 | V1.01 |
Производительность ввода/вывода | IOMeter 2003.05.10 Fileserver Benchmark Webserver Benchmark Database Benchmark Workstation Benchmark |
Системное ПО и драйверы | |
ОС | Microsoft Windows Server 2003 Enterprise Edition,Service Pack 1 |
Драйвер платформы | Intel Chipset Installation Utility 7.0.0.1025 |
Графический драйвер | Графический драйвер Windows по умолчанию |
Используемые жёсткие диски
Для нашей статьи мы использовали три разных жёстких диска: Samsung Spinpoint T166, Seagate Barracuda 7200.10 и Western Digital WD3200JD. Все они имеют ёмкость в 320 Гбайт.
Производитель | Samsung | Seagate | Western Digital |
Линейка | SpinPoint T166 | Barracuda 7200.10 | WD Caviar SE |
Модельный номер | HD321KJ | ST3320620AS | WD3200JD |
Ёмкость | 320 Гбайт | 320 Гбайт | 320 Гбайт |
Скорость вращения (об/мин) | 7200 | 7200 | 7200 |
Число пластин | 2 | 2 | 3 |
Интерфейс | SATA/300 | SATA/300 | SATA/150 |
Кэш (Мбайт) | 16 | 16 | 8 |
NCQ | Да | Да | Да |
Гарантия | 3 года | 5 лет | 3 года |
RAID-контроллер: Areca
Линейка Areca 1680ML обеспечивает высокую производительность ввода/вывода и прекрасную производительность до шести винчестеров.
Диаграммы передачи данных RAID 0
Диаграммы передачи данных RAID 5
Время доступа
Пропускная способность интерфейса
Скорость чтения данных
Скорость записи данных
Производительность ввода/вывода
Заключение
Заключение на основе наших тестов будет вполне однозначным: RAID-массивы на основе разных жёстких дисков работают корректно и обеспечивают сравнимую производительность, однако она определённо хуже RAID-массива на основе идентичных жёстких дисков – всё это при использовании одинаковой системы и RAID-контроллеров. Единственным исключением можно назвать время доступа, которое существенно ухудшалось при использовании разных жёстких дисков. Поэтому только массив на одинаковых жёстких дисках (гомогенный) позволяет достичь максимальной производительности, то есть быстрого времени доступа, высокой скорости чтения и записи данных, а также хорошей производительности ввода/вывода.
Если сравнивать идентичные уровни RAID (RAID 0 или RAID 5), разница в пропускной способности между гомогенным и гетерогенным массивом RAID составила от 10% до 25%. Это весьма важно, если вы хотите, чтобы массив RAID работал быстро. Для среднего файлового сервера, когда к данным обращается немного людей, а избыточность является основной целью, снижение производительности может оказаться приемлемым и вполне допустимым, чтобы продолжить работу сервера.
Однако, учитывая, что цены на 500-Гбайт жёсткие диски сегодня очень невысоки, мы рекомендуем “чистое” решение, поскольку вы не только получите лучшую производительность, но и сможете быть уверены, что массив проработает долгое время, если установите в него полностью новые винчестеры (особенно если вы используете модели, сертифицированные под RAID и 24/7), да и производительность будет получше.
Статьи по теме.
- “Тесты масштабируемости RAID. Часть I“;
- “Тесты масштабируемости RAID. Часть II“;
- “Тесты масштабируемости RAID. Часть III“.