Про RAID и большие числа

22 май, 2009 - 11:15Тимур Ягофаров

В старые добрые времена, когда «деревья были большими», а жесткие диски – маленькими, появилась идея улучшить совокупные характеристики системы хранения, построенной на базе дешевых накопителей. В последствии эта технология получила гордое имя RAID. Шли годы, диски все росли, росли, пока не выросли до терабайтных объемов…



«Ну и что?», – скажите вы. «Разве диск на 2 ТБ помеха для построения RAID-массива любого типа?» Конечно, нет. Только есть одно маленькое «но», появившееся вместе с ними, словно небольшая темная тучка на горизонте, грозящая со временем разразиться ураганом.

Дело в том, что когда 30 лет назад задумывалась эта технология, никто и не предполагал, что емкость накопителей дорастет до терабайт. Впрочем, общий объем так называемого SLED (Single Large Expensive Drive), каковым предстает перед хостом RAID-система может исчисляться и петабайтами. Вот только вся эта громадина не застрахована от того, чтобы фатально споткнуться о «кочку» в виде ошибки записи достаточно дешевого диска.

В типичных SATA HDD вероятность возникновения ошибок (BRE – bit rate error) составляет 1/10^14, что означает: на каждые 100,000,000,000,000 бит может встретиться одна некомпенсируемая ошибка. Переводя данный тип представления в привычный пользователям ПК вид, получаем систему емкостью 100 ТБ (терабайт). Так вот почти наверняка в ней при перестроении будет возникать ошибка.

В результате получается, что RAID подошел к пределу своих возможностей в случае использования в системе терабайтных дисков.

Впрочем, не стоит паниковать и складывать руки на груди крестом. На самом деле, подобные системы в нормально организованном бизнесе пока не встречаются и в ближайшие три-четыре года не встретятся. Обсуждая эту тему с одним из специалистов, мы пришли к выводу, что такая емкость оперативно необходимых данных ныне может встречаться лишь в сфере профессиональной работы с HD-видео. Все прочие в состоянии использовать трехступенчатые схемы организации хранения типа: рабочий стол—ящики стола—пыльный шкаф.

На «поверхности стола» находится все, к чему вы часто обращаетесь, и загромождать ее никто не будет. В ящики же мы обычно кладем нужные нам лишь изредка документы или инструменты. Так вот поверхность стола и его ящики – это и есть первые два уровня в системах хранения, построенных в соответствии с принципами ILM. И здесь 100 ТБ пока не требуется. А вот «пыльный шкаф» – это как раз то место, где они могут потребоваться, но ныне его функцию выполняют ленты и их аналоги.

В общем, трубить тревогу еще рано, но иметь в виду угрозу уже стоит. Ведь говорят же, кто предупрежден, то вооружен. Ведь, по оценкам IDC, наша цифровая вселенная, объем которой в 2007 г. оценивался в 281 экзабайт, к 2011 увеличится в 10 раз. А там глядишь, и RAID отомрет сам собой за ненадобностью с появлением дешевых и надежных SSD. Но это уже другая история…