`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Что для вас является метрикой простоя серверной инфраструктуры?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

S.M.A.R.T. — интеллект, который всегда в цене

+11
голос

Существует устойчивый перекос в оценке факторов, влияющих на эффективность работы компьютерных компонентов и систем в целом. Как правило, речь идет о количественных характеристиках — скорости, частоте, размере, емкости и почти никогда — об организации, оптимизации управления, сбалансированности элементов. Так, при сравнении достоинств и недостатков различных жестких дисков в подавляющем большинстве случаев оперируют «физическими» параметрами, такими, как скорость привода, время поиска, время задержки. Присущие устройствам «интеллектуальные» характеристики алгоритмы кэширования данных, управление очередью команд, встроенная обработка ошибок — обычно отходят на второй план, если вообще вспоминаются. Вместе с тем разумная организация дисковой подсистемы и рациональный подбор носителей дают возможность добиться значительно большего эффекта минимальными средствами. Нельзя забывать и о том, что материнские платы и контроллеры вместе с шинами и их частотами — не более чем транспортная система, пусть и высокоразвитая, для данных, с которыми работают периферийные устройства.

Но ведь именно информация, а не средства ее передачи является основной ценностью. Вряд ли будет важно, на какой частоте работал центральный процессор и сколько оборотов в минута делал шпиндель жесткого диска перед тем, как в результате сбоя были утрачены уникальные данные безо всякого предуведомления пользователя. Риск потери информации, которая, возможно, накапливалась годами, — недопустимая роскошь для владельцев современных компьютерных систем.

Разумеется, существует множество средств уменьшения такого риска начиная с обычного резервного копирования и заканчивая использованием RAID-массивов, многократно повышающих степень защиты данных от потери. Эти средства выбирают, сопоставив их стоимость с ценой информации.

Однако помимо «внешних» способов решения проблемы существует возможность повышения внутренней устойчивости накопителей к сбоям, и наличие подобной опции особенно привлекательно в устройствах массового спроса. Корпорации себя защитят, а применительно к настольным системам об этом должны думать производители носителей. О чем и договорились в свое время Fujitsu, Hewlett-Packard, IBM, Maxtor, Quantum, Seagate и Western Digital, а также примкнувшие к ним Compaq, Micro House, NexStor, Phoenix, Promise и Symantec, организовав так называемую рабочую группу S.M.A.R.T. для создания спецификации функций и команд, передаваемых по АТА-интерфеису, служебным назначением которых были бы ранняя диагностика и профилактика сбоев в устройствах хранения информации.

Технология S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) объединяет усилия разработчиков и производителей оборудования, направленные на повышение надежности хранения данных. Реализующие S.M.A.R.T.-подход РС-сисгемы значительно более эффективны за счет функции раннего предупреждения пользователя о вероятных или прогрессирующих ошибках устройств. Подобное упреждение оставляет возможность сохранения критичных данных и замены допускающих сбои накопителей без потери информации и непредсказуемого останова системы.

В своей недолгой истории технология S.M.A.R.T. прошла через три стадии развития. S.M.A.R.T. I обеспечивает предсказание ошибок осуществляя мониторинг совокупности определенных параметров диска во время обращения к нему. S.M.A.R.T. II позволяет также выполнять ряд профилактических операции в состоянии ожидания или покоя (idle mode), обеспечивая, например дрейф головок над поверхностью с отводом в зону парковки. S.M.A.R.T.

Ill предполагает не только мониторинг работы диска, но и определение сбойных секторов с попытками их восстановления. Все эти алгоритмы или их часть могут быть реализованы в электронике современных дисков (firmware), но их применение обусловлено политикой конкретного производителя жестких дисков. Наличие опции S.M.A.R.T. указывается в спецификации жестких дисков наряду с физическими параметрами, типом используемых головок и показателями надежности.

Современные устройства хранения данных (такие, как, например, жесткие диски) являются сложными электромеханическими системами. Вследствие этого они подвержены влиянию многих факторов, снижающих производительность или вызывающих ошибки в их работе. Некоторые воздействия влекут за собой немедленные и серьезные последствия, другие приводят к постепенному снижению способности устройства полноценно функционировать. Часть подобных проблем может быть предсказана, хотя далеко не все прогрессирующие ошибки накопителей распознаются, и S.M.A.R.T. не в состоянии гарантировать их упреждающее детектирование в будущем. Эту технологию следует рассматривать как средство помощи пользователю в предотвращении ряда неполадок, возникающих вследствие ошибок. Устройства, оснащенные S.M.A.R.T., непрерывно производят мониторинг своего внутреннего состояния для оценки надежности и предупреждения сбоев. Эта информация в ряде случаев доступна по интерфейсу и может быть представлена пользователю через драйверы и сопутствующие приложения. Однако алгоритмы предсказания в SMART интерпретируют внутренние условия для детектирования возможных ошибок самим устройством и не предназначены для принятия решения пользователем о прогнозе сбоев на основании внутренних данных.

Разработчикам приложений, BIOS и драйверов предписано обеспечить их совместимость как с устройствами, поддерживающими технологию S.M.A.R.T., так и с не совместимыми с ней продуктами, обеспечив игнорирование последними соответствующих команд. Приложения не должны интерпретировать или предоставлять пользователю атрибуты S.M.A.R.T.-команд, их типичными задачами являются только индикация негативного статуса состояния поверхности и вывод следующего сообщения — WARNING: Immediately back-up your data and replace your hard disk drive. A failure may be imminent.

Приложение показывает, какое физическое устройство служило причиной вывода предупреждающего S.M.A.R.T.-coooбщения В его функции также входит предоставление расширенной информации о носителе: списка логических дисков, типа, имени производителя, серийного номера и др. Совместимость приложений и устройств со спецификацией S.M.A.R.T. может подтверждаться соответствующим логотипом.

Из существующих S.M.A.R.T.-приложений можно отметить EZ-S.M.A.R.T. от компании Micro House International, специализирующейся на распространении служебных утилит. Эта программа работает со S.M.A.R.T.-совместимыми жесткими дисками, предупреждая о их возможных ошибках и позволяя переместить данные в безопасное место до того, как произойдет их потеря. Применение утилиты рекомендовано ведущими производителями жестких дисков, в частности Western Digital и Maxtor.

Примером расширенного аппаратного использования S.M.A.R.T. является технология Westren Digital Data Lifeguard, воплощенная в последнем поколении EIDE-дисков WD Caviar от 3,2 GB (АС13200) до 10,1 GB (АС310100). Основными достоинствами технологии является автоматическое определение, изолирование проблематичных участков поверхности диска и перераспределение данных для предотвращения потери информации. Data Lifeguard расширяет возможности S.M.A.R.T. по мониторингу и предсказанию ошибок. Если последняя предотвращает останов системы и возможную потерю производительности и данных при обращении к диску, сообщая статус надежности пользователю, то Data Lifeguard дополнительно обеспечивает самовосстановление устройства в процессе работы. Для этого используются те 90% времени, в течение которого жесткий диск, как правило, находится в состоянии ожидания idle mode.

Data Lifeguard, как это и описано в спецификации S.M.A.R.T. Ill автоматически выявляет и восстанавливает сбойные секторы до потери данных. Это осуществляется путем сканирования поверхности диска в состоянии покоя и регенерации «слабых» данных. Снижения производительности устройства не происходит, поскольку восстановление ошибок производится в паузах, наоборот, общим результатом является ускорение работы за счет уменьшения повторных обращений к сбойным зонам. Отработка функции сканирования инициируется каждые восемь часов непрерывной работы жесткого диска, что в среднем соответствует его дневной загрузке. По истечении восьми часов активного вращения привода и 15 секунд покоя Data Lifequard считывает все секторы, заполненные данными пользователя Состояние покоя определяется как время, в течение которого диск не отрабатывает посланных системой команд. Если сканирование прерывается после команды или при отключении питания, то через 15 минут работы и 15 секунд покоя оно продолжится с той точки, где было прекращено. Отключение и управление питанием не сбивают счетчик, и процесс возобновляется при следующем включении. Время полного сканирования поверхности пропорционально емкости жесткого диска (примерно 16 минут для диска 10,1 GB). Если в процессе сканирования детектирован код ошибки (ЕСС Firmware Correctable Error), то запускается утилита Sector Test для определения дефекта поверхности. При обнаружении такового Data Lifeguard переносит скорректированные данные и запрещает запись в подозрительные секторы, предотвращая обращение к поврежденным участкам поверхности и их расширение при интенсивном использовании жесткого диска.

Возможности S.M.A.R.T.-технологии — один из ключевых элементов в дальнейшем развитии архитектуры PC, это качественно новый уровень работы с данными, залог их целостности и доступности. Но даже при наличии S.M.A.R.T. в системе пользователю не следует забывать, что полную гарантию сохранности данных может дать только регулярно выполняемая процедура резервного копирования.

+11
голос

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT