`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

SSD endurance и вопросы геронтологии

+66
голосов

Проблема живучести полупроводниковых компонентов возникла с момента использования p-n-проводимости в электронике. Докладчиками по данному вопросу изначально выступали представители военно-промышленного комплекса и агентств по исследованию космоса. Но широкомасштабные задачи технической геронтологии возникли с появлением твердотельных дисков.

Ячейки NAND-памяти, повышая информационную плотность SSD-накопителей, поставили вопрос живучести (или в оригинальной терминологии endurance — выносливости) полупроводников из теоретической плоскости в практическую. Все дело в том, что одной из основных технологий хранения для твердотельных носителей является применение ячеек Flash-памяти, способных хранить несколько бит информации за счет обеспечения более чем двух устойчивых состояний. Это решение привнесло в архитектуру цифровых устройств ряд недостатков, присущих аналоговой технике. После краткого обзора основных NAND-технологий, постараемся проанализировать, какой ценой достигается компромисс в каждой из них, и на какие трюки идут производители SSD, чтобы сохранить быстродействие и обеспечить надежность.

Классика и авангард

Формирование, хранение и декодирование сигналов с двумя устойчивыми состояниями обладает лучшей стабильностью по сравнению с дискретно-аналоговым принципом, в основе которого наличие большого количества промежуточных уровней и сложных методов их дифференцирования, нередко требующих применения сигнальных процессоров (DSP) для выполнения операции в условиях ограниченных таймингов. Поэтому, бескомпромиссным решением, обеспечивающим максимальное быстродействие и надежность, по праву считается классическая технология SLC.

SSD endurance и вопросы геронтологии

Сравнение характеристик энергонезависимой памяти в зависимости от используемой технологии хранения

  • Ячейка SLC (Single Level Cell) имеет два устойчивых состояния, она способна хранить один бит информации. Обладает наилучшей устойчивостью к деградации физических параметров и наивысшим количеством циклов перезаписи. Потребление энергии минимально, а производительность максимальна. Недостатком является высокая стоимость хранения информации, поэтому применение такой памяти характерно для высокоуровневых «бескомпромиссных» устройств.

  • Ячейка MLC (Multi Level Cell) обладает несколькими устойчивыми состояниями. В ряде источников к этому типу относят элементы памяти с четырьмя состояниями, способные хранить два бита. Такой дискретно-аналоговый метод повышает зависимость устойчивости хранения информации от деградации физических характеристик носителя, что неизбежно сказывается на количестве допустимых циклов перезаписи. Необходимость применения избыточных контрольных кодов и усиление требований к помехозащищенности многоуровневых сигналов негативно отражаются на производительности. Мотивацией применения такой памяти является снижение стоимости коммерческих платформ.

  • Ячейка eMLC (Enterprise Multi Level Cell) с улучшенными физическими характеристиками и количеством циклов перезаписи. Достоверная информация о методах, лежащих в основе заявленных улучшений, как правило, недоступна и может различаться у разных производителей. В частности, упоминается зависимость уровня качества кристаллов от их расположения в полупроводниковой пластине, используемой при производстве.

  • Ячейка TLC (Three Level Cell) способна хранить три бита информации, для этого требуется 8 устойчивых состояний. Плотность хранения максимальна, удельная стоимость минимальна. Как уже было сказано, на производительности и допустимом количестве циклов перезаписи такой подход сказывается негативно.

SSD endurance и вопросы геронтологии

Классификация ячеек энергонезависимой памяти по количеству устойчивых состояний для различных типов NAND-памяти

Инструменты компромисса

Рассмотрим некоторые секреты производителей и решения, призванные компенсировать фактор износа накопителя, в наибольшей степени важный для многоуровневых ячеек.

Ошибка чтения — не повод для пессимизма

SSD endurance и вопросы геронтологии

Уточнение алгоритма Toshiba для ремапа сбойных блоков — при случайных ошибках чтения, блок не исключается из использования

Пояснение под несчастливым номером 13 в документе на микросхемы энергонезависимой памяти Toshiba, детализует компромиссы, имеющие место в связи с увеличением плотности записи в MLC NAND. Согласно рекомендации, случайные ошибки чтения (random bit errors) отныне не следует считать поводом для отбраковки запоминающего блока. Присвоение блоку статуса сбойного (marked as bad) рекомендуется только в тяжелых случаях: если устойчивая ошибка имеет место при записи или стирании. Это означает, что сбойный блок не будет сразу отключен логикой ремапа накопителя. Для вывода из эксплуатации потребуются более весомые аргументы.

Синергия NAND — путь к успеху

Существует еще один метод, позволяющий оптимистичнее смотреть на перспективы NAND-технологии. Его суть в том, чтобы объединить преимущества и недостатки одноуровневой и многоуровневой памяти в одном чипе. Накопитель, собирая статистику обращений к блокам хранимой информации, располагает интенсивно востребованные данные в памяти SLC, обладающей лучшей производительностью и устойчивостью. Остальные данные находятся в дешевой и емкой MLC-памяти.

SSD endurance и вопросы геронтологии

Пример совмещения технологий SLC и MLC в пределах одной микросхемы

Согласно диаграмме, запоминающие ячейки обоих типов могут быть реализованы в пределах одной микросхемы. Система адаптивна благодаря динамическому изменению размеров областей.

Технологию можно классифицировать как своеобразное обобщение известного принципа Wear Leveling, управляющего нагрузкой на блоки запоминающей матрицы с целью минимизации ее износа и повышения производительности.

Вместо послесловия

Поиск оптимальных решений в критериях производительности, надежности и стоимости мотивировал производителей SSD устройств к ряду интересных, а иногда неоднозначных шагов. Читая между строк информацию о технологических новинках, выделим три подхода в дизайне SSD накопителей.

  1. Минимизация количества ошибок за счет совершенствования технологии, это бескомпромиссный вариант, в первую очередь характерный для классических SLC устройств.

  2. Алгоритмы коррекции ошибок, выходят на первый план для MLC и TLC устройств. Применение недорогого физического носителя, допускающего сравнительно высокую вероятность сбоев здесь компенсируется избыточностью запоминающей матрицы в сочетании с контрольными кодами, позволяющими обнаруживать и исправлять ошибки. Плюс технологии, уравнивающие нагрузку на запоминающую матрицу.

  3. Компромиссные решения, характерные для недорогих устройств могут состоять в ревизии алгоритмов, управляющих контролем износа блоков запоминающей матрицы. Например, микропрограмма накопителя может принять решение о ремапе неисправного блока, сразу после единичного сбоя чтения или только в случае устойчивой ошибки, повторившейся после стирания.

Будем надеяться, что благодаря технологическим ухищрениям и трюкам шансы SSD-устройства дожить до Дня Благодарения проработать до окончания гарантийного срока возрастут, радуя потребителей и разработчиков бенчмарок случайными паузами в работе.

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

+66
голосов

Напечатать Отправить другу

Читайте также

"случайные ошибки чтения (random bit errors) отныне не следует считать поводом для отбраковки запоминающего блока"

А UBER (unrecoverable bit error rate) вообще запретить как параметр. Говорите, 10^-18? Боже, упаси.

Совершенные алгоритмы коррекции ошибок позволяют получать приемлемый уровень UBER. За скобками остается ухудшение предсказуемости времени выполнения операции. Это следует из практики использования сбойнувшего блока до прихода его в нестираемое состояние.

Есть ведь компромиссы: если браковать после первого сбоя накладно, можно поискать золотую середину, не дожидаясь Erase Fail и возможной потери пользовательских данных.

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT