Исследователи из Microsoft Research обработали громадную базу отчетов об ошибках, собранную системой Windows Error Reporting (WER).
Удалось собрать весьма представительную выборку с миллиона компьютеров и классифицировать три типа ошибок: аппаратные исключения CPU, однобитные ошибки DRAM (в зоне ядра), критичные для ОС ошибки чтения с диска.
Это первое столь масштабное исследование и многие его результаты далеко не тривиальны (хотя некоторые другие кажутся вполне очевидными).
Обнаружено, что вероятность аппаратных сбоев достаточно велика: порядка 1/190 при наработке хотя бы 30 дней за 8-месячный период. Причем данная оценка касается только CPU.
Другой интересный вывод - сбои редко бывают одиночными. Вероятность повторных ошибок в среднем на два порядка выше, чем первых, при этом от 20 до 40% ПК испытывают периодические, а не одиночные сбои.
Более детально с результатами и выводами данного исследования вы можете ознакомиться в блоге Игоря Дериева.
Стратегія охолодження ЦОД для епохи AI
| +11 голос |
|

