7 марта 2017 г., 16:05
Причиной сбоя серверов AWS, повлёкшего за собой в прошлую среду нарушения в работе облачных служб Adobe, Amazon Twitch, Docker, GitHub, iFixit, Kickstarter, Slack, Yahoo! Mail и многих устройств IoT, согласно официальному комментарию компании, стала опечатка, допущенная пользователем.
«Команда Amazon Simple Storage Service (S3) занималась устранением проблемы, замедлявшей работу системы выставления счетов S3. В 9:37 утра по Тихоокеанскому стандартному времени авторизованный участник команды в установленном порядке дал команду, которая должна была удалить небольшую группу серверов в одной из подсистем S3, используемой в процессе выставления счетов, — сообщается в блоге AWS. — К сожалению, из-за ошибки, допущенной при вводе команды, было удалено больше серверов, чем предполагалось».
Хотя сокращение ресурсов и является одной из ключевых эксплуатационных процедур, в данном случае было удалено слишком много серверов сразу и это произошло слишком быстро.
AWS заявила, что предприняла ряд мер, чтобы исключить подобные инциденты в будущем. В частности, модифицированная утилита теперь уменьшает ресурс более медленно. Кроме того, введены ограничения, блокирующие удаление серверов, если это оставляет какие-либо подсистемы без минимально необходимого им уровня ресурсов.
Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365