`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Архив или резервное копирование?

+44
голоса

Согласно данным Symantec, полученным в ходе исследований в 2010 г., более половины компаний хранят данные бессистемно, не применяя политики, неоптимально используют процессы резервного копирования и архивирования, более того, на половине предприятий в качестве архивов используются резервные копии, а сотрудники лишены возможности создавать собственные архивы на локальных машинах или жестких дисках. Так может ли резервная копия заменить архив и наоборот?

По оценке специалистов, к 2020 г. человечество создаст 35 трлн ГБ контента, и, совершенно очевидно, что несмотря на потребности где-то хранить все эти данные, использовать их единовременно никто не будет. Технологии архивирования и резервного копирования решают проблему хранения данных, тем не менее, их цели и задачи совершенно различны. По данным экспертов, не только в потребительском сегменте, но и в корпоративном секторе зачастую отсутствует понимание принципиальной разницы между этими двумя технологиями и существует убеждение, что в случае необходимости всегда можно воспользоваться данными резервных копий. Возможно, но каких затрат это потребует? Согласно исследованиям Symantec, 75% резервных копий состоит беспорядочно собираемых данных, а 25% помещаемых в бэкап документов вообще не должны там находиться.

По определению Метью Лоджа (Matthew Lodge), автора Metropolitan Corporate Counsel, «активное архивирование – это способ централизованного управления хранилищем, поддержки и хранению данных с обеспечением живого, активного доступа к любой его части». Активный архив индексируется, поэтому данные можно восстановить оперативно, с соблюдением регуляторных и поисковых норм, а любым находящийся в архиве элементом можно индивидуально управлять в соответствии с установленными политиками.

В отличие от архива, резервное копирование – это множественные копии данных, которые используются в процессе восстановления специфических подмножеств данных в случае, если что-то в системе сработало неверно. При этом правильно спроектированная резервная копия позволит откатиться на нужный срок назад и восстановить версию нужной давности. Как правило, полное резервное копирование выполняется еженедельно и хранится месяц (при этом ежедневно производится инкрементальное резервное копирование), ежемесячно создаваемая копия хранится год, и годовая – семь лет. В системах резервного копирования информация как правило просто потоком записывается на носитель, таким образом формируется кипа неструктурированной информации, из которой чрезвычайно сложно выделить один файл, а поиск нужных данных превращается в сложную, практически невыполнимую задачу.

Собственно, приложения резервного копирования и архивирования отличаются в нескольких принципиальных моментах: времени создания копии данных (при архивировании это происходит в реальном времени, в зависимости от типа данных практически мгновенно после создания, получения или окончания правки, в то время как резервное копирование выполняется по расписанию, когда система менее загружена), детализации (при архивировании сохраняется не только сам файл, но и все его метаданные).

Нужно оговориться, что некоторые системы резервного копирования, например от CommVault, хранят параллельно с резервной копией файл с метаданными и обеспечивает доступ к ним, однако е-поиск здесь не отличается высокой эффективностью. Именно эти дополнительные возможности позволяют конфигурировать ПО резервного копирования так, чтобы долговременная резервная копия выполняла одновременно и роль архива, но вряд ли такой подход можно назвать эффективным, хотя бы потому, что для восстановления документа желательно знать время его создания. Кроме того, создание подобных архивов не решает еще одну важную задачу, а именно автоматического освобождения дискового пространства – напротив, помимо исходных данных на ресурсы хранения падает дополнительная нагрузка в виде копий.

Конечно, можно вынести резервное копирование в «облако», но этот подход также имеет ряд недостатков. Во-первых, для эффективной работы системы необходимо хранить запись каждого созданного либо измененного документа в облаке (придется позаботиться о достаточно широком канале связи), а также разработать систему имен, которая даст возможность легко оперировать с версиями. Во-вторых, сервисы резервного копирования создают в «облаке» зеркало всех файлов, а затем самостоятельно отслеживают изменения в документах и структуре файлов и непрерывно и автоматически реплицируют их в «облако». Это позволяет всегда иметь в распоряжении последние версии, однако если вынести на сервис старые документы, а затем их удалить с ПК, логика системы предпишет убрать их и из зеркала, хранимого в «облаке». Конечно, можно положиться на версии (как правило, все итерации записываемых файлов хранятся на протяжении 30 дней) и даже будучи удаленными с ПК файлы показываются в директории резервного копирования. На самом деле это ложное чувство безопасности пройдет очень скоро, как только версии будут удалены из резервных копий. Ну и в-третьих, отказ доступа к облаку (который в действительности имеет очень малую вероятность ) может привести к значительным убыткам.

«Облачные» сервисы, вероятно, в большей степени подходят для архивов, которые имеют дело со статичными объектами, а для доступа к ним применяются динамические технологии. Архивируемые документы специально отбираются, сохраняются и каталогизируются для того, чтобы в будущем иметь возможность оперативно затребовать нужную информацию, воспользовавшись системой поиска. При этом наряду с самим документом хранится история файлов (кем и когда они созданы, редактировались, пр. ), ключевые слова, ссылки, пр., и при вынесении архив, исходный файл, как правило, удаляется. Хотя вендоры ПО стремятся обеспечить обратную совместимость с более ранними версиями приложений, со временем данные неизбежно устаревают настолько, что к ним нельзя получить доступ с помощью современных приложений. Многие архивные решения решают данную проблему, предлагая встроенные возможности конвертации и преобразуют архивируемые документы в универсальные форматы (например PDF). Главное же достоинство архивов – возможность оперативно получить доступ к нужным данным за счет широких поисковых возможностей.

Так можно ли спроектировать архив так, чтобы использовать его и как резервную копию? Во-первых, к архиву такого типа нужно обеспечить простой доступ, и для остальной среды он должен выглядеть как файловая система. Доступ к данным архива должен быть оперативным, а это значит, что скорее всего необходимо предусмотреть диск в клиентской части системы наряду с другими устройствами хранения, возможно и более медленными, как например LTFS. Система должна получать данные, сохранять их на диске для быстрого доступа, и затем, при необходимости, делать вспомогательные копии на другие архивные устройства следуя настраиваемым политикам, которые определяют, на протяжении какого времени должны оставаться данные на быстром диске, сколько копий необходимо сохранить на другие носители и, пр. и все это незаметно для администратора, и что еще важнее – для пользователя. Поиск данных в этой распределенной системе так же прост, как сканирование файловой системы архива в поисках нужного файла, даже когда файлы перемещены на ленту, при этом системы LTFS уже поддерживают индексирование, а вскоре ожидается и контекстный поиск.

В отдельных случаях такой подход использования архивов в качестве резервных копий может оказаться эффективным. Примером могут служить юридические компании, работающие с огромными массивами данных и хранящие все документы и судебные дела, над которыми когда-либо работали сотрудники. Здесь возможности оперативного поиска прецедентов и документации, связанной с аналогичными процессами, оказывает прямое влияние на бизнес-процессы. Для таких компаний ведущие эксперты уже разработали стандартный подход решения дилеммы архивирование-резервное копирование, который называется правилом ABC (Archiving beats Backup in the Courtroom – в суде архивирование побеждает резервное копирование).

Для остальных же компаний рекомендации не столь четкие, в одном эксперты единодушны – не стоит отказываться ни от одной из двух систем в пользу другой, а применять их в комплексе, оптимизировав под конкретные бизнес-процессы компании. Основой для работы таких систем должны быть политики автоматического хранения информации (что должно удаляться, что храниться и на протяжении какого времени), дополненные системой предотвращения утери данных. Во всех средах приложений и резервного копирования необходимо использовать дедупликацию. Резервное копирование не рекомендуется применять для долговременного хранения и создания пулов данных, предельный срок жизни резервных копий должен составлять 30-60 дней, затем они должны автоматически удаляться, это позволяет значительно сократить время восстановления. Кроме того, необходимо использовать полнофункциональную систему архивирования – по оценке экспертов в средах с избыточным хранением долговременных резервных копий вместо активов стоимость доступа к данным может оказаться в 1,5 тыс раз дороже, чем собственно их хранение.

+44
голоса

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT