`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Дмитрий Гудков

Oracle Exadata: а что на практике?

+11
голос

Анонс программно-аппаратного комплекса Oracle Exadata созданного в прошлом году при сотрудничестве с HP, вызвал волну дискуссий в блогосфере, а "сейлы" Oracle стали активно предлагать это решение крупным заказчикам. Прошел год, и несмотря на то, что наличие реальных (кто ж сейчас верит маркетологам?) внедрений Exadata оставалось для обозревателей рынка под большим вопросом, Oracle выпустила следующую версию Oracle Exadata v2, в этот раз уже на Sun-овском железе (что и понятно). Кроме заявленной высокой производительности, было также озвучено, что Oracle Exadata v2 – это универсальное решение для OLTP систем и для BI/DWH, благодаря возможности использовать специальное индексирование данных для поколоночного их представления, подобно Sybase IQ или Vertica (хотя, строго говоря, последняя хранит данные по колонкам на физическом уровне и вообще не использует индексы). Это заявление также вызвало много дискуссий. Ниже приводится переведенная заметка из популярного журнала Intelligent Enterprise, которую написал Нейл Раден (Neil Raden), основатель компании Hired Brains специализирующейся на консалтинге в области BI и аналитических хранилищ данных.

"Я не могу однозначно сказать, где заканчивается обзор IDC продукта Exadata V2, а где начинается мнение Стефана Суоера (Stephen Swoyer), но в последней статье "Почему Oracle Exadata может быть привлекательной для CXO" , были озвучены несколько небесспорных утверждений.

С одной стороны Суоер пишет: "Многие из крупейших в мире аналитических хранилищ данных и OLTP систем продолжают использовать Oracle” и далее добавляет “многие из крупнейших комбинированных ХД и OLTP-конфигураций также работают на Oracle”. Это, конечно же, может быть правдой, но ключевым словом тут является “работают”. Я не знаю ни одной “комбинированной” инсталяции OLTP и аналитического хранилища данных, которая бы действительно показывала хорошую производительность. И для этого есть масса причин, например:

  • Управление нагрузкой (workload management) принципиально различается. OLTP – это маленькие транзакции, многие из которых осуществляют запись, в то время как аналитические хранилища данных – это редкие, но объемные загрузки данных в сочетании с очень большими (если сравнивать) выборками. Активность намного менее прогнозируема и сильно неравномерна по сравнению с OLTP.
  • Физическая схема таблиц различается из соображений производительности.
  • Как правило в ХД сущестувет потребность в агрегировании данных.
  • Для OLTP и BI-систем используются разные стратегии оптимизации.

Что такое комбинированная OLTP+ХД система в конце концов? OLTP-система служит для операционных целей, в то время как хранилище данных совмещает данные из нескольких систем. Значит ли это, что “комбинированная система” предлагает аналитический доступ только к одной OLTP системе? Это не звучит как очень хорошая идея. Я надеюсь, что я проживу достаточно долго чтобы увидеть мечту комбинированных СУБД действительно реализованной – когда данные вводятся и хранятся в логичном для них месте, и далее используются для любых необходимых целей без репликации. Это было бы фантастично, но это из разряда нереального.

Хранилища данных в прошлом служили большой свалкой данных, на которой строились витрины данных (datamarts), кубы и прочие структуры предназначенные для решения тех задач, ради которых собственно и создавалось хранилище. Другими словами, многие из “больших” оракловских хранилищ данных – не более чем “склады” этих данных. Но никто уже не видит аналитические хранилища данных подобным образом. Неважно, имеете ли вы 100 ГБ или 100 ТБ, эта база данных должна предоставлять глубокую аналитику сама по себе. Большие оракловские базы данных так не делают. А вот конкуренты – делают.

Поэтому исходное предположение, что Exadata V2 собирается перетянуть все существующие внедрения на старых SMP-платформах на новую платформу Exadata, неверно по двум причинам. Во-первых, если вендор вашей СУБД не способен предложить адекватный взгляд на решение проблемы (прим. пер. – в тексте используется идиоматическое выражение "can't cut"), вряд ли стоит испытывать судьбу, полагаясь на наиновейшие обещания. А во-вторых, Oracle имеет абсолютно нулевую компетенцию в области массивно-паралельных платформ (massively parallel platform). Кто-нибудь помнит Oracle PQO для SP2? Это был последний раз, когда Oracle пытался выиграть рынок хранилищ данных с высоко масштабируемой платформой. Не сработало. И тот же RAC – ужасный выбор для построения хранилища данных.

Exadata должна на практике доказать свою способность управляться с хранилищами БОЛЬШИХ ДАННЫХ, а СУБД Oracle в конце концов должна получить ту функциональность для аналитики, которую ее конкуренты уже демонстрируют."

+11
голос

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT