`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Рынок СУБД для хранилищ данных: в непрерывном движении

Статья опубликована в №7 (624) от 19 февраля

+22
голоса

В последние годы для рынка СУБД для построения хранилищ данных (data warehouse database management system, DW DBMS) характерна жесткая конкуренция. Расширяя функциональность своих продуктов и увеличивая их продажи, компании Teradata, IBM и Oracle прилагают немало усилий, чтобы отвоевать наибольшую его долю. В прошлом году к тройке лидеров присоединилась и Microsoft со своим решением, возможности которого высоко оцениваются средним бизнесом.

Рынок СУБД для хранилищ данных в непрерывном движении

Чтобы не быть голословными, в данном обзоре рынка систем управления хранилищами данных (СУХД) мы будем опираться на последние отчеты компании Gartner в этой области – «магические квадранты» за 2006 г. и 2007 г. Но прежде чем перейти собственно к обсуждению темы, обсудим, что представляют собой решения класса СУХД.

Традиционные СУБД – это программные системы, обеспечивающие функции по манипуляции базами данных (БД) в информационном хранилище. Их подвиду, корпоративным СУХД, присущи следующие особенности: поддержка доступности данных для front-end ПО, развитые технологии параметризации рабочей нагрузки, а также возможности указания различных характеристик доступа конечных пользователей к одним и тем же сведениям. Под корпоративными информационными хранилищами данных понимают предметно-ориентированный, интегрированный, поддерживающий хронологию набор данных (репозиторий), организованный для целей поддержки управления предприятием. Дальше углубляться в детали нет необходимости. Осталось отметить, что по версии Gartner, различают малые по объему хранилища данных (менее 5 ТБ), средние (5–20 ТБ) и большие (свыше 20 ТБ). При этом в расчет берется лишь фактическое количество информации, полученное из источника. Структуры, создаваемые при построении хранилища, не учитываются.

Современные СУХД подвергаются следующим видам рабочей нагрузки:

  1. Непрерывная загрузка данных (с пренебрежимо малой задержкой) – обеспечивает работу приборных панелей (dashboard) и формирование промежуточных отчетов;
  2. Потоковая загрузка – необходима, так как менее изменчивая информация не требует столь частого обновления, как более динамичная;
  3. Обработка проходящих ежедневно тысячами стандартных отчетов, влекущая применение оптимизационных структур;
  4. Обеспечение поддержки тактического бизнес-анализа, при которой участники тех или иных бизнес-процессов с ограниченным опытом применения языка запросов используют разработанные BI-архитектором кубы и таблицы;
  5. Обработка постоянно увеличивающегося числа уникальных запросов от пользователей-«горняков» (data miners) со случайными непредсказуемыми способами применения данных, без какой-либо возможности в приспособлении под них;
  6. Функционирование аналитических OLTP-приложений (в реальном масштабе времени), требующее высокой доступности хранилища данных и скорости обработки запросов.

Из них четыре (1, 3, 5 и 6) Gartner выделяла в своем отчете за 2006 г. В 2007 г. прибавились еще две, следовательно, задачи, возлагаемые на СУХД, растут. Подобные решения все дальше отходят от средств обеспечения работы инструментов бизнес-анализа в направлении систем поддержки всей аналитической инфраструктуры корпорации. С другой стороны, растущая сложность и размер СУХД неизбежно влекут применение все больших ресурсов для их обслуживания, в том числе и оптимизации их работы. И тем не менее потребность в дополнительных специалистах и емких хранилищах (для специальных структур, призванных повысить эффективность использования БД) следует принимать как закономерное следствие увеличения значимости информации.

Отношение суммарного объема хранилища данных к емкости исходных БД меняется на протяжении всего периода существования хранилища. На начальной стадии, когда много различных приложений инициируют многочисленные стратегии оптимизации и само хранилище мало заполнено, соответствующий показатель довольно высок. Но с увеличением объема полезных данных, значение показателя падает, ведь не обязательно, чтобы каждый объект данных требовал дополнительное пространство для оптимизации. Также к его уменьшению ведет и то, что, в связи с общим ростом информационного хранилища, емкость, выделенная под индексы, остается прежней. Задачи оптимизации ложатся на плечи администраторов, которым предписывается тесное сотрудничество с бизнес-департаментами компании для определения действительно необходимых блоков записей. Это исключает варианты, когда детальная информация хранится дольше положенного срока и тем самым ухудшает производительность.

С 2006 г. популярность начали приобретать распределенные хранилища данных, где информация логически делится на домены и размещается без дублирования на различных площадках. Обоснованность этого метода нередко исходит из соображений безопасности. Другая наблюдаемая сегодня тенденция состоит в предоставлении хранилищ данных в виде управляемых сервисов (managed service). Эта концепция, предложенная Kognitio, заключается в том, что поставщик решения по соответствующему контракту обслуживает СУХД заказчиков через своих партнеров. В прошлом году ее взяла на вооружение компания Greenplum. Вообще же, по мнению аналитиков, в ближайшее время применение данной модели должно существенно увеличиться. В недалеком будущем идея, по всей видимости, воплотится в отдельный вид услуг (Software as a Service) и будет востребована малым и средним бизнесом из-за недостатка ресурсов для содержания собственных хранилищ данных. И, наконец, третий тренд заключается в том, что повышается спрос на так называемые витрины данных (data mart). Последние представляют собой подмножества хранилищ данных, организованные для решения аналитических задач конкретного подразделения фирмы (т. е. по одному из направлений ее деятельности) или конкретных пользователей (групп), и применяемые вместе с определенным ПО как традиционным (например, ERP-система от SAP), так и характерным для данного вида рабочей нагрузки. Следствием эксплуатации витрин данных могут быть оптимизации корпоративных хранилищ данных, которые при этом частично разгружаются.

Кто есть кто

Лидерами рынка СУХД сегодня являются четыре компании: Teradata, IBM, Oracle и Microsoft. Вероятно, скоро к ним присоединится Sybase, весьма перспективно выглядит и MySQL. Рассмотрим сильные и слабые стороны каждой из них.

Рынок СУБД для хранилищ данных в непрерывном движении
На рынке СУХД продолжает лидировать Teradata. Oracle немного опередила IBM. Несомненным прогрессом может похвастаться Microsoft. Sybase cущественно укрепила позиции

Teradata занимается сугубо «хранилищным» бизнесом уже более 27 лет. У компании более тысячи клиентов, которые в прошлом году принесли ей 1,7 млрд долл., что на 10% выше аналогичного показателя 2006 г. В портфеле у поставщика функционально развитые программно-аппаратные комплексы (appliance), ориентированные на большие и сложные среды с поддержкой смешанных рабочих нагрузок. Возможности ПО управления от Teradata по достоинству оцениваются специалистами. У нее прочные позиции на таких вертикальных рынках, как розничная торговля, финансовый сектор, телекоммуникации и производство. Наконец, уже больше года компания предлагает решения, наряду с основанными на ОС MP-RAS (собственная закрытая UNIX-подобная система поставщика), разработки на платформе SUSE Linux, позиционируемые, естественно, как экономически выгодные. Согласно последним данным, они пользуются спросом.

Тем не менее в сегменте SMB Teradata постепенно начинают теснить компании с развитыми СУБД – IBM, Microsoft и Oracle, неплохо справляющимися с задачами построения хранилищ данных вместимостью до 10 ТБ. Кроме того, ощущается ценовое давление со стороны новичков (DATAllegro, Greenplum и Netezza) с более доступными решениями. В сложившейся ситуации компания вынуждена будет создавать предложения для малых БД, а также расширять продуктовую линейку менее дорогостоящими системами. Наконец, Teradata в глазах потенциальных клиентов еще не до конца «оправилась» от разделения с NCR, поэтому ей еще предстоит поработать над своим образом.

Oracle отличается широтой географии присутствия и значительной клиентской базой. Ее решение Real Application Clusters со средством Automatic Storage Management, характеризующееся довольно высокими параметрами доступности, способно обслуживать, в том числе, и большие хранилища. Благодаря выпуску Database 11g в августе 2007 г., оснащенной, как говорится, по последнему слову техники, поставщик существенно упрочил свои позиции на рынке СУХД. Oracle сотрудничает с производителями оборудования, реализуя программные комплексы на заказ, а также приспособленные под серверы (например, Dell, EMC) конфигурации СУБД. Немаловажно и то, что ПО от корпорации может исполняться на базе разных операционных систем (Linux, UNIX и Windows), а также включает бесплатный ETL-инструмент Oracle Warehouse Builder.

К недостаткам программных средств для построения хранилищ данных от Oracle специалисты относят существенный объем ручной работы для их обслуживания и избыточную емкость накопителей для целей оптимизации. В свою очередь заказчики часто сетуют на неотчетливые схемы оплаты. Так, стоимость продления поддержки может возрасти на 22% от указанной в контракте. Также клиентам приходится разбираться, какие дополнительные составляющие СУБД поставляются вместе с ней, а какие необходимо приобретать отдельно.

IBM располагает и appliance-решением, и сугубо программным. В первом случае заказчикам предлагается комплекс Balanced Warehouse, который составляют сервер и система хранения (либо System p с ОС AIX, либо System x – под управлением Linux), ПО DB2 Warehouse (с применением СУБД DB2 9-й версии), а также услуги поддержки (Balanced Configuration Units). Второй вариант предполагает использование только DB2 Warehouse, включающей довольно мощные инструменты настройки рабочей нагрузки, средства преобразования данных, возможности интеграции с решениями SAS и SPSS с поддержкой технологий извлечения информации и визуализации и пр. Количество клиентов, эксплуатирующих хранилища данных на базе решений IBM, исчисляется сотнями.

Однако, как и в решениях Oracle, недостатком IBM DB2 Warehouse признают достаточно внушительный полный объем хранилища (превышение емкости исходных данных достигает от 1,3 до 5 крат). Интересно, что подразделение IBM Software Group в некотором роде конкурирует с «аппаратными» департаментами Голубого Гиганта, поскольку те не только реализуют оборудование для СУХД сторонних поставщиков, но и совместно разрабатывают appliance-предложения и оказывают услуги по их поддержке. Бизнес есть бизнес.

В прошлом году к тройке лидеров присоединилась Microsoft (в 2006 г. она находилась на границе между ними и претендентами). Сегодня темпы потребления ее продукта SQL Server 2005 для построения хранилищ данных, особенно небольших по объему, весьма высоки. Очевидно, немаловажную роль в этом играет вспомогательное предложение корпорации – при покупке SQL Server 2005 Enterprise Edition, заказчик дополнительно получает еще такие программные средства, как SQL Server Analysis Server, SQL Server Reporting Services и SQL Server Integration Services, обеспечивающие функции OLAP, отчетности и интеграции данных для механизмов ETL. И все это по конкурентоспособной цене. Масштабируемость СУБД от корпорации находится на должном уровне, как результат – решение может «расти» вместе с бизнесом. Благодаря обширной экосистеме Microsoft проблем с поддержкой ПО у клиента, как правило, не возникает. Наконец, в III квартале должен выйти SQL Server 2008, в котором заявлено множество усовершенствований, касающихся организации хранилищ данных, что указывает на серьезные намерения поставщика относительно рынка СУХД.

Между тем, у Microsoft весьма скромный опыт в применении SQL Server для построения больших хранилищ данных. Хотя подобные внедрения время от времени и имеют место, на рынке все еще ощущается дефицит лучших практик и соответствующих специалистов. Согласно прогнозу Gartner, пройдет два, а то и три года, прежде чем организации будут рассматривать СУБД SQL Server наравне с другими решениями. Еще один минус платформы от Microsoft состоит в том, что использование кубов SQL Server Analysis Server часто ведет к значительному повышению избыточной емкости хранилищ (в 2–6 раз по отношению к исходным данным). Ну и, разумеется, SQL Server исполняется только на платформе Windows Server, а значит, не может похвастаться такими возможностями совместимыми с другими ОС, как конкуренты. Есть мнение, что некоторые предприятия не видят в SQL Server инструмент построения хранилища данных прежде всего потому, что не приветствуют введение ОС Windows Server в среду своих ЦОД.

Попасть в зону лидеров настойчиво стремится Sybase. Благодаря использованию столбцовых таблиц ее IQ analytic server (на основе СУБД Sybase IQ) отличается более чем приличными показателями сжатия информации, высокой производительностью работы, обладает поддержкой ETL, что делает решение превосходной платформой для аналитических применений (например, для организации витрин данных). Этот факт выражается в финансовой стабильности компании и быстром росте ее доходов, составляющем ежеквартально порядка 40%. Недавний альянс с подразделением IBM System p открыл для Sybase новый и очень желанный канал продаж. В планах компаний разработка комплекса Analytic Data Warehouse Appliance (на базе той же IBM System p).

Тем не менее Sybase по-прежнему пытается освободиться от ярлыка поставщика традиционных СУБД. Несмотря на довольно успешные шаги на рынке систем управления хранилищами данных, компании все еще необходимо серьезно поработать над тем, чтобы избавиться от статуса малого бизнеса и потенциальной мишени для поглощения. Сверх того, архитектура со столбцовыми таблицами по производительности не совсем хорошо подходит под требования сред корпоративных хранилищ данных, к тому же ее взяли на вооружение и другие участники рынка – новички ParAccel и Vertica, а также MySQL, что грозит втягиванием в конкурентную борьбу.

Наконец, MySQL (ею мы и закончим данный обзор, так как другие игроки не присутствуют в Украине и мы их рассматривать не будем), приобретенная Sun Microsystems, в последние несколько лет существенно укрепила свои позиции на рынке СУХД: увеличила клиентскую базу, расширила функциональность своей продукции, провела работы по развитию профессиональных сервисов, заключила партнерские соглашения со сторонними разработчиками. Благодаря сравнительно низкой стоимости, MySQL Enterprise пользуется популярностью у малых фирм с небольшими БД (200–500 ГБ). Впрочем, случаются и внедрения для построения терабайтовых хранилищ с применением технологии под названием sharding, состоящей в разбиении БД на части меньше терабайта. Хотя это и влечет рост ресурсозатрат, как шаг в направлении больших хранилищ данных, такие действия вполне целесообразны.

Чтобы выйти из тени лидеров и достойно конкурировать с новыми Open Source-участниками рынка, такими как EnterpriseDB, ParAccel и Vertica (использующих СУБД PostgeSQL), компании предстоит увеличить клиентскую базу с хранилищами объемом свыше 1 ТБ, а также осуществить внедрения для средних хранилищ, продемонстрировав уровень масштабируемости своего ПО. СУХД MySQL недостает ряда специальных возможностей и действенных средств управления. В общем, Sun Microsystems теперь есть над чем поработать.

+22
голоса

Напечатать Отправить другу

Читайте также

Странно что нет ни слова об HP, которая весьма агрессивно сейчас развивается и например вошла в такой традиционный терадатовский эккаунт, как Walmart.

Gartner еще не видит в HP серьезного игрока рынка СУХД.

p.s.: материал расширен. я включил в него те данные, которые были срезаны при верстке статьи

Gartner уже видит в HP серьезного игрока рынка СУХД:
http://mediaproducts.gartner.com/reprints/ncr/article2/article2.html

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT