`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

MS SQL Server: теперь уже с MPP, а будет и с поколоночным хранением и веб-репортингом

Вчера Microsoft анонсировала первую бету следущего поколения SQL Server (Denali). Версия CTP1 (Community Technology Preview) уже доступна для загрузки. Denali будет преемником SQL Server 2008 R2, выпущенного в этом году.

Новая версия, как положено, будет иметь массу разных новшеств. Из того что касается BI и хранилищ данных, в Denali ожидается:

  • Механизм для по-колоночного хранения данных (кодовое название Apollo). Вероятно, это что-то типа Oracle Exadata Storage System, но подробных деталей пока нет. Microsoft заявляет об увеличении скорости выполнения запросов в 10 раз (Ораклу бы их скромность) и отсутствии необходимости строить таблицы с аггрегатами.
  • Веб-клиент для интерактивного анализа данных и отчетности (кодовое название Crescent). Некое развитие PowerPivot, но подробностей опять же пока нет.

Несмотря на доступность CTP1 пока нет определенности в дате финального релиза -- даже неясно выйдет ли он хотя-бы в 2011 году. Microsoft заявляет что "продукт будет тестироваться столько времени, сколько будет требоваться для получения стабильного релиза".

Кроме того Microsoft заявила о начале продаж SQL Server 2008 Parallel Data Warehouse.

Parallel Data Warehouse -- программно-аппаратный комплекс (appliance), основанный на DATAllegro, купленном 2 года назад. Представляет собой массивно-паралельную СУБД на базе SQL Server, преднастроенную и сконфигурированную на железе от HP (и видимо Dell). Версии на серверах IBM не будет. Цены в США стартуют от приблизительно $13,000 за Терабайт (по другим данным $38,225 за CPU). По сути это аналог Netezza, приобретенной недавно IBM, только непонятно использются ли специализированные контроллеры дискового ввода-вывода (как в Netezza).

PS. Microsoft продолжает медленно, но уверенно продвигаться в сегмент BI и хранилищ данных. И шаги, которые она для этого делает -- грамотные и разумные. По-колоночное хранение данных, appliances -- Microsoft неплохо понимает куда дует ветер.

Источник: bi-review.ru

IBM Cognos 10 BI - первые впечатления

Удивительно как IBM сумела до последнего дня сохранить в тайне какие-либо подробности новой версии Cognos -- твиттер молчал как рыба, гугл тоже мало чего внятного мог сказать по этому поводу. Никаких утечек -- даже как-то непривычно для нашего времени. Тем более было интересно взглянуть на видео-ролики Cognos 10 BI. Кстати, если кому было лень заполнять все 22 поля формы (или сколько их там), чтобы таки добраться до роликов -- вот прямая ссылка.

Что бросилось в глаза - конечно же новое приложение Business Insight, претендующее на главное место во всей линейке продуктов. Это то, чего так давно не хватало Cognos -- инструмент для ad hoc анализа, ориентированный на нетехнических пользователей. Очень умная и правильная идея добавлять на рабочий стол не абстрактные показатели и размерности, а сразу готовые аналитики - готовые графики, таблицы и индикаторы из общего репозитария. Умная потому что подобные аналитики - это отдельный уровень абстракции, более приближенный к бизнес-пользователям и это дополнительный шаг от информации к знанию, потому что данные сами по себе -- нейтральны, а интерпретация этой информации с помощью правильной визуализации -- вот что имеет смысл. Помнится мне подобная идея была в некогда существовавшем продукте BusinessObjects Performance Manager, хорошо задуманном, но отвратительно сделанном, из-за чего его и отправили на свалку, ибо терпеть все эти баги клиентам было уже невозможно.

Но вернемся к Cognos 10 Business Insight. На дешборд добавлять можно все что есть в Cognos -- таблицы, графики, фильтры для динамической выборки прямо на дешборде, деревья показателей (scorecarding), объекты TM1, графики SPSS и реал-таймовую аналитику (не совсем понял что это -- имеется в виду контент Cognos Now! ?).

Новый интерфейс Cognos безусловно лучше старого. Ему не хватает point-and-click-овости QlikView, но шаги сделаны в верном направлении.

Business Insight Advanced позволяет самостоятельно делать ad hoc запросы с помощью метаданных. А также, нетехнические пользователи могут добавлять собственные данные в отчет (например из Excel), причем можно связывать размерности с уже существующеми метаданными не покидая Business Insight (!). Возможности Business Insight таковы, что отпадает надобность в Query Studio -- функциональность Business Insight похоже перекрывает QS с головой, а также частично покрывает область применения Analysis Studio. На роликах видно что в Business Insight есть возможность задавать собственную формулу вычисления -- интересно насколько сложные формулы можно вводить?

Следующее новшевство, которое заслуживает внимания -- это интеграция с Lotus Connections. В отличие от ветерана Lotus Notes, мало кто слышал о Lotus Connections -- корпоративной социальной платформе, которая включает в себя обсуждения, вики, блоги, профайлы и прочие известные социальные инструменты, но в корпоративной оболочке. Теперь, когда Cognos интегрирован с Lotus Connections можно вставлять контент Cognos например непосредственно в обсуждения и блоги Lotus Connections и наоборот -- можно привязывать инициативы сотрудников непосредственно к дешбордам Cognos Business Insight. На практике это означает, что если бигбосс посмотрел на свой дешборд по продажам и увидел падение продаж какого-то продукта, то он может сразу через Lotus Connections инициировать мероприятия для анализа и исправления ситуации и видеть дальнейшие действия сотрудников в этом направлении (отчасти это чем-то напоминает SAP Streamwork, только как мне кажется здесь подход более фундаментальный). И в этом сказывается мощь IBM -- пока вендоры помельче прикручивают к отчетам блеклое подобие форумов, IBM сравнительно легким движением руки может прикрутить к Cognos ни много ни мало целую социальную платформу со всеми bells & whistles.

Из других социальных фич в 10-й версии Cognos стоит отметить возможность комментировать отдельные ячейки таблиц, причем учитывается переход по drill-down/up на другие уровни иерархий. Похожая функциональность была в Cognos Planning -- так что появление ее в BI-пакете логично. К сожалению комментарии привязаны к данным только в таблицах, а жаль -- я все жду когда BI-вендоры научатся отображать комментарии, привязанные к областям графиков.

Новинкой в Cognos 10 также является Active Report -- интерактивные дешборды, конструируемые в Report Studio и способные работать в офф-лайне. Не совсем понял предназначения этого загадочного инструмента. Для нетехнических пользователей он слишком технической, для продвинутых -- вряд ли полезный. Это либо "наш ответ Чемберлену QlikView Xcelsius" со стороны Cognos, либо попытка заменить Go! Dashboards на что-то более вразумительное и практичное.

Итого, первое впечатление от 10-й версии Cognos -- это действительно новая веха для Cognos. Постарались учесть слабые места предыдущих версий - слабую интерактивность, чрезмерную техничность интерфейсов. Очень похвально движение в сторону социальных функций и совместной работы, потому что информация без правильной интерпретации -- ничто. Ну и конечно видно невооруженным взглядом вливание в стройные ряды IBM -- точки интеграции выбраны удачно, существующие и потенциальные заказчики IBM это оценят.

В остальном Cognos остается Cognos-ом -- полновесная масштабируемая BI/CPM-платформа для крупных предприятий, хорошо продуманный конструктор для создания общекорпоративных управленческих информационных систем, однако со сложной моделью метаданных и интерфейсом, требующим основательного обучения пользователей, что в конце концов выливается в немалые трудозатраты по настройке и сопровождению всего этого хозяйства.

Источник: bi-review.ru

SAP анонсировал BusinessObjects 4.0

На прошедшей в США конференции ASUG (American SAP User Group) было объявлено о выходе следующего поколения BI-платформы SAP BusinessObjects, получившей индекс 4.0. Новая платформа разрабатывалась в недрах R&D Business Objects больше двух лет под кодовым названием Aurora.

"Около 2.5 лет назад, после объединения SAP и Business Objects, мы запустили агресcивную стратегическую инициативу по консолидации и гармонизации всего продуктового портфолио BusinessObjects, а также по интеграции этого портфолио с NetWeawer, результатом которой стала новая версия BusinessObjects, которая выходит в этом квартале", заявил Вишал Сикка (Vishal Sikka), Chief Technology Officer и член совета директоров SAP.

Чем может порадовать новая версия?

Во-первых, федерация данных на уровне юниверса — теперь юниверсы могут покрывать не один, а несколько источников данных. BusinessObjects оставался наверное последним крупным BI-вендором, у которого одна схема метаданных не позволяла описывать более одного физического источника данных (без использования отдельно лицензируемого и недешевого Data Federator). И Oracle и Cognos могли похвастаться этим уже давно, но теперь позиции более-менее уравнялись.

Еще одно полезное нововведение — Xcelsius теперь может полноценно работать с юниверсами, не прибегая к разным костылям типа Query-as-a-Service.

Кроме того, новая версия работает только на 64х-битной платформе, поэтому желающим проапгрейдиться возможно прийдется заодно и проапгрейдить "железо".

Новый релиз призван глубже интегрировать разные продукты BusinessObjects.  Как было заявлено - это первый релиз, который унифицирует работу всех клиентских приложений — таких как Xcelsius, Crystal или Explorer.

"€Один дизайн для всего - является ли это отчетами, дешбордами, ad hoc анализом, исследованием данных в Explorer, интеграцией с SAP Netweaver, Identity Management, Life-Cycle management, Solution Manager или Business Warehouse", сказал г-н Викка.

Это несомнено хорошие новости для клиентов BusinessObjects и тех, кто рассматривает эту платформу для использования в будущем. Ранее продуктовый портфель BusinessObjects представлял собой набор замечательных по-отдельности продуктов, но слабо знакомых друг с другом, что представляло проблему при интеграции контента, обучении пользователей, разработке и сопровождении всего этого мини-зоопарка. Новый релиз похоже направлен на решение этой давней проблемы, а также предоставляет несколько долгожданных новшеств, за отсутствие которых BusinessObjects регулярно критиковался ранее.

С другой стороны, налицо дальнейшее развитие тенденции уравнивания традиционных BI-платформ — с каждым годом они становятся все похожее и похожее. И вряд ли можно ожидать от них каких-то кардинальных изменений — уж слишком много инвестировали клиенты в их продукты, чтобы что-то кардинально менять. Так что если и будет революция в бизнес-анализе, то мне кажется, она прийдет совсем с другой улицы.

Источник: bi-review.ru

Вышла 10-я версия QlikView

Вчера появился официальный пресс-релиз о выходе 10-й версии QlikView. Нельзя сказать, что это стало сюрпризом — первые анонсы следующей версии появились еще в мае, а с лета шло активное бета-тестирование. Непонятно только почему произошла задержка на пару дней — по аналогии с прошлым годом логично было бы ожидать появления 10-й версии 10 октября 2010 года – т.е. 10/10/2010. Но неважно – вышла и вышла. Итак, что можно ожидать в ней нового и интересного:

  • Распаралеливание загрузки данных – загрузочные скрипты QlikView теперь понимают многоядерность и могут распаралеливать загрузку на несколько потоков. Это несомненно хорошая новость — обычная скорость загрузки в 9й версии QlikView находилась в пределах 2-3млн. строк в секунду для QVD файлов (что в общем неплохо) и 20-30тыс. строк в секунду для текстовых файлов и ODBC/OLE DB источников (что явно маловато). Теперь можно надеятся на улучшение этих показателей в несколько раз.
  • Новый AJAX-клиент. Точнее существенно более функциональный, чем старый. Так как новый AJAX-клиент теперь ничуть не слабее Java-клиента в 9й версии, то необходимости в Java-клиенте в 10й версии нет, а посему его упразднили. Что разумно, потому что во-первых не нужно заморачиваться с Java на клиентских машинах, а во-вторых — клиентских приложений у QlikView и так было многовато и их функциональность частично перекрывалась.
  • QlikView Extensions — возможность делать/использовать кастомные модули визуализации данных – например диаграммы Гантта и т.д. Потенциально — очень мощная штука, особенно если у разработчиков будет что-то типа Extensions Market — место где можно было-бы обмениваться самодельными модулями визуализациями. Уж очень идея напрашивается.
  • QlikView Data Exchange — формат маппирования внешних данных на структуру данных QlikView. По-идее, это должно позволить создавать коннекторы для ETL-средств, которые позволяли бы грузить данные сразу в QVD. Если это окажется так, это будет очень неплохо — скриптовый язык QlikView хоть и неплохой, но все же его не сравнить с промышленным ETL типа Informatica или IBM Information Server.
  • Всякое разное – более удобный ассоциативный поиск (это хорошо), Мекко-диаграммы (бестолковая штука), централизованное управление user accounts (наконец-то), связанные объекты, теги метаданных (давно пора) и т.д.

Чуть детальнее — в официальной брошуре What’s new in QlikView 10

В общем и целом — очень полезные нововведения. Очевидно желание QlikView сдвинуться в сегмент более крупных внедрений – QV Exchange, теги метаданных, ускорение загрузки свидетельствуют об этом . Не знаю, насколько можно говорить о новом поколении — на мой взгляд справедливее было бы назвать версию 9.5, но маркетологам QlikTech виднее — уж они-то известные специалисты по выдаванию действительного за желаемого.

4й квартал 2010 года обещает быть богатым на интересные новинки в Business Intelligence. На подходе — Tableau 6, кроме того новая, и по слухам, совершенно убойная 9-я версия Cognos, а значит и BusinessObjects как всегда что-нибудь интересное тоже засветит. Так что — ждем-с.

Источник: bi-review.ru

IBM покупает Netezza

IBM покупает Netezza. Приблизительно за 1.7млрд.долл. или 6.8 годовых продаж, ожидаемых в 2010году, что означает почти 9 оборотов 2009 года - что очень неплохо для акционеров Netezza.

Netezza - производитель программно-аппаратных комплексов для BI-систем и аналитических хранилищ данных, активно эксплуатирующий идею дисковых супер-контроллеров (я о ней писал ранее). Агрессивная ценовая политика, направленная прежде всего против Teradata, хорошая производительность и благосклонные отзывы отраслевых аналитиков позволили  Netezza завоевать сердца и бюджеты 350 заказчиков по всему миру, что с одной стороны в разы меньше чем у классика программно-аппаратных BI/DWH систем Teradata, но с другой стороны - в разы больше чем у ближайших конкурирующих игроков в этой области, если смотреть на pure-play вендоров типа Kognitio.

Если с выгодой Netezza в сделке все более-менее очевидно, то вот зачем IBM купила Netezza не совсем понятно. С одной стороны, очевидно было что долго выдавать свои квази-специализированные Balanced Warehouse за полноценные DWH-appliance нельзя - любому более-менее посвященному было понятно, что это не так. IBM Balanced Warehouse - это по сути стандартные серверы IBM со стандартным ПО Cognos и/или InfoSphere. Вся оптимизация сводилась лишь к хорошо просчитанной конфигурации и грамотной настройке под конкретную задачу. Это конечно дает отдачу, так как хороший расчет железа под BI/DWH решения скорее редкость, чем правило, но далеко не такую как специализированная программно-аппаратная архитектура, где софт и железо намного больше оптимизированы друг для друга. Поэтому с приобретением Netezza IBM получает в свой портфолио настоящий высокопроизводительный DWH-appliance. И это очевидный шаг не сколько против Teradata, сколько против Oracle, агрессивно продвигающей Exadata по своей клиентской аудитории. И шаг наверное сильный - у IBM есть что предложить с точки зрения аппаратной части - недавний выход Power7 и zEnterprize с гибридной архитектурой это только еще раз подтверждают.

А вот с программной частью не все так понятно. Останется ли на Netezza своя СУБД или же она уступит место DB2 в какой-нибудь Appliance Edition? Как насчет колоночной архитектуры СУБД? СУБД Netezza имеет построковое хранение данных - архитектурно это не лучший вариант для OLAP-систем, но он компенсировался специализированной аппаратной частью. Oracle Exadata кроме специализированной аппаратной части имеет пусть и достаточно примитивный, но все-же колоночно-ориентированный движок. Чем IBM ответит на это? IBM до сих пор не имеет своей колоночной СУБД - и покупка например Vertica была бы весьма логичным шагом. Может это просто вопрос времени?

BI-всячина: Tableau, GoodData, Palantir

Поддамся моде на посты в стиле "всякая релевантная всячина". Удобный формат - вроде бы как и сказал, что хотел, и много времени не потратил. Кому интересно - сходят по ссылкам и разберутся самостоятельно. Итак герои сегодняшнего поста - Tableau, GoodData, Palantir.

Tableau

www.tableausoftware.com

Трудночитаемое для нефранкоязычных название произносится просто - "табло". Tableau засветилась на рынке BI недавно, но уже достаточно ярко - они были однозначным открытием 2009 года по мнению Gartner (за год до этого такой чести удостоился QlikView). Основной козырь "табло" - сильная и продуманная визуализация табличных данных. Я смотрел продукт - впечатляет. Они действительно открыли новую главу в промышленных BI-инструментах. Такое ощущение, что они внимательно прислушались к рекомендациями S.Few в его книге "Now you see it" - все сделано очень грамотно. Помимо большого количество действительно полезных видов диаграмм, радует возможность автоматически, драг-н-дропом задавать некоторые параметры графика, такие как цвет линии или толщина линии, в зависимости от значений измерений или размерностей. Причем Tableau довольно умно автоматически вычислает границы этих параметров - для этого не нужно писать какие-то заумные формулы. В остальном же - это традиционный ROLAP-клиент c простенькой организацией метаданных, ориентированный на работу с SQL-ориентированными СУБД типа Oracle/SQL Server или аналитическими СУБД типа Vertica/Sybase IQ. Существует как в десктопном, так и в серверном вариантах. Из существенных недостатков - не поддерживает работу со структурами данных типа parent-child (спасибо Евгению Павлючкову за информацию).

tableau screenshot

GoodData

www.gooddata.com

GoodData - довольно молодой стартап, который впрочем уже смог построить достаточно функциональную платформу и найти платежеспособных клиентов. GoodData построен по принципу SaaS - Software-as-a-Service и предлагает заказчиками полный BI-стек - от ETL до визуализации - как веб-сервис. Клиентам не требуется разворачивать у себя какую-либо инфраструктуру - данные загружаются и обрабатываются в облаке. Хорошая визуализация, гуманные цены, автоматическая масштабируемость - GoodData довольно точно следует современным тенденциям в мире BI.

GoodData screenshot

Palantir

www.palantir.com

Palantir - еще более юный стартап, основанный умными мальчиками с докторскими степенями из американских университетов. Особой заметности на международном рынке пока не получил. Меня впечатлила детальность проработки архитектуры веб-приложений Palanir - их всего два - Palantir Government и Palantir Finance. Каждое приложение - пакет отраслевых специализированных аналитических приложений, построенных на одной SaaS-платформе. Что-то типа SAS, только web-based. Это не тот случай, когда гениальное - просто, скорее наоборот - для базового понимания как что работает потребуется неделька-другая обучения. Массовой популярности они не получат, но объем инвестирования умозатрат и трудозатрат впечатляет. Одна только поддержка собственного формульного синтаксиса и метаданных чего стоит. Желающие могут посмотреть он-лайн демо (требует регистрации) - https://joyride.pfinance.com/welcome .

Вот почему американские студенты могут такое сделать, а украинские - нет? Риторический вопрос. Зато главный борец с коррупцией в МВД Украины не гнушается принимать "в подарок" Кадиллак от анонима. Это к вопросу, кто что может сделать в Украине. Ну да ладно, мы сегодня не об этом, хотя сегодня день Независимости, а каждый такой день Независимости вызывает все большее желание независимости от подобных персонажей. Географической.

BI-всячина Tableau, GoodData, Palantir

Lyza: cоциальный BI в персональных облаках

Несколько поутихла волна по поводу BI 2.0. Масса публикаций, заметок и записей в блогах о необходимости коллаборативного BI в общем-то закончилась ничем - каких-либо существенных инноваций от производителей популярных продуктов для бизнес-анализа мы пока так и не увидели. Впрочем их можно понять - зачем инвестировать в что-то новое, если и старое пока приносит неплохие деньги, да и хорошо было бы в конце концов как-то подружить друг с другом, все что было накуплено за последние годы. Кстати в этом плане первые положительные сигналы показывает Oracle, выпустивший после 3-летнего перерыва следующую, 11ю версию Oracle BI Enterprise Edition, которая наконец-то добавила продукту так нехватавшей ему зрелости, что положительно было оценено прессой. Но речь сегодня не об этом.

Пока ветераны индустрии заняты интеграцией неинтегрированного, на горизонте появляются небольшие компании со свежими идеями, которые впрочем пока еще на ранней стадии реализации. Одной из таких первых ласточек является компания Lyzasoft, основанная Скоттом Дэвисом (Scott Davis). Популярный сайт tdwi.org недавно опубликовал интервью с ним, что вполне можно считать признаком неплохого прогресса в развитии продуктов Lyza.

Не буду пересказывать интервью, желающие могут ознакомиться с ним по ссылке выше. Скажу несколько слов о самом продукте:

Основная идея Lyza - совместить BI-контент и обсуждения этого контента пользователями в одном интерфейсе, а также хранить данные в приватных облаках. Как видно на скриншоте ниже (кликабельно) - рядом с отчетом в виде графика (или таблицы) есть дополнительная панель, в которой видны заметки пользователей, которые могут содержать ссылки на другие отчеты. Таким образом появляется социальный способ навигации - просматривая отчет, можно посмотреть кто что еще рекомендует посмотреть.

Lyza cоциальный BI в персональных облаках

Еще одной интересной особенностью Lyza является возможно проследить путь расчета того или иного показателя. Пример такого пути на скриншоте ниже (кликабельно).

Lyza cоциальный BI в персональных облаках

Использование Lyza предполагается в 2х вариантах:

  • Lyza Commons - по сути дела shared hosting на сайте производителя. Для одного человека с правами просмотра - бесплатно. Создавать отчеты могут пользователи подписавшиеся на пакет Pro, стоимостью $49/мес.
  • Dedicated Lyza Environments - это модель с выделенным хостингом и тарифами от $149/мес для группы 10 человек, до $2499/мес для 250 пользователей. Во всех случаях доступны приватные облака с выделенным объемом для пользовательских данных - от 500ГБ для небольших групп и до 8ТБ для больших.

В интервью Скотта Девиса кое-где проскакивают упоминания о десктопных клиентах, но на сайте Lyza об этом ни слова. Видимо основной упор - на социальный BI в персональных облаках. Насколько эта идея интересна можете оценить сами - регистрация на Lyza Commons бесплатная.

Круговая диаграмма в душевой кабинке и еще немного юмора

Еще один штрих к портрету BI в поп-культуре:

На популярном ресурсе digg.com сейчас на 1м месте в списке "Top in all topics" с приличным отрывом от остальных висит ссылка на вот такой забавный график:

Круговая диаграмма в душевой кабинке и еще немного юмора

А если вам когда-нибудь захочется несколько минут позитива - зайдите на graphjam.com - и вы еще найдете много хороших шуток, остроумно визуализированных в стиле BI.

PS. Как оказалось, я первый кто сделал пост на КО с тегом "юмор". Неужели на КО с юмором было так плохо? :)

SAP покупает Sybase. Что это для BI?

Итак, как стало известно вчера поздно вечером - SAP приобретает Sybase, крупного производителя СУБД и средств разработки, за $5.8 млрд. Как и любая другая крупная сделка на рынке ИТ - это, без сомнения, интересный шаг. SAP получит свою собственную, весьма развитую, промышленную СУБД. Это довольно необычно для SAP, бизнес-модель которой до этого момента строилась вокруг business applications, т.е. ориентация была на front-end и немного на middleware. Теперь же появился и back-end. Вряд ли идеология SAP от этого существенно поменяется - скорее всего это будет означать постепенный уход Sybase с рынка специалистов в СУБД и "перетекание" в SAP-овский клуб.

Впрочем, СУБД не есть основная цель приобретения - SAP вполне неплохо себя чувствовал на других СУБД - особенно DB2. Цель приобретения  - синергия технологий мобильного доступа (Sybase), in-memory обработки (SAP и Sybase), complex event processing (Sybase), репликации (Sybase), аналитических систем (Sybase и SAP).

С точки зрения BI,  из этого списка интересен прежде всего последний пункт. Sybase, кроме основной, транзакционной СУБД Sybase ASE, породившей когда-то MS SQL Server, имеет в своем портфолио также специализированную аналитическую СУБД Sybase IQ. Sybase IQ является развитой СУБД, первый релиз которой появился еще в 1996г, с поколоночным представлением данных, оптимизированным с помощью большого набора разнотипных индексов и SMP-архитектурой. Как и любая другая СУБД с поколоночным хранением данных (как например, Vertica), Sybase IQ позволяет получить прирост скорости выполнения аналитических запросов в несколько раз, по сравнению с традиционными СУБД и сократить объем данных, хранящихся на дисках. Вместе с тем, Sybase IQ достаточно медленно работает на запись данных, имеет несколько неудачную схему лицензирования и ограничена в масштабировании из-за SMP-архитектуры.

Sybase IQ будет являться весьма полезным дополнением к линейке SAP BusinessObjects, особенно для тех случаев, когда in-memory технологии SAP не способны справиться с большими объемами данных (свыше 0.5-1Тб). В тоже время, 98% внедрений Sybase IQ оперирует данными объемом менее 5Тб, что означает что Sybase IQ пригодна скорее для мало-терабайтных хранилищ данных. Хотя есть и несколько примеров с достаточно большими объемами, но впрочем их немного.

Приобретение Sybase, естественно рождает вопросы - а как же отреагируют на это другие игроки рынка? Приобретение Sybase наверное сильнее всего скажется на отношениях SAP и IBM. Последняя, возможно, в качестве паритетного усиления своего BI портфеля InfoSphere/Cognos, решится на покупку колоночной СУБД. Первым претендентом, конечно же, является Vertica, но, например ParAccel, мог бы быть более дешевым вариантом, впрочем с соотвествующим качеством. Остальные игроки вряд ли предпримут какие-либо активные действия. Oracle занята Sun, Microsoft адаптирует DatAllegro и Gemini, HP остается в стороне. Вот только непонятно что будет со стратегическим партнерством SAP и Teradata. Ведь еще недавно казалось, что там все так хорошо начинается. Не договорились о цене?

 

[Де]Централизация песочниц

Похоже мировая мысль как-то до сих пор не определилась, насколько анализируемые данные должны быть централизованы в чем-то типа хранилища данных. Аналитические хранилища данных появились в 90х как ответ на разобщенность и несогласованность данных, хранящихся в разных учетных системах, бурно размножившихся с середины 60х годов. Хранилища данных явились инициативой топ-менеджмента компаний, желающих получить цельное и достоверное представление о деятельности своей организации. С тех пор централизация была возведена в культ, к ней стремились как к абсолюту, как к недостижимой линии горизонта. Централизация данных в разнообразных хранилищах и хабах принесла не только ожидаемое цельное видение бизнеса, но и немало выгод для ИТ - с точки зрения разнесения нагрузки, сокращения избыточности данных, упрощения контроля доступа, экономии на оборудовании и т.д.

Однако сейчас похоже маятник начинает двигаться в обратную сторону. И основными двигателями этого процесса являются уже не топ-менеджеры, а среднее звено менеджмента и ключевые аналитики, которые все больше недовольны теми ограничениями свободы, которые налагают на них хранилища данных и традиционные BI-платформы. Они все чаще нуждаются в своей собственной "песочнице", где они могли бы самостоятельно манипулировать достаточно большими массивами данных, связывать данные из ХД с внешними источниками, готовить ad-hoc отчеты, строить аналитические приложения и т.д. Другими словами self-service BI становится уже не просто произвольным визуальным конструированием отчетов из фиксированного набора показателей и размерностей, описанных в модели метаданных, а еще и произвольным изменением этой самой модели, выполняемого нетехническими специалистами. Причем этому процессу активно оппонируют как раз ИТ подразделения, справедливо опасающиеся неконтролируемого роста всевозможных витрин, витриночек и витринищ (в общем того, что называют datamarts), с неконтролируемым качеством данных в них.

Приведу два примера, сигнализирующих об этой тенденции:

Gartner, в отчете 2010 года по BI платформам первым же пунктом отметила тенденцию учащающегося использования на уровне департаментов BI-инструментов, позволяющих пользователям быстро и самостоятельно манипулировать данными - таких как QlikView и некоторых других in-memory платформ, при том что в организациях в целом за стандарт принята другая, более традиционная, BI-платформа. Gartner отмечает, что для бизнес-пользователей выгоды от их применения перевешивают возможные риски увеличения разобщенности данных.

Еще один пример - интервью Рэнди Ли (Randy Lea) МЗ Product and Services Marketing Teradata, опубликованному сегодня на tdwi.org. В этом интервью г-н Ли объясняет вывод новых, нетипичных для Teradata аналитических устройств (analytical appliance) как раз возрастающей тенденцией к самостоятельной манипуляции данными на уровне департаментов, в стороне от которой Teradata не хотела бы оставаться.

Очевидно, есть две крайности. Одна крайность - это пытаться все запихнуть в хранилище данных. Со всем требуемым проектированием и переделыванием моделей, ETL-процедур, метаданных BI и т.д. Однако даже самые убежденные сторонники централизации признают, что достичь этого на 100% невозможно да и нецелесообразно. С другой стороны, возвращаться к хаосу разобщенных данных тоже не хотелось бы - эта крайность уже хорошо известна. Но как сформулировать однозначный, хорошо работающий критерий, по которому определять - какие данных необходимо включать в ХД, а какие - нет? И какой должен быть размер "песочницы" для тех, кому она необходима как воздух?

Хорошего ответа на этот вопрос я пока не слышал.

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT