Microsoft BI: путь к успеху

18 март, 2013 - 21:36Игорь Дериев

Свежий «магический квадрант» Gartnet в сфере BI снова подтвердил лидирующие позиции Microsoft. Потребность в глубоком анализе корпоративных данных сегодня возникает на всех уровнях управления и Microsoft предоставляет один из наиболее полных портфелей продуктов, в котором найдутся инструменты как для построения мощных централизованных решений, так и для персонального использования аналитиками.

Хотя тема бизнес-анализа (Business Intelligence, BI) становится все более «горячей», а сам термин не сходит с уст всевозможных экспертов, соответствующая предметная область далека от окончательной формализации. Достаточно заглянуть на несколько тематических ресурсов, начиная с Википедии, чтобы найти несколько весьма различных определений BI. Простейшее подразумевает лишь средства построения содержательных отчетов и в таком случае под него подпадает практически любая бизнес-система с соответствующей функциональностью или даже СУБД. Наиболее, пожалуй, общее, звучит как «превращение данных в знания». Компания Gartner, предлагает более подробную формулировку: приложения и технологии, используемые для преобразования, хранения, анализа, моделирования, совместного использования и доставки данных с целью помочь корпоративным пользователям в принятии лучших управленческих решений.

Еще хуже, что в английском языке наряду с Business Intelligence существует и Business Analytics, что вносит дополнительную терминологическую путаницу, а в русском языке — и подавно. Показательно, что Gartner, ежегодно публикующая свои знаменитые «магические квадранты» для рынка BI, в нынешнем году назвала свой отчет «Magic Quadrant for Business Intelligence and Analytics Platforms», чтобы дополнительно подчеркнуть важность собственно аналитических средств. Это отражает одну из основных текущих тенденций BI — переход от описательного («что происходит») к диагностическому («почему происходит именно так») подходу, который предполагает наличие мощных, быстрых интерактивных инструментов с развитыми возможностями визуализации. Это область, которая пока еще не вполне формально описывается термином data discovery (не путать с data mining), и где традиционно работали компании вроде QlikTech, Salient Management Company, Tableau Software, Tibco Spotfire. В 2012 г., однако, к последним подтянулись (создав/доработав собственные решения или приобретя специализированные продукты/компании) и все прочие лидеры BI-рынка, в том числе IBM, Microsoft, Oracle, SAP, SAS.

В общем, от окончательной путаницы спасает лишь то, что Gartner оценивает не отдельные инструменты/решения/технологии, а именно платформы, которые должны в достаточной мере соответствовать определенному перечню требований. Количество последних менялось со временем, по мере взросления технологий и рынка — уже в 2012 г. их насчитывалось 14 в трех категориях (интеграция, доставка информации, анализ), а в 2013 г., несмотря на описанное выше смещение акцентов, добавилось лишь одно новое: директивное моделирование и оптимизация (предсказуемо, в категории анализа).

Сам «магический квадрант» за 2013 г. не принес больших сюрпризов, их вряд ли приходится ожидать на достаточно зрелом и заполненном рынке. Tableau Software и Tibco Spotfire смогли прорваться в группу лидеров, среди которых также произошли некоторые перестановки. В частности, многие обратили внимание, что смогла заметно упрочить свои позиции Microsoft, которая по совокупности двух измерений уступает лишь IBM, и является единоличным лидером по уровню соответствия реальным запросам рынка (на самом деле метрика ability to execute гораздо сложнее, подробная расшифровка присутствует в отчете). Однако примерно такое же положение Microsoft занимала и в прежние годы, так что, скорее, 2012 г. стал исключением, что можно объяснить ожиданием выхода SQL Server 2012, в котором было обещано дальнейшее развитие направление BI, начиная с появления специальной редакции Business Intelligence.

Microsoft BI: путь к успеху

Microsoft BI: путь к успеху

Стабильность успеха Microsoft на рынке BI обусловлена многими факторами, среди которых можно выделить два важнейших. Во-первых, это традиционно гибкая лицензионная политика, обеспечивающая ее решениям очень конкурентные цены. Именно стоимость лицензий и TCO называются главными аргументами в пользу BI-платформы Microsoft, причем такое положение дел сохраняется в течение последних шести лет. Во-вторых, в отличие от большинства конкурентов, BI-платформа Microsoft фактически «размазана» по ряду популярных продуктов (SQL Server, SharePoint, Excel), которые нередко используются как стандартные компоненты информационной инфраструктуры. Соответственно, переход к их применению для целей бизнес-анализа выглядит естественным, простым и экономичным как для SMB, так и для крупных предприятий — не случайно, выйдя на рынок BI лишь в 2000 г., через десять лет Microsoft занимала на нем уже третье место. По мнению Gartner, дальнейший рост доли рынка Microsoft может быть обусловлен развитием даже не серверных продуктов, а Excel, который наполняется все более мощными специализированными инструментами для работы с данными, и может использоваться и самостоятельно, и в тесном взаимодействии с SQL Server.

Таким образом Microsoft охватывает три уровня бизнес-анализа: персональный, коллективный и корпоративный. Самых верхний, естественно, реализует SQL Server. В нынешней версии 2012 его BI-составляющая основывается на пяти специализированных службах:

  • Integration Services представляет собой платформу для интеграции корпоративных данных из различных источников и охватывает все этапы процесса ETL (extract, transform, load), т.е. извлечение данных, их обработку (в том числе агрегацию, очистку) и загрузку в хранилище;

  • Master Data Services (MDS) позволяют формировать эталонные модели, иерархии, справочники, метаданные, которые в дальнейшем будут применяться для стандартизации (к примеру, на этапе интеграции) представления данных из различных источников. Предполагается, что с MDS будут работать не только ИТ-специалисты, но и бизнес-пользователи, для которых предоставляется веб-интерфейс, а в SQL Server 2012 — и специальная надстройка для Excel, позволяющая использовать готовые списки, автоматически создавать справочники и пр.;

  • Data Quality Services (DQS) впервые появилась в SQL Server 2012 и применяется для проверки качества или очистки данных, под которой понимаются их приведение к стандартному виду, выявление некорректных значений/форматов, удаление дубликатов. DQS функционирует на базе специальных проектов, которые задействуют базы знаний, где задаются исследуемые атрибуты, допустимые значения, правила проверки и корректировки и пр. Для создания проектов и баз знаний, а также для контроля за процессом очистки имеется специальное клиентское ПО, рассчитанное как на ИТ-специалистов, так и на бизнес-пользователей;

  • Analysis Services представляют собой собственно аналитический инструментарий. В SQL Server 2012 внедрена семантическая модель BI, которая охватывает как многомерные, так и табличные модели данных. Первые по-прежнему используют OLAP и язык MDX, последние — технологии PowerPivot, в том числе in-memory движок xVelocity и язык DAX. Профессиональные разработчики BI-решений могут применять любой подход с помощью традиционных инструментов SQL Server, однако с табличными моделями, как более простыми и понятными, могут работать и бизнес-пользователи — с помощью Excel и надстройки PowerPivot. Analysis Services также предоставляет инструменты data mining, в том числе девять стандартных алгоритмов (байесовский, линейную регрессию и пр.);

  • Reporting Services обеспечивает построение и визуализацию фиксированных и интерактивных отчетов, для чего может обращаться как непосредственно к различным источникам данных, так и к моделям Analysis Services. Для создания отчетов кроме стандартных инструментов SQL Sever также предлагаются отдельное приложение Report Builder и надстройки Power View для Excel и SharePoint.

Для создания аналитических компонентов и решений в SQL Server имеется специальный инструментарий, построенный на основе Visual Studio. Это еще один пример того, насколько сильно BI-платформа Microsoft переплетена с ее программной экосистемой. Использование стандартных инструментальных средств, среди прочего, упрощает поиск и подготовку специалистов, а стало быть и стоимость внедрения бизнес-анализа.

Коллективный уровень представлен, естественно, SharePoint. Аналитическая часть основывается на Excel Services, а также на надстройках PowerPivot, которые позволяют публиковать на портале рабочие книги Excel и модифицировать их прямо в браузере. Для составления отчетности также могут использоваться таблицы и диаграммы Excel, но есть и специальные механизмы, вроде поддержки отчетов Power View, PerformancePoint Services для построения информационных панелей и расчетов KPI, а также Visio Services для публикации схем и подключения к ним источников данных для отображения на элементах какой-то информации.

Персональный уровень — это Excel и различные надстройки. Стоит отметить, что в контексте бизнес-анализа SharePoint и Excel нередко объединяют в единую категорию средств самообслуживания, с той лишь разницей, что Excel предназначен для полного цикла разработки решения, а SharePoint — в основном, для работы с готовыми таблицами и интерактивными отчетами. Тем не менее, два продукта развиваются параллельно для максимальной совместимости.

Excel 2013 стал настоящим прорывом в области BI и едва ли не половина комментариев Gartner относительно успехов BI-платформы Microsoft, посвящена именно ему. Главным нововведением безусловно является то, что обновленные PowerPivot и Power View стали штатными компонентами Excel, хотя они по-прежнему выполнены в виде надстроек и автоматически не подключаются (дабы не тормозить запуск приложения). Однако часть возможностей PowerPivot перекочевала в сам Excel 2013, в частности, ядро xVelocity (прежнее название VertiPaq) теперь автоматически задействуется при работе с любыми внешними данными, что фактически снимает ограничения на их объем. Подключение надстроек, однако, открывает ряд дополнительных возможностей, к примеру, можно будет фильтровать данные при загрузке, визуально корректировать модель данных, определять KPI и пр.

К категории BI-инструментов также относится ряд других надстроек Excel. Одни из них, в том числе, упомянутые в описании SQL Server, играют роль удобных клиентов для SQL Server и позволяют привлекать бизнес-пользователей к разработке и настройке аналитических решений. Другие, как например Data Mining Add-ins, позволяют на персональном уровне задействовать мощные аналитические инструменты SQL Server, без непосредственного взаимодействия с ними.

Приоритетность направления BI в развитии Excel подтверждается и ближайшими планами Microsoft. Так, если PowerPivot в Excel можно сопоставить с Analysis Services в SQL Server, т.е. с инструментами собственно аналитики, то еще одна находящаяся в разработке надстройка — Data Explorer станет своеобразным персональным аналогом Integration Services, т.е. инструмента подготовки данных. Она сможет подключаться к различным источникам, в том числе и к таким как Facebook или Hadoop Distributed File System, комбинировать и фильтровать данные, агрегировать их и пр.

Средства визуализации кроме Power View в скором времени пополнятся еще одной интересной надстройкой — GeoFlow, которая позволит накладывать данные с географической привязкой на глобус, изменять их детализацию одновременно с масштабом изображения и пр. (все возможности пока неизвестны, за некоторые даже идет голосование среди тестеров).