`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

PowerPivot for Excel: бизнес-анализ для всех

Статья опубликована в №18 (729) от 25 мая

+33
голоса

Современная конкурентная экономическая среда предъявляет повышенные требования к оперативности и качеству принимаемых решений на всех уровнях управления. Для этого, разумеется, необходимо обладать всей полнотой информации, объем которой растет лавинообразно. А инструменты бизнес-анализа сегодня нужны широкому кругу информационных сотрудников компаний любых размеров.

PowerPivot for Excel бизнес-анализ для всех
PowerPivot for Excel бизнес-анализ для всех
Создание меры мало отличается от процедуры вставки функции

Исторически так сложилось, что в таблицах Microsoft Excel ведется множество отчетности, более того, они широко используются, например, для экономического моделирования (от линейной оптимизации до имитационных моделей и прогнозирования, анализа временных рядов, принятия решений на основе выборочной информации и пр.), при этом сводные таблицы Excel (Pivot Tables) являются одной из самых востребованных функций. Безусловно, крупные массивы данных зачастую эффективнее обрабатывать средствами СУБД, но сколько времени (и денег) потребуется, чтобы каждого сотрудника обучить премудростям работы с SQL? Идея PowerPivot как раз и состоит в том, чтобы дать возможность задействовать для самостоятельного анализа больших и очень больших выборок данных хорошо известные и интуитивно понятные инструменты Excel, не изучая дополнительно OLAP, многомерное моделирование или специализированные системы бизнес-аналитики.

Microsoft PowerPivot (www.powerpivot.com) выполнена в виде надстройки к Excel 2010, но за счет использования размещаемой в оперативной памяти базы данных с архитектурой VertiPaq позволяет оперировать миллионами записей, для хранения которых применяются эффективные алгоритмы сжатия данных. И именно движок VertiPaq, а не собственно Excel, выполняет запросы, необходимые для создания сводных таблиц и диаграмм, производит вычисления и агрегацию данных, не обращаясь при этом к диску. За счет работы со структурированными в виде столбцов данными и отсутствия операций дискового чтения/записи PowerPivot достигает высочайшей производительности.

Кстати, PowerPivot, в отличие от Excel, где число строк на листе не может превышать 1 048 576, не имеет никаких ограничений на количество записей в таблицах данных – объем информации лимитирован лишь размером рабочей книги PowerPivot, который не должен превышать 2 ГБ (что обычно соответствует набору данных в 4 ГБ) – в противном случае программа просто не сможет ее сохранить. PowerPivot использует формат XMLX, причем надстройка вообще не держит данные вне рабочей книги – только в процессе сохранения применяется временный кэш. Это позволяет пользоваться обычными инструментами обмена данными и коллективной работы, в том числе, например, SharePoint, но следует учесть, что не установившие PowerPivot будут ограничены исключительно возможностью просмотра информации (это же относится к Excel 2007). Между прочим, в файле XMLX легко найти встроенную БД, открыв его как zip-архив любым подходящим инструментом и заглянув в папку xlcustomData.

PowerPivot for Excel бизнес-анализ для всех
Создание средствами Excel информационных панелей

С помощью PowerPivot можно обрабатывать самые разные данные – поддерживается импорт из наиболее популярных реляционных БД, из каналов Microsoft Reporting Services, служб Microsoft Analysis Services, потоков данных ATOM (при этом идентифицируются и импортируются связанные таблицы, поддерживается создание фильтров, запросов и пр.). В процессе загрузки данных автоматически строится скрытый OLAP-куб, который затем и применяется для анализа. PowerPivot не только выявляет и сохраняет связи между таблицами, но и позволяет связывать данные разных источников вручную, а также редактировать имеющиеся связи.

При работе с таблицами практически невероятно, чтобы в них содержались все необходимые значения, в особенности если последние являются производными от других источников. Поэтому в PowerPivot предусмотрена возможность создания двух типов вычисляемых значений: полей и мер. Вычисляемые поля, в сущности, ничем не отличаются от таковых в Excel – при вводе формулы для каждой ячейки указанного столбца рассчитывается производное значение (любого типа – число, текст, дата и пр.), впоследствии с ними работают, как с обычным полем.

PowerPivot for Excel бизнес-анализ для всех
PowerPivot позволяет импортировать структурированные данные из множества источников – от таблиц Word и Excel до БД и потоков данных

Куда интереснее с точки зрения аналитика построение с помощью PowerPivot логических схем без обращения к многомерному моделированию. Для этой цели создаются специальные функции, называемые мерами – они рассчитываются по заданному правилу на основании уникальной комбинации связанных с ячейкой меток столбцов, строк и заданных параметров фильтров. При этом в отличие от полей при вводе формулы вычисления автоматически не выполняются и не сохраняются – PowerPivot запоминает заданное название меры и связанную с ней формулу, вычисляя ее только тогда, когда она помещается в область значений сводной таблицы.

Фактически неявно простейшие меры, основанные на агрегации данных одного поля, создаются при формировании любой сводной таблицы: как только в нее помещается числовое поле, его значения автоматически суммируются, впрочем, данную меру можно быстро изменить, задав в контекстном меню любую другую агрегационную функцию (минимум, максимум, среднее).

Гораздо сложнее могут быть меры DAX (Data Analysis Expressions), создаваемые вручную в специальном диалоговом окне. Здесь можно задать формулу для расчета значения, используя данные разных таблиц, дополнительные фильтры, операторы сравнения, условные операторы и пр. Поскольку расширение DAX создавалось для работы с наборами таблиц, в него включены не только часть функций из стандартной библиотеки Excel, но и ряд специальных, реализующих концепции реляционных БД.

PowerPivot for Excel бизнес-анализ для всех
В сводных таблицах PowerPivot применимы все современные инструменты визуализации

Нужно учесть, что в DAX не поддерживается принятый в Excel способ адресации отдельной ячейки – это расширение всегда оперирует с полями, поэтому, скажем, функции агрегации (SUM, AVERAGE, MIN, MAX, COUNT) в качестве параметров принимают не набор диапазонов, а отдельное поле (столбец) таблицы. Кроме того, в DAX есть аналогичные функции, способные оперировать с выражениями, зависящими от записей (строк таблицы) – SUMX, AVERAGEX, MINX и т. д. Имеются также совершенно не характерные для Excel функции, возвращающие таблицу – они, естественно, используются преимущественно в качестве аргументов для других операций. В целом процесс создания мер мало чем отличается от стандартной в Excel процедуры вставки функции – здесь предусмотрены как подсказки, так и проверка введенного выражения. За более подробной информацией о DAX, правда, придется обращаться на msdn.microsoft.com, где к тому же имеется ряд примеров (на сайте проекта также можно отдельно загрузить файл справки).

Безусловно, самым ярким впечатлением от PowerPivot являются сводные таблицы и диаграммы – последние как нельзя лучше подходят для информационных панелей (dashboard), которые визуализируют данные, ускоряют и упрощают их восприятие. Независимо от размера исходного массива данных для их создания можно использовать привычные инструменты, надо только учитывать, что PowerPivot отображает списки полей в собственной панели задач. Доступными остаются и такие дополнительные возможности, как слайсеры или инфомаркеры, хотя для работы с последними иногда приходится создавать вспомогательные таблицы и связывать их с основной – в тех случаях, когда для таких мини-графиков нужны более подробные данные, нежели присутствуют в сводной таблице.

+33
голоса

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT