
Компания SAS СНГ объявляет о выводе на рынок полной линейки аналитических инструментов нового поколения – SAS High Performance Analytics. Как утверждается, они позволяют решать бизнес-задачи принципиально другого уровня сложности, давая возможность обрабатывать и анализировать большие объемы данных, с гораздо большей точностью и в десятки раз быстрее.
Сегодня многие крупные организации накопили терабайты структурированной и неструктурированной информации. Это данные о миллионах клиентов и их действиях, об операционной деятельности самих организаций… По данным McKinsey Global Institute, объем этих данных стремительно нарастает, процессы их обработки и анализа занимают все больше времени, поэтому и получать из них полезные для бизнеса знания становится все сложнее.
Между тем, экономисты исследовательского центра Cebr (Великобритания) подсчитали, что развитие технологий больших данных в ближайшие пять лет может принести экономике страны 216 млрд фунтов стерлингов и создать около 58 тыс. рабочих мест.
Уже сегодня организации, применяющие на практике разработки High Performance Analytics, добились впечатляющих результатов. К примеру, крупнейший в Европе по размеру рыночной капитализации банк HSBC, внедрив систему SAS по противодействию кредитному мошенничеству, повысил эффективность службы по выявлению случаев мошенничества в 3 раза, а точность его выявления – в 10 раз. При этом в первые же 2 недели эксплуатации 7 специалистов службы безопасности HSBC выявили новые криминальные группы и схемы с общим потенциальным ущербом более 10 млн долл.
Для решения бизнес-задач аналитическими методами организации нужно пройти определенный набор шагов, требующих вовлечения разных специалистов – менеджеров, аналитиков и ИТ-специалистов. Перед каждым из участников аналитического процесса стоят свои задачи, поэтому они предъявляют разные требования к функциональности средств бизнес-аналитики.
Поэтому линейка технологий SAS состоит из трех частей и основанных на них продуктах и решениях. Первая из них – SAS Grid Computing – предназначена для управления распределенными вычислениями в среде SAS при работе как на одном, так и на большом количестве серверов. Это некий аналог «облачных» технологий.
Вторая технология, разработанная около года назад, воплощена в продуктах класса in database: в этом случае распределенная обработка достигается путем переноса вычислений внутрь хранилища данных, то есть с аналитического сервера SAS – на сервер внешней базы данных. Этот метод применим для различной функциональности, но дает самый существенный выигрыш в ситуации, когда аналитические модели разрабатываются на инструментах SAS, а корпоративное хранилище данных реализовано на СУБД другого вендора.
Наконец, продукт SAS High Performance Analytics позволяет алгоритмам основных существующих направлений аналитики выполняться на десятках и сотнях миллионов записей с высочайшей производительностью. Если раньше на анализ закономерностей и построение аналитических моделей требовались часы или даже дни, то теперь эти операции проходят за секунды и минуты. Например, банки, разрабатывая модели принятия решений о выдаче кредитов на основе регрессионного анализа, могут получить ускорение в 100 раз.