Производительностью и доступностью сервисов нужно управлять

4 март, 2016 - 19:37Леонід Бараш

Развиваясь, технологии и ИТ-сервисы усложняются, и традиционного инфраструктурного мониторинга становится уже не достаточно. Это приводит к необходимости централизованного управления производительностью и доступностью приложений и сервисов, к необходимости автоматизации этих процессов.

Для решения подобных задач необходимы современные средства управления производительностью приложений (АРМ). Они позволяют построить ресурсно-сервисную модель, включающую все компоненты ИТ-системы, отслеживать бизнес-транзакции в режиме реального времени, осуществлять мониторинг бизнес-приложений и управлять ИТ-ресурсами.

Как это делается на основе систем Hewlett Packard Enterprise (HPE) рассматривалось на практическом семинаре, организованном ALG Systems, DevOps Hub и НРЕ.

Напомним нашим читателям, что ALG Systems является представителем американской компании ALG Systems, Inc., на рынках Украины и России. Компания предоставляет широкий спектр услуг в сегменте ИТ-технологий. Основные направления ее деятельности, в частности, включают ИТ-аутсорсинг, внедрение систем мониторинга ИТ-инфраструктуры и приложений, внедрение и автоматизацию процессов жизненного цикла приложений (ALM) и внедрение систем корпоративного управления и бюджетирования (CPM).

Евгений Марко: «Со временем пришло понимание того, что подвергать мониторингу все, а потом убирать лишнее – не совсем верный подход»

После краткого приветствия участников семинара директором по работе с партнерами НРЕ Мирко Шнайдером, практическим опытом использования инструментов управления поделился менеджер отдела управления ИТ-операциями Евгений Марко из компании «Астелит Украина».

Он отметил, что у компании был достаточно большой опыт мониторинга, однако не все делалось хорошо и не все правильно. В некоторых случаях применялся метод проб и ошибок. Но в итоге это все вылилось в опыт, а опытом стоит делиться.

В начале работы в Украине мониторинг большей частью выполнялся посредством разработанных в компании сценариев. С их помощью легко было посылать SMS мобильному оператору. Однако по мере роста компании все больше становилось объектов, которые нужно было проверять, и на каком-то этапе компания заинтересовалась более серьезными инструментами – системами мониторинга корпоративного класса. В поиске очень помогли маркетинговые презентации.

Сначала решили осуществлять мониторинг всего подряд, а потом разобраться, что оставить, а что отбросить. Основным источником информации служили журналы регистрации событий (log files). Однако некоторые приложения генерировали слишком большие log-файлы, поэтому был установлен ряд фильтров. Ситуация улучшилась, но и количество анализируемых файлов стало увеличиваться в разы, поэтому пришлось по определенному критерию ограничить их количество. Тем не менее к 2012—2013 г. стало ясно, что количество сообщений увеличивается настолько, что в их потоке начинают теряться важные сообщения. Таким образом, пришло понимание того, что подвергать мониторингу все, а потом убирать лишнее – не совсем верный подход. Как следствие, была проведена работа по уменьшению количества обрабатываемых сообщений. К настоящему времени генерируется около 100 тыс. видимых сообщений и около 900 тыс. дубликатов в неделю. Сложилась неоднозначная ситуация. С одной стороны, есть много важной информации, а с другой – с ней нельзя удобно работать. Необходимы были масштабные и радикальные перемены.

Сейчас в компании используется зонтичный мониторинг. Центральная система – HP Operations Manager, работающая под управлением HP-UX. Поток сообщений поступает в единую систему, там ищутся какие-то корреляции, какие-то данные отбираются, другие отбрасываются на входе, третьи обрабатываются и представляются в виде других сообщений. В итоге из почти миллиона сообщений, которые приходят, фактических инцидентов около 200 в день. Это то, что действительно важно. И здесь возникает вопрос, а зачем тогда глобальный мониторинг? Однако опытные операторы, круглосуточно следящие за потоком сообщений мониторинговой системы, могут выявить ряд инцидентов задолго до срабатывания стандартных правил их обнаружения.

Производительностью и доступностью сервисов нужно управлять

Александр Кацюба: «HP RUM способна отслеживать многошаговые транзакции и объединять их в единую транзакцию»

В настоящее время компания уделяет особое внимание и изучает возможности Application Performance Management – инструмента для мониторинга и управления производительностью и доступностью приложений. Возможно, в будущем компания откажется от глобального мониторинга и остановится на использовании только АРМ. В то же время, рассматриваются возможности технологий больших данных, которые считаются весьма перспективными для получения информации о работе приложений. Однако, по мнению докладчика, наиболее эффективным будет симбиоз всех трех технологий.

Онлайн-сервисы уже давно подчиняются рыночным отношениям, и их доходность зависит от восприятия пользователей. Нередки случаи, когда все номинально работает и услуга предоставляется, однако некоторые пользователи получают ошибки приложения или обслуживаются недопустимо медленно. Таким образом, важно не только следить за рабочей средой, но и проводить мониторинг восприятий конечных пользователей. О мониторинге качества обслуживания клиентов интернет-банкинга рассказал Александр Кацюба из «Альфа-Банк Украина».

Банк получал много обращений клиентов по поводу неуспешных транзакций. При работе с интернет-банкингом клиент может получить ошибку при выполнении транзакции по разным причинам: сбой в работе сервиса на стороне банка, ошибка на шине данных или ошибка со стороны сервис-провайдера или получателя платежа. Необходимо было проследить выполнение транзакции на протяжении всего маршрута прохождения, с момента регистрации клиента до ее завершения, другими словами, весь жизненный цикл, и определить, что является источником ошибки.

В прошлом для оценки качества восприятия конечных пользователей использовались два подхода: базовый мониторинг помогал следить за состоянием инфраструктуры, поддерживающей выполнение транзакций, а высокоуровневый мониторинг показывал состояние бизнес-процессов с точки зрения бизнеса. Но оба этих подхода не отвечали на наиболее критичный для бизнеса вопрос – насколько качественно предоставляемый сервис выглядит с точки зрения конечных пользователей. Проблему решает новый подход, использующий пассивный мониторинг для отслеживания и оценки пользовательских транзакций и взаимодействия пользователей с приложениями. Он, в частности, реализован в продукте HP Real User Monitoring (HP RUM).

Благодаря мультипротокольной поддержке система анализирует трафик по всем протоколам, которые используются приложениями. Это дает возможность определить, откуда и куда был сделан запрос, отследить на каждом шаге взаимодействие между пользователем и приложением и путь обработки запроса.

К примеру, оплата коммунальных услуг с помощью интернет-банкинга состоит из нескольких шагов, или последовательности действий. HP RUM способна сопровождать такие действия и объединить их в единую транзакцию. Программа дает возможность отслеживать, сколько времени тратит клиент на заполнение полей, какие из них вызывают затруднения или вообще прерывание транзакции. Это позволяет оператору позвонить клиенту и помочь заполнить форму и/или послать запрос разработчикам, чтобы они более понятно сформулировали название полей или предоставили подсказку.

Производительностью и доступностью сервисов нужно управлять

Юрий Козлов: «Для определения поведения и реакции клиента при заполнении форм в процессе интернет-банкинга был использован анализ многошаговых транзакций»

В банке были выбраны определенные функции интернет-банкинга, и типы операций были сгруппированы по логическому признаку. В результате была получена «приборная доска» (dash board), на которой в режиме онлайн представлялись показатели, которые отражали текущее состояние обслуживания клиента интернет-банкинга. По этим показателям стало возможным определять уровень качества обслуживания с привязкой к регионам и даже к устройствам и ОС. Это позволило построить поведенческую модель клиентов и обратить внимание на типологию ошибок. С помощью полученных данных удалось, в частности, повысить скорость выполнения операции поиска поступившего перевода средств. Были также настроены пороги SLA. Сократилось время устранения ошибок, поскольку вместе с уведомлением об инциденте со стороны банка посылался соответствующий участок кода.

Некоторые технические детали проекта приоткрыл технический директор из ALG Юрий Козлов. Для достижения этих результатов был применен анализ пакетов (HP RUM) между серверами интернет-банкинга и различными клиентами и между серверами приложений и другими компонентами инфраструктуры. Была получена картина восприятия клиентов выполняемых действий и взаимодействия с другими программами, интегрированными с интернет-банкингом. Обнаружилась также возможность находить некоторые ошибки в сценариях java. Крайне полезной оказалась прорисовка экранов пользователя на основе статического html-файла, позволившая увидеть все данные, кроме конфиденциальных, которые передавались между сервером и клиентом. Для определения поведения и реакции клиента при заполнении форм был использован анализ многошаговых транзакций.

Тему качества предоставляемых ИТ-услуг продолжил технический директор HPE Software в регионах Россия и СНГ Артур Гиоев. Прежде всего докладчик выделил необходимость для компаний актуализации информации и планирования. Для этого нужно построить систему управления конфигурациями, чтобы понимать, какими ИТ-ресурсами владеет компания. Основой для системы управления конфигурациями может служить HPE Universal CMDB (Configuration Management DB). С ее помощью можно осуществлять стандартизацию, контроль изменений, поддерживать непрерывность бизнеса. Следующий шаг – внедрение решения, позволяющего управлять ИТ-архитектурой и преобразованием ИТ путем сопоставления общего ИТ-ландшафта с бизнес-целями, выявлять и исключать нецелесообразную трату ресурсов, обеспечить их соответствие бизнес-стратегии компании. Эти задачи можно решить с помощью HPE Enterprise Maps. Система позволяет определять ненужные траты ИТ-ресурсов и сокращать избыточные расходы на ИТ, понимать ИТ-ландшафт и принимать обоснованные решения, уменьшить проектные риски и запутанность ИТ путем систематической стандартизации.

Производительностью и доступностью сервисов нужно управлять

Артур Гиоев: «Для эффективного использования ИТ необходимо планировать мощности, прорабатывать сценарии «что если», обеспечить поддержку разных технологий виртуализации»

Для эффективного использования ИТ необходимо также планировать мощности, прорабатывать сценарии «что если», обеспечить поддержку разных технологий виртуализации. Анализ для оптимизации и планирования мощностей можно выполнять с помощью HPE Cloud Optimizer.

Важную роль в качественном предоставлении услуг играет управление ИТ-инфраструктурой. На централизованную консоль HPE Operations Bridge поступают все события от всех систем мониторинга, которые затем приводятся к единому формату и отображаются на сервисно-ресурсную модель для поиска основной причины сбоев.

Докладчик представил еще ряд продуктов для поддержки и эффективного использования ИТ-инфраструктуры, среди которых брокер ИТ-сервисов HPE Propel, решение для автоматизации процессов ITIL/ITSM HPE Service Manager и ПО для учета ИТ-активов и управления финансами HPE Asset Manager.

В заключение семинара состоялось практическое занятие по совместному решению лабораторных задач в тестовой среде, которое провел Юрий Козлов.