Метаданные в нашей жизни

27 май, 2013 - 16:21Дмитрий Луговой

Хотя сам по себе термин «метаданные» может показаться чересчур наукообразным, наверняка с ними так или иначе сталкивался каждый. Это EXIF-информация, MP3-тэги, свойства документов и даже альтернативные потоки NTFS. Уже из этих очевидных примеров ясно, что применение метаданных во многих случаях может существенно упростить нашу жизнь. А в бизнес-среде они и подавно являются насущной необходимостью.

С тех пор как я начал заниматься управлением метаданными, мне часто стали задавать вопросы: что такое метаданные? зачем нужны метаданные? чем метаданные могут помочь в работе? и почему мы должны беспокоиться о метаданных? Ответы на эти вопросы лежат на поверхности. Ведь на самом деле мы постоянно имеем дело с метаданными, вся наша жизнь окружена и буквально «пропитана» ими. Мы уже так к этому привыкли, что не замечаем их ценности. Чтобы немного прояснить ситуацию, я попробую на нескольких живых примерах показать, какова роль метаданных в нашей жизни, и почему они так нам нужны. Итак, давайте представим себе такие ситуации:

Отсутствие метаданных

Предположим, мы зашли в аптеку и не можем найти нужное нам лекарство, потому что вместо привычных для нас названий на упаковках видим надписи:

«ДляГоловы_120453_Евгений»;

«Не_выбрасывать_полезно»;

«Для_Сергея»;

«Лекарство1»;

«Лекарство2».

И это еще не вся проблема. Открыв любую из упаковок, мы видим, что в инструкции полностью отсутствует описание лекарства: нет ни срока годности, ни данных о производителе, не указаны противопоказания. Вряд ли мы станем пить все подряд, пока не поможет, не правда ли?

У большинства компаний сегодня такая же ситуация с внутренней информацией. Отчеты называют «Report_1», показатели называют «Indicator01_Client» и т.п., при этом никакого описания к ним не прилагают. И когда другому сотруднику необходимо получить аналогичный отчет, то ему проще потратить несколько часов на эту задачу и создать еще один дубль уже существующего отчета, нежели выяснять, какой из сотен существующих отчетов отвечает поставленным требованиям. В итоге отчетность превращается в снежный ком, который с каждым днем увеличивается, и на работу с которым сотрудники тратят все больше времени и сил.

Данный факт подтверждается статистикой TDWI Technology Survey:

  • более 50% информации, содержащейся в отчетах/документах, это дублирование уже существующих отчетов;

  • 65% отчетов/документов на момент создания уже устарели;

  • 85% отчетов/документов используются не более одного раза.

Чтобы пользователи могли доверять информации, она должна быть описана, а сотрудники должны иметь четкое понимание, как интерпретировать данную информацию, и к кому можно обратиться с вопросами относительно ее корректности, полноты и актуальности. Именно метаданные способствуют этому, повышая качество информации и обеспечивая ее прозрачность, облегчая поиск необходимых отчетов и ответственных за нее сотрудников. Метаданные повышают эффективность использования информации и отвечают на вопросы:

  • Какие данные есть в компании, в каком они состоянии?

  • Где данные хранятся, в каком виде?

  • Что данные означают?

  • Кто создавал и модифицировал данные?

  • Какие приложения/пользователи имеют доступ к данным?

  • Кем и для каких целей данные используются?

  • Кто ответственный за данные?

Стоит также помнить, что, тратя огромные средства на сбор и обработку информации, на построение новых хранилищ данных и аналитических систем, нельзя забывать о процессах управления этой информацией и контроле над ее использованием и изменением. Так как без построения таких процессов, в свете постоянного роста объема и сложности информации, качество и доступность данных будут неизбежно падать, а значит и доверие к системам и к информации, которая в них хранится, будет снижаться. Другими словами, отсутствие процессов управления информацией со временем вызовет отказ от использования этих систем. Именно качественные метаданные помогут избежать такой ситуации, и именно они являются основой для качественного управления информацией!

Метаданные — это информация, содержащая ответы на вопросы: кто? что? где? когда? почему? как? относительно любых данных в компании.

Метаданные без контекста

Однажды мы с друзьями поехали в туристическую поездку по Испании. На нашем пути лежала очень маленькая но, судя по информации с туристических форумов, очень аутентичная деревня. Хотя население деревни составляло не более 40 человек, в ней имелся свой домашний ресторан, и, решив отведать местной кухни, мы направились именно туда. Владелица ресторана, она же повар, она же официантка и весь остальной персонал в одном лице, подошла к нам и предложила перекусить. Естественно, меню было написано на испанском языке. Но что нас еще больше озадачило, хозяйка ничего не понимала на английском, поэтому для заказа еды нам пришлось использовать язык жестов. Нас было шестеро и мы заказали около десяти блюд. Ожидание оправдались за исключением всего пары блюд, так что обед можно было считать успешным.

Аналогичная ситуация имеет место, когда возникает непонимание между коллегами, что часто происходит в наших компаниях. Это случается из-за отсутствия единого бизнес-языка в общении и различных взглядов на одни и те же вещи. Такое происходит в момент, когда встречаются люди из разных бизнес-подразделений для выполнения общих задач, или когда сотрудники бизнес-подразделений встречаются с ИТ-специалистами, в этом случае проблема проявляется еще более остро. К примеру, на вопрос: кто такой клиент/абонент? от разных подразделений мы можем получить совершенно разные ответы:

  • Финансы ответят, что клиент — это объект взаиморасчета.

  • Маркетинг ответит, что клиент — это, прежде всего, потребитель.

  • Для ИТ и того проще, клиент = запись в базе, у которой есть транзакции.

Разное понимание таких базовых вещей может привести к тому, что, к примеру, показатель «Количество клиентов/абонентов» для разных подразделений может рассчитываться по-разному (могут применяться различные формулы для расчета) и, более того, с использованием разных источников информации. Это звучит весьма странно, однако, как показывает опыт, происходит такое гораздо чаще, чем хотелось бы. Отсутствие единого бизнес-глоссария, единой базы знаний в компании затрудняет коммуникации между подразделениями. Кроме того, отсутствие единого толкования данных в компании сказывается на скорости, качестве выполняемой работы и, как следствие, на эффективности деятельности компании.

Наша цель — создать единое понимание/видение данных в компании, чтобы пользователь мог с минимальными трудозатратами получить необходимую для него информацию, четко ее интерпретировать, а также определить, в каких еще процессах компании данная информация используется, и кто ответственный за ее качество.

Наша цель — построение корпоративных процессов управления метаданными!

Управление метаданными позволяет компаниям устранить рассогласования в данных, повысить эффективность интеграции бизнес-процессов и устранить препятствия для успешного внедрения и развития корпоративного хранилища данных, систем управленческой отчетности и аналитических систем.

Неструктурированная информация

Китайская мудрость гласит: «Много «хорошо» тоже плохо». Что в оригинале звучит примерно так: «感謝您的興趣在元數據中».

Мы уже давно привыкли к тому, что из-за отсутствия указателей на наших железнодорожных или автовокзалах порой трудно что-то найти, к примеру, кассу для покупки билетов или туалет. Благодаря нашей находчивости мы научились ориентироваться по направлению движения толпы и по другим ориентирам. Но в некоторых аэропортах и вокзалах можно встретить абсолютно противоположную картину. Так называемая сценка «Растерянный турист»: Вы наверняка хотя бы раз видели туриста, который стоит посреди вокзала, держит перед собой карту и растерянно крутит головой, пытаясь найти направление, в котором двигаться. И проблема не в том, что правильного указателя нет. Он есть. Где-то... Проблема в том, что окружающее количество информации такое, что найти нужную довольно трудно, на это тратится огромное количество времени. Или, что хуже, когда терпение на исходе, решение может быть принято наугад, а это может повлечь за собой негативные последствия.

Если информации много, она неструктурирована и дублируется в разных системах, сотрудник компании, скорее всего, будет использовать ту информацию, на получение которой он потратит минимальное количество сил и времени. В такой ситуации существует риск того, что источником будет выбрана система, в которой хранится устаревшая или некорректная информация. Если это произойдет, то решения, которые будут приняты на основе такой некачественной информации, также могут быть неверными. Такие риски нельзя оставлять без внимания, так как именно от того, насколько правильные были приняты решения, главным образом зависит успешность бизнеса. Четкое и полное описание информации, т.е. метаданные, поможет избежать такой ситуации с информацией в компании. Именно структурированные метаданные, с построенными между ними связями, помогут быстро и, главное, точно найти искомую информацию, т.е. информацию, которая будет наиболее полной, актуальной и корректной. Для хранения метаданных и автоматизации процессов по управлению ими используется система корпоративного управления метаданными. Данная система является единым репозитарием хранения всех метаданных в компании, она позволяет сотрудникам быстро и точно получить любую информацию, касающуюся бизнеса или ИТ.

Основные преимущества использования системы управления метаданными следующие:

  • единое хранилище (репозитарий) метаданных, доступное всем сотрудникам компании;

  • быстрый поиск и удобная работа с информацией (гибкий механизм поиска и настройка фильтров, визуализация связей между метаданными, хранение истории изменений метаданных и возможность «отката» к предыдущей версии, автоматическое создание гиперссылок на уже созданные метаданные, wiki-технология и т.д.);

  • структурное хранение информации (возможность для построения таксономии, классификации и многоуровневых иерархий);

  • возможность перехода от бизнес-метаданных (определений бизнес-терминов) к техническим метаданным (например, к полю в отчете, в котором используется данная информация, или к таблице в базе данных, в которой хранится данная информация);

  • lineage/impact анализ — визуализация потоков данных, благодаря которой пользователь может найти первоисточник данных; системы, в которые эти данные передаются из первоисточника; а также все преобразования, в которых данные принимают участие;

  • встроенные правила и процедуры Data Stewardship — назначение ответственных за метаданные сотрудников, бизнес-процесс ввода новых метаданных и контроль над изменениями уже существующих в системе метаданных.

Безусловно, можно найти оправдания отсутствию системы управления метаданными, но нельзя найти оправдание отсутствию процессов управления информацией, так как именно от информации зависят успех и эффективность деятельности компании! Если Вы хотите, чтобы эти процессы были полностью контролируемы и управляемы, именно корпоративная система управления метаданными послужит основой для их успешной реализации.

Заключение

Согласно отчету McKinsey Global Institute 2012, 19% своего рабочего времени сотрудники тратят на сбор и обработку информации. 19% — это почти 2,5 месяца работы каждого сотрудника ежегодно! Таким образом, от того, насколько легко необходимая информация может быть получена, насколько она будет полна и качественна, зависит эффективность времени, затрачиваемого сотрудниками, и, как следствие, эффективность компании в целом. При правильном и структурном подходе к управлению метаданными мы можем значительно сократить операционные затраты, связанные с поиском и обработкой информации, как минимум на треть. Для этого необходимо сделать пять шагов:

  1. Оценить текущее состояние процессов управления метаданными в компании.

  2. Разработать стратегию развития процессов управления метаданными в компании.

  3. Назначить ответственных за предметные области.

  4. Собрать все метаданные в единой корпоративной системе управления метаданными.

  5. Запустить программу управления метаданными!

Кто владеет информацией, тот правит миром!