`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Прогресивні системи доставки даних. ETL та ELT

Головним завданням ETL та ELT-систем є структурування, збагачення, оптимізація та передача вихідних даних компанії з кількох програмних оболонок у єдину централізовану базу зберігання для подальшої обробки.

Модель ETL працює за принципом Extract, Transform, Load. Інформація, що отримується з різних джерел, оброблена відповідно до алгоритмів довідників різних ІТ-систем і має неоднаковий ступінь деталізації, наводиться в єдиний формат і стає придатною для подальшої обробки. Наступне завдання ETL – це доставка даних, яка має здійснюватися найшвидшим способом без втрати якості та достовірності.

Своєю чергою ELT-системи відрізняються послідовністю виконуваних дій: Extract, Load, Transform. Дані спочатку отримують та завантажують, а лише після обробляють. Ця модель забезпечує високу швидкість обробки великих масивів асинхронних даних. Для цього вона залучає ресурси хмарних обчислень, які можна масштабувати без використання локального обладнання. Таким чином, ELT – це не просто зміна послідовності дій, але якісно новий підхід до процесу трансформації даних.

ETL і ELT – два прогресивні підходи, кожен з яких має певні переваги.

ETL здійснює підготовку даних для подальшої аналітики одразу після їх вивантаження. Для цього система отримує інформацію з різних баз, очищує від помилок, приводить до єдиного рівня деталізації тощо. Таким чином, збагачені дані, що одержуються з різних джерел, приводяться до єдиного формату, що дозволяє ефективно з ними взаємодіяти. Тільки після всіх цих маніпуляцій інформація надходить до цільового репозиторію і стає доступною для вивчення з використанням технологій BI та data science.

Прогресивні системи доставки даних. ETL і ELT

Головні перевагами ЕТL:

  • добре вивчений процес, який легко підтримувати на професійному рівні. Існує велика кількість перевірених часом інструментів та платформ ETL;
  • якісна підготовка даних для аналізу – після вивантаження інформації вона може бути використана для вивчення без додаткового коригування;
  • наявність аудиторського сліду, що дозволяє відстежувати походження даних.

ETL якісно впорядковує вихідну інформацію, готуючи її до процесів візуалізації, моделювання та подальшого перетворення. ЕТL-системи досить надійні та проєктуються відповідно до потреб користувача. Однак вони мають кілька вагомих недоліків:

  1. Значні витрати часу. Для консолідації даних необхідно розробити єдині вимоги, які мають бути застосовані до різних джерел інформації. Їх використання може розтягнутися на тижні та навіть місяці. Чимало часу знадобиться і на оновлення цільового репозиторію;
  2. Відсутність гнучкості. Конвеєри даних спочатку проєктуються відповідно до поточної специфіки джерел інформації та цілей користувача. При збільшенні кількості джерел даних або появі нових варіантів їх використання необхідно заново модернізувати систему;
  3. Залежність передачі від коректності процесів їх перетворення. У разі помилки на одному з підготовчих етапів вивантаження інформації зупиняється;
  4. Обмеження доступу до вихідних даних кінцевих користувачів. Його мають лише фахівці, залучені у їхній трансформації.

Головною причиною недосконалості ETL можна вважати виконання перетворення даних у конвеєрі. Тому доводиться технічно модернізувати систему за будь-яких змін, що потребує значного ресурсу часу. Звідси випливає і проблема зупинення оновлення інформації через внутрішні помилки, а також обмеження доступу до вихідних значень.

Прогресивні системи доставки даних. ETL і ELT

У деяких випадках специфічне оновлення інформації в ETL виявляється незручним. Суть у тому, що пакети даних завантажуються із певною періодичністю, яка заздалегідь визначена. Ще на етапі налаштування процесу ETL фахівці розраховують, скільки часу необхідно для отримання оновлення і задають частоту запуску процесу. Проблема виникає тоді, коли кількість інформації, що обробляється, збільшується. Пакети не завантажуються вчасно і система дає збій.

Існують ситуації, коли для бізнесу критично важливим є оновлення даних з високою частотою. Якщо вам потрібні нові значення показників кожні 30 хвилин, а на завантаження пакета потрібно 40 – система ETL вам не підійде.

В епоху постійного збільшення кількості джерел інформації та обсягу даних, які можуть бути використані для подальшого аналізу, бізнес потребує прискорення процесів їх підготовки та передачі. Швидкість стає важливою конкурентною перевагою, тому впровадження систем ELT стає все більш актуальним питанням.

Прогресивні системи доставки даних. ETL і ELT

Прискорення процесу передачі даних досягається з допомогою оптимізації підходу внаслідок зміни послідовності операцій. Спочатку дані виймаються та завантажуються, а лише після обробляються. У процесі їх трансформації задіяні хмарні технології, що дозволяє оптимізувати його швидко і непомітно для користувача.

Особливістю ELT є також поступове опрацювання інформації, що здійснюється в міру формування запитів. При цьому користувач може використовувати єдиний репозиторій для різних програм. На відміну від процесу підготовки інформації в конвеєрі, вихідні дані не будуть втрачені – для вирішення конкретного завдання створюється репліка. Наявність подібної проміжної бази даних дозволяє повертатися до вивчення вихідної інформації неодноразово, не вносячи технічних змін до ELT-системи.

Прогресивні системи доставки даних. ETL і ELT

Завдяки використанню ELT ви зможете оперативно керувати великими або постійно зростаючими обсягами даних. До головних переваг такої системи відносять:

  1. Висока швидкість роботи. По-перше, процесу передачі не передує їх підготовка всередині системи. По-друге, з інформацією працюють хмарні сервіси, призначені для швидкої взаємодії з великими обсягами даних. Інтерактивна аналітика самообслуговування стає доступною у режимі реального часу;
  2. Гнучкість. Дані перетворюються відповідно до запитів конкретних користувачів у момент безпосереднього звернення та можуть використовуватися для різних цілей багаторазово. При цьому не доведеться настроювати процеси на рівні ELT-системи;
  3. Масштабованість. Збільшення обсягів даних не є проблемою для ELT або хмарного сховища;
  4. Прозорість. Користувачі оперативно одержують інформацію про те, які дані доступні для вивчення;
  5. Низькі експлуатаційні витрати. При використанні хмарного ELT нема потреби інвестувати в локальне обладнання та доопрацьовувати систему у разі розширення потреб бізнесу в аналітиці або збільшення обсягів даних. Ви платите тільки за реально використаний обсяг хмарних сервісів.

Завдяки впровадженню ELT можна скоротити витрати фінансів та часу, необхідних для обробки інформації, а також отримати більше можливостей для використання вихідних даних.

Яке рішення потрібне саме вам?

На сьогодні обидві системи здатні задовольняти потреби бізнесу. ETL інструменти ефективно взаємодіють з невеликими масивами інформації, які потребують складної трансформації, але не вимагають надто частого оновлення. На противагу йому ELT-система здатна швидко передавати великі обсяги даних, регулярне оновлення яких є критично важливим.

Існують компанії, які успішно використовують обидві методики підготовки та доставки інформації. Функціонуючи паралельно, ETL і ELT здатні задовольняти різні потреби й запити бізнесу. Прикладом є використання ETL для вивчення регулярної звітності, яка не дуже часто оновлюється. При цьому ELT застосовується у напрямках, де швидке реагування є критично важливим. Відповідно, інформація може завантажуватися щохвилини або щомиті.

Попри реальну перспективу паралельного використання обох систем, останнім часом все більше компаній схиляються до повного переходу на ELT-модель. Це зумовлено постійним збільшенням обсягів даних та появою нових можливостей їх застосування на благо бізнесу. ELT має потенціал зростання і може використовуватися як шаблон передачі даних, а також реалізовувати безліч концепцій їх зберігання.

Використовуючи ELT, не потрібно налаштовувати періодичність оновлення даних у репозиторії. Вони не проходять попередньої підготовки, а отже, можуть передаватися в потоковому режимі при коригуванні старих або появі нових значень. Для цього використовується система відстеження змінених даних, яка може бути доповнена технологією CDC. Програма активуватиме процес завантаження під час кожного оновлення інформації в джерелах.

Таким чином, дані передаються постійно невеликими пакетами, що дозволяє працювати з ними в режимі реального часу, на відміну від ETL, де оновлення протягом певного часу акумулюються, а потім масово вивантажуються, що потребує великого ресурсу.

Отже, технологія CDC дозволяє автоматизувати процеси поповнення сховища даних оновленою інформацією. Його організація ELT здійснюється в автономному режимі завдяки використанню рішення з автоматизації DWA. Воно відповідає за усунення помилок, формує структуру сховища та відповідає за його повне внутрішнє обслуговування. Завдяки DWA заощаджується час, зменшуються проєктні ризики та додаткові витрати.

Сьогодні недостатньо використовувати в аналітиці точні дані для ухвалення управлінських рішень. Ключове значення має швидкість, яка стає важливою конкурентною перевагою практично у всіх сферах бізнесу. У відповідь на цю тенденцію слід оптимізувати стратегію роботи з даними. Хоча сьогодні ETL ще не є остаточно застарілим і непотрібним підходом, варто звернути увагу на ELT, що дозволяє отримати більше конкурентних переваг.

Self Service BI – аналіз даних без програмування

Інструменти Self Service BI (SSBI) стали важливою частиною платформ бізнес-аналітики (Business Intelligence). Вони дозволяють користувачам створювати запити природною мовою без знань SQL або інших мов програмування, а вбудовані алгоритми штучного інтелекту та машинного навчання допомагають ідентифікувати дані, зрозуміти значення елементів даних, автоматизувати процес підготовки звітів, а також створити різноманітні типи візуалізацій. Далі ми поговоримо про сучасні тренди й підходи у бізнес-аналітиці та як трансформувалися інструменти бізнес-аналітики за останнє десятиліття.

Історично підхід у бізнес-аналітиці пережив три основні етапи розвитку.

Централізація даних. Раніше, коли даних у компаній було значно менше, для власників бізнесу було очевидним, що відбувається всередині бізнесу та у конкурентів. Усі інструменти управління значними даними знаходились в ІТ-підрозділу. Бізнес-користувачі були змушені вимагати у колег з ІТ-відділу дані для створення звітів. Такий метод дозволяв ІТ-спеціалістам краще контролювати якість даних, забезпечувати їх безпеку та чистоту. Але на отримання, консолідацію, аналітику даних та підготовку звітності у фахівців компанії витрачалися дні, а то й тижні. У поточних конкурентних реаліях швидкість отримання інформації та її достовірність відіграють ключову роль, тому від такого підходу багато компаній відмовилися.

Децентралізація даних. Наступним став підхід децентралізації даних. Виникла потреба надати бізнес-користувачам можливість самостійно отримувати дані з джерел для створення аналітичної звітності. В результаті бізнес-користувачі отримали можливість самостійно вивантажувати дані із джерел. Як наслідок, у компаніях запанував хаос – кожен підрозділ аналізував та інтерпретував одні й ті самі дані по-своєму, використовуючи свої методи та підходи у розрахунку одних і тих самих показників. Кожен підрозділ приходив на нараду зі своїм звітом, в якому дані відрізнялися і приймати рішення на їх підставі було важко або зовсім неможливо.

Демократизація даних. Сучасний підхід у роботі з даними, який встановив баланс між ІТ-підрозділом та бізнес-користувачами. При даному підході основне завдання ІТ – це забезпечити технічну складову: організувати доступи, забезпечити масштабованість інфраструктури та якість (чистоту та достовірність) первинних даних. А всі функції аналізу та інтерпретації даних віддаються бізнес-користувачам. Даний підхід, реалізований у сучасних системах Business Intelligence, дозволяє грамотно розмежувати права доступу до потрібних даних, забезпечити максимальну гнучкість та швидкість отримання необхідної інформації. Тренд SSBI став логічним доповненням цього підходу.

Кожна компанія має кілька категорій користувачів, які оперують різними функціональними можливостями Business Intelligence:
  • Інтерактивна аналітика, дослідження даних та пошук причинно-наслідкових зв’язків;
  • Регламентна звітність. Люди, які використовують лише регламентну звітність, яким потрібні дані лише у вигляді статичних звітів. Сучасні системи бізнес-аналітики повинні мати функціонал, який автоматично підготує та надішле звіти залежно від ролі та посади людини в компанії;
  • Self Service BI. Інструмент для просунутих бізнес-користувачів, який дозволяє самостійно працювати з даними без допомоги розробників.
Як можна охарактеризувати що таке Self Service BI? Це сучасний підхід до аналізу даних, орієнтований на кінцевого користувача, який дозволяє йому самостійно створювати аналітичні звіти, моделі даних, візуалізації та ділитися ними із зацікавленими сторонами бізнес-процесу, не вдаючись до допомоги ІТ-відділу. Інструменти SSBI дозволяють розглянути будь-які показники компанії під різними кутами, перевірити гіпотези, створити нетипові звіти під індивідуальний запит бізнесу, а головне робити це швидко та без сторонньої допомоги.

Self Service у сучасних системах бізнес-аналітики характеризується простими в роботі інструментами з базовими аналітичними можливостями та спрощеною моделлю даних, яка легко сприймається та надає прямий доступ до потрібної інформації. Гнучкість Self-Service BI дозволяє користувачам створювати власні дашборди з даними, які їм необхідні.

Дослідна компанія Gartner виділяє ряд важливих критеріїв Self-Service, якими повинні мати сучасні BI-платформи. Наведемо деякі з них:
ІТ-інфраструктура. Це поняття включає безпеку, можливість підключення до різноманітних даних, можливість управління даними як локально, так і в хмарі;
  • Управління даними. BI інструмент повинен використовувати загальну семантичну модель та метадані, володіти можливістю управління завантаженням даних та оновлень, а також забезпечувати швидкий пошук, зберігання, використання та публікацію об’єктів метаданих (показників);
  • Аналіз та створення звітів. BI має забезпечити великий набір візуальних елементів для аналізу та можливості взаємодії з ними. Інструмент повинен автоматично створювати деякі показники, потрібні користувачеві, забезпечити можливість розробляти звіти для мобільних пристроїв з використанням їх переваг (сенсорний екран, камера, місцеперебування та ін.);
  • Загальні здібності. У цей пункт входить простота у використанні, візуальна привабливість, кількість використовуваних продуктів для досягнення мети (всі функції доступні в одному продукті або для цього потрібні додаткові інструменти).
Розширені можливості доступу до даних та аналітики, які надаються Self Servise, можуть принести користь підприємствам різними способами. Потенційні переваги включають:
  • Ефективне використання ресурсів бізнес-аналітики та ІТ. Оскільки бізнес-користувачі можуть проводити свій власний спеціальний аналіз, самостійна бізнес-аналітика звільняє підрозділи бізнес-аналітики та ІТ-спеціалістів організації від створення більшості запитів, візуалізацій, моніторингових панелей та звітів. Це дозволяє їм зосередитись на пріоритетних завданнях, що вимагають додаткових технічних навичок, таких як управління наборами даних для бізнес-користувачів та створення складних запитів;
  • Швидкий аналіз даних та прийняття рішень. Можливості самообслуговування допомагають виявити вузькі місця у програмах бізнес-аналітики, перекладаючи аналітичну роботу на бізнес-користувачів, а не на невелику групу бізнес-аналітиків. Це, своєю чергою, прискорює бізнес-процеси, оскільки користувачі можуть швидше аналізувати дані, а потім приймати рішення та робити дії;
  • Організація, керована даними. У міру того, як все більше керівників, менеджерів та співробітників використовують інструменти бізнес-аналітики, системи самообслуговування можуть допомогти створити культуру управління даними;
  • Конкурентні переваги. Розширене використання даних та швидке прийняття рішень можуть зробити організацію гнучкішою, що допомагає їй створити або зберегти конкурентну перевагу на ринку.
Важливо враховувати, що самостійна бізнес-аналітика також має підводне каміння. Приводячи своїх бізнес-користувачів до того, щоб вони ставали спеціальними інженерами даних, ви можете отримати хаотичний набір показників, які різняться у відділах, зіткнутися з проблемами безпеки даних.

Якщо ваша компанія щодня покладається на інструменти Self Service BI, бізнес-аналітики мають відігравати важливу роль, оскільки вони необхідні для управління цими інструментами. Вони налаштовують та стандартизують звіти, які генеруватимуть менеджери, щоб забезпечити узгодженість та значущість результатів у вашій організації. А щоб уникнути проблем, пов’язаних із надходженням та видаленням сміття, бізнес-аналітикам необхідно переконатися, що дані, що надходять до системи BI, є правильними та несуперечливими. Це часто включає вилучення їх з інших сховищ даних та їх очищення.
 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT