Про дата-центричний світ АІ

На прикінці вересня в Сан-Хосе Intel провела велику конференцію на якій офіційно запустила свій флагманський чип Raptor Lake 13-го покоління. Але в цій публікації ми зупинимось на виступі Ендрю Ин (Andrew Ng), засновника і CEO компанії Landing AI. Він сконцентрував увагу на демократизації АІ і розповів про те, яку роль, на його думку, буде мати в цьому дата-центричний АІ.

На думку Ендрю Ин, АІ не може досягнути свого повного потенціалу, поки він не буде доступним для кожного. І АІ явно трансформував технологічні компанії, особливо ті, що працюють у сегменті Інтернет та мають сотні мільйонів або, навіть, мільярди користувачів. Але якщо вийти за межі споживачів, інтернет- або техсектору, потенціальний розвиток або прийняття АІ тільки починається. Якщо подивитися на систему охорони здоров'я, виробничі підприємства або логістику, там є якась активність, але ця активність тільки зароджується по зрівнянню з секторами споживачів та Інтернету.

Доповідач висловив припущення, що у недалекому майбутньому навіть власник невеликої піцерії, у кого є дані, зможе використовувати АІ, щоб покращити свій малий бізнес. Якщо подивитися на великі підприємства поза технологічним сектором, чому впровадження AІ так відстає в порівнянні з секторами споживачів, Інтернету та розробниками ПЗ? Андрю Нг висловив думку, що є два основних бар'єри для прийняття АІ, а потім декілька ідей, які могли б допомогти всім індустріям у цьому питанні.

Виступаючий багато працював в області комп'ютерного зору і контролю виробництва. Але рецепт, який він описує, на його думку, можна застосувати до багатьох прикладних програм АІ та інших доменів комп'ютерного зору, що допоможе багатьом людям прийняти АІ. По-перше, один з бар’єрів для прийняття АІ - це малі набори даних. Коли доповідач працював для великих компаній, він одного разу розробив систему розпізнавання облич, використовуючи 350 млн. зображень. Але в деяких сегментах, скажемо, де працюють з медичними зображеннями, мова може йти про сотні зображень рідкісних станів. На думку Ендрю Ин, орієнтований на дані АІ буде ключовою частиною для розблокування цінностей у всіх індустріях, де розміри набору даних досить малі.

Другий основний бар’єр на шляху широкого розповсюдження АІ, який бачить доповідач - це налаштування (кастомізація). Якщо взяти існуючі та потенціальні AI-проекти у світі і відсортувати їх по зменшенню порядку вартості, то отримаємо криву, схожу на гілку гіперболи.

Про дата-центричний світ АІ

Залежність кількості проєктів від вартості

Для прикладу, деякі компанії можуть найняти сотні інженерів, щоб збудувати єдину систему, яка показує релевантнішу рекламу та привертає увагу, яка коштуватиме, скажімо, 1 млрд дол. на рік. Мабуть, другою найбільш коштовною АІ-системою можна назвати систему пошуку у Інтернет. І третій приклад - це деякі рекомендаційні системи онлайн-торговлі. Але дещо в AI-світі ми маємо колективно усвідомити - як будувати ці великі монолітні AI-системи, які можуть обслуговувати сотні мільйонів або іноді мільярди користувачів і принести величезну економічну цінність. І це виправдовує створення великих АІ-команд. Як тільки піти до інших індустрій, фізичного світу, то прикладне ПЗ роблять більш неоднорідним. Наприклад, візьмемо фармацевтичну фабрику, де виробляють пігулки, там може виникнути потреба у системі комп'ютерного бачення для виявлення браку. І тільки ця одна компанія виробляє пігулки, які виглядають так, як вона бажає. То вони потребують АІ-систему, яка налаштовується саме під них. Ії треба створити, виходячи з вигляду пігулок. Далі, ви можете піти до фабрики, яка виробляє листи сталі. Вони виглядають зовсім інакше, ніж пігулки, тому потрібна повністю інша АІ-модель. Візьмемо тепер виробника напівпровідників, який випускає напівпровідникові пластини. І там все інше. Таким чином, проблеми АІ для широкої індустрії потребують колективного пошуку шляху для свого використання. Фізичний світ неоднорідний, це різні продукти. І кожен з проєктів може коштувати від 1 до 5 млрд. дол.

Сьогодні можна бачити, що багато з проєктів з використанням АІ насправді не виконуються ефективно. Як колективно зробити їх ефективними, не наймаючи 10 тис. інженерів по машинному навчанню? Один з шляхів - це стартувати поширення АІ в індустрії, щоб збудувати вертикальні платформи, які дозволять кінцевому клієнту будувати потрібні саме їм системи. Тому, чим наймати 10 тис. інженерів по машинному навчанню, краще поставити виробничий персонал на таких фабриках, щоб побудувати АІ-системи. Найбільш ефективний шлях до успіху, який дійсно працює, це налаштувати їх на розробку даних, а не коду. Треба надати персоналу необхідні інструменти, які посилять предметні знання для збору даних. Це те, що можна зробити, і що налаштовує на успіх у створенні та розгортанні АІ-систем. І багато з цього є серцем ідеї дата-центричного АІ, який є ключем до демократизації доступу до нього. Що мається на увазі?

За останні декілька декад звичайний підхід до розробки АІ був модель-цернтричним, або код-центричним. Мається на увазі, що для побудови АІ-систем потрібно написати код, щоб реалізувати алгоритм, або якусь модель нейронної мережі, якусь модель глибокого навчання. Потім цю модель тренують на наборі даних. Тобто, був справедливий вираз АІ = Код + Дані. Шлях, який використовували для АІ упродовж декількох декад, це завантажити набір даних з Інтернету або отримати їх від когось. А потім, давайте розробимо наш код, працюймо над кодом, шліфувати алгоритм нейронної мережі. В цьому немає нічого поганого, і фактично, це парадігма розробки, яка призвела до великого прогресу в машинному навчанні останні декілька десятиліть. Але завдяки цій парадигмі в розробці машинного навчання можна побачити, що для великої кількості практичних прикладних програм, код вирішує задачу, але не всі задачі. Для багатьох задач є реалізація з відкритим кодом, або щось, що можна отримати на GitHab, і яке буде добре працювати.

Таким чином, дата-центричний АІ - це дисципліна систематичної розробки даних, які використовуються для побудови АІ-систем. Далі Ендрю Ин поділився одним прикладом. Це проєкт, який розроблявся на заводі, де виробляють дуже великі листи сталі. Виробничі підприємства, їх внутрішня технічна команда досягли точності контролю листів 76,2%. Але вони хочуть досягнути 90%. Один з інженерів пішов до них і надав їм дата-центричні інструменти Landing AІ, за допомогою яких вдалося виявити невідповідності на поверхні.

Але що мається на увазі під розробкою даних? Що таке дата-центричний АІ? Ось приклад для ілюстрації. Виявляється, дані навіть помарковані експертами, часто суперечливі. Експерти часто маркували одні й ті речі по-різному. Так, дивлячись на неоднорідність на пігулці, один міг сказати, що це тріска на поверхні, а другий — що подряпина. І фактично невідомо, хто правий.

Про дата-центричний світ АІ

Приклад суперечності даних

ʼАле ця суперечність даних робить задачу визначення для АІ дуже заплутаною. Практика показує, що коли є подібна суперечність, майже любий послідовний стандарт кращий, ніж суперечність. То ж, назвемо це тріскою, або назвемо це подряпиною. Будь-що підійде. Але досягнення цієї узгодженості має велике значення для продуктивності праці, і це також є критичним для продуктивності на малому наборі даних. Якщо є 100 млн. зображень, це добре. Алгоритм навчання буде брати середнє і, може, буде називати щось подряпиною частіше. Але якщо у вас тільки 10 або 50 зображень, ця узгодженість є критичною для роботи прикладного ПЗ. У типічному випадку така ж картина спостерігається і при обробці природної мови. Потім відбулася коротка демонстрація інструменту, який має компанія. Це маркування на основі угоди для допомоги розробникам помітити ці суперечності. Репрезентативне рішення приймається, базуючись на статистиці.

Ідея виникнення нової технології схожа з ідеєю створення нового ПЗ. Спочатку є декілька експертів, яким вдається змусити щось працювати. Для прикладу Ендрю Ин узяв глибоке машинне навчання. Приблизно 15 років тому була невелика група людей, які були в змозі примусити алгоритми глибокого навчання працювати. А потім зрештою принципи стали поширюватися, з’явились дослідницькі публікації. Отже, способи змусити нейронну мережу працювати стали поширюватися. І зараз дуже багато людей здатні реалізувати нейронну мережу на С++. І зрештою це дало старт інструментам, таким як TensorFlow і PyTorch.

То ж де ми зараз в дата-центричному АІ? На думку доповідача, ми вже давно цим займаємось. Упродовж багатьох десятиріч є фахівці, які вводять дані для машинного навчання. Дата-центричний АІ-рух набирає обертів за останні декілька років. Зараз ми міцно перебуваємо на цій стадії, коли є багато семінарів, заходів тощо, де багато людей організовують технологію АІ. Можна побачити початок деякої стандартизації термінології, і принципи набувають більшого поширення. Одне, чим захоплений доповідач, за його словами, це побудова інструментів, що роблять застосування цих ідей більш систематичними.

Про дата-центричний світ АІ

Процес розгортання нових технологій

І тому проєкт, над яким Ендрю Ин працював декілька років у Landing AI, - це ПЗ, щоб зробити комп'ютерний зір легшим. Річ у тому, що в області даних є багато проблем. Частину з них вдалося вирішити, частина вирішується. Дані безладні. Вже йшла мова про неузгодженість маркування, некоректних міток або взагалі про їх відсутність. Іноді зображення поганої якості, іноді недостатньо даних певних типів. Багатьом дослідникам потрібна допомога у визначення пріоритетів помаркованих ресурсів. Але як найбільш ефективно використати обмежені ресурси? Поповнення даних або синтез даних, обробка метаданих, обробка каскадів даних, де є складні ланцюги багатьох моделей? Тут багато проблем, які потрібно вирішити. Як побудувати принципи, розробити принципи, а також створити інструменти, які дозволять багатьом людям отримати доступ і побудувати свою власну індивідуальну АІ-систему. Але доповідач має надію, що колективно це можна зробити.

Отже, які ключові переваги дата-центричного АІ? Мова йде про демократизацію доступу до АІ. Ендрю Ин бачить, що команди можуть більш систематично покращувати дані, де команди, мається на увазі не тільки інженери по машинному навчанню, фахівці з предмету та кілька зацікавлених сторін або навіть глобальні команди, працюючі в георозподілений спосіб, можуть співпрацювати, щоб визначити дефект. Тепер, коли побудована система машинного навчання і, може, дуже швидко розгорнута, ії треба покращувати.

Про дата-центричний світ АІ

Після побудови, систему треба покращувати

АІ буде змінювати всі індустрії, зокрема, ритейл, транспорт і логістику, охорону здоров’я. Але на його шляху є два бар’єри, про які було згадано раніше — це малі набори даних та довгострокова проблема налаштування. На думку Ендрю Ин, дата-центричний АІ буде ключем для розблокування повного потенціалу штучного інтелекту.

Підсумовуючи, дата-центричний АІ є дисципліною систематичного вводу даних, необхідних для побудови АІ-системи. Це дуже важливий технічний напрямок для АІ-спільноти. І вирішення проблеми малого набору даних та кастомізації буде ключем до демократизації доступу до АІ.

Стратегія охолодження ЦОД для епохи AI