`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Денис Хлєбосолов

Відмінність пошуку Google від запиту до AI

0 
 

Спробуємо на простому прикладі показати, чим структурно, філософськи та програмно відрізняється простий прикладний запит у Google від цього ж запиту до сучасного AI-агента у різних версіях. Для зручності та прив'язки до реальних завдань ми розглянемо роботу пошукової системи та AI-агента на базі такого важливого та актуального для українців запиту, як-от: “Купити квитки Варшава-Лондон 26 березня”

Стандартний пошук у Google – режим "бібліотекар"

Пошукова система Google є складним механізмом (це якщо сказати дуже лагідно), але ми розглянемо базові принципи, як це взагалі працює. Для нас важливими є три параметри: Сканування, Індексування, Ранжування.

Тож як Google-пошук відпрацьовуватиме наш запит “Купити квитки Варшава-Лондон 26 березня”

Сканування (експедиція ресурсів). Це попередній процес підготовки даних. Умовні роботи постійно пробігають інтернетом (тому пошук у Google відбувається так швидко) і постійно моніторять наявні ресурси та знаходять нові. Цей етап не ініціюється нашим запитом до пошукової системи, він фоновий і йде 24/7. Це базовий фоновий режим пошукового движка.

Індексування (інвертований індекс) — це створення "зв'язку", де навпроти наших слів "Варшава", "Авіаквитки", "Лондон" стоять адреси всіх сторінок, де вони зустрічаються. Це можна порівняти зі створенням пошукової картки.

Ранжування. Це найенерговитратніший і, скажемо так, наукомісткий етап. Це вибірка з релевантності, тобто відповідь на запитання – скільки з тисяч результатів показати нам (які ресурси в мережі мають найбільшу довіру та вагу) та які з них поставити першими. А потім ще включається надбудова — які послуги запропонувати як пряму та непряму рекламу.

Що в результаті? Пошуковик Google обробляє наш запит пройшовши ось ці три етапи, і витрачає на це абсолютно реальні 0,3 Вт·год (значення звичайно усереднене). Далі для зручності сприйняття порівнюватимемо енерговитрати з роботою світлодіодної лампочки 5 Вт. Так ось ті самі 0,3 Вт·год, це кілька хвилин її роботи.

Фіксуємо: пошукова машина Google на запит "Купити квитки Варшава-Лондон 26 березня" видає нам найбільш відвідувані та "шановні" сайти, показує рекламу, що належать до авіаквитків і безпосередньо видає розклад рейсів по даному напрямку на задане число. По суті виконується операція порівняння, де Google порівнює наші слова із запиту зі своєю, заздалегідь готовою базою. Процесу комп'ютерного "мислення" тут як такого немає, всі "розумні дії" лягають виключно на вас, і як ми обговорили, кожен такий запит коштує цивілізації двох хвилин освітлення в коморі.

З пошуком сяк-так розібралися. Тепер переходимо до найсмачнішого: як же наш запит про квитки обробить AI-агент (наприклад, найпопулярніші Gemini, ChatGPT).

Запит в AI-агент (вибір моделі "швидка") — режим "консьєрж-сервіс, що думає"

Важливе уточнення, чому ми саме вказали «швидку» модель, тому що включення режиму Pro "думає" серйозно змінює суть процесів, що відбуваються. Мова про наш запит у версію PRO AI-агентів піде нижче.

Оскільки ми домовилися, що говорити про те, як “думає AI” будемо пізніше, зараз обговоримо, що він робить. Часто ми це робитимемо на рівні аналогій з реального світу, поки це взагалі буде можливим.

Тут наш запит можна умовно порівняти з телефонним дзвінком до консьєрж-центру з назвою “швидке вирішення будь-яких питань”. Технічно ж AI-агент обробляє наш текст "Купити квитки Варшава-Лондон 26 березня" наступними етапами.

  • Семантичний розбір. Штучний інтелект не просто шукає слова "Варшава", "Лондон", "авіаквитки". AI-агент визначає ваш намір (інтент, зміст запиту). Завдання: Зрозуміти, що це не просто інтерес до географічних об'єктів (міст), а комерційний запит на транзакцію. AI виділяє сенси: Пункт А, Пункт Б, Дата, Тип послуги.
  • Активація контекстного шару. AI-агент звертається до вашого профілю в рамках поточної сесії спілкування та нещодавньої історії діалогів. Завдання: Підняти «вагу та важливість» ваших уподобань. Ви інженер, бухгалтер, маркетолог, військовий? Значить, важлива точність, зручність, ціна тощо. У вас раніше були описані проблеми зі здоров'ям? Значить, параметри комфорту та часу пересадки набувають додаткового пріоритету.
  • Планування ланцюжка дій. Тут AI-агент вирішує які інструменти йому потрібні саме для обробки вашого запиту. Завдання: Для покупки квитків недостатньо індексації в Google, потрібний прямий доступ до Google Flights API. Формується внутрішній план: «Спочатку запит цін -> потім перевірка розкладу -> потім зіставлення з особистими фільтрами».
  • Виконання зовнішнього виклику. Етап "виходу" запиту за межі нейронної мережі у зовнішній інтернет. Завдання: Надіслати вже структурований запит від AI до шлюзів авіакомпаній. Тут виходять «сирі» дані: 150 варіантів рейсів, які Google Search просто видав би списком у разі просто запиту в пошуковій системі.
  • Багатофакторна фільтрація. Це найбільш енерговитратний та “повільний” з погляду обчислень етап для нашого процесу. Кожному з умовних 150 рейсів надається вага (важливість). Враховуються параметри: ціна, тривалість, аеропорти імені Шопена та Модлін, репутація перевізника, час вильоту, відгуки про авіакомпанії, можливість раннього бронювання тощо.

Саме на цьому етапі відбуваються фундаментальні для AI обчислення — перемноження матриць (тензорів). Суть цього процесу та термін “тензор” ми обов'язково обговоримо пізніше, це взагалі БАЗА все того, про що ми говоритимемо у майбутньому. Цей етап для AI найважливіший — коли з “сирих” даних величезного розміру формується той остаточний варіант, що “дістається” вам на екрані агента. Тут AI перетворює ваші суб'єктивні бажання та питання на об'єктивні числа, а згодом знаходить єдину точку перетину в багатовимірному (іноді з тисячею математичних вимірювань) просторі параметрів. Розуміємо звучить складно, так що краще перечитати ще раз і вже починати гуглити що таке багатовимірні тензори (успіхів).

  • Синтез та «Галюцинаторний контроль». Тут AI-агент перевіряє сам себе. Завдання: Чи не запропоновано рейс, який уже вилетів? Чи не переплутані аеропорти Лондона (Хітроу та Станстед)? Згенерована відповідь звіряється з нині отриманими фактами, щоб виключити вигадування (в термінах AI — галюцинацію).
  • Формування відповіді. Трансформація табличних математичних даних у зрозумілий людині текст. Завдання: Упакувати сухі цифри у зрозумілу відповідь і, можна додати пораду, що має велику "вагу", наприклад «Це хороша вартість для цього напряму на ці дати».
  • Підготовка до зворотного зв'язку. AI-агент прогнозує наступне питання користувача на основі наявного “досвіду”. Завдання: Знайти інформацію про трансфер з аеропорту або правила перевезення багажу, щоб вони були «в кеші» агента, якщо надійде питання: «А що з допустимою вагою та обсягом багажу?»

Повертаємося до дійсності, тобто до розрахунку витрат. Один такий запит, в середньому, коштує людству вже 3 Вт·год, як ви помітили у 10 разів більше ніж звичайне звернення до пошуку Google. Це ніби ви забули де лежить старий калькулятор у коморі та пів години підсвічували його пошук, або зарядили свій iPhone на 30%. Мало того, один такий запит споживає приблизно 0,5 літра води для охолодження (яку, до речі, не можна проносити на рейси в літаки маршрутом Варшава-Лондон у ручній поклажі).

Як ви бачите (навіть на цьому етапі) тензорна математика аж ніяк не є "безкоштовною" на відміну від нульової ціни "швидкої" версії популярних AI-агентів. До глобальних масштабів проблеми ми ще обов'язково повернемося в наступних постах, а зараз переходимо до поточного фіналу нашого матеріалу — обробці запиту "Купити квитки Варшава-Лондон 26 березня" в "версії агентів ChatGPT і Gemini, що думає".

Запит в AI-агент (вибір моделі "PRO") — режим "персональний помічник"

Пристебніться, починається "важке машинобудування в режимі турбулентності". Якщо в першій частині ми описали роботу пошукача Google, у другій — дисциплінованого консьєржа (швидка модель), то режим PRO можна порівняти з особистим секретарем-референтом, що має PhD-ступінь.

Для нашого запиту «Варшава — Лондон 26 березня» різниця буде не в результаті (посилання на квитки ви отримаєте у всіх трьох випадках), а в глибині опрацювання системних ризиків та обліку кількості непрямих факторів, що впливають на результат.

Ось як це працює на рівні архітектури AI-агента у версії PRO.

  • Метод «Дерево думок». Швидка модель AI йде прямо: «Запит - Пошук - Обробка — Відповідь». Режим PRO "вирощує" дерево варіантів з відповідями. Він «думає» відразу в кількох напрямках: Гілка А: «Найдешевший лоукостер за маршрутом. Гілка Б: «Прямий рейс із Шопена (ближче до центру)». Гілка В: «Можливо варіант з пересадкою, у якихось випадках може бути кращим.

AI у собі починає натурально “сперечатися” сам із собою. Він імітує критику в самодіалозі: «Так, варіант А дешевий, але проїзд до Модліна вночі коштує 100 злотих, отже, варіант Б насправді може бути вигіднішим». Швидка (однопрохідна) модель на таку багатоходівку за визначенням не здатна.

  • Ланцюжок міркувань із самоперевіркою. У режимі PRO вмикається циклічний верифікатор. Швидка модель: Побачила ціну $40 (в один прохід), вважала такий результат кращим і достатнім і видала вам як результат. PRO модель: Бачить ціну $40, а далі приблизний хід мислення PRO AI-агента: — "Стоп. 26 березня — це середина тижня. Чому так дешево? Перевіряються правила перевезення багажу. Ага, тут тільки дозволена маленька ручна поклажа. Якщо користувач з України, а значить довго їде до Англії, і до Варшави, мабуть, мав валізу. Разом $85. А може є варіант не у лоукостера, але з кращим сервісом?
  • Робота з галюцинаціями на стероїдах. У PRO-версії виділяється окремий (немалий) обчислювальний ресурс на факт-чекінг (за певних настройок навіть параноїдальний). AI-агент кілька разів перепитує пошуковий індекс: «Чи пустять українця до Лондона (потрібна віза)? Чи точно цей рейс літає середами? Чи точно в Лондоні аеропорт Лутон не закритий на ремонт чи є складнощі щодо трансферу до міста через ремонт доріг?». Це ніби інженер перед здаванням проєкту тричі перевірив ще раз всі розрахунки в різних програмах, а потім ще попросив про це колег.
  • Ресурсний "кошмар" (Фізика процесу). Ось тут самий сік, чого ви точно не знали. Відповідаємо на запитання: чому PRO-версія така повільна та дорога? Обчислення: Якщо швидка модель робить один «прохід» (про що ми говорили раніше: однопрохідний механізм формування результату) по нейронній мережі, то PRO робить десятки та сотні ітерацій (циклів) для уточнення і корекції.

Енергія: Замість 0,3-3 Вт·год витрачається від 30 до 100 Вт·год. Як ви помітили тут жарти скінчилися, це один запит за ціною кількох добових зарядок iPhone і відра води, перетвореної на пару на додачу. Уявіть, ви йдете на посадку в літак, обвішані повер-банками, а в рюкзаку стратегічний запас води на тиждень, а в коморі ви світло взагалі забули вимкнути.

Різниця між швидкою та PRO версією — це різниця між РЕАКЦІЄЮ на запит та РОЗДУМАМИ над запитом. Швидка модель дає вам статистично найімовірнішу відповідь, над якою “подумали” дуже добре, але один раз. PRO-модель будує математичну модель вашої поїздки з огляду на приховані змінні, логістичні пастки та економічну доцільність. Ви платите грошима, часом очікування і колосальною витратою електроенергії за те, щоб AI-агент здійснив за вас не просто пошук, а вирішив повноцінний квест із переміщенням українця з Варшави до Лондона.

Наш поточний висновок: головна відмінність режиму PRO — наявність “зворотної петлі”. Якщо звичайна (швидка) модель AI працює як конвеєр (вхід -> вихід), то PRO-модель - ще і як "відділ технічного контролю" для фінального результату. Згенерувавши попередню відповідь, AI-агент проганяє її через фільтр ваших особистих обмежень. Якщо знаходиться невідповідність — наприклад, занадто довга пересадка для людини з хворою спиною — модель "відкатується" назад, анулює результат і починає пошук знову (що може відбуватися сотні разів), поки не знайде рішення, яке пройде внутрішню перевірку на всі фактори, що на думку AI можуть вплинути на результат.

Ось таким вийшов перший пост з серії “Введення в AI”. Завдання, яке ми ставили — це розуміння базових механізмів взаємодії з AI, виявлення різниці цієї взаємодії в порівнянні зі звичайним пошуком в інтернеті, і якою є ціна кожної з ваших взаємодій.

Сподіваємося ви здогадалися (з огляду на описану логіку процесів), що найкращим варіантом запитів стане:

у Google пошук: "авіаквитки Варшава-Лондон".

у швидку модель AI-агента: "купити авіаквитки на прямий рейс 26 березня Варшава-Лондон"

у модель PRO AI-агента: "купити авіаквитки на прямий рейс 26 березня Варшава-Лондон, виліт з ранку, з габаритним багажем, місце біля вікна в задній частині літака".

До речі важливе уточнення: якщо ви зрозуміли, чому саме такі запити дадуть вам найкращі результати, ви зрозуміли зміст цього посту на 100% і ми можемо рухатися далі в безмежний океан світу AI.

Стратегія охолодження ЦОД для епохи AI

0 
 

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT