`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Леонід Бараш

Інтуїтивне навчання фізики в моделі глибокого навчання, натхненної психологією розвитку

0 
 

«Інтуїтивна фізика» уможливлює нашу прагматичну взаємодію з фізичним світом і є ключовим компонентом аспектів «здорового глузду». Сучасні системи штучного інтелекту (ШІ) бліді у своєму розумінні інтуїтивної фізики навіть у порівнянні з дуже маленькими дітьми. Цікаво розглянути цей розрив між людьми та машинами, спираючись на поле психології розвитку.

Інтуїтивна фізика є фундаментальною для втіленого інтелекту, очевидно тому, що вона необхідна для всіх практичних дій, а також тому, що вона забезпечує єдину основу для концептуального знання та композиційного представлення в цілому.

Щоб розвивати здоровий глузд у фізичній інтуїції в системах ШІ, у багатьох моментах натхнення черпається з психології розвитку. Розробляючи поведінкові зонди для дослідження дітей, психологи розвитку ґрунтували свій підхід на двох принципах. По-перше, ядро інтуїтивної фізики ґрунтується на наборі дискретних понять (наприклад, постійність об’єкта, міцність об’єкта, безперервність тощо), які можна диференціювати, операціоналізувати та індивідуально досліджувати. Другий принцип, який використовують психологи розвитку для дослідження фізичних концепцій, полягає в тому, що володіння фізичною концепцією відповідає формуванню набору очікувань щодо того, як може розгортатися майбутнє. Завдяки цій концептуальній основі з’являється метод вимірювання знань про конкретну фізичну концепцію: парадигма порушення очікувань (VoE).

Використовуючи парадигму VoE для дослідження конкретної концепції, дослідники показують немовлятам візуально схожі масиви (так звані зонди), які або узгоджуються (фізично можливо), або не відповідають (фізично неможливо) цій фізичній концепції. Якщо немовлята більше здивовані неможливим масивом, це є доказом того, що їхні очікування, які випливають зі знання досліджуваної фізичної концепції, були порушені. У цій парадигмі здивування ймовірно вимірюється тривалістю погляду.

У цій роботі використовувався набір даних Physical Concepts. Важливо те, що набір даних Physical Concepts також включав окремий корпус відео, призначених для навчання.

Отримавши цей набір даних і систему оцінки, переходять до головної мети: будують модель, здатну навчатися інтуїтивно зрозумілій фізиці, і розібрати, що забезпечує цю здатність. Використована архітектура натхненна твердженнями психології розвитку, які стверджують, що в основі інтуїтивної фізичної поведінки немовляти лежать три об’єктоцентричні процеси. Перш за все, це процес індивідуації об’єкта. Індивідуація об’єкта вирізає безперервний перцептивний вхід бачення в дискретний набір сутностей, де кожна сутність має відповідний набір атрибутів. По-друге, відстеження об’єктів призначає індекс кожному об’єкту, забезпечуючи відповідність між сприйняттям об’єкта протягом часу та обчислення динамічних властивостей. Останнім компонентом є реляційна обробка цих відстежуваних об’єктів.

Для реалізації об’єктоцентричного підходу обрана модель складалася з двох основних компонентів: перцептивного модуля прямого зв’язку і рекурентного предиктора динаміки з пам’яттю для кожного об’єкта. Перцептивний модуль приймає як вхідні дані зображення та маску сегментації та перетворює їх у векторне вбудовування за допомогою стандартних методів автоматичного кодування глибокого навчання. Центром предиктора динаміки є структурована рекурентна нейронна мережа, яка має назву InteractionLSTM.

Була висунута гіпотеза, що залучення кодування на об’єктному рівні буде критично важливим для набуття інтуїтивно зрозумілих фізичних концепцій і відповідних ефектів VoE.

Для всіх моделей навчання складалося з двох етапів. На першому етапі перцептивний модуль був навчений реконструювати окремі зображення з навчальних даних. На другому – динамічний модуль навчили передбачати наступний набір об’єктних кодів у відео з навчального набору.

Нарешті, щоб врахувати мінливість результатів моделювання, було обчислено середню точність і середню відносну несподіванку для п’яти різних початкових випадкових значень кожної моделі.

Інтуїтивне навчання фізики в моделі глибокого навчання, натхненної психологією розвитку

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

0 
 

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT