У Meta з'явився штучний інтелект для "мозкового" набору тексту

11 февраль, 2025 - 11:45

У Meta з'явився штучний інтелект для "мозкового" набору тексту

Ще 2017 року Facebook представила плани зі створення капелюха, що «читає» мозок, за допомогою якого можна набирати текст, просто подумавши. «Ми працюємо над системою, яка дасть вам змогу набирати текст прямо з мозку», - поділився того року генеральний директор компанії Марк Цукерберг (Mark Zuckerberg).

Тепер компанія, перейменована в Meta, дійсно зробила це, зазначається у публікації Technology Review. Ось тільки важить таке рішення пів тонни, коштує 2 млн дол. і ніколи не покине лабораторію. Проте, досить круто, що дослідники в галузі нейронаук та AI, які працюють у Meta, змогли проаналізувати мозок людей під час набору тексту і визначити, які клавіші вони натискають, просто за їхніми думками.

Дослідження, описане у двох статтях, опублікованих компанією, а також у її блозі, особливо вражає тим, що думки випробовуваних вимірювалися зовні їхнього черепа за допомогою магнітного сканера, а потім оброблялися за допомогою глибокої нейронної мережі.

«Як ми вже неодноразово переконувалися, глибокі нейронні мережі можуть відкривати дивовижні можливості в поєднанні з надійними даними», - каже Самнер Норман (Sumner Norman), засновник компанії Forest Neurotech, який не брав участі в дослідженні, але зазначає, що Meta «доклала чимало зусиль для збору високоякісних даних».

За словами Жана-Ремі Кінга (Jean-Rémi King), керівника дослідницької групи Meta «Мозок і AI», система здатна визначити, яку літеру натиснула досвідчена друкарка, у 80% випадків - точність, достатня для відновлення повних речень за сигналами мозку.

Початковий проєкт Facebook зі створення шапочки або пов'язки на голову, що зчитує мозок користувача, зіткнувся з технічними перешкодами, і через чотири роки компанія відмовилася від цієї ідеї. Але Meta ніколи не припиняла підтримувати фундаментальні дослідження в галузі нейронаук, які вона тепер розглядає як важливий шлях до створення потужніших AI, що навчаються і міркують як люди. За словами Жана-Ремі Кінга, перед його групою, що базується в Парижі, стоїть конкретне завдання - з'ясувати «принципи інтелекту», закладені в людському мозку. «Спроба зрозуміти точну архітектуру або принципи роботи людського мозку може стати основою для розробки машинного інтелекту», - каже Кінг. «Це шлях».

Система типування безумовно не є комерційним продуктом і не збирається ним ставати. Магнітоенцефалографічний сканер, використаний у новому дослідженні, збирає магнітні сигнали, що виникають у корі головного мозку під час роботи нейронів. Але він великий і дорогий, та працювати з ним потрібно в екранованому приміщенні, оскільки магнітне поле Землі набагато сильніше, ніж магнітне поле мозку. Самнер Норман порівнює пристрій з «апаратом МРТ, перекинутим на бік і підвішеним над головою користувача».

Ба більше, каже Кінг, щойно голова випробуваного рухається, сигнал втрачається. «Наші зусилля спрямовані зовсім не на продукти», - каже він. «Насправді, я завжди кажу, що не думаю, що є шлях для продуктів, тому що це занадто складно».

У проєкті з типування брали участь 35 добровольців із дослідницького центру в Іспанії, Баскського центру з вивчення пізнання, мозку і мови. Кожен із них провів близько 20 годин у сканері, набираючи фрази на кшталт «el procesador ejecuta la instrucción» (процесор виконує інструкцію), тоді як сигнали їхнього мозку надходили до системи глибокого навчання, яку Meta називає Brain2Qwerty, посилаючись на розташування букв на клавіатурі.

Завдання цієї системи глибокого навчання - з'ясувати, які сигнали мозку означають, що людина набирає букву «а», які - «z» і так далі. У підсумку, простеживши за тим, як окремий доброволець набирає кілька тисяч символів, модель зможе вгадати, яку клавішу людина насправді натискала.

У першому препринті дослідники Meta повідомляють, що середній рівень помилок становив близько 32% - майже кожна третя буква неправильна. Проте, на думку Meta, отримані ними результати є найбільш точними для мозкового набору тексту з використанням повної алфавітної клавіатури та сигналів, зібраних поза черепом.

Дослідження в галузі читання за допомогою мозку швидко просуваються вперед, хоча найефективніші підходи використовують електроди, імплантовані в мозок або безпосередньо на його поверхню. Це так звані «інвазивні» мозкові комп'ютерні інтерфейси. Хоча вони вимагають хірургічного втручання в мозок, але можуть дуже точно збирати електричну інформацію від невеликих груп нейронів.

У 2023 році, наприклад, людина, яка втратила голос через ALS, змогла говорити за допомогою програмного забезпечення для читання мозку, підключеного до голосового синтезатора. Компанія Neuralink, заснована Ілоном Маском (Elon Musk), тестує свій власний мозковий імплантат, який дає паралізованим людям можливість керувати курсором.

Meta каже, що її власні зусилля, як і раніше, спрямовані на фундаментальні дослідження природи інтелекту. І саме в цьому може допомогти великий магнітний сканер. Попри те, що він не підходить для пацієнтів і не вимірює окремі нейрони, він дає змогу поглянути на весь мозок, широко й одразу.

Учені з Meta кажуть, що в другому дослідженні, використовуючи ті самі дані про набір тексту, вони використовували цей ширший погляд, щоб зібрати докази того, що мозок продукує мовну інформацію за принципом «згори донизу», коли початковий сигнал для речення спричиняє окремі сигнали для слів, складів і, зрештою, друкованих букв.

«Основне твердження полягає в тому, що мозок будує виробництво мови ієрархічно», - каже Норман. Це не нова ідея, але доповідь Meta підкреслює, «як ці різні рівні взаємодіють як система», - наголосив Норман.

Подібні висновки можуть в кінцевому підсумку вплинути на розробку систем штучного інтелекту. Деякі з них, як-от чат-боти, вже значною мірою спираються на мову, щоб обробляти інформацію і міркувати так само як це роблять люди.

«Мова стала основою AI», - зазначає Кінг. «Тому обчислювальні принципи, що дають змогу мозку або будь-якій іншій системі набути такої здатності, є ключовою мотивацією цієї роботи».