`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Нова концепція недорогих акумуляторів

Алюмінієво-сірчана батарея, виготовлена з дешевих матеріалів, що є в наявності, може забезпечити недороге резервне зберігання відновлюваних джерел енергії.
 

Оскільки світ будує все більші установки вітряних і сонячних енергетичних систем, швидко зростає потреба в економічних, великомасштабних резервних системах для забезпечення електроенергією, коли сонце заходить і повітря спокійне. Сучасні літій-іонні батареї все ще занадто дорогі для більшості подібних застосувань, а інші варіанти, такі як насосна гідросистема, вимагають специфічної топографії, яка не завжди доступна.
 

Тепер дослідники з Массачусетського технологічного інституту (МТІ) та інших країн розробили новий вид батареї, повністю виготовленої з недорогих матеріалів, що у великій наявності, яка може допомогти заповнити цю прогалину.
 

Нова архітектура батареї, яка використовує алюміній і сірку як два електродні матеріали, з розплавленим сольовим електролітом між ними, описана  в журналі Nature у статті проф. МТІ Дональда Садоуея (Donald Sadoway) разом із 15 іншими співробітниками із МТІ та Китаю, Канади, Кентуккі та Теннессі.
 

Окрім того, що літій-іонні батареї дорогі, вони містять легкозаймистий електроліт. Тож Садоуей почав вивчати періодичну таблицю Менделєєва, шукаючи дешеві, поширені на Землі метали, які могли б замінити літій. Домінуючий у комерційних цілях метал, залізо, не має відповідних електрохімічних властивостей для ефективної батареї. Але другим, після заліза, за поширеністю металом на ринку є алюміній. «Отже, добре, нехай це буде алюміній», – каже він.
 

Потім вирішували, з чим поєднати алюміній для іншого електрода, і який тип електроліту поставити між ними, щоб переносити іони. Найдешевшим з усіх неметалів є сірка, тому вона стала другим електродним матеріалом. Що стосується електроліту, то вони дослідили різні розплавлені солі, які мають відносно низьку температуру плавлення — близьку до точки кипіння води.

 
Три інгредієнти, які вони отримали, дешеві та легкодоступні — алюміній, нічим не відрізняється від фольги в супермаркеті; сірка, яка часто є відходами таких процесів, як переробка нафти; і широко доступні солі. «Інгредієнти дешеві, і річ безпечна — вона не горить», — каже Садоуей.


Дивно, але розплавлена сіль, яку команда обрала як електроліт просто через її низьку температуру плавлення, виявилася неочікуваною перевагою. Однією з найбільших проблем у надійності батареї є утворення дендритів, вузьких металевих шипів, які накопичуються на одному електроді та з часом розростаються, щоб контактувати з іншим електродом, спричиняючи коротке замикання та перешкоджаючи ефективності.


Хлоро-алюмінатна сіль, яку вони обрали, «по суті видаляла ці дендрити, а також дозволяла дуже швидко заряджатися», — каже Садоуей. Більше того, для підтримки робочої температури батареї не потрібне зовнішнє джерело тепла. Тепло утворюється електрохімічним шляхом під час заряджання та розряджання батареї.


Менший масштаб алюмінієво-сірчаних батарей також зробить їх практичними для використання, наприклад, для зарядних станцій для електромобілів, каже Садоуей. Він зазначає, що коли електричні транспортні засоби стають настільки поширеними на дорогах, що кілька автомобілів хочуть заряджати одночасно, як це відбувається сьогодні з бензиновими паливними насосами, «якщо ви спробуєте зробити це за допомогою акумуляторів і вам потрібна швидка зарядка, сила струму просто настільки висока, що ми не маємо такої сили струму в лінії, яка живить установку». Таким чином, наявність такої акумуляторної системи для накопичення енергії, а потім її швидкої віддачі, може усунути необхідність встановлення нових дорогих ліній електропередач для обслуговування цих зарядних пристроїв.


Чи може батарея на основі сірки створювати неприємні запахи, пов’язані з деякими формами сірки? Немає шансів, каже Садоуей, бо батарея герметична.  

 
До дослідницької групи входили члени Пекінського університету, Юньнаньського університету та Уханьського технологічного університету в Китаї; Університет Луїсвіля, штат Кентуккі; Університет Ватерлоо, Канада; Національна лабораторія Оук-Рідж, штат Теннессі; і MIT. Робота була підтримана Енергетичною ініціативою Массачусетського технологічного інституту, Центром технологічних інновацій Дешпанде Массачусетського технологічного інституту та ENN Group.

Нова концепція недорогих акумуляторів


Три основні складові батареї: зліва - алюміній; в центрі, - сірка; праворуч — кристали кам’яної солі. Усі вони доступні всередині країни і не потребують глобального ланцюжка поставок

Катерина Ющенко — винахідник вказівників

Згідно з Вікіпедією, вказівни́к, пока́жчик або пока́зник, іноді також посилання (англ. pointer або reference) — тип даних в комп'ютерних мовах програмування, об'єкт програми, що містить адресу іншого об'єкта в пам'яті комп'ютера.

Вказівники разом з операцією їх розіменування (англ. dereference operator) були введені Катериною Логвинівною Ющенко у 1955 р. в “Адресній мові програмування”.

Якщо згідно з історією, Гарольду Лоусону (Harold Lawson) приписують винайдення покажчиків у 1964 році для мови програмування PL/1, то саме Катерина Логвинівна Ющенко придумала цю ідею ще в 1955 році, коли вона створила мову адресного програмування. На жаль, на «Заході» мало знають про мову адресного програмування, оскільки більшість її підручників надруковані російською.

Ким була Катерина? Вона народилася 8 грудня у 1919 році у місті Чигирині, Україна. Навчалася в АН України, де закінчила аспірантуру. Вона була першою жінкою в СРСР, яка здобула ступінь кандидата фізико-математичних наук із програмування. Але шлях до цього був нелегким.

У 1937 році її виключили з Київського університету, оскільки її батька звинуватили як «ворога народу». Вона подала документи в Московський університет і поступила, але не змогла почати навчання, оскільки там не надали житло.

Вона продовжувала намагатися і переїхала до Узбекистану, вступивши до університету в Самарканді. Ніщо не заважало їй вивчати математику. Вона навіть влаштувалася працювати на завод, де виготовляли приціли для танків під час війни!

Лише після війни вона повернулася в Україну, де змогла продовжити навчання та здобути ступінь кандидата наук.

У 1950 році Борис Васильович Гнеденко, колишній керівник «Катерини», був призначений дійсним членом Української Академії Наук. Його новий кабінет розмістився в Київському інституті математики. Як тільки він туди переїхав, то запросив Катерину до себе.

З 1950 року Катерина стала старшим науковим співробітником Київського інституту математики. Там вона мала можливість працювати на комп’ютері MESM, одному з перших комп’ютерів у континентальній Європі. Через сім років, у 1957 році, вона була призначена директором Інституту обчислювальної техніки.

В Інституті обчислювальної техніки вона працювала над мовою адресного програмування, писала про неї книги. У 1961 році вона була співавтором книги «Елементи программирования» (рос.). Книгу використовували в усьому СРСР і країнах Східного блоку. Під її керівництвом було захищено 56 докторських дисертацій!

Так хто ж винайшов вказівники? Відповідно до деяких джерел, це був Андрій Колмогоров, радянський математик, який вперше описав їх у статті “К опрелению алгоритма”, УФН, т. XIII, вып. 4(82), 1958. Сучасне уявлення про вказівники та те, як ми дізналися про них у мовах програмування, очевидно, походить від Гарольда Лоусона (Harold Lawson). Він отримав за це нагороду IEEE. Про це немає дискусій. Лоусон отримав нагороду, тому що зробив їх частиною синтаксису мови в PL/1 ще в 1964 році.

Але водночас у 1955 році Ющенко створила Адресну мову програмування, яка також могла використовувати адреси аналогічним чином як вказівники. Дійсно, можливо, що в 60-х роках минулого століття в західних країнах ніхто не знав про роботу Ющенко та її соратників. Це були часи холодної війни.

 

 
 

Чи дійсно система AI має свою секретну мову?

Нове покоління моделей штучного інтелекту може створювати «творчі» зображення на запит на основі текстової підказки. Такі компанії, як Imagen, MidJourney та DALL-E 2, починають змінювати спосіб створення творчого контенту з наслідками для авторського права та інтелектуальної власності.

Хоча результати цих моделей часто вражають, важко точно знати, як вони дають свої результати. Минулого тижня дослідники зі США зробили інтригуючу заяву про те, що модель DALL-E 2, можливо, винайшла власну секретну мову, щоб говорити про об'єкти.

Попросивши DALL-E 2 створити зображення, що містять текстові підписи, а потім повернувши (безглузді) підписи назад в систему, дослідники дійшли висновку, що DALL-E 2 думає, що Vicootes означає «овочі», а Wa ch zod rea відноситься до "морських істот", які кит може з'їсти».

Ці твердження, якщо вони вірні, можуть мати важливі наслідки для безпеки та інтерпретації такої великої моделі AI. То що саме відбувається?

Ймовірно, DALL-E 2 не має «таємної мови». Було б точніше сказати, що він має власний словник, але навіть у цьому випадку ми не можемо знати напевно.

Насамперед, на даному етапі дуже складно перевірити будь-які заяви про DALL-E 2 та інші великі моделі AI, тому що до них мають доступ лише кілька дослідників та творчих практиків.

Навіть ті, хто має доступ, можуть використовувати ці моделі лише обмеженими способами. Наприклад, користувачі DALL-E 2 можуть створювати або змінювати зображення, але не можуть (поки що) глибше взаємодіяти з системою AI, наприклад, змінюючи закулісний код. Це означає, що методи «зрозумілого AI» для розуміння того, як працюють ці системи, не можуть бути застосовані, а систематичне дослідження їхньої поведінки є складним завданням.

Однією з можливостей є те, що «тарабарські» фрази пов'язані зі словами з неангломовних мов. Наприклад, Apoploe, який, здається, створює зображення птахів, схожий на латинське Apodidae, яке є біномною назвою сімейства видів птахів.

Це видається правдоподібним поясненням. Наприклад, DALL-E 2 був навчений дуже великій кількості даних, взятих з Інтернету, які включали багато неанглійських слів.

Одним із моментів, що підтримують цю теорію, є той факт, що мовні моделі AI не читають текст так, як це робимо ми з вами. Натомість вони розбивають вхідний текст на «токени» перед його обробкою.

DALL-E 2 (та інші моделі) використовують проміжний підхід, який називається кодуванням байтових пар (BPE). Перевірка представлень BPE для деяких тарабарських слів дозволяє припустити, що це може бути важливим фактором у розумінні «секретної мови».

"Секретна мова" також може бути просто прикладом принципу "сміття на вході, сміття на виході". DALL-E 2 не може сказати "Я не знаю, про що ви говорите", тому він завжди буде генерувати якесь зображення із заданого вхідного тексту.

Чи це дійсно важливо? Відповідь позитивна. "Секретна мова" DALL-E є прикладом "змагальної атаки" на систему машинного навчання: спосіб порушити передбачувану поведінку системи шляхом навмисного вибору вхідних даних, з якими AI погано справляється.

Однією з причин занепокоєння з боку зловмисників є те, що вони кидають виклик нашій впевненості в моделі. Якщо AI інтерпретує тарабарські слова ненавмисним чином, він може ненавмисно інтерпретувати значущі слова.

Ворожі атаки також спричиняють проблеми з безпекою. DALL-E 2 фільтрує текст, що вводиться, щоб користувачі не створювали шкідливий або образливий контент, але «секретна мова» тарабарщини може дозволити користувачам обійти ці фільтри.

Зрештою, такі явища, як «таємна мова» DALL-E 2, викликають проблеми з інтерпретованістю. Ми хочемо, щоб ці моделі поводилися так, як очікує людина, але структурований висновок у відповідь на тарабарщину збиває наші очікування.

Натомість «секретна мова» DALL-E 2 підкреслює існуючі побоювання з приводу надійності, безпеки та інтерпретації систем глибокого навчання.

Доки ці системи не стануть ширше доступними — і, зокрема, поки що ними не зможуть користуватися користувачі з ширшого кола неангломовних культурних верств, ми не зможемо по-справжньому знати, що відбувається.

Чи дійсно система AI має свою секретну мову?


Чи дійсно система AI має свою секретну мову?

Дивна нова фаза матерії діє так, ніби має два часові виміри

Опромінюючи послідовність лазерних імпульсів, навіяну числами Фібоначчі, на атоми всередині квантового комп’ютера, фізики створили дивовижну, ніколи раніше не бачену фазу матерії. Фаза має переваги двох часових вимірів, незважаючи на те, що все ще існує лише один окремий потік часу, повідомляють фізики в Nature.


Ця приголомшлива властивість пропонує бажану перевагу: інформація, що зберігається у фазі, набагато краще захищена від помилок, ніж альтернативні налаштування, які зараз використовуються в квантових комп’ютерах. У результаті інформація може існувати без спотворення набагато довше, що дозволить зробити квантові обчислення життєздатними, каже провідний автор дослідження Філіп Думітреску (Philipp Dumitrescu).


Робочими конячками квантового комп’ютера команди були 10 атомних іонів ітербія. Кожен іон окремо утримується та контролюється електричними полями, створеними іонною пасткою, і ними можна маніпулювати або вимірювати за допомогою лазерних імпульсів.


Кожен із цих атомарних іонів служить кубітом. Кубіти використовують незвичайність квантової механіки для зберігання ще більше інформації. Подібно до того, як кіт Шредінгера живий і мертвий у своїй коробці, кубіт може бути 0, 1 або суперпозицією обох. Така додаткова щільність інформації та те, як кубіти взаємодіють один з одним, обіцяють, що квантові комп’ютери зможуть вирішувати обчислювальні проблеми, які далеко не під силу звичайним комп’ютерам.


Однак є велика проблема: так само, як заглядання в коробку Шредінгера вирішує долю кота, так само взаємодія з кубітом. І ця взаємодія навіть не має бути навмисною. «Навіть якщо ви тримаєте всі атоми під суворим контролем, вони можуть втратити свою кількісність, спілкуючись з навколишнім середовищем, нагріваючись або взаємодіючи з речами непланованими способами», — говорить Думітреску.


Отже, завдання полягає в тому, щоб зробити кубіти більш надійними. Для цього фізики можуть використовувати «симетрії», по суті властивості, які витримують зміни. Одним із методів є додавання часової симетрії шляхом опромінювання атомів ритмічними лазерними імпульсами. Такий підхід допомагає, але Думітреску та його співробітники задалися питанням, чи можуть вони піти далі. Тож замість однієї часової симетрії вони прагнули додати дві, використовуючи впорядковані, але неповторювані лазерні імпульси.


Найкращий спосіб зрозуміти їхній підхід — розглянути щось інше впорядковане, але неповторюване: «квазікристали». Квазікристал все ще має порядок, але його візерунки ніколи не повторюються. Мозаїка Пенроуза є одним із прикладів цього.


Мозаїка Пенроуза є типом квазікристала, що означає, що він має впорядковану, але ніколи не повторювану структуру. Візерунок, що складається з двох фігур, є двовимірною проекцією 5D квадратної решітки.

 

Для кубітів Думітреску, Роман Вассер (Romain Vasseur) і Ендрю Поттер (Andrew Potter) у 2018 р. запропонували створити квазікристал у часі, а не в просторі. Тоді як періодичний лазерний імпульс чергувався (A, B, A, B, A, B тощо), дослідники створили квазіперіодичний режим лазерного імпульсу на основі послідовності Фібоначчі. У такій послідовності кожна частина послідовності є сумою двох попередніх частин (A, AB, ABA, ABAAB, ABAABABA тощо). Це розташування, як і квазікристал, впорядковане без повторення. І, схоже на квазікристал, це двовимірний візерунок, здавлений в одному вимірі. Це розмірне зведення теоретично призводить до двох часових симетрій замість однієї: система, по суті, отримує бонусну симетрію від неіснуючого додаткового часового виміру.

 

Фактичні квантові комп’ютери є неймовірно складними експериментальними системами, тому залишається недоведеним, чи будуть переваги, обіцяні теорією, тривати в кубітах реального світу.

 

Використовуючи квантовий комп’ютер Quantinuum, дослідники перевірили теорію. Вони імпульсували лазерне світло на кубіти комп’ютера як періодично, так і використовуючи послідовність, засновану на числах Фібоначчі. У центрі уваги були кубіти на обох кінцях лінійки з 10 атомів; саме там дослідники очікували побачити нову фазу матерії, яка відчуває дві часові симетрії одночасно. У періодичному тесті крайові кубіти залишалися квантовими приблизно 1,5 секунди — це вже вражаюча тривалість, враховуючи, що кубіти сильно взаємодіяли один з одним. З квазіперіодичною схемою кубіти залишалися квантовими протягом усієї тривалості експерименту, близько 5,5 секунд. Це тому, що додаткова часова симетрія забезпечила більше захисту, каже Думітреску.

   Дивна нова фаза матерії діє так, ніби має два часові виміри

У цьому квантовому комп’ютері фізики створили небачену раніше фазу матерії, яка діє так, ніби час має два виміри. Ця фаза може допомогти захистити квантову інформацію від знищення набагато довше, ніж сучасні методи

Інтуїтивне навчання фізики в моделі глибокого навчання, натхненної психологією розвитку

«Інтуїтивна фізика» уможливлює нашу прагматичну взаємодію з фізичним світом і є ключовим компонентом аспектів «здорового глузду». Сучасні системи штучного інтелекту (ШІ) бліді у своєму розумінні інтуїтивної фізики навіть у порівнянні з дуже маленькими дітьми. Цікаво розглянути цей розрив між людьми та машинами, спираючись на поле психології розвитку.

Інтуїтивна фізика є фундаментальною для втіленого інтелекту, очевидно тому, що вона необхідна для всіх практичних дій, а також тому, що вона забезпечує єдину основу для концептуального знання та композиційного представлення в цілому.

Щоб розвивати здоровий глузд у фізичній інтуїції в системах ШІ, у багатьох моментах натхнення черпається з психології розвитку. Розробляючи поведінкові зонди для дослідження дітей, психологи розвитку ґрунтували свій підхід на двох принципах. По-перше, ядро інтуїтивної фізики ґрунтується на наборі дискретних понять (наприклад, постійність об’єкта, міцність об’єкта, безперервність тощо), які можна диференціювати, операціоналізувати та індивідуально досліджувати. Другий принцип, який використовують психологи розвитку для дослідження фізичних концепцій, полягає в тому, що володіння фізичною концепцією відповідає формуванню набору очікувань щодо того, як може розгортатися майбутнє. Завдяки цій концептуальній основі з’являється метод вимірювання знань про конкретну фізичну концепцію: парадигма порушення очікувань (VoE).

Використовуючи парадигму VoE для дослідження конкретної концепції, дослідники показують немовлятам візуально схожі масиви (так звані зонди), які або узгоджуються (фізично можливо), або не відповідають (фізично неможливо) цій фізичній концепції. Якщо немовлята більше здивовані неможливим масивом, це є доказом того, що їхні очікування, які випливають зі знання досліджуваної фізичної концепції, були порушені. У цій парадигмі здивування ймовірно вимірюється тривалістю погляду.

У цій роботі використовувався набір даних Physical Concepts. Важливо те, що набір даних Physical Concepts також включав окремий корпус відео, призначених для навчання.

Отримавши цей набір даних і систему оцінки, переходять до головної мети: будують модель, здатну навчатися інтуїтивно зрозумілій фізиці, і розібрати, що забезпечує цю здатність. Використована архітектура натхненна твердженнями психології розвитку, які стверджують, що в основі інтуїтивної фізичної поведінки немовляти лежать три об’єктоцентричні процеси. Перш за все, це процес індивідуації об’єкта. Індивідуація об’єкта вирізає безперервний перцептивний вхід бачення в дискретний набір сутностей, де кожна сутність має відповідний набір атрибутів. По-друге, відстеження об’єктів призначає індекс кожному об’єкту, забезпечуючи відповідність між сприйняттям об’єкта протягом часу та обчислення динамічних властивостей. Останнім компонентом є реляційна обробка цих відстежуваних об’єктів.

Для реалізації об’єктоцентричного підходу обрана модель складалася з двох основних компонентів: перцептивного модуля прямого зв’язку і рекурентного предиктора динаміки з пам’яттю для кожного об’єкта. Перцептивний модуль приймає як вхідні дані зображення та маску сегментації та перетворює їх у векторне вбудовування за допомогою стандартних методів автоматичного кодування глибокого навчання. Центром предиктора динаміки є структурована рекурентна нейронна мережа, яка має назву InteractionLSTM.

Була висунута гіпотеза, що залучення кодування на об’єктному рівні буде критично важливим для набуття інтуїтивно зрозумілих фізичних концепцій і відповідних ефектів VoE.

Для всіх моделей навчання складалося з двох етапів. На першому етапі перцептивний модуль був навчений реконструювати окремі зображення з навчальних даних. На другому – динамічний модуль навчили передбачати наступний набір об’єктних кодів у відео з навчального набору.

Нарешті, щоб врахувати мінливість результатів моделювання, було обчислено середню точність і середню відносну несподіванку для п’яти різних початкових випадкових значень кожної моделі.

Інтуїтивне навчання фізики в моделі глибокого навчання, натхненної психологією розвитку

PLATO підходить до світу з інтуїтивним розумінням, як немовлята

Немовлята, як ми знаємо, досить розумні, щоб сприймати навколишнє, навіть якщо це не вимагає пригадування. Це називається інтуїцією, яка іншими словами називається підсвідомістю. На сьогодні штучний інтелект (ШІ) домігся багатьох цілей на шляху досягнення людського інтелекту, але не «здорового глузду», характеристики, яка вважається унікальною для людини. Коли досвідченому досліднику потрібно проаналізувати підсвідомі мозкові хвилі, як ми навчимо ШІ вивчати інтуїцію? Тепер вчені DeepMind стверджують, що ШІ під назвою (Physics Learning Through Auto-Encoding and Tracking Objects) вивчив фізику інтуїтивно, як це робить малюк. Це означає, що PLATO досяг так званого шостого чуття або чуття, яке давно обговорюється, що ускладнює розрізнення між ШІ та людьми.

DeepMind нещодавно опублікував дослідження в журналі Nature Human Behavior, яке продемонструвало, як знання здорового глузду можна використовувати в машинах. Вони розробили інтуїтивно зрозумілу фізичну модель під назвою PLATO, інтегрувавши в неї інтуїтивні знання, з якими народжуються діти. Їхня мета полягала лише в розгортанні безпечних інтуїтивно зрозумілих моделей. «Якщо ми хочемо розгортати безпечні та корисні системи в реальному світі, ми хочемо, щоб ці моделі поділяли наше інтуїтивне відчуття фізики. Але перш ніж ми зможемо побудувати ці моделі, постає ще одне завдання: як ми будемо вимірювати здатність цих моделей розуміти фізичний світ? Тобто, що означає розуміти фізичний світ і як ми можемо це кількісно оцінити?», — каже Луїс С. Пілото (Luis S. Piloto), провідний автор статті.

PLATO навчали у такій спосіб. Спочатку команда прочитала дані за 10 рокив, отримані в ході досліджень психології розвитку про немовлят, які навчаються інтуїтивно зрозумілій фізиці. Згодом вони прийшли до висновку, що фізичне розуміння нашого світу зазвичай є результатом нашої вродженої здатності шляхом розбиття образів, які ми сприймаємо, на окремий набір об’єктів. Вони зробили висновок, що дитина вбирає інтуїцію, спостерігаючи за рухом предметів і взаємодією один з одним. Модель глибокого навчання, доповнена масивними наборами даних, отриманих шляхом переміщення твердих об’єктів, як-от м’ячі, що ковзають по площині, або блоки, що рухаються вздовж шляху. Експеримент мав дві версії: версію з чистого аркуша, де передбачалося, що модель не має попередніх знань про навколишнє середовище, і ту, де модель мала очікування до того, як потрапила в нове оточення. Наприкінці експерименту команда могла зробити висновок, що інтуїтивна модель працює краще, ніж чиста. «На щастя для нас, психологи розвитку витратили десятиліття, вивчаючи те, що немовлята знають про фізичний світ, і каталогізуючи різні інгредієнти або концепції, які входять у фізичне розуміння», — говорить нейробіолог Луїс Пілото з дослідницької лабораторії ШІ DeepMind у Великій Британії. «Розширюючи їхню роботу, ми створили та відкрили набір даних фізичних концепцій. Цей синтетичний набір відеоданих черпає натхнення з оригінальних експериментів з розробки для оцінки фізичних концепцій у наших моделях», – сказав він.

Виявилось, що інстинкти PLATO не розвинені навіть наполовину.

Коли команда провела тести без об’єктів, PLATO, здавалося, не дуже здивувався. Це був той самий випадок, коли команда використовувала схожі моделі тестування та навчання. Крім того, відео, на яких навчався PLATO, містили додаткові дані, які не були потрібні для навчання. Це привело вчених до висновку, що PLATO навіть не має інтуїції трирічної дитини. «Наша робота з моделювання забезпечує доказ концепції, що принаймні деякі центральні концепції інтуїтивної фізики можна отримати за допомогою візуального навчання», — стверджують дослідники у своїй статті, опублікованій на Nature.com. Ідентифікація об'єкта та його динаміка з оточенням є лише візуальним проявом інтуїції. Є багато інших способів, відомих і невідомих, як людський розум копається в інтуїції, – якими PLATO має опанувати, щоб його називали «ШІ з передчуттям».

PLATO підходить до світу з інтуїтивним розумінням, як немовлята

Відкріто код нейронної мережі з 117 млрд параметрів

Група дослідників випустила Bloom, передову модель обробки природної мови, яка містить 117 мільярдів параметрів. Дослідники зробили код нейронної мережі Bloom доступним за ліцензією з відкритим кодом.

Проєкт розпочався минулого року як співпраця між Hugging Face, стартапом зі штучного інтелекту (ШІ), який нещодавно залучив 100 млн дол. від інвесторів, і двома суперкомп’ютерними організаціями у Франції. Hugging Face та її партнери створили дослідницьку групу під назвою BigScience, щоб керувати розробкою Bloom. У роботі взяли участь понад 1000 дослідників із понад 70 країн.

Bloom підтримує 46 мов і 13 мов програмування, пишуть дослідники BigScience в блозі. ШІ може відповідати на запитання, підсумовувати текст, отримувати фрагменти інформації з документів і виконувати ряд інших завдань. Універсальність Bloom частково є результатом того, що він містить 117 мільярдів параметрів.

Параметри — це налаштування, які визначають, як ШІ виконує обчислювальне завдання. Чим більше таких налаштувань містить система ШІ, тим складніші завдання вона здатна виконувати. Маючи 117 мільярдів параметрів, Bloom є однією з найдосконаліших моделей обробки природної мови у світі.

Bloom має більше параметрів, ніж розширена нейронна мережа GPT-3, яку OpenAI LLC описав у 2020 році. Як і Bloom, GPT-3 оптимізовано для обробки природної мови. Він також здатний виконувати інші завдання, наприклад генерувати програмний код.

Дослідники BigScience навчали Bloom за допомогою суперкомп’ютера Jean Zay поблизу Парижа. Суперкомп’ютер, який включає оптимізовані для ШІ відеокарти від Nvidia, має максимальну швидкість понад 28 петафлопс.

«Це кульмінація року роботи за участю понад 1000 дослідників із 70+ країн і 250+ установ, що призвело до останнього 117-денного тренінгу (11 березня – 6 липня), — детально розповіли сьогодні дослідники BigScience. Розробка була підтримана «грантом на обчислення вартістю приблизно 3 мільйони євро від французьких дослідницьких агентств CNRS і GENCI», уточнили вони.

Окрім коду для Bloom, дослідницька група BigScience відкрила деякі технічні дані, які були створені під час процесу розробки. Розробники можуть запускати Bloom на власному апаратному забезпеченні або отримати доступ до розміщеної версії ШІ через інтерфейс прикладного програмування, наданий BigScience.

У майбутньому дослідницька група планує розробити нову версію Bloom із ще більш розширеними можливостями. BigScience має намір додати підтримку для більшої кількості мов і оптимізувати ШІ, щоб полегшити роботу на власній інфраструктурі компанії. BigScience також розроблятиме додаткові системи ШІ з більш складною архітектурою, ніж Bloom.

Відкріто код нейронної мережі з 117 млрд. параметрів

У часи війни та миру українка знаходить магію в математиці

Марина В’язовська стала другою жінкою, яка виграла медаль Філдса за 86-річну історію нагороди.

На сьогоднішній церемонії International Mathematical Union (IMU) назвав численні математичні досягнення В'язовської, зокрема її доказ того, що система під назвою решітка E8 є найщільнішою упаковкою сфер у восьми вимірах. Вона лише друга жінка, яка отримала цю нагороду за 86-річну історію медалі. (Мар'ям Мірзахані (Maryam Mirzakhani) була першою, у 2014 році).

Як і іншім володарям Філдсових медалей, В’язовській «вдається робити абсолютно неочевидні речі, які багато людей намагалися та не змогли», — сказав математик Генрі Коен (Henry Cohn), якого попросили виступити з офіційною доповіддю ICM, присвяченій її роботі. На відміну від інших, сказав він, «вона робить це, відкриваючи дуже прості, природні, глибокі структури, речі, яких ніхто не очікував і які ніхто інший не зміг знайти».

У 2011 році В’язовська разом з Бондаренком і Радченком подали статтю до журналу Annals of Mathematics на тему «сферичний дизайн». «Аннали», як його називають математики, є чи не найпрестижнішим журналом у математиці. Стаття була прийнята, і незабаром математики організовували цілі конференції для її обговорення.

Починаючи з 1970-х років, математики задавалися питанням: як зростає кількість точок у сферичному плані, коли ви дивитесь на поліноми все більшого й вищого ступеня? На це запитання відповіли В’язовська, Бондаренко та Радченко.

Разом з Бондаренком і Радченком вона почала досліджувати, чи можуть модулярні форми прояснити багатовікове питання, яке вони троє намагалися розгадати деякий час: як упакувати сфери разом якомога щільніше. Математики вже знали, що найщільніший спосіб упаковки кіл у площині — це стільниковий візерунок, а найщільніший спосіб упаковки сфер у тривимірному просторі — це знайоме пірамідальне нагромадження, яке ви бачите на стопках апельсинів у бакалійника. Але питання також можна поставити у вищих вимірах, де воно має важливі застосування для кодів з виправленням помилок.

Ніхто не знав, які найщільніші сферичні упаковки є у вимірі більше трьох. Але два спеціальні виміри — вісім і 24 — мали сильних кандидатів. У цих двох вимірах існують високосиметричні схеми, що називаються E8 і решіткою Ліча, відповідно, які упаковують сфери набагато щільніше, ніж будь-які інші схеми, які можуть знайти математики.

Бондаренко, В'язовська та Радченко шукали модулярні форми, щоб спробувати побудувати магічну функцію, але протягом тривалого часу вони мало просувалися. Згодом Бондаренко і Радченко звернули увагу на інші проблеми. В’язовська, однак, не могла не думати про упаковку сфер.

Після кількох років роздумів над проблемою, у 2016 році їй вдалося точно визначити магічну функцію восьмого виміру. Вона виявила, що відповідь полягає не в модулярній формі, а в певній «квазімодулярній» формі, дещо з помилками в симетрії.

В’язовська та її співробітники вийшли з роботи з упаковки сфер з більш високими амбіціями. Математики давно підозрювали, що E8 і решітка Ліча — це набагато більше, ніж просто найкращий спосіб упаковки сфер. Ці дві решітки, за гіпотезою математиків, є «універсально оптимальними», тобто вони є найкращими структурами за безліччю критеріїв.

Щоб довести, що E8 і решітка Ліча мінімізують енергію в усіх цих різних контекстах, команді довелося придумати магічні функції для кожного окремого поняття енергії. Але вони мали лише часткову інформацію про те, як має поводитися така магічна функція (якщо вона існує). Вони знали значення функції в деяких точка. Вони також знали, як швидко змінюються функція та її перетворення Фур’є в окремих точках. Постало питання: чи достатньо цієї інформації для реконструкції функції?

В’язовська висунула сміливе припущення: ця інформація, яку мала команда, була достатньою, щоб визначити магічну функцію. Менше, і буде багато функцій, які підходять. Більше, і функція буде занадто обмеженою, щоб існувати.

За словами Сільвії Серфаті (Sylvia Serfaty) з Університету Нью-Йорка, отримана стаття відповідає великим проривам 19 століття, коли математики розв’язали багато проблем, які століттями бентежили їхніх попередників. «Ця стаття дійсно є великим досягненням науки, — сказала вона. - Знати, що людський мозок здатний створити доказ чогось подібного, для мене це справді чудовий факт».

В'язовська пишається своєю країною, але жахливо почувається, що її співвітчизникам довелося звикнути до сирен повітряної тривоги, обстрілів, війни.

Принаймні, сказала вона, «тирани не можуть перешкодити нам займатися математикою. Є принаймні щось, що вони не можуть у нас забрати».

 

Китай створює модель штучного інтелекту в масштабі мозку

Китайські вчені побудували те, що вони називають «моделью штучного інтелекту в масштабі мозку», на основі одного зі своїх останніх суперкомп’ютерів ExaFLOPS з процесорами Sunway, повідомляє SCMP. Вчені стверджують, що модель ШІ із 174 трильйонами параметрів може бути використана для різноманітних застосувань, починаючи від автономних транспортних засобів і закінчуючи науковими дослідженнями.

Використовувана система Sunway OceanLight (іноді називається OceanLite) базується на 96 000 вузлах, які працюють на гібридних 390-ядерних процесорах Sunway SW39010 із загалом майже 40 мільйонами ядер (з процесорами, еволюціонувавшими з процесорів SW26010). Цю машину рекламували як один із перших у світі екзамасштабних суперкомп’ютерів, але з тих пір твердження про його FP64-продуктивність було значною мірою спростовано, коли виявилося, що вчені знизили точність обчислень, які машина виконувала для отримання приза Гордона Белла (який іноді називають «Нобелівською премією з суперкомп’ютерів»).

Китайська команда дослідників з Національного дослідницького центру паралельної комп’ютерної інженерії та технологій (NRCPC) називає свою модель ШІ bagualu — горщик алхіміка — оскільки вона включає близько 174 трильйонів параметрів, що конкурує за кількістю синапсів у мозку людини. Фактична продуктивність OceanLight зараз становить 5,3 «AI» ExaFLOPS, хоча раніше говорили, що це 4,4 «змішаної точності» ExaFLOPS, що ще раз показує, що показники продуктивності цієї системи, надані NRCPC, не є насправді точними.

Але навіть якщо OceanLight працює повільніше, ніж кажуть, робота зі створення навчальної моделі AI зі 174 трильйонами параметрів є величезною. Вчені з NRCPC повідомили South China Morning Post, що для досягнення гідної продуктивності своєї моделі ШІ в масштабі мозку їм довелося запровадити «внутрішньовузлову орієнтовану на апаратуру оптимізацію», а також реалізувати «гібридні паралельні стратегії» у безпрецедентному масштабі. Враховуючи той факт, що OceanLight має 96 000 вузлів і майже 40 мільйонів процесорів, оптимізація апаратного та програмного забезпечення для цієї системи є великою справою.

Оголошення про безпрецедентну модель ШІ було зроблено через кілька тижнів після того, як Oak Ridge National Laboratory офіційно представила свій Frontier — перший у світі суперкомп’ютер з продуктивністю 1102 FP64 ExaFLOPS у тесті Linpack. Примітно, що NRCPC офіційно не публікувала результати продуктивності свого OceanLight у списку 500 найкращих суперкомп'ютерів.

Китай створює модель штучного інтелекту в масштабі мозку

Захищаючи Україну: перші уроки кібервійни

Microsoft днями опублікувала розгорнуте дослідження "Defending Ukraine: Early Lessons from the Cyber War". Ось деякі підсумки від Бреда Сміта (Brad Smith), президента і віце-голови компанії, про перші уроки кібервійни в Україні.

Перш за все він зауважив, що кожен з інцидентів, який був приводом до війни, також містить звіт про технологію того часу—технологію, яка відіграє певну роль у війні, що почалася, і житті людей, які пройшли крізь це.

Війна в Україні йде перевіреною схемою Другої світової війни. Російські військові перетнули український кордон 24 лютого, 2022 року, з комбінацією військ, танків, літаків і крилатими ракетами. Але фактично перші постріли пролунали годинами до того, коли в календарі ще було зазначено 23 лютого.

Росіяни залучили кіберзброю під назвою «Foxblade», яка була використана проти комп’ютерів в Україні. Відображаючи технології нашого часу, ті, що одними з перших спостерігали напад були за півсвіту, працюючи в Сполучених Штатах в Редмонді, штат Вашингтон.

Поки ніхто не може передбачити, як довго ця війна триватиме, але вже очевидно, що вона відбиває тенденцію, яка спостерігалася в інших великих конфліктах за останні два століття. Країни ведуть війни, використовуючи новітні технології, а самі війни прискорюють технологічні зміни. Тому важливо постійно оцінювати вплив війни на розвиток та використання техніки.

З перших чотирьох місяців війни випливають п’ять висновків. По-перше, зараз необхідний захист від військового вторгнення вимагає від більшості країн можливості виносити та розподіляти цифрові операції та активи даних через кордони та в інші країни. росія не дивно націлилася на урядовий центр обробки даних України під час ранньої атаки крилатими ракетами. Але українська влада досягла успіху, швидко передала свою цифрову інфраструктуру в загальнодоступну хмару, яка розміщувалася в ЦОД по всій Європі.

По-друге, останні досягнення в розвідці кіберзагроз і захисту кінцевої точки допомогли Україні відбити високий відсоток деструктивних російських кібератак. росія запустила кілька хвиль руйнівних кібератак на 48 окремих українських установ і підприємств. Вони спочатку намагалися проникнути в домени мережі, скомпрометувати сотні комп’ютерів, а потім поширювати шкідливе ПЗ, призначене для знищення програмного забезпечення та даних тисяч інших.

По-третє, оскільки коаліція країн об’єдналася для захисту України, російські спецслужби активізували проникнення в мережу та шпигунську діяльність, націлені на союзні уряди за межами України. Хоча Сполучені Штати були ціллю номер один для Росії, ця діяльність також була пріоритетною для Польщі, де координується значна частина матеріально-технічного забезпечення, військової та гуманітарної допомоги.

По-четверте, у координації з іншою кібердіяльністю, російські агентства здійснюють глобальний кібервплив на підтримку своїх військових зусиль. На жаль, при достатньому плануванні й витонченості, ці операції кібервпливу мають можливість скористатися перевагами багаторічної відкритості демократичних суспільств та суспільної поляризації.

Нарешті, уроки з України вимагають злагодженості й комплексної стратегії зміцнення оборони проти всього спектру кібердеструктивних і шпигунських операцій. Як показує війна в Україні, хоча між цими загрозами є відмінності, російський уряд не розглядає їх як окремі зусилля. Крім того, оборонні стратегії повинні враховувати узгодження цих кібероперацій з кінетичними військовими діями в Україні.

Потрібні нові досягнення, щоб запобігти цим кіберзагрозам, і вони залежатимуть від чотирьох загальних принципів і — принаймні на високому рівні — спільної стратегії. Перший оборонний принцип повинен визнати, що російські кіберзагрози просуваються загальним набором акторів всередині та зовні російського уряду та покладаються на подібну цифрову тактику. Другий принцип повинен визнати, що на відміну від традиційних загроз у минулому, кіберреакція повинна покладатися на більшу державну і приватну співпрацю. Третій принцип повинен охоплювати потребу для тісного та спільного багатостороннього співробітництва між урядами для захисту відкритих і демократичних суспільств. І четвертий захисний принцип повинен підтримувати свободу висловлювань, уникати цензури в демократичних суспільствах, оскільки необхідні нові кроки для вирішення всього спектру кіберзагроз, які включають операції кібервпливу.

Війна в Україні передбачає не лише уроки, а й заклик до дій для ефективних заходів, які будуть життєво важливими для захисту майбутнього демократії.

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT