`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Skynet все ближче

Google DeepMind публікує третю ітерацію Frontier Safety Framework – найдетальнішу версію системи оцінки ризиків від просунутих AI-моделей. Головне нововведення – Critical Capability Level для harmful manipulation, коли модель може систематично змінювати переконання і поведінку людей в критично важливих контекстах.

Компанія фактично визнає можливість втрати контролю над моделями. У документі прямо йдеться про сценарії, де «неправильно налаштовані моделі штучного інтелекту можуть перешкоджати операторам керувати, змінювати або припиняти свої операції». Раніше це обговорювалося як щось гіпотетичне – тепер же в документі розроблені конкретні протоколи для моделей, які здатні розвинутися до потенційно небезпечного рівня.

Фреймворк описує і протоколи тестування нових моделей – причому не тільки перед оприлюдненням моделей на публіку, але і масштабних внутрішніх розгортаннях. Тобто визнається можливість проблем з моделями і при їх тестовій експлуатації всередині компанії.

Загалом, до деплою Skynet готові.

Skynet все ближче

П'ять комітетів для організації та координації

З цікавістю прочитав свіже інтерв'ю CTO з AI в Мінцифрі України про те, як вони чудово розробляють LLM і той самий чат на порталі Дія.

Загалом, нічого особливо нового про процес я не дізнався. Крім того, що всю розробку LLM буде тягнути на собі «Київстар», а міністерство поки створило п'ять структур для організації та координації. Поки що нинішня інфраструктура того ж чату – це хмара Google. Правда, було несподівано зустріти іронію, з якою CTO заявив, що всю ключову функціональність розробила одна людина, і тому він передає привіт тим, хто будує великі команди. А тестуванням займався ще один тестувальник, плюс допомагали ще якимись командами Мінцифри, плюс залучені DevOps (без зазначення чисельності), плюс ще один займався фронтендом, з яким допомагали всією Мінцифрою. Чомусь тут привіти тим, хто будує великі команди, закінчилися.

Я писав, коли цей чат запустився, що функціонально там досить простий RAG-бот, який знає контент сайту і відповідає на питання по ньому. У чому предмет гордості людей, які зібрали працездатний додаток, я не дуже розумію. Відразу скажу, що аргумент «А ти спробуй сам зроби» зі мною не працює ніколи, а особливо зараз. З лютого місяця я веду розробку бота трохи складнішого. Причому спочатку довелося дослідити потенціал файнтюнінгу доступних моделей, потім розробити панель для оцінки різних моделей, в тому числі використовуючи ще одну модель як суддю, з донастроюванням оцінок LLM за оцінками експерта-людини (я планую детальніше це описати окремо), а вибравши модель, почати розробку чат-системи, яка має в розпорядженні базу податкової та бухгалтерської інформації, що оновлюється кілька разів на день, слідує певній схемі міркувань і видає досить складні відповіді фахівцям.

На цей час вона доступна більш ніж 20 тис. користувачів і обробляє близько 2 тис. запитів на день. Розробник і DevOps там рівно один – я сам з декількома LLM, фронтенд реалізований на Nuxt.js штатним розробником клієнта. У проєкті також бере участь провідний консультант, який спочатку описував, як треба відповідати, а тепер тестує і оцінює роботу. Втім, коли в проєкт потрапили живі користувачі, з'ясувалося, що вони запитують і оцінюють все інакше. Ну, як зазвичай. Проте на сьогодні середня оцінка користувачів – 96%.

За цим передаю привіт Мінцифрі, де тільки для координації розробки потрібно чотири комітети плюс координаційний комітет із семи осіб, включаючи міністра.

П'ять комітетів для організації та координації

ChatGPT – не більше, ніж цифровий радник?

OpenAI опублікувала дослідження на основі аналізу 1,5 млн чатів з ChatGPT. Найцікавіше – люди використовують ChatGPT зовсім не так, як припускали техно оптимісти. Програмування, яке всі вважають чи не головною здатністю GPT, залишається нішевою активністю. Зате половина всіх запитів – це Asking, коли користувачі просять поради, а не генерації контенту. ChatGPT став не інструментом автоматизації, а цифровим радником. Причому 70% використання взагалі не пов'язане з роботою – люди вирішують повсякденні завдання, шукають інформацію, пишуть особисті тексти.

ChatGPT – не більше, ніж цифровий радник?

Тижнева кількість активних користувачів ChatGPT

Про особисті тексти не знаю, а ось у мене він повністю замінив пошук в інформаційних запитах. Щобільше, він же прекрасно замінює навіть shopping-пошуки – спочатку пояснює, що саме потрібно для вирішення завдання, а потім з'ясовується, що це продається в Епіцентрі за декілька кілометрів від дому.

Географія теж виглядає незвично. Зростання в країнах з низькими доходами в чотири рази перевищує показники багатих країн. Схоже на історію зі смартфонами та мобільним зв'язком, коли у великій кількості країн, що розвиваються, їх освоєння відбулося без використання дротового інтернету і десктопного інтернету.

Гендерний розрив практично зник – жінки складають вже 52% користувачів проти 37% рік тому.

Правда, за межами дослідження залишилося корпоративне використання – тобто чати корпоративних користувачів. Там, безумовно, все інакше – можливо, програмування і лідирує. Втім, необов'язково.

ChatGPT – не більше, ніж цифровий радник?

HBM-пам'ять гальмує AI-амбіції Китаю

Великий огляд SemiAnalysis присвячений детальному аналізу виробничих потужностей Huawei з виробництва AI-чіпів і доходить до цікавого висновку – Huawei готова штампувати мільйони AI-чіпів Ascend, але натрапляє на вузьке місце у вигляді HBM-пам'яті.

Huawei отримала 2,9 млн кристалів від TSMC до введення санкцій, що дозволило підтримувати виробництво у 2024-2025 роках. Samsung поставив 11,4 млн стеків HBM безпосередньо в Китай, причому 7 млн з них – в місячний період між оголошенням і вступом в силу обмежень в грудні 2024 року. Ці запаси дозволять виготовити близько 1,6 млн чіпів Ascend 910C, але до кінця року вони будуть вичерпані.

Власне виробництво HBM в Китаї компанією CXMT (найбільшого китайського виробника DRAM) знаходиться на початковій стадії. За прогнозами SemiAnalysis, у 2025 році компанія зможе виготовити тільки 2 млн стеків пам'яті – достатньо для 250-300 тис. процесорів. Це істотно нижче потенційних можливостей з виробництва логічних чіпів. Для порівняння, без обмежень по пам'яті Huawei могла б збільшити виробництво з 805 тис. одиниць в цьому році до більш ніж 5 млн в наступному.

При цьому CXMT досі не включена в entity list, попри її критичну роль в потенційному обході санкцій. Автори звіту вважають це серйозною помилкою адміністрації Байдена, яку необхідно виправити.

Паралельно триває виробництво мережевого обладнання та процесорів для дата-центрів Huawei на потужностях TSMC через систему підставних компаній, причому на більш передовому 5-нм техпроцесі. Це звільняє потужності SMIC (китайського аналога TSMC) для виробництва AI-чіпів, але також демонструє прогалини в системі контролю.

У контексті ширшої стратегії США розглядають можливість ліцензування поставок чіпів Nvidia H20 і потенційно потужніших B30A на базі Blackwell. Логіка полягає в балансуванні між стримуванням розвитку китайського AI та збереженням залежності Китаю від американських технологій. При цьому підкреслюється, що дозвіл на постачання більш потужних чіпів повинен корелюватися з власними можливостями Китаю – тільки коли місцеве виробництво досягне зіставного рівня.

Загальна картина показує, що стратегія технологічного стримування працює в короткостроковій перспективі. Виробництво передових AI-чіпів у Китаї буде серйозно обмежене щонайменше до 2026-2027 років, коли CXMT зможе налагодити виробництво конкурентоспроможної HBM пам'яті в потрібних масштабах (чверть міліонна пластин на місяць, що складе 15% світового виробництва DRAM). До цього моменту розвиток китайського AI буде залежати від залишкових запасів, обмеженого місцевого виробництва і можливих каналів обходу санкцій. Але ось після цього досягнення Китаєм повного AI суверенітету по всьому ланцюжку – від виробництва кремнію до генерації токенів, – стане тільки питанням часу.

HBM-пам'ять гальмує AI-амбіції Китаю

AI фантазує, коли не знає або не впевнений

Співробітники OpenAI за результатами дослідження галюцинацій моделей роблять цікавий висновок: причина галюцинацій не тільки в моделях, а в метриках і лідербордах, які заохочують припущення замість визнання невизначеності. Їхній приклад показовий: модель з високою часткою відмов у відповідях дає менше помилок, тоді як більш «смілива» трохи виграє в точності, але різко збільшує частку неправильних відповідей. GPT‑5, за словами OpenAI, вже рідше галюцинує при міркуванні, але не позбавлена цього повністю.

«Правильні» відповіді та граматика масштабуються, на відміну від рідкісних фактів – низькочастотні відомості статистично призводять до вигадок. Калібрування простіше, ніж точність: маленька модель, яка не знає маорі, чесніше скаже «не знаю», ніж велика, яка трохи знає і почне впевнено фантазувати. І загальний висновок OpenAI виглядає досить просто – якщо при навчанні з підкріпленням карати за впевнені помилки сильніше, ніж за невпевненість у відповіді, і частково заохочувати модель за чесну відповідь «Не знаю», кількість галюцинацій помітно зменшується.

AI фантазує, коли не знає або не впевнений

Google не змушуватимуть продати Chrome та Android

Новина місяця, мабуть, – суддя Аміт Мехта відмовився від радикальних заходів у справі про монополію Google – компанія не зобов'язана продавати Chrome й Android. Правда, їй заборонено укладати ексклюзивні договори на дистрибуцію і наказано ділитися частиною пошукових даних з конкурентами. Ринок зітхнув з полегшенням: акції Alphabet додали близько 8% на постмаркеті, Apple, яка отримує мільярди доларів на рік за пошук за замовчуванням – близько 4%.

При цьому платити за попередню установку застосунків і установку пошуку (та інших застосунків) як і раніше можна, просто без умов про ексклюзивність. Широкої заборони платежів суд уникає, посилаючись на потенційний збиток для партнерів і споживачів. Ділитися доведеться не всім і не безплатно: рішення згадує «певні дані пошуку і дані про взаємодію користувачів» і не «рекламні дані».

Остаточне рішення буде оголошено на засіданні суду 10 вересня, куди викликаються обидві сторони. Ймовірно, воно може бути оскаржене. Хоча, якщо судити з реакції Мін'юсту, який прокоментував рішення в дусі «Суд визнав нашу правоту», поки продовження не буде.

Google не змушуватимуть продати Chrome та Android

Не останній dial-up провайдер Америки

AOL вимикає свій dial-up сервіс 30 вересня. Він був запущений в 1991 році. У 2015 році у AOL було близько 1,5 млн dial-up передплатників. До 2021 року їх кількість скоротилася до «декількох тисяч». І ось ці кілька тисяч людей протрималися ще чотири роки – до 2025-го.

AOL, до речі, не останній провайдер dial-up в Америці. Є й інші компанії. Так що формально послуга залишиться доступною для тих, кому вона дійсно необхідна.

Цікаво порівняти – з 2011 року я не просто не маю доступу до dial-up, у мене півтора десятиліття взагалі немає провідного телефону, куди модем для такого доступу можна було б підключити. І щось я сумніваюся, що у когось в Україні картина виглядає радикально інакше. Хоча, напевно, десь ADSL ще й залишився.

Не останній dial-up провайдер Америки

Плани Apple щодо розвитку лінійки iPhone

Apple планує витратити три роки на перезапуск iPhone. Марк Гурман у своїй колонці описує все детально – все почнеться з iPhone Air у 2025 році, який повторить стратегію MacBook Air 2008 року: тонкий, легкий, з компромісами. Одна камера, слабка батарея і перший власний модем Apple замість Qualcomm.

Власне, модем – це ключова деталь всієї історії. Apple працює над ним з 2019 року, коли купила модемний бізнес Intel за мільярд доларів. Перша версія буде слабкішою за рішення Qualcomm, але до 2026 року з'явиться чіп C2, який вже наблизиться до сучасних стандартів. І саме він піде в складаний iPhone з кодовою назвою V68 (м-м-м, згадуються складні моделі Motorola серії V).

Складаний iPhone цікавий не тільки сам по собі – Apple в черговий раз приходить в продуктову категорію, яку довго ігнорувала, поки першопрохідці набивали гулі. Можливо, цього разу вийде так само – Марк пише, що класична «складка» на екрані в Apple повинна бути практично непомітна на тлі моделей Samsung і Pixel.

Правда, в Купертіно вирішили відмовитися від Face ID на користь Touch ID. Технологічне обмеження чи усвідомлений вибір – незрозуміло.

Вінчає цей план 2027 рік, коли вийде ювілейний iPhone 20 з вигнутим склом. До того моменту Apple, можливо, вирішить і проблеми з Siri, поряд з використанням AI взагалі. Не факт, що сама, правда.

Плани Apple щодо розвитку лінійки iPhone

«95% компаній отримують "нульову віддачу" від інвестицій у GenAI»

Звіт MIT про те, що 95% компаній отримують «нульову віддачу» від інвестицій у генеративний AI, спровокував цілком передбачуваний розпродаж. Компанія Nvidia втратила 3,5%, хоча нещодавно стала першою компанією з капіталізацією у 4 трлн дол. Palantir та ARM впали ще сильніше – на 9,4% та 5% відповідно.

Цікаво, що найбільше падіння показали Oracle та AMD – саме ті компанії, які демонстрували найкращу динаміку з травня – на 5,9% та 5,4% відповідно.

Financial Times вбачає ще одну причину в словах Сема Альтмана (Sam Altman), який минулого тижня сказав, що «деякі інвестори втратять багато грошей».

Втім, за останні п’ять років ми так звикли до щоденних стрибків фондового ринку на відсотки та десятки відсотків у різні боки, що тепер це навіть корекцією ніхто не називає. Це лише волатильність, не більше.

«95% компаній отримують «нульову віддачу» від інвестицій у GenAI»

«Трильйони доларів на дата-центри»

OpenAI організувала для кількох журналістів вечерю з Семом Альтманом, на якій також були присутні інші топменеджери компанії, включно з головним операційним директором Бредом Лайткепом. Кейсі Ньютон, автор Platformer, зробив детальний виклад розмови.

Про запуск GPT-5 і реакцію користувачів

Визнання помилок: Альтман визнав, що компанія «однозначно накосячила» із запуском GPT-5. Вони різко відключили доступ до GPT-4o та інших попередніх моделей, що викликало найбільший бунт користувачів в історії компанії.

Парасоціальні відносини: OpenAI не врахувала, що деякі користувачі розвинули емоційну прихильність до конкретних моделей. Хоча Альтман зазначив, що таких людей «дуже малий відсоток», посилаючись на спільноти типу r/MyBoyfriendIsAI. Сам він не відчув «ні краплі» смутку з приводу втрати GPT-4o.

Зростання доходів: Попри скандал, доходи від API подвоїлися в перші 48 годин після виходу GPT-5.

«Тепліша» версія: У четвер OpenAI випустила «набагато теплішу» версію GPT-5, яка починає з емпатичних фраз типу «це звучить складно» при обговоренні проблем користувача.

Про бульбашку AI та фінанси

«Так, ми в бульбашці»: На пряме запитання про бульбашку AI Альтман відповів ствердно. Інвестори «в цілому перехвильовані», і «хтось втратить феноменальну кількість грошей».

Прибутковість: Кумедний момент – Альтман заявив, що OpenAI «прибуткова на рівні інференсу» (якщо відняти астрономічні витрати на навчання моделей). Його COO Бред Лайткеп нервово виправив: «Досить близько до цього».

Трильйони на дата-центри: OpenAI планує витрачати «трильйони доларів на дата-центри», і коли економісти будуть обурюватися, компанія скаже: «Дайте нам робити нашу справу, будь ласка».

Про нові продукти та плани

Chrome: Якщо Google дійсно буде продавати Chrome, OpenAI «погляне на це» і зацікавлена в покупці.

Проєкт з Джоні Айвом: Альтман не дав жодного натяку на те, над чим вони працюють, але це займе «досить багато часу».

Більше додатків: Компанія планує випустити більше додатків під керівництвом нового CEO з додатків Фіджі Сімо.

Соціальні мережі: OpenAI зацікавлена в створенні соціальних експериментів, але поки не знайшла ідею, яка їм дійсно подобається.

Про політику та етику

Політичний тиск: Компанія поки не відчуває сильного політичного тиску змінити висновки ChatGPT, але «очікує, що він з'явиться дуже скоро».

Конфіденційність: Користувачі чат-ботів повинні мати щось на зразок лікарської таємниці, оскільки діляться найінтимнішими думками.

«Японські аніме секс-боти»: OpenAI категорично відмовляється створювати подібне в стилі Grok, хоча визнає, що для відсталих в AI компаній це легкий спосіб залучити користувачів.

Особисті моменти

Не використовує Google: Альтман каже, що більше не користується Google – ChatGPT обробляє майже всі його запити.

Стосунки з Олександром Вангом: Раніше були нормальні, тепер «не дуже хороші» після того, як Ванг переманив кількох топових співробітників OpenAI в лабораторію Meta.

Конфлікт з Маском: На питання, чому він кинув виклик Ілону Маску в X з приводу маніпуляцій з алгоритмами, Альтман посміхнувся і сказав: «Немає дисципліни».

«Трильйони доларів на дата-центри»

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT