|
СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ
Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях
Кто внес наибольший вклад в развитие украинского ИТ-рынка.
Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары
|
|

18 апреля 2025 г., 17:25
Велике інтерв'ю Елізабет Рід, VP of Search в Google, в основному присвячене результатам роботи AI Overviews – функції AI в пошуку, запущеної рік тому.
Ось основні пункти. Близько року тому було запущено функцію AI Overviews, яка спочатку зіткнулася з проблемами достовірності, але відтоді Google поліпшив баланс між точністю і корисністю.
AI змінив поведінку користувачів – вони ставлять більше запитань і довше, особливо молодь. Зростає використання комбінованих запитів із зображеннями. На відміну від чат-ботів, Google фокусується на наданні інформації, а не на створенні персоніфікованого співрозмовника, віддаючи пріоритет фактичній точності.
Google серйозно контролює якість відповідей, особливо у фінансовій та медичній сферах (your money or your life). AI Overviews показується тільки за умови впевненості у високій якості. Система стала показувати більш різноманітні джерела, покращилася якість переходів на сайти (з одного боку, це схоже на відмовку, але Елізабет дотепно зауважує, що люди, які, наприклад, ставлять боту запитання про моду, найімовірніше, раніше взагалі нею не цікавилися). З'явилися нові можливості для контекстної реклами.
Базовий пошук залишиться безкоштовним, хоча деякі функції можуть стати платними. Майбутнє пошуку – за мультимодальністю, персоналізацією і розширеними можливостями при збереженні інформаційної спрямованості.
Сама Елізабет почала ставити більше запитань, використовуючи AI-пошук для швидкого отримання інформації про теми, на вивчення яких не вистачає часу.
Цікаві міркування щодо AI в пошуку Google
14 апреля 2025 г., 17:25
Прочитав інтерв'ю з Дмитром Овчаренком, CTO центру AI, нещодавно організованого Мінцифрою, яке присвячене в основному питанню створення національної великої мовної моделі (LLM). Ця розробка була анонсована під час запуску центру і, чесно скажу, одразу викликала в мене подив. Інтерв'ю його абсолютно не розвіяло, а скоріше посилило.

Наприклад, спікер перераховує причини, з яких Україні потрібна своя LLM, і перша називається «Культурне значення». Причому з конкретним прикладом – модель має «правильно» відповідати на запитання «Чий Крим?». Я б зрозумів, якби таке сказав політик або який-небудь блогер у коментарях. Але ж інтерв'ю дає, здається, технічний фахівець, до того ж, мабуть, той, хто стежить за новинами. У нас реально є мета повторити подвиг розробників DeepSeek, чия модель відмовляється обговорювати події 1989 року в Пекіні та на кого схожий Вінні Пух?
Цілком розумію резони, пов'язані з конфіденційністю та безпекою – дійсно, не годиться вивантажувати в хмару державну інформацію. Тим паче що більшість хмар розташована в країні, де просто зараз природний інтелект пішов у відпустку. Але це завдання вирішують багато бізнесів по всьому світу і мало хто приходить до ідеї «Спочатку навчимо свою LLM».
Абсолютно вірно – у світі існує кілька прикладів LLM, оголошених національними. За рідкісними винятками це розробки країн, мови яких погано підтримували більшість наявних рішень. Йдеться про арабську, тюркську, японську, тобто такі, що доволі далеко відстоять від аналітичної англійської, яка найпростіша для токенізації та машинного опрацювання. Цим країнам, загалом, і діватися нікуди – будь-яке багатомовне рішення працюватиме з їхніми мовами погано та/або дорого, а будь-яке власне, орієнтоване на пари на кшталт англійська/арабська або англійська/японська, буде ефективнішим.
Так, українська мова, як будь-яка флективна, має розвинену морфологію і просто через це будь-яка модель у тексті українською бачитиме більше токенів, ніж у його дослівному перекладі англійською. Якщо додати обмеження словника, то вилазять досить кумедні речі – наприклад, слово «London» – це один токен, а слово «Odessa» – два. А ось «Odesa» – це три токени (всі приклади наведено за токенайзером GPT-4).
Але треба ж розуміти різницю між становищем Саудівської Аравії, Сінгапуру, Японії та України. У них є проблема з підтримкою основної мови практично у всіх наявних моделях і немає проблеми з фінансуванням. У нас ситуація приблизно зворотна – українська досить добре підтримується в більшості моделей, нехай і не оптимально, але грошей немає зовсім – власне, про це прямо згадується в інтерв'ю. Ба більше, немає датацентрів, немає GPU, немає навіть зайвої електроенергії.
Що ж тоді зібралися розробляти? Ось тут державний діяч гранично відвертий – ще не зібралися. Тобто буквально – «триває етап формування концепції, визначаємо завдання, формуємо структуру, оцінюємо бюджет і шукаємо партнерів». Зокрема – тих, хто грошей дасть.
Давайте я вам відразу скажу, що це буде. Візьмуть Llama, причому, як уже визначилися, досить малі моделі (від 1 до 17B), напевно, навчать свій токенайзер, і займуться донавчанням моделі на українських датасетах. Тут буде, наскільки я розумію, маса роботи на масу часу – я останні три місяці займаюся таким специфічним українським корпусом і періодично почуваюся чи то Гераклом у стайнях, чи то старателем на Юконі.
Але знаєте, в чому буде проблема? Отримана в результаті такої тяжкої праці своя LLM програватиме за всіма тестами абсолютно звичайній GPT-4o, не кажучи вже про reasoning моделі. І причин тому дві – по-перше, великі пропрієтарні моделі вже знають все те, що розробники збиратимуть і згодовуватимуть Llama (втім, можливо, вони візьмуть Gemma), і, по-друге, модель на трильйони параметрів завжди відповідатиме краще, ніж модель на 17 млрд, нехай і з зайвою кількістю токенів.
До речі, бог із нею, з GPT, не факт, що донавчена українська LLM на базі Llama-17B виграватиме у відкритої ж Llama-405B (пардон, уже начебто можна наводити як приклад Llama-4-Behemoth). Причому з тієї ж причини – велика модель просто вже знає більшу частину того, що буде використовуватися для донавчання маленької, а різниця занадто невелика, щоб її можна було побачити неозброєним оком.
Я не розкриваю жодних секретів або таємниць, якщо що – подібні міркування цілком доступні будь-кому, хто витратить деякий час і зусилля на вивчення AI. І тому кожен міг би замислитися – а навіщо це все?
Ні, ну правда. Якщо ви хочете мати у своєму розпорядженні всю міць нинішнього AI – є готові пропрієтарні рішення. Якщо вам критична конфіденційність – візьміть готову модель, яку можна розгорнути локально, або компромісне рішення на кшталт тієї самої mT5, що має хорошу підтримку українського. Якщо ви хочете забезпечити умовний технологічний суверенітет – почніть із забезпечення енергетичної безпеки та видобутку GPU за помірними цінами. Але якщо ви починаєте розповідати про істориків і культурних діячів, які збиратимуть політично витриманий датасет – ви явно не розвитком AI зібралися зайнятися.
Я б міг запідозрити, що весь цей проєкт є розпилом – узяти приклад із Польщі, яка планує бухнути в розвиток AI мільярд злотих, багато і марно тренувати моделі, купуючи дорогі GPU. Але тут грошей немає і, найімовірніше, навіть заявленої суми в мільйони доларів проєкт може не зібрати. Тому найприкріше, що це навіть не заради грошей – а заради політичного піару, щоб кілька людей могли регулярно розповідати про формування концепції, визначення структури та залучення фахівців і громадськості до вирішення грандіозної проблеми – щоб кілька рядків коду вміли видавати відповідь на питання «Чий Крим?».
Тому що, якби хотілося щось зробити для, наприклад, розв'язання проблеми якості інформації в численних реєстрах, то взяли б уже готові моделі та почали їхнє реальне застосування, водночас збираючи проблеми, що вилазять, і формуючи вимоги до тієї ж майбутньої національної моделі, доводячи тим самим її необхідність. А якщо структуру запускають із готовим рішенням «Написати все своє», то питання про завдання не стоїть, звісно.
Full disclosure: Цей текст коментує інтерв'ю одного з керівників Мінцифри України в галузі AI. Я брав участь у конкурсі на посаду Chief AI Officer, який пів року тому проводило Мінцифри.
Навіщо потрібна національна LLM
9 апреля 2025 г., 17:25
В історії з чатом у Signal знайшли винного – це виявилася Siri. Радник Трампа з нацбезпеки Майк Волц випадково додав журналіста Atlantic Джеффрі Голдберга до групового чату Signal про запланований військовий удар у Ємені через автоматичну пропозицію Siri оновити контакт.
За даними Guardian, усе відбулося в кілька етапів. Голдберг надіслав до штабу Трампа лист про статтю, що критикує ставлення експрезидента до поранених військовослужбовців. Для протидії цій історії до справи підключили Волца. Представник Трампа Браян Г'юз скопіював вміст листа, включно з підписом із номером телефону Голдберга, у свій лист Волцу. Потім iPhone Волца запропонував «оновлення контакту», додавши невідомий номер до наявного контакту Хьюза.
Що тільки доводить правоту мого висновку, який я повторюю за будь-якої зручної нагоди останні років 15 – жоден геніальний продуктовий менеджер не в змозі вгадати, як користувач насправді використовуватиме його продукт. Звісно, неперевершеним чемпіоном у цьому плані є невеличка компанія, в якій поштову скриньку на безплатному сервері використовували як місце зберігання документів, включно з «Кошиком», де зберігали найважливіші документи. Але цьогорічний приклад теж непоганий.
У всьому винна Siri
4 апреля 2025 г., 17:25
Майстер переговорів, тимчасово (але це не точно) виконуючий обов'язки президента США, після того, як уже закінчив усі війни, навів лад у світі тощо, розгляне пропозицію про продаж американських операцій TikTok, відокремивши їх від китайської материнської компанії ByteDance. Термін, який сам Трамп призначив, спливає в суботу. Втім, якщо що, він ще раз продовжить.
За інформацією джерел, адміністрація вивчає угоду за участю Oracle і Blackstone, а можливо й інших інвесторів. Віцепрезидент Венс, який допомагає вести переговори про примусовий продаж, візьме участь у зустрічі разом з іншими високопоставленими чиновниками.
Запропонована угода передбачає, що Oracle отримає невелику частку в новій американській компанії та забезпечить захист даних американських користувачів, але водночас цінний алгоритм програми може залишитися в китайських руках.
Пекін, імовірно, погодиться на угоду за участю Oracle, якщо алгоритм TikTok залишиться повністю під китайським контролем. Oracle вже створила значну хмарну інфраструктуру для роботи з TikTok у рамках партнерства під назвою Project Texas.
Трамп також заявив, що розгляне можливість зниження мит на китайські товари, щоб заручитися підтримкою Пекіна для продажу.
Щоправда, залишення контролю за Китаєм суперечить якраз закону, який потрібно виконати. Але зате повністю вкладається в уже знайому нам переговорну тактику Трампа – відразу здати низку позицій і пообіцяти подальші поступки, аби інша сторона погодилася зробити так, як їй максимально вигідно.
Oracle придбає американський TikTok?
31 марта 2025 г., 17:25
Поки читав огляд, згадував, що у 2000-х чув, як китайці планують будівництво не окремих будинків, а цілих районів, з кварталами хмарочосів у кожному. А років десять потому пішли відео, як зносять, так і не розпродані квартали хмарочосів.
Ще рік тому в Китаї спостерігався ажіотажний попит на високопродуктивні чипи Nvidia, багато з яких потрапляли в країну контрабандою, обходячи санкції США. Тоді ціни на чорному ринку сягали 200 тис. юанів за модель H100. Однак сьогодні ситуація кардинально змінилася: попит впав, ціни знизилися, а багато датацентрів, побудованих з розрахунку на бум штучного інтелекту, тепер простоюють порожніми.
Причин кілька. По-перше, успіх китайської моделі DeepSeek R1, здатної конкурувати із західними аналогами за набагато менших витрат, різко змінив економіку ринку. Тепер замість масового навчання нових моделей компанії воліють використовувати вже наявні рішення, що знижує потребу в оренді GPU.
По-друге, багато датацентрів було побудовано поспішно, без урахування реальних потреб ринку. Часто будівництвом займалися компанії та місцева влада без належного досвіду в галузі інфраструктури AI, розраховуючи на швидкий прибуток і державні субсидії. Тим більше, що в комуністичній економіці важливу роль відіграють освоєння бюджетів на втілення політичних гасел, а деякі риси капіталізму дають змогу цілком по-сучасному розпиляти частину коштів. У результаті якість багатьох об'єктів залишає бажати кращого, а самі вони не відповідають новим вимогам ринку, орієнтованого на real-time inference, а не на масштабне попереднє навчання моделей.
Крім того, виникла парадоксальна ситуація – попри високу вартість купівлі чипів Nvidia в Китаї, ціни на оренду GPU впали до рекордно низьких рівнів. Це пов'язано з надлишком обчислювальних потужностей і недостатньою потребою в таких ресурсах, особливо у віддалених регіонах, побудованих далеко від великих технологічних центрів.
Водночас китайська влада продовжує підтримувати розвиток інфраструктури AI, вважаючи її стратегічно важливою для національної безпеки і технологічної незалежності. Великі китайські компанії, такі як Alibaba і ByteDance, заявили про багатомільярдні інвестиції в розвиток датацентрів і AI-інфраструктури.
Ну, а непотрібні датацентри знесуть, як ті хмарочоси.
Непотрібні AI-датацентри знесуть
26 марта 2025 г., 17:25
Автори європейського закону про штучний інтелект закликали Брюссель зупинити «небезпечні» спроби пом'якшити правила, які могли б звільнити великі американські технологічні компанії, такі як OpenAI та Google, від ключових вимог закону.
Єврокомісія розглядає можливість зробити добровільними, а не обов'язковими деякі положення закону. Включно з тими, які змушують AI-компанії гарантувати, що їхні передові моделі не виробляють насильницького і неправдивого контенту і не використовуються для втручання у вибори. Ці кроки послідували за інтенсивним лобіюванням з боку адміністрації Трампа і великих технологічних компаній.
У листі єврокомісару з цифрових питань Хенне Вірккунен депутати Європарламенту, які брали участь у розробці регулювання AI, назвали поступки «небезпечними, недемократичними, такими, що створюють правову невизначеність». Вони попередили про серйозні наслідки для європейської економіки та демократії, якщо потужні AI-моделі використовуватимуть для просування екстремістських політичних позицій, маніпуляцій на виборах або поширення незаконного контенту.
Наразі дебати стосуються розроблення «кодексу практики», який має дати AI-компаніям керівництво щодо впровадження закону. Остаточну версію має ухвалити Єврокомісія в травні. Експерти намагаються знайти баланс між забезпеченням сили закону і привабливістю для AI-компаній.
Брюссель зіткнувся із сильним тиском з боку США. Глава глобальних зв'язків компанії Meta Джоел Каплан попередив, що кодекс практики накладе «непрацездатні й технічно нездійсненні вимоги». Meta також заявила, що не може випустити свої останні моделі AI в ЄС через суворі правила конфіденційності. Віцепрезидент США Дж.Д.Венс нещодавно розкритикував «надмірне регулювання AI» і попередив, що «AI має залишатися вільним від ідеологічної упередженості».
У світлі розвитку відносин між різними країнами в останні кілька місяців навіть і не знаєш, на чий бік ставати. Начебто менше заборон і обмежень – це добре. Але з іншого боку ми маємо обіцянку продавати європейцям тільки спрощені версії винищувачів і того самого віце-Венса, який чатиться з секретних питань у публічному месенджері.
Менше обмежень для AI?
20 марта 2025 г., 17:55
DeepSeek схоже набуває в Китаї статусу «національного скарбу». З усіма наслідками, що випливають з цього. За даними джерел, керівництво компанії заборонило деяким співробітникам, які беруть участь у розробці AI, вільно виїжджати за кордон, а уряд провінції Чжецзян, де розташована штаб-квартира материнської компанії DeepSeek, почав перевіряти потенційних інвесторів перед особистими зустрічами з керівництвом.
Для контролю над пересуваннями DeepSeek і хедж-фонд High-Flyer Capital Management зажадали від деяких співробітників здати паспорти, пояснивши це тим, що їхня робота пов'язана з конфіденційною інформацією, яка може становити комерційну або навіть державну таємницю.
З січня генеральний директор DeepSeek Лян Веньфен був запрошений на дві зустрічі з вищим керівництвом Китаю – з головою Сі Цзіньпіном і прем'єром Лі Цяном. Зазвичай на такі зустрічі запрошують тільки керівників найбільших компаній Китаю.
До речі, DeepSeek, можливо, піонери і в цьому. Ми ж пам'ятаємо, що китайська політика улюбленців не має. Наприклад, політика посилення контролю за IPO компаній кілька років тому була спровокована конкретною поведінкою Джека Ма, але зрештою прилетіло всім. З огляду на те, що та ж Alibaba за останні місяці також представила кілька хороших моделей, можливо, подібний контроль прилетить і до них.
«Національний скарб»
17 марта 2025 г., 17:45
OpenAI оприлюднила свої пропозиції для «Плану дій щодо AI», який має бути представлений президенту США до липня. У своїх рекомендаціях OpenAI наголошує на необхідності прискорення розробки штучного інтелекту і закликає до мінімального регулювання. Компанія виступає за «свободу інновацій у національних інтересах» і «добровільне партнерство між федеральним урядом і приватним сектором», а не за «надмірно обтяжливі закони штатів».
Серед пропозицій є і вельми спірні: наприклад, тимчасово відмовитися від програми FedRAMP (федеральної системи управління ризиками) і «модернізувати» процес схвалення AI-інструментів для урядового використання. OpenAI стверджує, що це дасть змогу уряду отримувати доступ до нових AI-сервісів на 12 місяців раніше, ніж за поточних процедур.
Компанія також закликає до співпраці з приватним сектором у розробці AI для потреб національної безпеки та виступає за «стратегію авторського права, що сприяє свободі навчання» і зберігає «здатність американських AI-моделей вчитися на матеріалах, захищених авторським правом».
Щодо Китаю OpenAI попереджає, що DeepSeek та інші китайські AI-стартапи становлять загрозу для приватності та безпеки. «Хоча Америка сьогодні зберігає лідерство в AI, DeepSeek показує, що наша перевага невелика і скорочується», – вважають у компанії.
**
Google, слідом за OpenAI, опублікував пропозиції щодо політики в галузі штучного інтелекту у відповідь на заклик адміністрації Трампа створити національний «План дій щодо AI». Компанія також виступає за мінімальні обмеження авторських прав під час навчання AI-моделей і «збалансований» контроль експорту, який «захищає національну безпеку, даючи змогу водночас здійснювати експорт зі США і глобальні бізнес-операції».
У документі Google стверджує, що винятки в рамках сумлінного використання (fair use) і дозвіл на аналіз текстів і даних мають «критичне значення» для розвитку AI й пов'язаних із ним наукових інновацій. Фактично, компанія хоче закріпити право навчати моделі на загальнодоступних даних, включно із захищеними авторським правом, практично без обмежень. Аналогічну пропозицію висуває й OpenAI.
Що стосується відповідальності, Google виступає проти покладення надмірних зобов'язань на розробників AI-систем, стверджуючи, що вони «мають мало або взагалі не мають контролю» над тим, як використовується модель, і тому не повинні нести відповідальність за неправильне використання.
Google також назвав вимоги до розкриття інформації, подібні до тих, що розглядаються в ЄС, «занадто широкими» та закликав уряд США виступити проти правил прозорості, які вимагають «розкриття комерційних таємниць» або «дозволяють конкурентам дублювати продукти».
Свободу розробникам AI?
12 марта 2025 г., 17:35
The Wall Street Journal публікує невелике розслідування, з якого випливає, що китайські покупці прекрасно обходять американські експортні обмеження, замовляючи новітні чіпи Nvidia Blackwell через треті країни. Це наочно демонструє проблеми, з якими зіткнеться адміністрація Трампа, намагаючись обмежити доступ Китаю до передових американських технологій.
Торговці в Китаї продають обчислювальні системи зі встановленими чіпами Blackwell, отримуючи їх через треті сторони в сусідніх регіонах. Деякі продавці обіцяють доставлення протягом шести тижнів. Один постачальник із Шеньчженя отримав замовлення на понад десять серверів Blackwell від клієнта з Шанхая, який вніс депозит близько 3 млн дол.
Перекупники використовують компанії, зареєстровані за межами Китаю, для купівлі серверів Nvidia у фірм у Малайзії, В'єтнамі та Тайвані. Ці компанії, включно з операторами дата-центрів і авторизованими клієнтами Nvidia, купують сервери для власного використання, а частину перепродують у Китай.
У Китаї сервер Blackwell з вісьмома AI-процесорами може коштувати понад 600 тис. дол., що вище за глобальні ціни. Більшість замовлень китайських клієнтів складають чіпи H200 зі старішої серії Hopper. Сервер із вісьмома H200 зазвичай коштує в районі 200 тис. дол.
Китайські компанії також збільшують замовлення на Nvidia H20 – найпотужніший чіп серед тих, які не підпадають під американські експортні обмеження. Місцеві гіганти хмарних обчислень, як-от Alibaba, Tencent і ByteDance, закуповують більше H20, почасти в очікуванні того, що адміністрація Трампа незабаром може включити цей чіп до експортних обмежень.
Дивлячись на велику кількість китайських імен у цікавих статтях, на думку спадає: «Що вони винайдуть, якщо в них узагалі чіпи відібрати?». Принаймні, способів отримання чіпів вони знайшли достатньо, як бачимо.
Китайські компанії без проблем купують AI-прискорювачі Nvidia в обхід санкцій
6 марта 2025 г., 17:55
Непоганий огляд на голосову модель Sesame. Пишуть, що реалізм моделі такий, що користувачі повідомляють про емоційну прихильність до AI-асистента. Conversational Speech Model (CSM) від Sesame долає «зловісну долину» штучної мови, імітуючи людські недосконалості – паузи на вдих, сміх, застереження і самовиправлення.
На відміну від традиційних систем синтезу мовлення, CSM використовує два взаємопов'язаних AI-модулі (основний і декодер), навчених на приблизно мільйоні годин аудіо. Модель обробляє текст і аудіо одночасно, що робить мову природнішою, а в основі лежить, як не дивно, Llama. Загалом натреновано три моделі різних розмірів – від 1 до 8B в основному і від 100 до 300M у декодері.
Реакції користувачів варіюються від захоплення до занепокоєння. Дехто називає технологію «приголомшливою» і «першою справжньою розмовою з AI». Тоді як інші, наприклад редактор PCWorld Марк Хачман, описують взаємодію як «лячну». Особливо вражає здатність моделі розігрувати емоційні сценарії – наприклад, сварку з розгніваним начальником, що відмовляється робити ChatGPT.
Компанія Sesame, заснована Бренданом Айрібом, Анкітом Кумаром і Раяном Брауном, отримала значні інвестиції від Andreessen Horowitz та інших венчурних фондів. Вона планує зробити ключові компоненти своєї технології відкритими та розширити підтримку до більш ніж 20 мов.
Поговорити з AI по душах
|
|

|