`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Андрій Тищенко

Полювання на дані

+22
голоса
Весь штучний інтелект побудований на аналізі великих масивів даних і пошуку закономірностей. Парадокс у тому, що світовий обсяг згенерованої інформації зростає вибуховими темпами, але змістовні дані «закінчуються».
 
Ще за часів керування цифровою трансформацією Михайлом Федоровим був запущений  проект національної LLM – інструмента цифрового суверенітету, розвитку українських AI-рішень, автоматизації державних сервісів, створення оборонних продуктів. Операційним виконавцем виступає Київстар (технічна реалізація, запуск і масштабування інженерної та обчислювальної інфраструктури). 
 
Без локальних даних LLM неминуче буде «чужою», тож ключове завдання Мінцифри – забезпечити дані для навчання, доступ до державних і відкритих корпусів, координацію з академічними установами, університетами й бібліотеками. Навчання на великих обсягах «своїх» текстів дозволяє моделі краще розуміти мову і діалекти, контекст, стиль і тональність, формувати зв’язні та логічні відповіді.
 
Втім, існують перешкоди. Для навчання потрібно залучити архіви, які містять великі масиви рукописних і друкованих, але неоцифрованих джерел. Тому з’являються ініціативи зі створення інструментів автоматичного розпізнавання рукописних державних документів, що дозволить перевести мільйони архівних записів у цифровий формат.
 
Окрім технічних проблем, є й адміністративні. Країна довго жила в укладі усуспільнення плодів науки та культури. Спадщина розпорошена між профільними установами, «доглядачі даних» роками забезпечували їх збереження, обробку та впорядкування. Те, що їхня праця (мізерно) оплачувалась державою, не є достатньою підставою для автоматичної передачі даних у розпорядження творців національної LLM за запитом Мінцифри, МОНу або Київстару. Телефонують і вимагають.
 
Люди з людьми, зрештою, якось домовляться. Іронія полягає в тому, що сам AI починає спотворювати реальність, «полюючи на дані».
 
За оцінками, платформа Spotify отримує до 100 000 нових треків щодня. Подейкують, 30–45% музики сьогодні генерує AI. Створення треків стало майже безкоштовним і масовим: з’явилися «контент-ферми», які продукують тисячі композицій щодня. Закономірно, у загальний потік завантажень від музикантів, лейблів і дистриб’юторів вливається синтетична творчість.
 
Якби ж-то проблема була в авторстві. Системною бідою індустрії стали штучні прослуховування (artificial streaming). Автоматичні акаунти або ферми пристроїв (телефонів чи серверів) масово «слухають» треки без участі реальних людей - до 8–10% усіх стрімів можуть бути фейковими. Це призводить до цілком реального перерозподілу роялті на користь нової тіньової економіки. Справжні білкові артисти втрачають доходи, спотворюються алгоритми рекомендацій, сходять вигадані “зірки”.
 
Раніше казали: якщо ви не платите за продукт, то продуктом є ви самі. Розвиток AI фінансує, прямо чи вимушено, кожен з нас – і все одно не полишає відчуття, що полюємо не ми. Полюють на нас.
 

Стратегія охолодження ЦОД для епохи AI

+22
голоса

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT