`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Машинный интеллект учится переводу без словаря

0 
 

Стремительный прогресс в области машинного обучения не только демонстрирует растущее количественное превосходство искусственного интеллекта, над естественным, но и приоткрывает качественно новые аспекты его применения.

В романе Жюля Верна, профессор Паганель изучал испанский, сопоставляя текст одной и той же поэмы на двух близких языках. Современные искусственные нейросети так же, но гораздо быстрее, осваивают машинный перевод — на параллельных текстах и под руководством человека, служащего критерием качества результата.

Но, что если необходимо создать словарь для редкой языковой пары, для которой не существует параллельных текстов? Паганель спасовал бы перед такой задачей, однако для ИИ она вполне разрешима уже сегодня. К таким выводам пришли две независимые команды исследователей, которые практически синхронно выложили свои статьи в Arxiv.org.

«Предположим, вы дадите человеку множество книг на китайском и множество на арабском, среди которых нет одинаковых, и потребуете научиться переводить с китайского на арабский. Это кажется невозможным, не так ли?, — спрашивает первый автор одной из статей, Микель Артетекс (Mikel Artetxe) из Университета Страны Басков (UPV). — Но мы показали, что компьютер способен сделать это».

В этих статьях, заявленных на следующую Международную конференцию по представлению данных для обучения (ICLR 2018), описываются два близких подхода к методу неконтролируемого машинного обучения. В каждом из них двуязычный словарь строится без вмешательства человека, предупреждающего систему о допущенных ошибках. Это возможно благодаря хорошей корреляции относительного расположения слов в предложениях. Например, слова «стол» и «стул» часто соседствуют во всех языках. Составляемая компьютером карта таких соответствий напоминает два атласа, наложенные один на другой: дороги в них совпадают, а названия населенных пунктов имеются на обоих языках, что даёт готовый двуязычный словарь.

В обоих исследованиях примерялись две стратегии обучения переводу на уровне предложений: обратный перевод (back translation) и шумоподавление (denoising). В первой сначала делается грубый перевод предложения, а затем уже его переводят обратно. Если результат не идентичен оригиналу, производится подстройка нейросети. Вторая стратегия работает похожим образом, но вместо двойного перевода вносит «шум» в предложение (переставляя или удаляя отдельные слова) и пытается восстановить первоначальный смысл. Цель этих методов — улучшить понимание нейросетью глубинной структуры языка.

Система UPV делает несколько больше обратных переводов в ходе обучения, чем другая, созданная компьютерным экспертом из Facebook, Гильемом Ламплом (Guillaume Lample), но эта удлиняет процесс перевода на лишний шаг. Обе сначала преобразуют предложение в его абстрактное представление, и уже затем декодируют на другой язык. При этом система Facebook специально верифицирует степень абстрактности промежуточного" языка.

Несмотря на различие методик результаты их применения легко сопоставимы, так как для тренировки в обоих случаях использовались тексты на английском и французском из одного и того же массива, содержащего примерно 30 млн предложений. В тестах BLEU (Bilingual Evaluation Understudy Score), используемых для оценки точности перевода, обе системы получили примерно 15 баллов для двух направлений перевода. Это не так много, как 40 баллов у Google Translate — система с контролируемым обучением — или, тем более, у переводчиков-людей, оцениваемых в 50 и выше баллов, но лучше, чем даёт пословный перевод.

Авторы признают, что их системы лучше работают если параллельные тексты принадлежат к одному жанру, например, газетным передовицам, и хуже, если переводят новые для себя материалы с медицинскими или просторечными жаргонизмами. Тем не менее, они подчёркивают, что такие исследования делают лишь первые шаги, и результаты могут быть значительно улучшены путём обмена методиками или введения частичного контроля обучения (нескольких тысяч пар идентичных предложений на двух языках).

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

0 
 

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT