`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Александр Черников

Трудности перевода

+55
голосов

Люди всегда хотели преодолеть языковой барьер. Со времен Вавилонского столпотворения они до сих пор никак не могут договориться друг с другом. Но, похоже, сейчас человечество готовится сделать вторую попытку посостязаться с богами и, если пока не начать говорить на едином всепланетном языке, то хотя бы добиться понимания смысла речи собеседника.

«Был у нас толмач-немчин. Ему переводить, а он лыка не вяжет. Ну, мы его в кипятке и сварили»

Из фильма «Иван Васильевич меняет профессию»

«Самое жуткое − это сочетание машинного перевода и предметной безграмотности живого переводчика»

Из дискуссии на сайте Алекса Экслера

Необходимое предисловие

Название этого блога − «Трудности перевода» (Lost in Translation), − заимствовано у хорошего американского фильма с Биллом Мюрреем и Скарлетт Йоханссон в главных ролях. Его премьера состоялась в августе 2003 г., а кто пропустил его по каким-то причинам, получит удовольствие от просмотра, − после небольшого поиска в сети.

В фильме хорошо показаны последствия недопонимая людьми друг друга. Однако в конце концов герои справляются со всеми этими трудностями, и все заканчивается хорошо. Ни одна машина на это не способна сейчас и не будет способна еще много лет, если вообще когда-нибудь это произойдет.

Но в данной статье мы будем говорить именно о свойствах, которые сейчас получают машины. Они уже достаточны для того, чтобы заменить часть людей в некоторых массовых профессиях.

Тенденция, однако!

Трудности перевода

На прошлой неделе, 25 октября случилось очередное «обыкновенное чудо» в области информационных технологий. Оператор перевозок без водителя (self-driving vehicle operation) OTTO, с недавних пор принадлежащий Uber, отправил здоровенный трак с 50 тыс. банками Будвайзера в самостоятельное путешествие длиной 120 миль по дорогам Колорадо, из Форт-Коллинз − в Колорадо Спрингс, по федеральной трассе Interstate 25.

Событие, конечно, требует отдельного изложения, и его приводить мы здесь не будем. Тогда вопрос − зачем вообще писать об этом в блоге, посвященном автоматическому речевому переводу?

Ну, если подумать, здесь можно найти общую черту, которая в ближайшие десятилетия полностью перекроит мировой рынок рабочей силы, − «скрипач не нужен»!

Будут не нужны миллионы и миллионы людей, зарабатывающих на хлеб верчением баранки. Точно так же не нужны будут сотни тысяч толмачей, которые, по сути, ничего не делают, кроме того, что перегоняют слова одинакового значения из одного звукового представления в другое.

К 2015-16 гг. в этих областях уже накопилась некая критическая масса знаний и технологий, достаточная для того, чтобы мешок прорвался. Искусственный интеллект забирает у людей все новые профессии и зачастую уже справляется с ними лучше, чем двуногие теплокровные.

Но это, опять же, − отдельная тема для разговора на кухне за полночь. Поэтому обратимся пока к IT, которые грозят оставить без работы профессиональных переводчиков, − по крайней мере низкой и средней квалификации.

К истории вопроса

Фантасты писали об универсальных устройствах-переводчиках еще бог знает когда. Первая реальная система в рамках «Джорджтаунского эксперимента» показала возможности машинного перевода 7 января 1954 г. в Нью-Йорке, в штаб-квартире IBM. В ходе эксперимента был продемонстрирован полностью автоматический перевод более 60 предложений с русского языка на английский.

Однако последующие шестьдесят лет показали, что особо обольщаться не стоит. Кто думает, что задача решается только мощностью аппаратных средств и новых алгоритмов, тот сильно заблуждается (по крайней мере, пока). Хорошо прочищает мозги энтузиастов статья на Лурке.

Интересно также почитать скептическую дискуссию «Невостребованная профессия переводчика» от мая текущего года на сайте Алекса Экслера.

Смыслоуловитель

Романтики, в общем, верили в возможности техники, но также частенько иронизировали над трудностями перевода. Если от шкафа переводчика IBM никто и не требовал портативности, то через двадцать лет уже оформилось более-менее современное представление о том. каким должен быть персональный носимый (wearable) переводчик, − вернее, «смыслоуловитель», как его назвали авторы фильмов «Москва — Кассиопея» и «Отроки во вселенной», снятых в 1973 г.

Трудности перевода

Вот так смыслоуловитель выглядел

Трудности перевода

Вот так его носили

Трудности перевода

А вот так он работал

В эпизоде, когда во время экскурсии человек в чалме говорит по-арабски − «Чудесная, поразительная, прекрасная вещь! Верите или нет, она за гранью того, что можно вообразить, и того, что говорили легенды древних и прочие»! Смыслоуловитель переводит все это одним словом − «Потрясающе»!

Ну что тут скажешь − как он работал сорок лет назад, так примерно работает и сейчас.

Вавилонские рыбы (Babel Fishes)

В отличие от отечественного смыслоуловителя, Бабельфиш − гораздо более продвинутая технология, работающая на симбиотическом телепатическом уровне. Здесь мы ограничимся только авторитетной цитатой.

Трудности перевода

«Babel fish − маленькая, желтая и похожая на пиявку. Это, вероятно, самая странная вещь во Вселенной. Она питается энергией волн мозга тех, кто находится вокруг нее. Затем она выделяет телепатическую матрицу, объединяя частоты мысли с сигналами нерва из речевых центров мозга.

Практический результат всего этого − если Бабельфиш у вас в ухе, то вы можете немедленно понять сказанное вам в любой языковой форме. Однако Бабельфиш, эффективно снимая все барьеры коммуникации между культурами, вызвала наибольшие войны, какие когда-либо знала история».

Hitchhiker’s Guide to the Galaxy

Дуглас Адамс (1978)

Современные аналоги

Еще в августе 2015 г. Microsoft выпустила свое ПО − Translator apps for iOS and Android, работающее в том числе на Smart Watch. Это − не аналог описанных выше фантастических устройств. Это − довольно неуклюжий и неудобный для пользователя концепт, демонстрирующий только саму возможность перевода в мобильном режиме. Надо полагать, особого дальнейшего развития это направление не получит.

Трудности перевода

С технической точки зрения это устройство, как сейчас видится, еще до рождения устарело. Оно требовало манипулирования двумя устройствами (Smart Watch и смартфон), в качестве защиты от шума предлагалось просто читать перевод на экране устройства и т.д. А вот следующие две платформы уже более близки к устранению языкового барьера.

ili Wearable Translator (IWT)

Трудности перевода

Похожий на цифровой диктофон переводчик «ili» − японский аналог смыслоуловителя. Устройство полагается на собственную встроенную, постоянно пополняемую и обновляемую базу данных. Не нуждается в радио, Bluetooth или других интерфейсах связи для перевода на внешнем мощном устройстве.

Возможно, это будет означать, что больше нет потребности в бумажных или цифровых разговорниках для утомленных путешественников. Если вспомнить, то такие штучки размером с маленький калькулятор выпускались лет десять назад, но большого распространения не получили из-за убогости возможностей.

Копания признает, что переводы «ili» несовершенны, но отмечает, что устройство безусловно полезно для человека, который, например, ищет свой поезд, буфет или туалет в некотором иностранном государстве.

Разработчик «ili», японская компания LogBar, основана в 2013 г. На ее сайте указано, что она имеет головной офис в Токио, а также офис в Сан-Франциско, а численность ее персонала составляет 20 человек. Ранее, на CES2015 она показала свое первое изделие − электронное кольцо Ring, которое было беспощадно раскритиковано, хотя проект и собрал на Kickstarter миллион долларов крауд-фонда. На CES2016 она опять нашумела со своим носимым нашейным переводчиком, получившим название «ili».

Движок переводчика выполнен также малоизвестной японской компанией FueTrek. Она выглядит чуть солиднее − основана в 2000 г. и имеет около 200 человек персонала. Ее технология vGate (распознавание речи и ведение диалога) уже нашла практическое применение в автомобильной промышленности.

После небольшого цунами январских публикаций 2016 г., посвященных «ili», в сети наступила полная тишина по поводу этого устройства, и вообще всего, относящегося к LogBar. Это может говорить о мошенничестве или изначально прожектерском отношении к своим разработкам. Впрочем, для контекста данной статьи это не важно.

Трудности перевода

Рассматривать «ili» следует как некий упрощенный разговорник для туристов, и не более чем прототип будущих переводчиков.

Несмотря на все свои «детские болезни», IWT является первым переводчиком в своем роде, хоть как-то пригодном к общению без помощи переводчика-человека. Он, хоть и не полностью, но ломает языковой барьер, давая возможность людям понять друг друга. По крайней мере, в определенном смысле он выгодно отличается, например, от Google Translate, поскольку является автономным.

По своей конструкции и схеме работы IWT доступен и ребенку. Нажимаем на кнопку записи, произносим фразу, ждем перевода и синтеза фразы на другом языке. Встроенный словарь содержит около 50 тыс. слов. в предварительно загруженном словаре путешественника (travel lexicon pre-loaded library). Этого вполне достаточно для любительских путешествий.

Например, одним из наиболее типичных запросов туристов оказался следующий − «Я хочу заказать гавайскую еду, которую никогда не пробовал прежде». Однако профессиональные переводы, в которых содержится техническая, медицинская и пр. терминология − это не та область, где «ili» может проявить свои возможности.

В модели, показанной в январе 2016 г. на CES2016, были доступны переводы с/на английский, японский и китайский языки. Вторая модель поколения должна была пополнится французским, тайским и корейским языками, а третья − также испанским, итальянским и арабским. Ориентировочная розничная цена «ili» находится в районе $130.

Есть и первый реальный коммерческий успех компании − 29 сентября переводчик «ili» получил статус «Official Product» агентства Hawaii Tourism Japan. Это даст LogBar обратную связь с пользователями и послужит дальнейшему совершенствованию устройства, − если она, конечно, будет продолжать работу над устройством.

Pilot

В начале сентября текущего года было анонсировано устройство, определяемое как «внутриушной мгновенный языковой переводчик» (Instant Language Translator Earpiece), а также (менее неуклюже) как «умный внутриушной переводчик» (Smart Earpiece Language Translator, SELT). Окончательное название класса этих устройств еще не устоялось.

Разработанное Waverly labs (компания создана в 2014 г.) устройство использует новейшие технологии распознавания речи, принципы построения носимых устройств и алгоритмы машинного перевода, несколько снижая языковый барьер. Но вот вопрос − для кого? Разумеется, − как можно легко догадаться, − снова для путешественников.

Трудности перевода

Комплект включает пару вкладышей-наушников и ПО. Требует смартфона, который обеспечивает перевод и беспроводную связь с наушниками. Пока позволяет оперативные языковые переводы в парах английский, французский, итальянский, португальский и испанский язык. В отличие технологии со Smart Watch, после запуска приложения (определенной языковой пары) от пользователя больше не требуется никаких действий.

Для основного перевода Pilot действует как фразеологический словарь (phrasebook), т.е., опять используется принцип разговорника.

Pilot может работать в режиме конференции (несколько человек) и в режиме громкой связи через динамик смартфона. Очень может быть, что через пару лет в Pilot будут добавлены функции слухового аппарата, который во многих случаях будет полезен и обычным людям.

Полный пакет поставки обойдется менее, чем в $200. Он включает пару наушников с тремя вкладышами разного размера, зарядку и апп для смартфона. Это − также краудсорсинговый проект. Однако он собрал на Indigogo $3,4 млн., в 32 раза больше запрошенного объема финансирования.

Как работает Pilot, можно посмотреть на видео.

Нет предела совершенству

Любители фантастики, наверное, помнят, что инженер Гарин при испытании своего гиперболоида, − так сказать, в тестовом режиме, − выжигал на металле слова «Проба пера». То, что происходит сейчас с wearable переводчиками, иначе назвать пока нельзя.

Не решены многие вопросы, например, − как одновременно общаться с несколькими людьми, каждый из которых говорит на своем родном языке. Профессиональное использование пока подразумевает наличие специальных библиотек, которые нужно как-то переключать. Нужна определенная сервисная служба, которую не под силу организовать крауд-фондам.

Так что человечество пока играет в перевод, как ребенок играет кубиками, составляя из них слова. Крупные компании пока выжидают и не спешат инвестировать в серьезные коммерческие проекты носимых переводчиков.

Раздаются и предостережения о том, что такие переводчики дадут и обратное воздействие на людей, − которые постепенно начнут говорить стандартными фразами, хорошо понятными как машинному собеседнику, так и машинному переводчику. Возможно, это убьет национальную литературу, от которой останется только смысловая канва.

В общем, вопросов здесь пока больше, чем ответов, и думается, что переход от буфетно-туалетной тематики к полноценному общению между людьми займет еще не одно десятилетие.

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

+55
голосов

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT