Mechanical Turk: доступ к огромному человеческому потенциалу прямо в «облаке»

15 апрель, 2011 - 09:14Елена Дериева

Во многих сферах деятельности зачастую возникает необходимость быстро обработать большие массивы данных либо получить информацию об определенном объекте или услуге от большого числа потребителей. Понятно, что выполнить такую работу в сжатые сроки и без привлечения дополнительных рабочих рук трудно. К счастью, для решения подобных проблем можно обратиться в «облака»

Несмотря на все возрастающую вычислительную мощность и использование систем искусственного интеллекта существует множество задач, трудно алгоритмизируемых и автоматизируемых. Такие простые действия как распознавание изображений, редактирование текста, анализ удобства веб-страницы или транскрибирование аудиозаписи человек выполнит намного быстрее и качественнее чем самая совершенная из современных программ. Подобные виды работ (получившие название HIT, от Human Intelligence Task – задание для человеческого интеллекта) зачастую не требуют большой квалификации и следовательно могут выполняться большим числом добровольцев. Конечно, в интернете нет недостатка ресурсов, которые дают возможность фрилансерам и их потенциальным клиентам найти друг друга. Тем не менее, когда дело касается сверхбольших объемов, которые должны быть исполнены в кратчайшие сроки, самостоятельный поиск исполнителей и управление ими оказывается весьма сложными и трудозатратными процессами. Решить проблему может Mechanical Turk, входящий в сервис Amazon.com. По сути, он представляет собой распределенную сеть, в которой работают не компьютеры, а люди – любой пользователь может взять любое доступное HIT, выполнить его за строго указанное время и получить вознаграждение.

Этот проект известен довольно давно, он был запущен в ноябре 2005 г. и изначально использовался преимущественно самой компанией Amazon для выполнения операций, требующих участия человека, в частности по обработке музыкальных компакт-дисков. Впоследствии сервис привлек других работодателей, расширялся и спектр заданий, уже к 2007 г. наиболее распространенными были расшифровка подкастов, рейтингование и маркировка изображений. Задания транскрибирования, например, до сих пор регулярно появляются на сервисе. Со временем стали популярны HIT, связанные с переформулированием предложений, написанием блогов, отзывов и даже целых статей, задачи связанные с участием в социальных сетях, пр.

На сервисе поддерживается и ряд проектов, рассчитанных исключительно на добровольцев. Так, в 2007 г участники бесплатно обрабатывали сотни снимков Google Maps и Google Earth, пытаясь найти Джима Грея (Jim Gray), пропавшего на своей яхте, в 2010 г. таким же образом поддерживалась операция поиска разбившегося самолета Стива Фоссета (Steve Fossett) в пустыне Невада.

Работать в Mechanical Turk может любой пользователь интернета, достаточно лишь зарегистрироваться в Amazon. Задания HIT меняются ежесекундно, за день их число измеряется десятками тысяч. Правда, ставки за выполнение настолько невелики, что вряд ли этот сервис можно рассматривать как источник дохода, скорее как небольшой заработок и способ занять свободное время, преимущественно для школьников и студентов, ну возможно еще для людей с ограниченными возможностями. Согласно последним статистическим данным, 80% заданий на сервисе оценивается менее $1, например гонорар за ответ на вопрос составит $0,01, выбор фотографии магазина для службы местного поиска составит $0,03, редактирование описания автомобиля – $0,65, а написание скрипта – $5. Нередки совершенно смешные предложения, браться за которые попросту бессмысленно, например $0,15 за обзор цифровой камеры или телефона, $0,1 за блог, пр. Изредка появляются и гонорары побольше, $10-15 за HIT.

Впрочем, относительно высокие расценки потребуют определенной квалификации, для чего перед получением доступа к заданию придется пройти тестирование (тесты формируются самими заказчиками). Поскольку хорошие задания разбирают быстро, есть смысл обратиться на страницу квалификаций и пройти общие тесты, открывающие доступ к HIT, требующим некоторых навыков. Кроме того, нужно учесть, что как и в любом виде деятельности, при наличии редких квалификаций (например знание экзотических языков), можно получать относительно высокооплачиваемые работы.

Каждое задание сопровождается описанием с указанием требуемой квалификации, времени до истечения заказа и расценок. Когда исполнитель берет заказ, позиция становится недоступной для других в течение четко определенного времени – чтобы получить оплату необходимо уложиться в срок. При выполнении заданий рейтинг исполнителя повышается, более того, чрезвычайно важно поддерживать его достаточно высоким – многие привлекательные задания просто недоступны для пользователей с рейтингом менее 95%. После выполнения HIT отправляется проверку, результат которой, как и вообще вся информация об активности, отображается в разделе Dashboard на странице учетной записи.

Главный вопрос любого исполнителя – как выбрать правильные задания. Проблема в том, что полагаться на ключевые слова сложно, зачастую они не имеют ничего общего с видом работы и используются как уловка для привлечения исполнителей. Кроме того, относительно высокооплачиваемые HIT ($3-5) нередко оказываются «кликовым мошенничеством», замаскированным под предложение стать «секретным покупателем» или пройти анкетирование. Пожалуй, лучше всего вести собственный реестр честных компаний и периодически проверять наличие заданий от них, вот только поиск по работодателям сервисом не предусмотрен.

Основной недостаток для исполнителей – мизерные расценки – является весьма привлекательным для работодателей. Собственно, выложить работу на сервисе может любая компания и даже частное лицо, достаточно иметь реальный счет в американском банке и помнить, что за услуги Amazon придется заплатить около 10% комиссионных. После этого необходимо зарегистрироваться на ресурсе Mechanical Turk Requester либо использовать открытый API, с помощью которого можно организовать альтернативные точки входа в систему, проверку выполненных заданий, их принятия или отклонения. Размещая HIT работодатель может запросить определенный уровень квалификации работников или их репутации.

Увеличить

Рис. 1. Список доступных задач исчисляется тысячами, вот только гонорары невелики (увеличение по клику)

Нужно понимать, что не все задания эффективно решать с помощью Mechanical Turk и позаботиться о том, чтобы HIT регулярно обновлялись – принимая во внимание скорость изменения ленты предложений. Практически всегда HIT можно отнести к одной из следующих категорий: маркировки (разметка веб-страниц, добавление описаний к фото, пр.), сбора и верификации данных (выявления дубликатов, информации определенного типа из неструктурированных источников, тестирования алгоритмов проверки данных, пр.), создания и модерирования контента (написание блогов, статей, комментариев, транскрибирование записей, пр.), категоризации элементов (для систематизации продуктовых позиций, анализа сообщений на наличие позитивного или негативного мнения о продукте, пр.), обратной связи с пользователями (оценка качества продукции, релевантности результатов поисковых запросов, тестирование, пр.)

В помощь работодателю на ресурсе Mechanical Turk имеются готовые приложения, способные автоматизировать размещение и повысить качество выполняемых работ. Так, для организации и поиска фотографий можно воспользоваться Tagcow – это решение отбирает исполнителей (в том числе и в соответствии с пожеланиями заказчика о соблюдении конфиденциальности), включает Tagcow API для интеграции задачи создания подписи к картинки в существующий бизнес-процесс, и доставляет изображение с полученным описанием в исходное приложение. Для поддержки задач транскрибирования и редактирования в Mechanical Turk можно обратиться к сервису CastingWords, который к тому же оказывает консалтинговые услуги. Speechpad поддерживает задачи транскрибирования аудиозаписей, в том числе телефонных разговоров, и доступ к ним с мобильных устройств iPhone и iPad. Пакет для веб-издателей SpeakerText использует элементы искусственного интеллекта в сочетании с Mechanical Turk для автоматического создания титров видеороликов, размещаемых в Amazon Web Services (AWS). Houdini API обеспечивает (с помощью нескольких строк кода) интеграцию Mechanical Turk в сторонние приложения – модерирование фото, редактирование текста и пр. услуги можно будет получать не заботясь о размещении HIT, квалификационных заданиях и управлении сотрудниками. Помощь в получении обратной связи от потенциальных пользователей еще на этапе разработки окажет Feedback Army – простой и удобный инструмент для тестирования веб-узлов. Достаточно составить список вопросов и указать нужное число респондентов (10, 25, или 50 посетителей), чтобы получить независимое конечных пользователей о ресурсе, сведения о том, какие части веб-узла приводят их в замешательство или категорически неудобны – исправить подобные недочеты. Причем все это за вполне умеренную плату от $15 за 10 отзывов.

Увеличить

Рис. 2. Типичная задача – опросник после посещения сайта (увеличение по клику)

Впрочем, Amazon Mechanical Turk не лишен недостатков и его главной проблемой, похоже, становится спам, вернее задания от спаммеров, на долю которых, по независимым оценкам, уже приходится порядка 41% HIT. Так, в течение сентября-октября 2010 г. группа студентов университета Нью-Йорка проводила анализ новых заказчиков и размещаемых ими заданий, используя специально разработанные опросники для независимых исполнителей Mechanical Turk. Оказалось, что 40,92% новых заданий – это тестирование рекламы на сайте, создание положительных отзывов на блог, создание учетных записей в социальных сетях, загрузка указанного приложения и т.д., т.е. спам, и 31,83% новых заказчиков размещают исключительно такие HIT. Таким образом, среди работодателей сервиса уже сформировалась группа, из которой исходят все спаммерские задания: они, во-первых, отличаются меньшим количеством HIT в каждом наборе, а во-вторых, оценивают работу дороже обычного.

Впрочем, вряд ли стоит ожидать, что подобные недостатки снизят интерес к краудсорсингу вообще и Mechanical Turk в частности, ведь это весьма эффективный инструмент для продвижения брендов, проведения рекламных компаний, обратной связи с пользователями любых видов продукции и услуг, пр., тем более, что с развитием социальных сетей и мобильной связи эти услуги стали доступными для малого и среднего бизнеса. Помимо реализации конкретных проектов Mechanical Turk позволяет практически даром собирать идеи, впечатления, советы, да и просто незаангажированное мнение потенциальных клиентов, и, следовательно, повысить мобильность бизнеса без значительных материальных и временных затрат.