Что это за песня звучит?

4 июнь, 2002 - 23:00Александр Москалюк
Вопрос, вынесенный в заголовок статьи, в ближайшем будущем может перестать волновать пользователей мобильной связи в Великобритании. Небольшая лондонская компания Shazam Entertainment разработала технологию распознавания музыкальных композиций.
Музыка окружает нас постоянно -- дома, на работе, в транспорте, в магазинах мы слушаем композиции самых разных стилей и направлений. И безусловно, каждому знакомо чувство, когда какая-то мелодия упорно крутится в голове, а ни названия, ни ее исполнителя никак не можешь вспомнить.

Сложно сказать, такое ли важное место это занимает в нашей жизни, однако Крис Бартон (Chris Barton) посчитал, что сервис по распознаванию музыкальных композиций можно превратить в успешный бизнес. Крис переехал из Штатов в Туманный Альбион, где в 2000 г. с первоначальным уставным фондом в 7,5 млн. долл. и была основана Shazam Entertainment. Главный продукт компании -- программное обеспечение, которое распознает мотив музыкальной композиции и предоставляет клиенту информацию об исполнителе и альбоме, где эта песня встречается.

Эвери Ванг (Avery Wang), руководитель научных разработок Shazam Entertainment, является автором программного пакета, создающего при "прослушивании" музыки уникальный набор байтов, своеобразный "цифровой отпечаток" для каждой композиции. Затем о наличии такого отпечатка запрашивается база данных, размещенная на серверах Shazam, и если последовательность нотных знаков совпадает, клиенту высылается информация об интересующей его песне.

Разумеется, при таком раскладе качество распознавания напрямую зависит от количества песен, содержащихся в базе данных. По словам Бартона, на сегодняшний день Shazam располагает 300 тыс. композиций, что дает компании возможность говорить о наличии в БД информации о большинстве популярных сегодня мелодий. Во многих даже крупных музыкальных супермаркетах меломаны могут найти не более 30--40 тыс. песен.

Вопрос, который Бартону приходится слышать чуть ли не каждый день, -- работает ли алгоритм распознавания, и если работает, то насколько надежно? Ведь поставлять свой сервис Shazam Entertainment собирается через сети мобильной связи, где идентификация усложнена, поскольку качество звука невысокое, а источник песни во время звонка пользователя может находиться на расстоянии. Бартон утверждает, что он лично участвовал в демонстрации сервиса, когда глава одной музыкальной студии решил проверить надежность базы данных Shazam, в результате чего были опробованы все компакт-диски, которые руководитель этой звукозаписывающей компании смог найти в своем офисе. И так 15 раз подряд. База данных тест выдержала.

К августу этого года Бартон надеется получить в свое распоряжение "цифровые отпечатки" 1,6 млн. композиций. В компании есть сотрудники, основной задачей которых является сканирование информации со всех новых альбомов, появляющихся в продаже, ведь, как правило, пользователи хотят получить информацию именно о них.

Почему сети мобильной связи? Во-первых, когда потенциальный клиент Shazam Entertainment идет по улице и хочет узнать, какая песня в этот момент доносится из соседнего ресторана, то наверняка единственным устройством, к которому этот клиент имеет доступ, является мобильный телефон. Во-вторых, британские, да и не только британские, сотовые компании в последнее время активно занимаются увеличением ассортимента платных услуг, а после выплат огромных сумм за лицензии на использование 3G-диапазона необходимость внедрения мобильных сервисов нового поколения для привлечения пользователей, привыкших к GSM, все возрастает. В-третьих, способ оплаты мобильной связи является для Shazam наиболее удобным с точки зрения доходов -- при заключении договора с оператором компания просто получает свой "куш" с каждого звонка.

Минимальная продолжительность телефонного разговора составляет 15 секунд -- именно столько времени отводится на "прослушивание" композиции алгоритмом, прежде чем в базу данных будет отправлен цифровой отпечаток. После получения информации пользователи также могут отправить 30-секундные ролики с понравившейся им песней своим друзьям. Здесь Shazam уже не получает комиссионных за звонок, однако в этом случае мобильный оператор может попытаться получить прибыль от музыкальных компаний, которые в сотовой связи видят один из каналов продвижения своей продукции.

Компания Бартона планирует запуск пилотного проекта к концу лета этого года. Заинтересованность в подобном предприятии музыкальных гигантов подтверждается и тем, что в числе инвесторов Shazam Entertainment можно найти Колина Саутгейта (Colin Southgate), экс-председателя правления крупнейшей звукозаписывающей студии EMI, а в числе других инвесторов на сайте перечисляются экс-председатель правления Bertelsmann Music Group, CTO компании Sony Music, бывший CTO British Telecom, a также руководитель британского отделения Amazon.