podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2
AddThis Social Bookmark Button
Версия для печати Блоггерам

Музыкальные сервисы в Интернете: опознание музыки

Музыкальные рекомендательные сервисы хороши, когда надо найти что-то новое. Но наш потребитель не всегда «не знает, чего хочет». Часто он знает, но не может вспомнить или помнит только на слух.

Каждый из нас бывал в такой ситуации, когда в голове вертится какая-то мелодия, но название никак не вспоминается. Или услышал песню по радио или просто на улице, а кто поет и как называется – не знаешь. В таких случаях очень кстати бы пришелся сервис по опознанию музыки.

В мире музыкальных интернет-сервисов решение задачи правильно опознать песню очень важно. Во-первых, сколько продаж не происходит из-за того, что люди не могут найти понравившуюся песню, они не знают или забыли, как она называется. Во-вторых, даже если человек не купит опознанную композицию, а скачает где-то бесплатно, он, тем не менее, воспользуется сервисом по опознанию, что можно монетаризовать, например, через рекламу.

Существует несколько техник в опознании песни, применение каждой из них зависит от того, что, собственно, знает человек об искомой композиции.

У каждого трека есть два главных идентификатора – название и исполнитель.

Это как имя и фамилия. В принципе, есть еще название альбома, но альбомы постепенно выходят из моды, да и у какого исполнителя есть две песни с одинаковым названием? Так что комбинации «исполнитель + название» вполне достаточно.

Другое дело, что с комбинацией этой далеко не всегда все ясно. Даже вполне официальные источники порой путаются в правильном написании названий музыкальных групп или их песен. Чего уж говорить об обычных людях.

Простейший случай – человек помнит название песни, но не помнит исполнителя. Или наоборот. В этом случае музыкальный сервис должен иметь доступ к базам данных по исполнителям и их творчеству. Пользователь посмотрит предложенные варианты, послушает их фрагменты в потоковом формате и выберет нужное.

Первый шаг опросника поисковой системы одного из рекорд-лейблов:
Помните ли Вы: 1) Часть имени исполнителя; 2) Часть названия альбома; 3) Часть названия композиции; 4) Музыкальный стиль композиции

Вообще, возможность предпрослушивания очень важна при опознании, поэтому подобные сервисы обязательно должны быть оснащены проигрывателем потокового аудио, по крайней мере, фрагментов композиций, достаточных для опознания.

Другая похожая задача – проверка правильности написания. Как часто мы неверно запоминаем имя исполнителя, название песни, особенно если это неродной язык! А ведь далеко не все сервисы принимают это во внимание, огорчая очередным «По вашему запросу ничего не найдено».

Ряд музыкальных сайтов, однако, организован с пониманием этих сложностей и имеет систему проверки написания, сводящую подобные ошибки минимуму. Естественно, для этого им тоже необходимо иметь обширную базу наименований исполнителей и композиций.

Проверка музыкальной грамотности на сайте myplaylist.biz

Для создания подобной базы точкой опоры пока даже в Интернете остаются музыкальные CD. Ведь подавляющее число аудиозаписей по-прежнему выходит в первую очередь в этом формате. Официальный релиз аудио-CD – мероприятие ответственное, оно должно соответствовать определенным стандартам. Все выпущенные диски каталогизируются, заносятся в классификаторы. Это создает первичную информацию о записи.

В Интернете уже довольно долго существуют онлайн-базы подобных данных. Это, так сказать, первичная информационная основа всей «музыкосферы». В таких базах содержится справочная информация о множестве исполнителей, альбомов, композиций. Их называют CDDB, CD Data Base – базы данных CD. Большинство музыкальных сервисов использует эти первичные данные.

Владелец крупнейшей CDDB (собственно, сама аббревиатура является зарегистрированной торговой маркой этой компании) – американская Gracenote.

Информацией Gracenote пользуются множество программ (Winamp, Windows Media Player, iTunes) и сервисов.

Совсем недавно Gracenote была приобретена компанией Sony. На фоне фиаско музыкального интернет-проекта последней – сервиса Connect – это выглядит интересным контрходом.

Таким образом, если есть договор с хорошей CDDB, то для проверки написания от музыкальных сервисов требуется лишь создание хорошей автокорректирующей системы при введении запроса.

Если сравнивать песню с человеком, то информацию, содержащуюся в базах CDDB, можно сравнить с паспортными данными. Название композиции, альбом, компиляция или сингл, в состав которого она входит, имя исполнителя или название группы – это ее ФИО. Но нужен номер паспорта. Его роль играет уникальный идентификатор CD, с тем отличием, что он относится не к одному треку, а к их группе.

Откуда берется этот идентификатор? Так как создатели стандарта аудио-CD в свое время никак не могли планировать существования треков с CD вне самого CD, то они не предусмотрели на диске никакой идентификационной информации. Таким образом, компакт-диск по умолчанию – человек без паспорта. Его самого надо опознать.

Если продолжить аналогию с человеком, то сделать это можно по его приметам. Для CD это будет сочетание числа треков и их продолжительности. Вместе они дают достаточно уникальную картину. Так и работают CDDB – в их базах хранятся уникальные идентификаторы CD, рассчитанные на основании данных о числе, последовательности и продолжительности треков – «фоторобот» диска. Программа-клиент на ПК пользователя создает такой «фоторобот» для диска, подлежащего идентификации, соединяется через Интернет с базой и ищет в ней совпадающий по приметам диск. Подобным образом могут опознаваться как физические CD-диски, так и их сжатые в MP3 и другие форматы копии, главное, чтобы сохранилась уникальная структура.

В идеале у музыки должны быть «устанавливающие личность документы» или «особые приметы». Для композиций на носителе – CD – это уникальные параметры диска, позволяющие восстановить все данные по базам CDDB. Для оцифрованной музыки это метаданные, теги.

В реальности же все не так просто. Что делать, если трек лишен каких-либо примет? Таких ситуаций может быть немало: запись с радио, безвестный файл, выкачанный из Интернета, запись с диктофона, оцифрованная аналоговая запись.

В случае с человеком на помощь приходят отпечатки пальцев. Это работает и для песен.

Акустические отпечатки пальцев – это выжимка из цифрового аудиофайла, минимальный объем информации, по которой его можно достоверно установить. Обычно это небольшой массив данных, до 10 КБ. Принципиально, что отпечатки, содержат чисто музыкальные характеристики – ритм, окраску звучания, информацию о мелодии – и не зависят от конкретного файла, с которого получены.

Далее все делается очень похоже на технологии CDDB: программа-клиент через Интернет сверяет «скармливаемую» ей композицию с базой данных таких отпечатков. Если обнаруживается совпадение, значит, файл опознан.

В настоящее время в Интернете доступно несколько таких баз данных отпечатков.

Gracenote MusicID

Главная CDDB – Gracenote – также владеет собственной технологией акустических отпечатков пальцев, называемой MusicID. Чаще всего с ней встречаются в популярном программном плеере Winamp, который может обратиться к базе отпечатков Gracenote по запросу пользователя. Другой клиент компании – производитель мобильных телефонов Sony Ericsson, что неудивительно. В базе Gracenote содержатся акустические отпечатки более 7 миллионов композиций.

AudioID Fraunhofer

Изобретатели MP3 также разработали и свою технологию акустических отпечатков пальцев. В 2004 году они создали отдельную компанию для раскрутки этой технологии, в 2007 году для этого предприятия было выбрано название Mufin (сокращенно MUsic FINd). Пока эта технология все еще менее заметна на рынке, чем продукты главных конкурентов, Gracenote и Shazam.

Last.fm Fingerprinter

Компания с такими амбициями на рынке музыкальных услуг, как Last.fm, не может зависеть от сторонних провайдеров данных, в том числе акустических отпечатков пальцев. Поэтому Last.fm разрабатывает свою технологию, используя внушительное комьюнити как источник данных и рабочую силу. Пока технология находится в бета-версии, но компания заявляет, что ее база уже содержит свыше 10 миллионов отпечатков.

Shazam

Эта английская компания предоставляет сервис опознавания музыки для сотовых телефонов. Она владеет собственной технологией акустических отпечатков пальцев, в ее базе данных информация по более чем 4 миллионам композиций. Еще с 2002 года Shazam предлагает жителям Великобритании оригинальную услугу – позвонив по определенному номеру и поднеся трубку к источнику звука, вы немедленно получаете SMS с именем исполнителя и названием композиции, если, конечно, ее удалось распознать. Компания старается расширить свою деятельность, создав поисковую систему музыки. Кроме того, она использует данные, полученные при опознании множества песен для создания своеобразного чарта – какую музыку пользователи хотели распознать чаще всего. В настоящее время сервис Shazam доступен в 45 странах у 50 операторов для более чем 500 миллионов используемых в мире мобильных телефонов.

MusicDNS

Сравнительно недавно, в январе 2007 года, американская компания MusicIP представила свою систему опознания музыки, названную MusicDNS. Базируется она в том числе и на технологии акустических отпечатков пальцев. По заявлениям компании, в настоящее время в ее базе содержатся отпечатки не менее 26 миллионов композиций.

Помимо рекомендательных сервисов, акустические отпечатки пальцев используются и в других сферах. К примеру, для защиты интеллектуальной собственности. По отпечаткам сервис может, к примеру, определить, относится ли композиция к числу лицензированных. Это применяется на сервисах с возможностью загрузки аудиофайлов пользователем.

Порой, причем нередко, «тело» песни находится в столь печальном состоянии, что никакое снятие отпечатков пальцев невозможно. Композиция осталась лишь в памяти человека в виде обрывков мелодии, слов. Но это не значит, что ее совершенно невозможно опознать.

Сервисы, способные опознавать песни по обрывкам мотива, уже существуют, хоть и в крайне сыром состоянии. Мелодия может вводиться пользователем через некий музыкальный интерфейс, например, наэкранную клавиатуру пианино. Конечно, это потребует некой музыкальной подготовки от пользователя. Или это может быть анализ аудиоданных, к примеру, напетых в микрофон, которым сегодня оборудованы очень многие ПК. Чудес от таких систем пока ждать не следует, но эти системы распознания музыки, аналогично системам распознания речи, прогрессируют.

Изобретатель MP3 Fraunhofer также работает над системой распознавания музыки по устному вводу

Сервис midomi.com предлагает опознание музыки по устному вводу

Другая, пожалуй, более надежная система поиска, – по словам песни. Тема слов песни, Lyrics, сама по себе очень обширна. В контексте данного материала достаточно упомянуть, что в Интернете существуют базы данных слов песен, оснащенные поиском по отдельным фразам. Это хорошее подспорье в опознании композиции, особенно при качественном алгоритме поиска и, опять, системе автокоррекции ошибок.

Пример поиска по словам песни

С человеком, когда все методы опознания оказываются бессильны, прибегают к анализу ДНК. И тут нам сразу вспоминается Pandora с ее Music Genome Project. Возможно ли использовать накопленную там информацию или общий подход этой компании при опознании? Вовсе не исключено. Как анализ ДНК делается с использованием генного материала родственников, так и музыкальную композицию можно попытаться опознать по ее «родственникам» в музыкальном отношении. Ведь часто, пытаясь вспомнить ту или иную песню, мы ощущаем, что она похожа на что-то, что мы уже слышали ранее.

В идеале хотелось бы иметь возможность при «генетической экспертизе» задавать сложные запросы: «Вокал, как в такой-то песне, гитарный риф, как в такой-то, проигрыш напоминает то-то, есть еще такие-то и такие-то элементы – что это может быть?»

В итоге мы можем алгоритмизировать процесс опознания музыки и разбить его на степени сложности.

  • 1-ая степень – известно имя песни и/или автор, но неточно. Здесь вполне может помочь система автокоррекции ошибок, поиск по базам CDDB по названию - чтобы найти исполнителя или наоборот.
  • 2-ая – нет информации о песне, но есть аудиоматериал. Это запись с радио, диктофона, оцифровка аналога. Здесь на помощь придет опознание по акустическим отпечаткам пальцев.
  • 3-я степень – есть лишь отрывочный образ музыки в памяти человека - мотив, слова. Здесь подойдут различные программы опознания музыки, поиск по словам песен.
  • Наконец, 4-ая, высшая сложность – образ песни в памяти настолько смутен, что вспоминается лишь, на что она примерно похожа. Здесь можно попытаться провести «генетическую экспертизу».

Таким образом, к настоящему времени в Интернете накопилось уже достаточное количество данных и механизмов, которые можно использовать для создания мощной системы опознания музыки. Такой системы, которая помогала бы в ситуациях типа «песня крутится в голове, но никак не вспомнить какая». Дело за малым: создать подобную единую систему, придать ей удобный пользовательский интерфейс. Будучи реализованной, она стала бы мощным элементом 360-градусной музыкальной стратегии в Интернете.

Алексей Дорожин (adoro@list.ru)
Опубликовано - 01 июля 2008 г.

Есть, что добавить?! Пишите... eldar@mobile-review.com

 
Новости:

29.03.2017 Samsung официально представила свои новые флагманские модели смартфонов – Galaxy S8 и S8+

29.03.2017 ZTE Nubia Z17 Mini получит сдвоенную камеру и будет показан 6 апреля

29.03.2017 LG V30 получит две двойных камеры?

29.03.2017 Micromax представил Dual 5 со сдвоенной основной камерой

29.03.2017 Tele2 обнуляет трафик в Viber

29.03.2017 В России стартуют продажи смартфона TP-Link Neffos X1

29.03.2017 Xiaomi начинает бороться с серыми поставками в России

29.03.2017 Яндекс.Маркет и Почта России запускают совместный проект

29.03.2017 Huawei представила для России флагмана линейки Honor – 8 Pro

28.03.2017 Вредоносные приложения в Google Play маскируются под Minecraft

28.03.2017 Очки дополненной реальности от Apple появятся через год или позже

28.03.2017 Vodafone рассекретил европейские цены на Samsung Galaxy S8

28.03.2017 Задержки поставок Google Pixel при покупке через Google Play превысили месяц

28.03.2017 Microsoft не покажет Surface Book 2 этой весной

28.03.2017 Oppo R11 получит двойную основную камеру

28.03.2017 LG подала иск о нарушении патентных прав в отношении североамериканского производителя смартфонов BLU

28.03.2017 Энди Рубин подразнил мобильный мир, показав часть будущего смартфона от своей новой компании

28.03.2017 Samsung представила новую технологию для «кинотеатров будущего»

28.03.2017 МТС продала свой узбекский бизнес за символический доллар

28.03.2017 Samsung планирует выпустить в продажу восстановленные Galaxy Note 7

Hit

28.03.2017 Посиделки по вторникам №163. Лень и автокоррекция

Hit

27.03.2017 Видео на канале: Обзор OnePlus 3T

Hit

27.03.2017 Видео на канале: Обзор смартфона Google Pixel XL

27.03.2017 Panasonic представил новые модели смартфонов с собственным виртуальным помощником Arbo

27.03.2017 TSMC проводит переоснащение для производства чипсетов Apple A11

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.