podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2
AddThis Social Bookmark Button
Версия для печати Блоггерам

Музыкальные сервисы в Интернете: опознание музыки

Музыкальные рекомендательные сервисы хороши, когда надо найти что-то новое. Но наш потребитель не всегда «не знает, чего хочет». Часто он знает, но не может вспомнить или помнит только на слух.

Каждый из нас бывал в такой ситуации, когда в голове вертится какая-то мелодия, но название никак не вспоминается. Или услышал песню по радио или просто на улице, а кто поет и как называется – не знаешь. В таких случаях очень кстати бы пришелся сервис по опознанию музыки.

В мире музыкальных интернет-сервисов решение задачи правильно опознать песню очень важно. Во-первых, сколько продаж не происходит из-за того, что люди не могут найти понравившуюся песню, они не знают или забыли, как она называется. Во-вторых, даже если человек не купит опознанную композицию, а скачает где-то бесплатно, он, тем не менее, воспользуется сервисом по опознанию, что можно монетаризовать, например, через рекламу.

Существует несколько техник в опознании песни, применение каждой из них зависит от того, что, собственно, знает человек об искомой композиции.

У каждого трека есть два главных идентификатора – название и исполнитель.

Это как имя и фамилия. В принципе, есть еще название альбома, но альбомы постепенно выходят из моды, да и у какого исполнителя есть две песни с одинаковым названием? Так что комбинации «исполнитель + название» вполне достаточно.

Другое дело, что с комбинацией этой далеко не всегда все ясно. Даже вполне официальные источники порой путаются в правильном написании названий музыкальных групп или их песен. Чего уж говорить об обычных людях.

Простейший случай – человек помнит название песни, но не помнит исполнителя. Или наоборот. В этом случае музыкальный сервис должен иметь доступ к базам данных по исполнителям и их творчеству. Пользователь посмотрит предложенные варианты, послушает их фрагменты в потоковом формате и выберет нужное.

Первый шаг опросника поисковой системы одного из рекорд-лейблов:
Помните ли Вы: 1) Часть имени исполнителя; 2) Часть названия альбома; 3) Часть названия композиции; 4) Музыкальный стиль композиции

Вообще, возможность предпрослушивания очень важна при опознании, поэтому подобные сервисы обязательно должны быть оснащены проигрывателем потокового аудио, по крайней мере, фрагментов композиций, достаточных для опознания.

Другая похожая задача – проверка правильности написания. Как часто мы неверно запоминаем имя исполнителя, название песни, особенно если это неродной язык! А ведь далеко не все сервисы принимают это во внимание, огорчая очередным «По вашему запросу ничего не найдено».

Ряд музыкальных сайтов, однако, организован с пониманием этих сложностей и имеет систему проверки написания, сводящую подобные ошибки минимуму. Естественно, для этого им тоже необходимо иметь обширную базу наименований исполнителей и композиций.

Проверка музыкальной грамотности на сайте myplaylist.biz

Для создания подобной базы точкой опоры пока даже в Интернете остаются музыкальные CD. Ведь подавляющее число аудиозаписей по-прежнему выходит в первую очередь в этом формате. Официальный релиз аудио-CD – мероприятие ответственное, оно должно соответствовать определенным стандартам. Все выпущенные диски каталогизируются, заносятся в классификаторы. Это создает первичную информацию о записи.

В Интернете уже довольно долго существуют онлайн-базы подобных данных. Это, так сказать, первичная информационная основа всей «музыкосферы». В таких базах содержится справочная информация о множестве исполнителей, альбомов, композиций. Их называют CDDB, CD Data Base – базы данных CD. Большинство музыкальных сервисов использует эти первичные данные.

Владелец крупнейшей CDDB (собственно, сама аббревиатура является зарегистрированной торговой маркой этой компании) – американская Gracenote.

Информацией Gracenote пользуются множество программ (Winamp, Windows Media Player, iTunes) и сервисов.

Совсем недавно Gracenote была приобретена компанией Sony. На фоне фиаско музыкального интернет-проекта последней – сервиса Connect – это выглядит интересным контрходом.

Таким образом, если есть договор с хорошей CDDB, то для проверки написания от музыкальных сервисов требуется лишь создание хорошей автокорректирующей системы при введении запроса.

Если сравнивать песню с человеком, то информацию, содержащуюся в базах CDDB, можно сравнить с паспортными данными. Название композиции, альбом, компиляция или сингл, в состав которого она входит, имя исполнителя или название группы – это ее ФИО. Но нужен номер паспорта. Его роль играет уникальный идентификатор CD, с тем отличием, что он относится не к одному треку, а к их группе.

Откуда берется этот идентификатор? Так как создатели стандарта аудио-CD в свое время никак не могли планировать существования треков с CD вне самого CD, то они не предусмотрели на диске никакой идентификационной информации. Таким образом, компакт-диск по умолчанию – человек без паспорта. Его самого надо опознать.

Если продолжить аналогию с человеком, то сделать это можно по его приметам. Для CD это будет сочетание числа треков и их продолжительности. Вместе они дают достаточно уникальную картину. Так и работают CDDB – в их базах хранятся уникальные идентификаторы CD, рассчитанные на основании данных о числе, последовательности и продолжительности треков – «фоторобот» диска. Программа-клиент на ПК пользователя создает такой «фоторобот» для диска, подлежащего идентификации, соединяется через Интернет с базой и ищет в ней совпадающий по приметам диск. Подобным образом могут опознаваться как физические CD-диски, так и их сжатые в MP3 и другие форматы копии, главное, чтобы сохранилась уникальная структура.

В идеале у музыки должны быть «устанавливающие личность документы» или «особые приметы». Для композиций на носителе – CD – это уникальные параметры диска, позволяющие восстановить все данные по базам CDDB. Для оцифрованной музыки это метаданные, теги.

В реальности же все не так просто. Что делать, если трек лишен каких-либо примет? Таких ситуаций может быть немало: запись с радио, безвестный файл, выкачанный из Интернета, запись с диктофона, оцифрованная аналоговая запись.

В случае с человеком на помощь приходят отпечатки пальцев. Это работает и для песен.

Акустические отпечатки пальцев – это выжимка из цифрового аудиофайла, минимальный объем информации, по которой его можно достоверно установить. Обычно это небольшой массив данных, до 10 КБ. Принципиально, что отпечатки, содержат чисто музыкальные характеристики – ритм, окраску звучания, информацию о мелодии – и не зависят от конкретного файла, с которого получены.

Далее все делается очень похоже на технологии CDDB: программа-клиент через Интернет сверяет «скармливаемую» ей композицию с базой данных таких отпечатков. Если обнаруживается совпадение, значит, файл опознан.

В настоящее время в Интернете доступно несколько таких баз данных отпечатков.

Gracenote MusicID

Главная CDDB – Gracenote – также владеет собственной технологией акустических отпечатков пальцев, называемой MusicID. Чаще всего с ней встречаются в популярном программном плеере Winamp, который может обратиться к базе отпечатков Gracenote по запросу пользователя. Другой клиент компании – производитель мобильных телефонов Sony Ericsson, что неудивительно. В базе Gracenote содержатся акустические отпечатки более 7 миллионов композиций.

AudioID Fraunhofer

Изобретатели MP3 также разработали и свою технологию акустических отпечатков пальцев. В 2004 году они создали отдельную компанию для раскрутки этой технологии, в 2007 году для этого предприятия было выбрано название Mufin (сокращенно MUsic FINd). Пока эта технология все еще менее заметна на рынке, чем продукты главных конкурентов, Gracenote и Shazam.

Last.fm Fingerprinter

Компания с такими амбициями на рынке музыкальных услуг, как Last.fm, не может зависеть от сторонних провайдеров данных, в том числе акустических отпечатков пальцев. Поэтому Last.fm разрабатывает свою технологию, используя внушительное комьюнити как источник данных и рабочую силу. Пока технология находится в бета-версии, но компания заявляет, что ее база уже содержит свыше 10 миллионов отпечатков.

Shazam

Эта английская компания предоставляет сервис опознавания музыки для сотовых телефонов. Она владеет собственной технологией акустических отпечатков пальцев, в ее базе данных информация по более чем 4 миллионам композиций. Еще с 2002 года Shazam предлагает жителям Великобритании оригинальную услугу – позвонив по определенному номеру и поднеся трубку к источнику звука, вы немедленно получаете SMS с именем исполнителя и названием композиции, если, конечно, ее удалось распознать. Компания старается расширить свою деятельность, создав поисковую систему музыки. Кроме того, она использует данные, полученные при опознании множества песен для создания своеобразного чарта – какую музыку пользователи хотели распознать чаще всего. В настоящее время сервис Shazam доступен в 45 странах у 50 операторов для более чем 500 миллионов используемых в мире мобильных телефонов.

MusicDNS

Сравнительно недавно, в январе 2007 года, американская компания MusicIP представила свою систему опознания музыки, названную MusicDNS. Базируется она в том числе и на технологии акустических отпечатков пальцев. По заявлениям компании, в настоящее время в ее базе содержатся отпечатки не менее 26 миллионов композиций.

Помимо рекомендательных сервисов, акустические отпечатки пальцев используются и в других сферах. К примеру, для защиты интеллектуальной собственности. По отпечаткам сервис может, к примеру, определить, относится ли композиция к числу лицензированных. Это применяется на сервисах с возможностью загрузки аудиофайлов пользователем.

Порой, причем нередко, «тело» песни находится в столь печальном состоянии, что никакое снятие отпечатков пальцев невозможно. Композиция осталась лишь в памяти человека в виде обрывков мелодии, слов. Но это не значит, что ее совершенно невозможно опознать.

Сервисы, способные опознавать песни по обрывкам мотива, уже существуют, хоть и в крайне сыром состоянии. Мелодия может вводиться пользователем через некий музыкальный интерфейс, например, наэкранную клавиатуру пианино. Конечно, это потребует некой музыкальной подготовки от пользователя. Или это может быть анализ аудиоданных, к примеру, напетых в микрофон, которым сегодня оборудованы очень многие ПК. Чудес от таких систем пока ждать не следует, но эти системы распознания музыки, аналогично системам распознания речи, прогрессируют.

Изобретатель MP3 Fraunhofer также работает над системой распознавания музыки по устному вводу

Сервис midomi.com предлагает опознание музыки по устному вводу

Другая, пожалуй, более надежная система поиска, – по словам песни. Тема слов песни, Lyrics, сама по себе очень обширна. В контексте данного материала достаточно упомянуть, что в Интернете существуют базы данных слов песен, оснащенные поиском по отдельным фразам. Это хорошее подспорье в опознании композиции, особенно при качественном алгоритме поиска и, опять, системе автокоррекции ошибок.

Пример поиска по словам песни

С человеком, когда все методы опознания оказываются бессильны, прибегают к анализу ДНК. И тут нам сразу вспоминается Pandora с ее Music Genome Project. Возможно ли использовать накопленную там информацию или общий подход этой компании при опознании? Вовсе не исключено. Как анализ ДНК делается с использованием генного материала родственников, так и музыкальную композицию можно попытаться опознать по ее «родственникам» в музыкальном отношении. Ведь часто, пытаясь вспомнить ту или иную песню, мы ощущаем, что она похожа на что-то, что мы уже слышали ранее.

В идеале хотелось бы иметь возможность при «генетической экспертизе» задавать сложные запросы: «Вокал, как в такой-то песне, гитарный риф, как в такой-то, проигрыш напоминает то-то, есть еще такие-то и такие-то элементы – что это может быть?»

В итоге мы можем алгоритмизировать процесс опознания музыки и разбить его на степени сложности.

  • 1-ая степень – известно имя песни и/или автор, но неточно. Здесь вполне может помочь система автокоррекции ошибок, поиск по базам CDDB по названию - чтобы найти исполнителя или наоборот.
  • 2-ая – нет информации о песне, но есть аудиоматериал. Это запись с радио, диктофона, оцифровка аналога. Здесь на помощь придет опознание по акустическим отпечаткам пальцев.
  • 3-я степень – есть лишь отрывочный образ музыки в памяти человека - мотив, слова. Здесь подойдут различные программы опознания музыки, поиск по словам песен.
  • Наконец, 4-ая, высшая сложность – образ песни в памяти настолько смутен, что вспоминается лишь, на что она примерно похожа. Здесь можно попытаться провести «генетическую экспертизу».

Таким образом, к настоящему времени в Интернете накопилось уже достаточное количество данных и механизмов, которые можно использовать для создания мощной системы опознания музыки. Такой системы, которая помогала бы в ситуациях типа «песня крутится в голове, но никак не вспомнить какая». Дело за малым: создать подобную единую систему, придать ей удобный пользовательский интерфейс. Будучи реализованной, она стала бы мощным элементом 360-градусной музыкальной стратегии в Интернете.

Алексей Дорожин (adoro@list.ru)
Опубликовано - 01 июля 2008 г.

Есть, что добавить?! Пишите... eldar@mobile-review.com

 
Новости:
Hit

25.05.2017 Видео на канале: Обзор Micromax BOLT warrior 1 plus

25.05.2017 Mail.Ru выпустила мессенджер TamTam

25.05.2017 «Билайн» предлагает смартфоны Билайн по спеццене

25.05.2017 Представлен 6,44-дюймовый фаблет Xiaomi Mi Max 2

Hit

25.05.2017 Видео на канале: Знакомство с Xiaomi Mi Mix 18K

Hit

25.05.2017 Видео на канале: Обзор Nokia 3310 (2017)

25.05.2017 Tele2 снижает стоимость корпоративных тарифов в Москве

25.05.2017 ESET: мошенники раздают на WhatsApp годовую подписку на Netflix

25.05.2017 Panasonic анонсировал тонкие полузащищенные бизнес-ноутбуки Toughbook CF-54mk3

24.05.2017 Sony объявила о старте продаж своего нового 6-дюймового смартфона Xperia XA1 Ultra

24.05.2017 В Госдуму внесен законопроект о регулировании работы мессенджеров

Hit

24.05.2017 Видео на канале: Обзор Asus ZenFone 3 Max

Hit

24.05.2017 Видео на канале: Пример работы Android Pay в России

Hit

24.05.2017 Видео на канале: Комментарий Андрея Кормильцева по поводу Android Pay и HTC U11

24.05.2017 Apple и Nokia урегулировали свои споры

24.05.2017 Власти Москвы отказались от акции проезда в метро за один рубль для пользователей Android Pay

24.05.2017 Google начала продавать «умные» доски для работы со своими сервисами

24.05.2017 Huawei представила новые модели ноутбуков серии MateBook

Hit

23.05.2017 Видео на канале: Знакомство с HTC U 11

Hit

23.05.2017 Видео на канале: Обзор Archos Diamond 2 Plus

23.05.2017 МТС представила финансовые и операционные результаты Группы за первый квартал 2017 года

23.05.2017 Российские ученые разработают первый электрокар на солнечных батареях

23.05.2017 «Мегафон» предложил абонентам три варианта компенсации за сбой

23.05.2017 В России появится система контроля за беспилотниками

Hit

23.05.2017 Видео на канале: Сравнение Samsung Galaxy S8 и S8 Plus

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.