AddThis Social Bookmark Button
Версия для печати Блоггерам

Музыкальные сервисы в Интернете: опознание музыки

Музыкальные рекомендательные сервисы хороши, когда надо найти что-то новое. Но наш потребитель не всегда «не знает, чего хочет». Часто он знает, но не может вспомнить или помнит только на слух.

Каждый из нас бывал в такой ситуации, когда в голове вертится какая-то мелодия, но название никак не вспоминается. Или услышал песню по радио или просто на улице, а кто поет и как называется – не знаешь. В таких случаях очень кстати бы пришелся сервис по опознанию музыки.

В мире музыкальных интернет-сервисов решение задачи правильно опознать песню очень важно. Во-первых, сколько продаж не происходит из-за того, что люди не могут найти понравившуюся песню, они не знают или забыли, как она называется. Во-вторых, даже если человек не купит опознанную композицию, а скачает где-то бесплатно, он, тем не менее, воспользуется сервисом по опознанию, что можно монетаризовать, например, через рекламу.

Существует несколько техник в опознании песни, применение каждой из них зависит от того, что, собственно, знает человек об искомой композиции.

У каждого трека есть два главных идентификатора – название и исполнитель.

Это как имя и фамилия. В принципе, есть еще название альбома, но альбомы постепенно выходят из моды, да и у какого исполнителя есть две песни с одинаковым названием? Так что комбинации «исполнитель + название» вполне достаточно.

Другое дело, что с комбинацией этой далеко не всегда все ясно. Даже вполне официальные источники порой путаются в правильном написании названий музыкальных групп или их песен. Чего уж говорить об обычных людях.

Простейший случай – человек помнит название песни, но не помнит исполнителя. Или наоборот. В этом случае музыкальный сервис должен иметь доступ к базам данных по исполнителям и их творчеству. Пользователь посмотрит предложенные варианты, послушает их фрагменты в потоковом формате и выберет нужное.

Первый шаг опросника поисковой системы одного из рекорд-лейблов:
Помните ли Вы: 1) Часть имени исполнителя; 2) Часть названия альбома; 3) Часть названия композиции; 4) Музыкальный стиль композиции

Вообще, возможность предпрослушивания очень важна при опознании, поэтому подобные сервисы обязательно должны быть оснащены проигрывателем потокового аудио, по крайней мере, фрагментов композиций, достаточных для опознания.

Другая похожая задача – проверка правильности написания. Как часто мы неверно запоминаем имя исполнителя, название песни, особенно если это неродной язык! А ведь далеко не все сервисы принимают это во внимание, огорчая очередным «По вашему запросу ничего не найдено».

Ряд музыкальных сайтов, однако, организован с пониманием этих сложностей и имеет систему проверки написания, сводящую подобные ошибки минимуму. Естественно, для этого им тоже необходимо иметь обширную базу наименований исполнителей и композиций.

Проверка музыкальной грамотности на сайте myplaylist.biz

Для создания подобной базы точкой опоры пока даже в Интернете остаются музыкальные CD. Ведь подавляющее число аудиозаписей по-прежнему выходит в первую очередь в этом формате. Официальный релиз аудио-CD – мероприятие ответственное, оно должно соответствовать определенным стандартам. Все выпущенные диски каталогизируются, заносятся в классификаторы. Это создает первичную информацию о записи.

В Интернете уже довольно долго существуют онлайн-базы подобных данных. Это, так сказать, первичная информационная основа всей «музыкосферы». В таких базах содержится справочная информация о множестве исполнителей, альбомов, композиций. Их называют CDDB, CD Data Base – базы данных CD. Большинство музыкальных сервисов использует эти первичные данные.

Владелец крупнейшей CDDB (собственно, сама аббревиатура является зарегистрированной торговой маркой этой компании) – американская Gracenote.

Информацией Gracenote пользуются множество программ (Winamp, Windows Media Player, iTunes) и сервисов.

Совсем недавно Gracenote была приобретена компанией Sony. На фоне фиаско музыкального интернет-проекта последней – сервиса Connect – это выглядит интересным контрходом.

Таким образом, если есть договор с хорошей CDDB, то для проверки написания от музыкальных сервисов требуется лишь создание хорошей автокорректирующей системы при введении запроса.

Если сравнивать песню с человеком, то информацию, содержащуюся в базах CDDB, можно сравнить с паспортными данными. Название композиции, альбом, компиляция или сингл, в состав которого она входит, имя исполнителя или название группы – это ее ФИО. Но нужен номер паспорта. Его роль играет уникальный идентификатор CD, с тем отличием, что он относится не к одному треку, а к их группе.

Откуда берется этот идентификатор? Так как создатели стандарта аудио-CD в свое время никак не могли планировать существования треков с CD вне самого CD, то они не предусмотрели на диске никакой идентификационной информации. Таким образом, компакт-диск по умолчанию – человек без паспорта. Его самого надо опознать.

Если продолжить аналогию с человеком, то сделать это можно по его приметам. Для CD это будет сочетание числа треков и их продолжительности. Вместе они дают достаточно уникальную картину. Так и работают CDDB – в их базах хранятся уникальные идентификаторы CD, рассчитанные на основании данных о числе, последовательности и продолжительности треков – «фоторобот» диска. Программа-клиент на ПК пользователя создает такой «фоторобот» для диска, подлежащего идентификации, соединяется через Интернет с базой и ищет в ней совпадающий по приметам диск. Подобным образом могут опознаваться как физические CD-диски, так и их сжатые в MP3 и другие форматы копии, главное, чтобы сохранилась уникальная структура.

В идеале у музыки должны быть «устанавливающие личность документы» или «особые приметы». Для композиций на носителе – CD – это уникальные параметры диска, позволяющие восстановить все данные по базам CDDB. Для оцифрованной музыки это метаданные, теги.

В реальности же все не так просто. Что делать, если трек лишен каких-либо примет? Таких ситуаций может быть немало: запись с радио, безвестный файл, выкачанный из Интернета, запись с диктофона, оцифрованная аналоговая запись.

В случае с человеком на помощь приходят отпечатки пальцев. Это работает и для песен.

Акустические отпечатки пальцев – это выжимка из цифрового аудиофайла, минимальный объем информации, по которой его можно достоверно установить. Обычно это небольшой массив данных, до 10 КБ. Принципиально, что отпечатки, содержат чисто музыкальные характеристики – ритм, окраску звучания, информацию о мелодии – и не зависят от конкретного файла, с которого получены.

Далее все делается очень похоже на технологии CDDB: программа-клиент через Интернет сверяет «скармливаемую» ей композицию с базой данных таких отпечатков. Если обнаруживается совпадение, значит, файл опознан.

В настоящее время в Интернете доступно несколько таких баз данных отпечатков.

Gracenote MusicID

Главная CDDB – Gracenote – также владеет собственной технологией акустических отпечатков пальцев, называемой MusicID. Чаще всего с ней встречаются в популярном программном плеере Winamp, который может обратиться к базе отпечатков Gracenote по запросу пользователя. Другой клиент компании – производитель мобильных телефонов Sony Ericsson, что неудивительно. В базе Gracenote содержатся акустические отпечатки более 7 миллионов композиций.

AudioID Fraunhofer

Изобретатели MP3 также разработали и свою технологию акустических отпечатков пальцев. В 2004 году они создали отдельную компанию для раскрутки этой технологии, в 2007 году для этого предприятия было выбрано название Mufin (сокращенно MUsic FINd). Пока эта технология все еще менее заметна на рынке, чем продукты главных конкурентов, Gracenote и Shazam.

Last.fm Fingerprinter

Компания с такими амбициями на рынке музыкальных услуг, как Last.fm, не может зависеть от сторонних провайдеров данных, в том числе акустических отпечатков пальцев. Поэтому Last.fm разрабатывает свою технологию, используя внушительное комьюнити как источник данных и рабочую силу. Пока технология находится в бета-версии, но компания заявляет, что ее база уже содержит свыше 10 миллионов отпечатков.

Shazam

Эта английская компания предоставляет сервис опознавания музыки для сотовых телефонов. Она владеет собственной технологией акустических отпечатков пальцев, в ее базе данных информация по более чем 4 миллионам композиций. Еще с 2002 года Shazam предлагает жителям Великобритании оригинальную услугу – позвонив по определенному номеру и поднеся трубку к источнику звука, вы немедленно получаете SMS с именем исполнителя и названием композиции, если, конечно, ее удалось распознать. Компания старается расширить свою деятельность, создав поисковую систему музыки. Кроме того, она использует данные, полученные при опознании множества песен для создания своеобразного чарта – какую музыку пользователи хотели распознать чаще всего. В настоящее время сервис Shazam доступен в 45 странах у 50 операторов для более чем 500 миллионов используемых в мире мобильных телефонов.

MusicDNS

Сравнительно недавно, в январе 2007 года, американская компания MusicIP представила свою систему опознания музыки, названную MusicDNS. Базируется она в том числе и на технологии акустических отпечатков пальцев. По заявлениям компании, в настоящее время в ее базе содержатся отпечатки не менее 26 миллионов композиций.

Помимо рекомендательных сервисов, акустические отпечатки пальцев используются и в других сферах. К примеру, для защиты интеллектуальной собственности. По отпечаткам сервис может, к примеру, определить, относится ли композиция к числу лицензированных. Это применяется на сервисах с возможностью загрузки аудиофайлов пользователем.

Порой, причем нередко, «тело» песни находится в столь печальном состоянии, что никакое снятие отпечатков пальцев невозможно. Композиция осталась лишь в памяти человека в виде обрывков мелодии, слов. Но это не значит, что ее совершенно невозможно опознать.

Сервисы, способные опознавать песни по обрывкам мотива, уже существуют, хоть и в крайне сыром состоянии. Мелодия может вводиться пользователем через некий музыкальный интерфейс, например, наэкранную клавиатуру пианино. Конечно, это потребует некой музыкальной подготовки от пользователя. Или это может быть анализ аудиоданных, к примеру, напетых в микрофон, которым сегодня оборудованы очень многие ПК. Чудес от таких систем пока ждать не следует, но эти системы распознания музыки, аналогично системам распознания речи, прогрессируют.

Изобретатель MP3 Fraunhofer также работает над системой распознавания музыки по устному вводу

Сервис midomi.com предлагает опознание музыки по устному вводу

Другая, пожалуй, более надежная система поиска, – по словам песни. Тема слов песни, Lyrics, сама по себе очень обширна. В контексте данного материала достаточно упомянуть, что в Интернете существуют базы данных слов песен, оснащенные поиском по отдельным фразам. Это хорошее подспорье в опознании композиции, особенно при качественном алгоритме поиска и, опять, системе автокоррекции ошибок.

Пример поиска по словам песни

С человеком, когда все методы опознания оказываются бессильны, прибегают к анализу ДНК. И тут нам сразу вспоминается Pandora с ее Music Genome Project. Возможно ли использовать накопленную там информацию или общий подход этой компании при опознании? Вовсе не исключено. Как анализ ДНК делается с использованием генного материала родственников, так и музыкальную композицию можно попытаться опознать по ее «родственникам» в музыкальном отношении. Ведь часто, пытаясь вспомнить ту или иную песню, мы ощущаем, что она похожа на что-то, что мы уже слышали ранее.

В идеале хотелось бы иметь возможность при «генетической экспертизе» задавать сложные запросы: «Вокал, как в такой-то песне, гитарный риф, как в такой-то, проигрыш напоминает то-то, есть еще такие-то и такие-то элементы – что это может быть?»

В итоге мы можем алгоритмизировать процесс опознания музыки и разбить его на степени сложности.

  • 1-ая степень – известно имя песни и/или автор, но неточно. Здесь вполне может помочь система автокоррекции ошибок, поиск по базам CDDB по названию - чтобы найти исполнителя или наоборот.
  • 2-ая – нет информации о песне, но есть аудиоматериал. Это запись с радио, диктофона, оцифровка аналога. Здесь на помощь придет опознание по акустическим отпечаткам пальцев.
  • 3-я степень – есть лишь отрывочный образ музыки в памяти человека - мотив, слова. Здесь подойдут различные программы опознания музыки, поиск по словам песен.
  • Наконец, 4-ая, высшая сложность – образ песни в памяти настолько смутен, что вспоминается лишь, на что она примерно похожа. Здесь можно попытаться провести «генетическую экспертизу».

Таким образом, к настоящему времени в Интернете накопилось уже достаточное количество данных и механизмов, которые можно использовать для создания мощной системы опознания музыки. Такой системы, которая помогала бы в ситуациях типа «песня крутится в голове, но никак не вспомнить какая». Дело за малым: создать подобную единую систему, придать ей удобный пользовательский интерфейс. Будучи реализованной, она стала бы мощным элементом 360-градусной музыкальной стратегии в Интернете.

Алексей Дорожин ([email protected])
Опубликовано - 01 июля 2008 г.

Есть, что добавить?! Пишите... [email protected]

 
Новости:

13.05.2021 MediaTek представила предфлагманский чипсет Dimensity 900 5G

13.05.2021 Cайты, имеющие 500 тысяч пользователей из России, должны будут открыть местные филиалы

13.05.2021 Amazon представила обновления своих умных дисплеев Echo Show 8 и Echo Show 5

13.05.2021 МТС ввел удобный тариф без абонентской платы - «МТС Нон-стоп»

13.05.2021 Zenfone 8 Flip – вариант Galaxy A80 от ASUS

13.05.2021 Поставки мониторов в этом году достигнут 150 млн

13.05.2021 Состоялся анонс модной версии «умных» часов Samsung Galaxy Watch3 TOUS

13.05.2021 Tele2 выходит на Яндекс.Маркет

13.05.2021 OPPO представила чехол для смартфона, позволяющий управлять устройствами умного дома

13.05.2021 TWS-наушники с активным шумоподавлением Xiaomi FlipBuds Pro

13.05.2021 В России до конца следующего года появится госстандарт для искусственного интеллекта

13.05.2021 ASUS Zenfone 8 – компактный флагман на Snapdragon 888

12.05.2021 Компания Genesis представила внешность своего первого универсала G70 Shooting Brake

12.05.2021 В России разработан высокоточный гироскоп для беспилотников

12.05.2021 В Россию привезли новую версию смарт-часов HUAWEI WATCH FIT, Elegant Edition

12.05.2021 Раскрыты ключевые особенности смартфона POCO M3 Pro 5G

12.05.2021 Honor 50: стали известны дизайн и другие подробности о смартфоне

12.05.2021 Чипсет Exynos 2200 от Samsung будет устанавливаться и в смартфоны, и в ноутбуки

12.05.2021 МТС начала подключать многоквартирные дома к интернету вещей

12.05.2021 iPhone 13 будет толще и получит более крупные камеры по сравнению с iPhone 12

12.05.2021 Xiaomi договорилась с властями США об исключении из чёрного списка

12.05.2021 Xiaomi выпустила обновлённую версию умного пульта Agara Cube T1 Pro

Hit

12.05.2021 Игровые ноутбуки с NVIDIA GeForce RTX 3050 Ti уже в России!

12.05.2021 Индийский завод Foxconn сократил производство в два раза

12.05.2021 Lenovo отказалась от очного участия в предстоящем в июне Mobile World Congress

Подписка
 
© Mobile-review.com, 2002-2021. All rights reserved.