Новые модели:
Huawei Mate 30 Pro
Huawei Mate 30
iPhone 11
iPhone 11 Pro
iPhone 11 Pro Max
Samsung Galaxy Note10+
Samsung Galaxy Note10
Honor 8S
BQ 2818 ART XL+
BQ 1846 One Power
Xiaomi Mi A3
Huawei P smart Z
Huawei Y5 (2019)
Huawei P30 lite
Samsung Galaxy A80 (2019)
Новые обзоры:
Samsung Galaxy S10 Lite
Samsung A51
Panasonic TOUGHBOOK P-01K
HTC Wildfire E1 и E1 Plus
Redmi Note 8T
Vivo V17
Samsung A20s 2019
Oppo A9 2020
BQ Magic S
Philips S397
|
Версия
для печати
Разновидности медиатеговПредыдущий материал мы посвятили изучению метаданных как незаметного, но важного инструмента современной медиаархитектуры. Мы поговорили о базовых принципах этих метаданных или тегов: структурированность, поддержка разных типов данных. Какие же разновидности верных этой парадигме тегов распространены в мире? Сегодня три типа компрессированных цифровых аудиофайлов можно причислить к лидерам: это, конечно же, MP3, а также AAC, используемый компанией Apple, и WMA, протеже Microsoft. И каждый из них имеет собственную систему тегов. Интернет-аудиофилы и поклонники Open-source имеют своих любимцев: формат Monkey Audio, сокращенно APE, и форматы OGG и FLAC, разработанные Xiph.org. И Monkey Audio, и форматы Xiph.org также могут похвастаться своей системой тегов. Наконец, один из самых малораспространенных сегодня в потребительской электронике форматов, ATRAC, принадлежит компании Sony и также имеет теговую систему. В итоге получаем шесть более-менее известных публике типов метаданных. Поговорим о них поподробнее. ID3 tag![]() MP3-файлы продолжают занимать первое место по распространенности среди сжатых аудиоформатов, причем с солидным отрывом, несмотря на более чем преклонный возраст. Самые первые теги появились именно здесь. Их название – ID3-теги – стало настолько популярным, что часто употребляется для обозначения тегов вообще, вне зависимости от того, идет ли речь об MP3, WMA, AAC или любом другом файле. А появилось оно от аббревиатуры: Identification Data for Studio3 (идентификационные данные для Studio3). Studio3 была программой Эрика Кемпа, автора первого тега. Долгая жизнь ID3-тегов обусловила то, что к настоящему времени они уже успели сменить изрядное число версий. Наиболее важным был переход от первой версии v1 ко второй v2. ID3 v1 Самый первый тег для аудиофайлов появился в 1996 году и был очень скромен по своим возможностям. ![]()
Во-первых, доступный для тега объем информации был ограничен 128 байтами (именно байтами!).
Для жанров создатель ID3 v1 подготовил список из 80 позиций, присвоив каждому из них порядковый номер от 0 до 79, который и заносился в один-единственный жанровый байт. Список этот, естественно, устроил не всех, критики замечали, что он несбалансирован, содержит много экзотических и маргинальных жанров, а некоторые распространенные классические жанры оказались обойдены. Но что можно было ожидать от одного человека с несколькими товарищами, не могли же они быть музыкальной энциклопедией? Число категорий позже выросло до семи за счет хитро добавленной позиции «номер трека в альбоме», такой обновленный тег получил название ID3 v1.1. В-третьих, рамки категорий были жесткими, заданными раз и навсегда. Если у вас осталось свободное место в графе «название песни» (что случалось часто), то использовать его для того, чтобы ввести имя исполнителя длиннее 30 символов, было нельзя. Оставшееся место просто заполнялось нулями. В-четвертых, тег размещался в конце файла. Это было сделано для того, чтобы программы-проигрыватели того времени не сходили с ума при попытке открыть такой файл. Чем это было плохо? Плохо это было при потоковой скачке файла – чтобы получить полную информацию о композиции, приходилось сначала скачать ее целиком. В-пятых, для текстовой информации по умолчанию использовалась кодировка ISO-8859-1. Если в теге использовалась, к примеру, кириллическая кодировка ISO-8859-5, то никакой возможности сообщить об этом программе-проигрывателю не было – место под это в теге не предусмотрено. Это делало невозможным создание универсальных проигрывателей с автоматическим распознанием кодировки, для каждой не англоязычной страны было необходимо создавать свою версию. В случае MP3-плееров этим утруждали себя далеко не все, в результате пользователям приходилось любоваться на «кракозябры». Отсюда популярный среди покупателей плееров вопрос: «Поддерживает ли он русские теги?» (т.е. теги в кириллической ISO-8859-5 кодировке). Рамки первой версии ID3 MP3-файлам стали тесны довольно быстро. Пользователи желали видеть намного более полную информацию о своей музыке, тридцати символов на название, исполнителя и альбом хватало не всегда, не говоря уж об остальных недостатках. Расширением возможностей ID3 v1 позже стал Lyrics3 – дополнительный тег для слов песен. Он шел перед самим ID3-тегом. Этот тег был позже расширен до версии 2, которая, помимо собственно слов песни, могла включать информацию о композиции (исполнитель, альбом, название), причем без ограничений в 30 символов. Слова песни было возможно синхронизировать с аудио, присваивая им временные метки. ![]()
Все это, впрочем, было полумерами, развитие Интернета диктовало необходимость в совершенно новом формате. Через два года, в 1998, на свет появился ID3 v2. ID3 v2 В новой версии было исправлено большинство недостатков. Тег «переехал» в начало файла. Каждая категория получила свой заголовок, благодаря которому их размеры теперь могли меняться, приспосабливаясь под реальный объем информации. В заголовок вошел и бит кодировки для борьбы с кракозябрами. Кроме кодировки ISO-8859 стала доступна и Unicode. Объем, доступный для каждой категории, вырос до 16 мегабайт, общий объем тега ограничен 256 мегабайтами. Для удобства программ сам тег получил заголовок, сообщающий много информации о нем (ну прямо тег для тега): ориентировочное количество категорий и их объемы, использованную кодировку, тип и разрешение графических файлов и многое другое. ![]()
Список категорий разросся до гигантских размеров (для экономии места не будем перечислять чисто служебные):
Как видим, создатели ID3 v2 постарались предусмотреть все категории, которые только могут понадобиться при идентификации композиции. Жаль, что подавляющая часть из них обычно так и остается незаполненной, а то теги вполне могли бы заменить собой среднюю музыкальную энциклопедию. И все же, при всех достоинствах ID3 v2 теги имеют один минус. Их структура фиксирована, количество категорий не подлежит изменению. А ведь пользователь или издатель может захотеть добавить в файл информацию, не предусмотренную даже богатой фантазией разработчиков. В данном случае им придется выкручиваться и импровизировать в рамках дозволенного. Хотя v2 и поддерживает Unicode, проблемы кракозябр не ушли в прошлое – по старой памяти теги сплошь и рядом продолжают вносить в ISO-8859. По крайней мере, современные плееры могут увидеть, какая кодировка использовалась, по заголовку тега. Недостатком ID3-тегов в целом является изобилие версий: v1 (две версии), v2 (четыре версии), Lyrics3. Производителям приходится заботиться о поддержке всех этих версий, и не все и не всегда с этим справляются. ID3 v2 стал большим шагом вперед для аудиотегов. За два года он пережил четыре модификации до версии 2.4 и вот уже семь лет существует без серьезных изменений. Теги новых цифровых файлов – WMA, AAC и пр. – создавались уже не без оглядки на опыт ID3. WM metadata![]() Microsoft начала продвижение своего конкурента MP3 – Windows Media Audio, WMA – в 2000 году. Существенным отличием было то, что формат с самого начала позиционировался для интернет-музыки. Поэтому одновременно с разработкой формата были разработаны и теги для него. Они не имеют четкого наименования, иногда ошибочно называются ID3-тегами, иногда WMA-тегами. Так как WMA – только часть стандарта Windows Media, имеет смысл пользоваться общим термином WM metadata. В силу более поздних сроков разработки WMA-файлы имеют несколько более хитрое строение, нежели MP3. Здесь используется контейнерная структура, при которой файл с потоком аудиоданных «запаковывается» в оболочку-контейнер. Для Windows Media контейнером должен был служить ASF-файл. Но широкого распространения расширение ASF так и не получило, для аудиофайлов контейнеру обычно присваивают все то же расширение WMA. Метаданные включены в состав этого контейнера. ![]()
Структура собственно метаданных напоминает ID3 v2: тег располагается в начале файла, разделен на категории, каждая из которых имеет заголовок и может варьировать свой объем. Список категорий покороче, чем у ID3 v2:
Сравнивая категории WM metadata с категориями ID3 v2, можно сразу понять, какой из тегов появился «снизу», а какой – «сверху». В WM metadata меньше информации, описывающей потребительские качества композиции, но есть вещи наподобие возрастного рейтинга, информации о провайдере и т.п. Т.к. WM metadata используется и для видеофайлов, этот тег создавался так, чтобы использоваться и для аудио, и для видео. Кое-что из категорий только для видео, наподобие «Продюсер», «Идентификатор DVD», мы приводить не стали (хотя теоретически эти категории могут использоваться для аудио). В WM metadata используется исключительно Unicode-кодировка, позволяющая нейтрализовать столь частую для тегов проблему кракозябр. Это можно причислить к преимуществам данного тега, хотя в силу меньшей распространенности WMA-файлов многие MP3-плееры, особенно старые модели, не способны их прочесть. В целом сходства с ID3 v2 очень много. Оба тега имеют жесткую, раз и навсегда прописанную структуру. Списки категорий имеют много совпадений. Это неудивительно: зачем Microsoft было выдумывать велосипед, когда в свободном доступе существовала уже хорошо обкатанная система тегов? iTunes tag![]() Хотя формат AAC имеет определенные технологические преимущества перед MP3, он едва ли получил бы сколь-либо серьезное распространение, не будь компании Apple. Она фактически «приватизировала» его для нужд своих iTunes Store, iTunes и iPod. Переход экосистемы Apple на AAC состоялся в 2003 году, т.е. у компании была возможность учесть достижения и промахи и ID3, и WM metadata. В итоге использованная ей технология получила много общих черт с форматом Microsoft. Впрочем, едва ли здесь можно говорить о заимствовании: программисты Apple уже имели богатый опыт работы с мультимедиа-форматами. Как и в случае с WMA, используется контейнер, для iTunes-медиафайлов это MP4 (или MPEG-4 Part 14). Он уходит корнями в старые разработки Apple, в QuickTime MOV. Различные типы MP4-медиа используют следующее семейство расширений:
Вместе с контейнерами под iTunes были разработаны и теги. Они не являются частью стандарта AAC, а были созданы отдельно, в этом у них имеется определенное сходство с ID3. ![]()
Apple не публикует спецификаций своих метаданных, и информация по ним довольно скудна. Известно, что они являются частью структуры MP4-контейнеров, основанной на иерархии так называемых «атомов». Грубо говоря, атомы в рамках MP4 представляют собой, как это следует из их названия, составные части-кирпичики файла. Каждый атом (на этот раз вопреки названию) может включать в себя группы других атомов. Теги iTunes также являются атомами, вместе они составляют группу метаданных, входящую в атомы калибром побольше. В число категорий-атомов iTunes тегов входит:
Спецификой iTunes-тегов является наличие семейства ID-категорий (не путать с ID3), содержащих информацию об их владельце. Их наличие неоднократно подвергалось критике части онлайн-общественности, в то же время другая часть утверждает, что если пользователь не будет нелегально распространять свои треки, то бояться ему нечего. ![]()
iTunes-теги используют Unicode-кодировку, следовательно, MP4-контейнеры тоже не подвержены кракозябрам. Разнообразие категорий в iTunes-тегах меньше, чем в ID3 и WM metadata. Имеется набор служебных тегов, связанных с коммерческой составляющей iTunes, аналогично WMA. В отличие от Microsoft, слегка забросившей в последнее время свое Windows Media направление, Apple регулярно дополняет свои теги, отражая расширение возможностей своих плееров и ПО. Из последних добавок – тег Gapless, появившийся в конце 2006 года. Если Apple все же откроет бизнес по продаже рингтонов для iPhone, следует ожидать новых модификаций iTunes tag. Xiph Comments![]() Популярные среди «продвинутой» публики форматы OGG и FLAC имеют свою систему тегов. Называется она по наименованию разработчика, некоммерческой организации Xiph.org. Отличительная особенность этой системы – отсутствие фиксированной структуры. Если в ID3, WM, iTunes все доступные категории раз и навсегда прописаны «сверху», то здесь пользователь может создавать любые свои категории, такого типа, какого захочет, с названиями по своему вкусу. В этом выразился «народный» open-source-характер Xiph-форматов. Для пользователей и разработчиков, не желающих создавать архитектуру тегов самостоятельно, существует рекомендованный список категорий:
Список короткий и нарочито законопослушный, т.к. Xiph заинтересованы в том, чтобы их форматы использовали и «серьезные» организаторы. Конечно, простые пользователи при желании могут его игнорировать, но большинство плееров, поддерживающих OGG и FLAC, ориентируются именно на эту структуру. Как и другие форматы тегов нового поколения, в Xiph comments используется Unicode-кодировка для текста. APE tag![]() Проект Monkey Audio и формат APE имеет много общего с Xiph – тоже «народный», ориентированный на «продвинутое» сообщество, симпатизирующее идеям open-source. Так же и теги, используемые в этом формате, схожи по архитектуре с Xiph comments. Тут мы снова видим гибкую структуру, без фиксированных категорий, открытую для модификации пользователем. Любопытной особенностью APE-тегов является возможность нахождения в одной категории нескольких значений (например, нескольких исполнителей и т.п.). В настоящее время в основном используется вторая версия APE tag. Как и в Xiph comments, Monkey Audio предлагает список категорий по умолчанию:
Список гораздо обширнее. Обращает на себя внимание ряд оригинальных категорий, таких, как библиография/дискография, и адаптированность тегов под аудиокниги. Несложно догадаться, что APE comments тоже используют Unicode-кодировку и тем самым защищены от кракозябр. OMA tag![]() Формат ATRAC в своей идеологии – абсолютная противоположность Xiph и Monkey Audio. Полная проприетарность в противовес open-source. Изначальная расположенность к DRM против полного отсутствия таковой. Эти форматы стоят на двух полюсах, неудивительно, что ни один из них не является самым популярным. Закрытость ATRAC отпугивает потребителя, открытость Xiph и Monkey Audio – производителя. Хотя сам по себе кодек ATRAC относится с самым древним алгоритмам сжатия аудио с потерями, современной функциональностью, в т.ч. метаданными, он «оброс» только на рубеже 1999-2000 гг. Sony применило уже известную нам контейнерную технологию. Аудиопоток ATRAC заключается в проприетарный OMA-контейнер: OMA – Open Magic Audio – обычный Контейнер OMA и содержит теги. Описывать их нет никакого смысла, это хорошо нам уже знакомые ID3v2 теги. Да, именно так, Sony просто-напросто встроила этот открытый стандарт метаданных в свой закрытый формат. Некоторые отличия все же есть – категории, в ID3v2 предназначенные для хранения текстовой информации, используются в нем для данных, относящихся к DRM OpenMG. Так, открытый, народный, созданный «низами» формат метаданных был поставлен на службу закрытой технологии, предназначенной исключительно для того, чтобы ограничить свободу этого самого народа в отношении своего контента. Помимо ATRAC в OMA-контейнер могут быть заключены также MP3-, WMA- или AAC-аудиопотоки. Собственно, именно это происходит при копировании аудио в подобных форматах на плееры Sony Network Walkman с помощью ПО SonicStage. Теги в них, соответственно, меняются на OMA (читай – ID3v2) теги, причем не всегда это происходит гладко, иногда метаданные теряются, искажаются. Эта особенность, как и многое другое в инфраструктуре SonicStage, вызывает серьезные претензии у пользователей. Стоит отметить, что в реальной жизни не редкость использование тегов одного типа с файлами другого. Большинство программных проигрывателей натаскано на поиск идентификаторов тегов в файлах и без труда прочтут «чужеродные» метаданные, к примеру, APE tag в MP3-файле или ID3 v2 в M4A. Технически подкованные пользователи часто создают подобных «мутантов», комбинируя любимый тип тега с любимым форматом сжатия. MP3-плееры, однако, будут введены в замешательство таким поворотом событий и в большинстве случаев «неправильный» тег не прочтут. Алексей Дорожин (adoro@list.ru) Есть, что добавить?! Пишите... eldar@mobile-review.com |
Новости:![]() 26.02.2021 Видео на канале: Знакомимся с Samsung Galaxy A32 2021 ![]() 26.02.2021 Видео на канале: МНЕНИЕ | SSD накопитель SAMSUNG 870 evo 26.02.2021 Nubia раскрыла дизайн смартфона Nubia Red Magic 6 26.02.2021 Глобальные версии смартфонов Vivo X60 и X60 Pro получат чипсет Snapdragon 870 вместо Exynos 26.02.2021 Убыток онлайн-сервиса аренды жилья Airbnb в четвёртом квартале составил $3.9 млрд 26.02.2021 Стали известны мартовские игры для подписчиков PS Plus 26.02.2021 Оборонные предприятия по всему миру были атакованы хакерской группой Lazarus 26.02.2021 Стали известны дизайн, характеристики и цена планшета Xiaomi Mi Pad 5 26.02.2021 Spotify стал популярнее Apple Music в России 26.02.2021 Huawei не будет производить электромобили 26.02.2021 Xiaomi представила новые ноутбуки RedmiBook Pro 26.02.2021 Компании Dell за предновогодний квартал удалось увеличить выручку на 9% 26.02.2021 «Ростех» создал комплекс для противодействия беспилотникам 26.02.2021 Почти 100% смартфонов и телевизоров, которые Xiaomi продаёт в Индии, сделаны на местном рынке 26.02.2021 МТС и Xiaomi объявили о проекте по созданию сети кобрендинговых магазинов под брендом Xiaomi 26.02.2021 В Яндекс.Музыке появились видеошоты к трекам 26.02.2021 Leica выпустила лимитированную камеру Leica Q2 Daniel Craig x Greg Williams 25.02.2021 TWS-наушники Redmi AirDots 3 будут стоить всего 30$ 25.02.2021 Анонсирован 120 Гц телевизор Redmi MAX TV 86" 25.02.2021 Samsung начала продажи в России смартфона Galaxy A32 25.02.2021 Представлены смартфоны Redmi K40 Pro и K40 Pro+ 25.02.2021 Redmi K40 представлен официально 25.02.2021 HUAWEI представила проект умного дома 25.02.2021 HP собирается расширить своё игровое направление за счёт приобретения бренда HyperX Подписка |