Новые модели:
Huawei Mate 30 Pro
Huawei Mate 30
iPhone 11
iPhone 11 Pro
iPhone 11 Pro Max
Samsung Galaxy Note10+
Samsung Galaxy Note10
Honor 8S
BQ 2818 ART XL+
BQ 1846 One Power
Xiaomi Mi A3
Huawei P smart Z
Huawei Y5 (2019)
Huawei P30 lite
Samsung Galaxy A80 (2019)
Новые обзоры:
Samsung Galaxy S10 Lite
Samsung A51
Panasonic TOUGHBOOK P-01K
HTC Wildfire E1 и E1 Plus
Redmi Note 8T
Vivo V17
Samsung A20s 2019
Oppo A9 2020
BQ Magic S
Philips S397
|
Версия
для печати
Разновидности медиатеговПредыдущий материал мы посвятили изучению метаданных как незаметного, но важного инструмента современной медиаархитектуры. Мы поговорили о базовых принципах этих метаданных или тегов: структурированность, поддержка разных типов данных. Какие же разновидности верных этой парадигме тегов распространены в мире? Сегодня три типа компрессированных цифровых аудиофайлов можно причислить к лидерам: это, конечно же, MP3, а также AAC, используемый компанией Apple, и WMA, протеже Microsoft. И каждый из них имеет собственную систему тегов. Интернет-аудиофилы и поклонники Open-source имеют своих любимцев: формат Monkey Audio, сокращенно APE, и форматы OGG и FLAC, разработанные Xiph.org. И Monkey Audio, и форматы Xiph.org также могут похвастаться своей системой тегов. Наконец, один из самых малораспространенных сегодня в потребительской электронике форматов, ATRAC, принадлежит компании Sony и также имеет теговую систему. В итоге получаем шесть более-менее известных публике типов метаданных. Поговорим о них поподробнее. ID3 tag![]() MP3-файлы продолжают занимать первое место по распространенности среди сжатых аудиоформатов, причем с солидным отрывом, несмотря на более чем преклонный возраст. Самые первые теги появились именно здесь. Их название – ID3-теги – стало настолько популярным, что часто употребляется для обозначения тегов вообще, вне зависимости от того, идет ли речь об MP3, WMA, AAC или любом другом файле. А появилось оно от аббревиатуры: Identification Data for Studio3 (идентификационные данные для Studio3). Studio3 была программой Эрика Кемпа, автора первого тега. Долгая жизнь ID3-тегов обусловила то, что к настоящему времени они уже успели сменить изрядное число версий. Наиболее важным был переход от первой версии v1 ко второй v2. ID3 v1 Самый первый тег для аудиофайлов появился в 1996 году и был очень скромен по своим возможностям. ![]()
Во-первых, доступный для тега объем информации был ограничен 128 байтами (именно байтами!).
Для жанров создатель ID3 v1 подготовил список из 80 позиций, присвоив каждому из них порядковый номер от 0 до 79, который и заносился в один-единственный жанровый байт. Список этот, естественно, устроил не всех, критики замечали, что он несбалансирован, содержит много экзотических и маргинальных жанров, а некоторые распространенные классические жанры оказались обойдены. Но что можно было ожидать от одного человека с несколькими товарищами, не могли же они быть музыкальной энциклопедией? Число категорий позже выросло до семи за счет хитро добавленной позиции «номер трека в альбоме», такой обновленный тег получил название ID3 v1.1. В-третьих, рамки категорий были жесткими, заданными раз и навсегда. Если у вас осталось свободное место в графе «название песни» (что случалось часто), то использовать его для того, чтобы ввести имя исполнителя длиннее 30 символов, было нельзя. Оставшееся место просто заполнялось нулями. В-четвертых, тег размещался в конце файла. Это было сделано для того, чтобы программы-проигрыватели того времени не сходили с ума при попытке открыть такой файл. Чем это было плохо? Плохо это было при потоковой скачке файла – чтобы получить полную информацию о композиции, приходилось сначала скачать ее целиком. В-пятых, для текстовой информации по умолчанию использовалась кодировка ISO-8859-1. Если в теге использовалась, к примеру, кириллическая кодировка ISO-8859-5, то никакой возможности сообщить об этом программе-проигрывателю не было – место под это в теге не предусмотрено. Это делало невозможным создание универсальных проигрывателей с автоматическим распознанием кодировки, для каждой не англоязычной страны было необходимо создавать свою версию. В случае MP3-плееров этим утруждали себя далеко не все, в результате пользователям приходилось любоваться на «кракозябры». Отсюда популярный среди покупателей плееров вопрос: «Поддерживает ли он русские теги?» (т.е. теги в кириллической ISO-8859-5 кодировке). Рамки первой версии ID3 MP3-файлам стали тесны довольно быстро. Пользователи желали видеть намного более полную информацию о своей музыке, тридцати символов на название, исполнителя и альбом хватало не всегда, не говоря уж об остальных недостатках. Расширением возможностей ID3 v1 позже стал Lyrics3 – дополнительный тег для слов песен. Он шел перед самим ID3-тегом. Этот тег был позже расширен до версии 2, которая, помимо собственно слов песни, могла включать информацию о композиции (исполнитель, альбом, название), причем без ограничений в 30 символов. Слова песни было возможно синхронизировать с аудио, присваивая им временные метки. ![]()
Все это, впрочем, было полумерами, развитие Интернета диктовало необходимость в совершенно новом формате. Через два года, в 1998, на свет появился ID3 v2. ID3 v2 В новой версии было исправлено большинство недостатков. Тег «переехал» в начало файла. Каждая категория получила свой заголовок, благодаря которому их размеры теперь могли меняться, приспосабливаясь под реальный объем информации. В заголовок вошел и бит кодировки для борьбы с кракозябрами. Кроме кодировки ISO-8859 стала доступна и Unicode. Объем, доступный для каждой категории, вырос до 16 мегабайт, общий объем тега ограничен 256 мегабайтами. Для удобства программ сам тег получил заголовок, сообщающий много информации о нем (ну прямо тег для тега): ориентировочное количество категорий и их объемы, использованную кодировку, тип и разрешение графических файлов и многое другое. ![]()
Список категорий разросся до гигантских размеров (для экономии места не будем перечислять чисто служебные):
Как видим, создатели ID3 v2 постарались предусмотреть все категории, которые только могут понадобиться при идентификации композиции. Жаль, что подавляющая часть из них обычно так и остается незаполненной, а то теги вполне могли бы заменить собой среднюю музыкальную энциклопедию. И все же, при всех достоинствах ID3 v2 теги имеют один минус. Их структура фиксирована, количество категорий не подлежит изменению. А ведь пользователь или издатель может захотеть добавить в файл информацию, не предусмотренную даже богатой фантазией разработчиков. В данном случае им придется выкручиваться и импровизировать в рамках дозволенного. Хотя v2 и поддерживает Unicode, проблемы кракозябр не ушли в прошлое – по старой памяти теги сплошь и рядом продолжают вносить в ISO-8859. По крайней мере, современные плееры могут увидеть, какая кодировка использовалась, по заголовку тега. Недостатком ID3-тегов в целом является изобилие версий: v1 (две версии), v2 (четыре версии), Lyrics3. Производителям приходится заботиться о поддержке всех этих версий, и не все и не всегда с этим справляются. ID3 v2 стал большим шагом вперед для аудиотегов. За два года он пережил четыре модификации до версии 2.4 и вот уже семь лет существует без серьезных изменений. Теги новых цифровых файлов – WMA, AAC и пр. – создавались уже не без оглядки на опыт ID3. WM metadata![]() Microsoft начала продвижение своего конкурента MP3 – Windows Media Audio, WMA – в 2000 году. Существенным отличием было то, что формат с самого начала позиционировался для интернет-музыки. Поэтому одновременно с разработкой формата были разработаны и теги для него. Они не имеют четкого наименования, иногда ошибочно называются ID3-тегами, иногда WMA-тегами. Так как WMA – только часть стандарта Windows Media, имеет смысл пользоваться общим термином WM metadata. В силу более поздних сроков разработки WMA-файлы имеют несколько более хитрое строение, нежели MP3. Здесь используется контейнерная структура, при которой файл с потоком аудиоданных «запаковывается» в оболочку-контейнер. Для Windows Media контейнером должен был служить ASF-файл. Но широкого распространения расширение ASF так и не получило, для аудиофайлов контейнеру обычно присваивают все то же расширение WMA. Метаданные включены в состав этого контейнера. ![]()
Структура собственно метаданных напоминает ID3 v2: тег располагается в начале файла, разделен на категории, каждая из которых имеет заголовок и может варьировать свой объем. Список категорий покороче, чем у ID3 v2:
Сравнивая категории WM metadata с категориями ID3 v2, можно сразу понять, какой из тегов появился «снизу», а какой – «сверху». В WM metadata меньше информации, описывающей потребительские качества композиции, но есть вещи наподобие возрастного рейтинга, информации о провайдере и т.п. Т.к. WM metadata используется и для видеофайлов, этот тег создавался так, чтобы использоваться и для аудио, и для видео. Кое-что из категорий только для видео, наподобие «Продюсер», «Идентификатор DVD», мы приводить не стали (хотя теоретически эти категории могут использоваться для аудио). В WM metadata используется исключительно Unicode-кодировка, позволяющая нейтрализовать столь частую для тегов проблему кракозябр. Это можно причислить к преимуществам данного тега, хотя в силу меньшей распространенности WMA-файлов многие MP3-плееры, особенно старые модели, не способны их прочесть. В целом сходства с ID3 v2 очень много. Оба тега имеют жесткую, раз и навсегда прописанную структуру. Списки категорий имеют много совпадений. Это неудивительно: зачем Microsoft было выдумывать велосипед, когда в свободном доступе существовала уже хорошо обкатанная система тегов? iTunes tag![]() Хотя формат AAC имеет определенные технологические преимущества перед MP3, он едва ли получил бы сколь-либо серьезное распространение, не будь компании Apple. Она фактически «приватизировала» его для нужд своих iTunes Store, iTunes и iPod. Переход экосистемы Apple на AAC состоялся в 2003 году, т.е. у компании была возможность учесть достижения и промахи и ID3, и WM metadata. В итоге использованная ей технология получила много общих черт с форматом Microsoft. Впрочем, едва ли здесь можно говорить о заимствовании: программисты Apple уже имели богатый опыт работы с мультимедиа-форматами. Как и в случае с WMA, используется контейнер, для iTunes-медиафайлов это MP4 (или MPEG-4 Part 14). Он уходит корнями в старые разработки Apple, в QuickTime MOV. Различные типы MP4-медиа используют следующее семейство расширений:
Вместе с контейнерами под iTunes были разработаны и теги. Они не являются частью стандарта AAC, а были созданы отдельно, в этом у них имеется определенное сходство с ID3. ![]()
Apple не публикует спецификаций своих метаданных, и информация по ним довольно скудна. Известно, что они являются частью структуры MP4-контейнеров, основанной на иерархии так называемых «атомов». Грубо говоря, атомы в рамках MP4 представляют собой, как это следует из их названия, составные части-кирпичики файла. Каждый атом (на этот раз вопреки названию) может включать в себя группы других атомов. Теги iTunes также являются атомами, вместе они составляют группу метаданных, входящую в атомы калибром побольше. В число категорий-атомов iTunes тегов входит:
Спецификой iTunes-тегов является наличие семейства ID-категорий (не путать с ID3), содержащих информацию об их владельце. Их наличие неоднократно подвергалось критике части онлайн-общественности, в то же время другая часть утверждает, что если пользователь не будет нелегально распространять свои треки, то бояться ему нечего. ![]()
iTunes-теги используют Unicode-кодировку, следовательно, MP4-контейнеры тоже не подвержены кракозябрам. Разнообразие категорий в iTunes-тегах меньше, чем в ID3 и WM metadata. Имеется набор служебных тегов, связанных с коммерческой составляющей iTunes, аналогично WMA. В отличие от Microsoft, слегка забросившей в последнее время свое Windows Media направление, Apple регулярно дополняет свои теги, отражая расширение возможностей своих плееров и ПО. Из последних добавок – тег Gapless, появившийся в конце 2006 года. Если Apple все же откроет бизнес по продаже рингтонов для iPhone, следует ожидать новых модификаций iTunes tag. Xiph Comments![]() Популярные среди «продвинутой» публики форматы OGG и FLAC имеют свою систему тегов. Называется она по наименованию разработчика, некоммерческой организации Xiph.org. Отличительная особенность этой системы – отсутствие фиксированной структуры. Если в ID3, WM, iTunes все доступные категории раз и навсегда прописаны «сверху», то здесь пользователь может создавать любые свои категории, такого типа, какого захочет, с названиями по своему вкусу. В этом выразился «народный» open-source-характер Xiph-форматов. Для пользователей и разработчиков, не желающих создавать архитектуру тегов самостоятельно, существует рекомендованный список категорий:
Список короткий и нарочито законопослушный, т.к. Xiph заинтересованы в том, чтобы их форматы использовали и «серьезные» организаторы. Конечно, простые пользователи при желании могут его игнорировать, но большинство плееров, поддерживающих OGG и FLAC, ориентируются именно на эту структуру. Как и другие форматы тегов нового поколения, в Xiph comments используется Unicode-кодировка для текста. APE tag![]() Проект Monkey Audio и формат APE имеет много общего с Xiph – тоже «народный», ориентированный на «продвинутое» сообщество, симпатизирующее идеям open-source. Так же и теги, используемые в этом формате, схожи по архитектуре с Xiph comments. Тут мы снова видим гибкую структуру, без фиксированных категорий, открытую для модификации пользователем. Любопытной особенностью APE-тегов является возможность нахождения в одной категории нескольких значений (например, нескольких исполнителей и т.п.). В настоящее время в основном используется вторая версия APE tag. Как и в Xiph comments, Monkey Audio предлагает список категорий по умолчанию:
Список гораздо обширнее. Обращает на себя внимание ряд оригинальных категорий, таких, как библиография/дискография, и адаптированность тегов под аудиокниги. Несложно догадаться, что APE comments тоже используют Unicode-кодировку и тем самым защищены от кракозябр. OMA tag![]() Формат ATRAC в своей идеологии – абсолютная противоположность Xiph и Monkey Audio. Полная проприетарность в противовес open-source. Изначальная расположенность к DRM против полного отсутствия таковой. Эти форматы стоят на двух полюсах, неудивительно, что ни один из них не является самым популярным. Закрытость ATRAC отпугивает потребителя, открытость Xiph и Monkey Audio – производителя. Хотя сам по себе кодек ATRAC относится с самым древним алгоритмам сжатия аудио с потерями, современной функциональностью, в т.ч. метаданными, он «оброс» только на рубеже 1999-2000 гг. Sony применило уже известную нам контейнерную технологию. Аудиопоток ATRAC заключается в проприетарный OMA-контейнер: OMA – Open Magic Audio – обычный Контейнер OMA и содержит теги. Описывать их нет никакого смысла, это хорошо нам уже знакомые ID3v2 теги. Да, именно так, Sony просто-напросто встроила этот открытый стандарт метаданных в свой закрытый формат. Некоторые отличия все же есть – категории, в ID3v2 предназначенные для хранения текстовой информации, используются в нем для данных, относящихся к DRM OpenMG. Так, открытый, народный, созданный «низами» формат метаданных был поставлен на службу закрытой технологии, предназначенной исключительно для того, чтобы ограничить свободу этого самого народа в отношении своего контента. Помимо ATRAC в OMA-контейнер могут быть заключены также MP3-, WMA- или AAC-аудиопотоки. Собственно, именно это происходит при копировании аудио в подобных форматах на плееры Sony Network Walkman с помощью ПО SonicStage. Теги в них, соответственно, меняются на OMA (читай – ID3v2) теги, причем не всегда это происходит гладко, иногда метаданные теряются, искажаются. Эта особенность, как и многое другое в инфраструктуре SonicStage, вызывает серьезные претензии у пользователей. Стоит отметить, что в реальной жизни не редкость использование тегов одного типа с файлами другого. Большинство программных проигрывателей натаскано на поиск идентификаторов тегов в файлах и без труда прочтут «чужеродные» метаданные, к примеру, APE tag в MP3-файле или ID3 v2 в M4A. Технически подкованные пользователи часто создают подобных «мутантов», комбинируя любимый тип тега с любимым форматом сжатия. MP3-плееры, однако, будут введены в замешательство таким поворотом событий и в большинстве случаев «неправильный» тег не прочтут. Алексей Дорожин (adoro@list.ru) Есть, что добавить?! Пишите... eldar@mobile-review.com |
Новости: 13.05.2021 MediaTek представила предфлагманский чипсет Dimensity 900 5G 13.05.2021 Cайты, имеющие 500 тысяч пользователей из России, должны будут открыть местные филиалы 13.05.2021 Amazon представила обновления своих умных дисплеев Echo Show 8 и Echo Show 5 13.05.2021 МТС ввел удобный тариф без абонентской платы - «МТС Нон-стоп» 13.05.2021 Zenfone 8 Flip – вариант Galaxy A80 от ASUS 13.05.2021 Поставки мониторов в этом году достигнут 150 млн 13.05.2021 Состоялся анонс модной версии «умных» часов Samsung Galaxy Watch3 TOUS 13.05.2021 Tele2 выходит на Яндекс.Маркет 13.05.2021 OPPO представила чехол для смартфона, позволяющий управлять устройствами умного дома 13.05.2021 TWS-наушники с активным шумоподавлением Xiaomi FlipBuds Pro 13.05.2021 В России до конца следующего года появится госстандарт для искусственного интеллекта 13.05.2021 ASUS Zenfone 8 – компактный флагман на Snapdragon 888 12.05.2021 Компания Genesis представила внешность своего первого универсала G70 Shooting Brake 12.05.2021 В России разработан высокоточный гироскоп для беспилотников 12.05.2021 В Россию привезли новую версию смарт-часов HUAWEI WATCH FIT, Elegant Edition 12.05.2021 Раскрыты ключевые особенности смартфона POCO M3 Pro 5G 12.05.2021 Honor 50: стали известны дизайн и другие подробности о смартфоне 12.05.2021 Чипсет Exynos 2200 от Samsung будет устанавливаться и в смартфоны, и в ноутбуки 12.05.2021 МТС начала подключать многоквартирные дома к интернету вещей 12.05.2021 iPhone 13 будет толще и получит более крупные камеры по сравнению с iPhone 12 12.05.2021 Xiaomi договорилась с властями США об исключении из чёрного списка 12.05.2021 Xiaomi выпустила обновлённую версию умного пульта Agara Cube T1 Pro ![]() 12.05.2021 Игровые ноутбуки с NVIDIA GeForce RTX 3050 Ti уже в России! 12.05.2021 Индийский завод Foxconn сократил производство в два раза 12.05.2021 Lenovo отказалась от очного участия в предстоящем в июне Mobile World Congress Подписка |