Матрица. Физический размер

Предустановленный

пользователь может выбрать один из предустановленных вариантов (шаблонов): стандартный (normal) – без изменений, джаз (jazz), рок (rock), где подчеркиваются (увеличивается громкость) низких и высоких частот; классика (classic), поп (pop). Каждая предустановка оптимизирует (или адаптирует) звучание плеера для определенного музыкального жанра. Производители (каждый по-своему) под этими настройками предполагают свой стиль звучания. Пользователю не нужно настраивать – достаточно выбрать.

ПользовательскийилиUSER

пользователь настраивает звук на своё усмотрение/вкус: убавляет или прибавляет громкость высоких, средних или низких частот. Если можно изменить только высокие (treble) и низкие (bass) частоты – такой эквалайзер называют 2-х полосным; если высокие, средние (middle) и низкие – 3-х полосным. Есть эквалайзеры, где каждая полоса задана частотными пределами, например: 16Гц – 100Гц, 100Гц – 500Гц, 500Гц – 5КГц, 5КГц – 10КГц, 10КГц – 20КГц – это 5-и полосный.

Предустановленный эквалайзер есть в любом современном плеере, в большинстве плееров есть еще и пользовательский, что расширяет возможные настройки звучания плеера.

Сопротивление

Сопротивление наушников измеряется в Омах и составляет от 16 до нескольких сотен Ом. В наушниках арматурной конструкции сопротивление может быть меньше 16 Ом. Большинство плееров рассчитаны на нагрузку в 16 Ом. Если подключить к ним наушники с большим сопротивлением, то наушники будут звучать тише, будет сильнее расходоваться заряд аккумулятора, но звук будет чище, т.е. с меньшим количеством искажений. Т.е. можно сказать, что сопротивление влияет на громкость наушников и качество звука (но тут все зависит от конкретной модели наушников).

Чувствительность

Это отношение громкости воспроизводимого звука к мощности входного сигнала, измеряется в дБ/мВт, иногда просто в дБ. Если написано, что чувствительность наушников составляет 100 дБ/мВт, это значит, что при подаче 1 мВт мощности, они выдают громкость в 100 дБ. Т.к. дБ – величина нелинейная, то разница в громкости между наушниками в 100 и 105 дБ/мВт будет очень существенная. Для портативной техники рекомендуется выбирать наушники с чувствительностью не менее 100 дБ, если будут меньше, то вы просто в них практически не услышите музыки, они будут очень тихо играть, т.е. такие наушники можно использовать только со стационарной аппаратурой, где запас мощности очень большой. Итог-чувствительность это основная характеристика, влияющая на конечную громкость наушников. Такой же параметр есть у колонок, но там значения ниже, в среднем около 90 дБ.

Диаметр мембраны

Диаметр динамика, встроенного в наушники влияет на количество искажений и общее качество звука. Т.е. намного проще сделать качественные наушники с большим диаметром мембраны, чем с маленьким. Именно поэтому профессиональные наушники очень большие, у них внутри динамик с большой мембраной, дающий очень маленькие искажения. Не надо думать, что все наушники с большой мембраной качественные, это не так, просто качественные наушники с большой мембраной сделать намного проще. Есть наушники-затычки стоимостью более 500$, дающие очень качественный звук, но за меньшие деньги можно купить большие мониторные наушники с выдающимся звучанием.

Это основные характеристики наушников. Есть еще, например, максимальная входная мощность, материал провода и тд., но это неважно, если наушники нужны для использования с плеером. Даже если все вышеперечисленные характеристики вас устраивают, для окончательного выбора наушники нужно слушать, потому что сам характер звука, которые они выдаю нельзя выразить никакими цифрами.

Некоторые виды наушников

Наушники делятся на два больших класса: открытые и закрытые. Открытые – это такие наушники, у которых сзади есть отверстия, через них могут проникать внешние звуки. Из недостатков стоит отметить, что из-за отверстий часть звука выходит наружу и слышно, что играет у вас в плеере, с другой стороны – меньше шансов попасть под машину, т.к. большая часть внешних звуков слышна.

Закрытые наушники не имеют отверстий на корпусе и вся музыка идет только в ухо. Из достоинств стоит отметить отличную шумоизоляцию (внешних звуков практически не слышно), большую отдачу на басах, но в таких наушниках сильно устает ухо и музыку в них несколько часов не послушаешь.

Нельзя сказать какие наушники лучше по звуку (все зависит от конкретной модели), если требуется большая звукоизоляция, то выбираем закрытые наушники, если наушники нужны для домашнего использования (например с компьютером), то разумнее выбрать открытые наушники, т.к. в них меньше устаешь.

По способу ношения наушники принято разделять на следующие виды:

Мониторные –самые большие наушники, чашка с динамиком полностью закрывает ухо (динамик имеет большой размер). В основном такие наушники рассчитаны на использование со стационарной техникой, поэтому для достижения отличного качества звука имеет относительно низкую чувствительность и большое сопротивление (иногда несколько сотен Ом). Из особенностей стоит отметить кабель длиной 3-5 метров, т.е. мониторных наушников с коротким кабелем не бывает.

Накладные –средние наушники, динамик в среднем диаметром около 30 мм и просто прикладывается к уху каким либо способом. Это может быть и верхняя дужка, и задняя дужка и просто заушины, в общем способов много. Такие наушники звучат часто очень приятно, от них не сильно устают уши. Но у них плохо с шумоизоляцией, т.к. динамик невозможно очень плотно прижать к уху. Обладают средним сопротивлением в 32 Ома и чувствительностью около 100 дБ.

Вставные(затычки) – динамик наушника вставляется непосредственно в ушной канал. Самые маленькие наушники, рассчитаны на использование с портативной техникой, поэтому имеют в большинстве случаев сопротивление в 16 Ом и обладают высокой чувствительностью (не менее 100 дБ). У них всегда короткий провод (не более метра). Из-за малых размеров излучателя недорогие модели обладают очень неровной АЧХ, поэтому звучание таких наушников часто не очень достоверно (слишком выпирают определенные частоты и настройками эквалайзера это очень сложно исправить).

Подключаются наушники к источнику звука в большинстве случаев проводом с разъемом. Основные типа разъемов под наушники:

Jack – диаметр 6,3 мм. Применяется в профессиональной или устаревшей технике. Мониторные наушники часто оснащены именно таким разъемом или имеют переходник на него.

miniJack – диаметр 3,5 мм. Самый распространенный разъем для наушников, применяется практически везде.

microJack – диаметр 2,5 мм. Применяется из-за своих компактных размеров в мобильных телефонах и некоторых плеерах. С помощью переходника можно подключать обычные 3,5 мм наушники.

Необычные наушники –иногда наушники оснащаются какими-либо необычными функциями. Например, из-за того, что глубокий бас чувствуется всем телом, то для усиления ощущений выпускаются наушники с вибромотором. При сильных басах он работает и усиливает ощущения. При прослушивании музыки он не используются, а вот например при игре в компьютерные игры – иногда применяются. Очень необычно будут например ощущаться взрывы и другие эффекты.

Так же существую наушники с активной системой шумоподавления. Устроены они несложно, в наушниках есть микрофон, специальная схема и элементы питания. Микрофон улавливает внешние шумы, схема эту шумовую волну, но в противофазе подает на наушники. Из курса физики известно, что если сложить волну и эту же волну в противофазе, то на выходе получится нулевой сигнал, т.е. внешних шумов вообще слышно не будет. Есть и оборотная сторона медали: при использовании такой системы приглушаются верхние частоты, т.е. такая система негативно сказывается на звуке. Компания Sony такую систему встроила в сам плеер, а в наушники встроила микрофон, т.е. с комплектными наушниками система активного шумоподавления работает, а с неродными – не работает.

Беспроводные наушники

Беспроводные наушники бывают нескольких видов:

Радионаушники – сигнал от базы к наушникам передается с помощью обычных аналоговых радиоволн, поэтому возможны помехи (например от работающего пылесоса) и такие наушники не могут выдавать качественный звук, поэтому их основное применение - это использование с телевизором, где изначально звук не особо качественный.

Bluetooth наушники –самый распространённый тип беспроводных наушников. Практически полное отсутствие помех, малое энергопотребление способствовали распространению данного типа наушников. В плееры иногда встраивают модуль Bluetooth, что еще более удобно. Но у таких наушников есть недостаток: при передаче музыки звуковая информация дополнительно сжимается, что негативно сказывается на качестве звука. Помимо Bluetooth иногда применяется другой протокол беспроводной связи, чтобы обеспечить лучшее качество звука, но такие наушники пока редкость.

Носители звуковой информации

Носители звуковой информации делятся на 2 больших класса: цифровые и аналоговые. Аналоговые носители – это виниловая пластинка, магнитная пленка. У аналоговых носителей есть большой недостаток – чем чаще мы слушаем музыку на них, тем быстрее они изнашиваются (грампластика стирается и начинает сильно потрескивать, пленка размагничивается и начинает сильно фонить плюс у нее сужается диапазон воспроизводимых частот). Поэтому при разработке цифровых носителей стоял вопрос о независимости качества звука от количества проигрываний. В середине 70-х придумали технологию записи на оптический диск, а в самом начале 80-х компании Sony и Philips выпускают всем известный Compact Disc. Как же он устроен: Сам компакт-диск имеет диаметр 120 мм (примерно в 3 раза меньше обычной грампластинки), толщину 1,2 мм, массу 10 г. Запись на диск выполняется только на одной стороне. Воспроизведение компакт-диска осуществляется на специальном проигрывающем устройстве, где вместо иглы применен лазерный луч.

Внешне поверхность компакт-диска блестящая, как зеркало (хотя бывают и с темной поверхностью), совершенно гладкая, без каких-либо канавок. Если взглянуть в микроскоп, то станут заметны мельчайшие продолговатые углубления (питы, от буржуйского pit - ямка, углубление), образующие дорожку записи. В разрезе диск показан на рис. Он состоит из пластмассовой прозрачной подложки 1, несущей информацию, алюминиевой отражающей пленки 2, нанесенной на подложку, лакового непрозрачного защитного слоя 3 с этикеткой. Цифрой 4 обозначены питы, образующие дорожку записи.

 


Дорожка записи с питами находится внутри диска и предохранена от повреждения, направлена по спирали от центра к краю диска. Всего концентрических дорожек с информацией около 20 000, общая длина примерно 5 км. Информация с диска считывается бесконтактным способом с помощью лазерного луча. Вопрос о сохранности пластинки, как уберечь её от "запиливания" отпадает сам собой, т.к. физический контакт со считывающей головкой отсутствует.

Компакт-диск не боится пыли, отпечатков пальцев (в разумных пределах), мелких царапин. Все дело в том, что если на информационном слое диска луч фокусируется в пятно размером около одного микрона (1 мкм), то на наружной поверхности диска размер его возрастает в тысячу раз - до 1 мм и мелкие дефекты на поверхности диска луч просто не замечает (рис. 2).

 

На CD помещается 700 Мб информации или 74 минуты музыки (почему именно так – разберем немного позднее). С течением времени разработки продолжались и в 90-х годах появились диски большего объема – DVD. На него уже помещалось 4,7 Гб информации, появилась возможность добавить второй слой для записи (т.е. один из них – полупрозрачный), что позволило увеличить полезную емкость до 9 Гб (сейчас часто применяется для записи лицензионных DVD-фильмов). Так же часто можно встретить двухсторонние диски, т.е. его надо переворачивать и считывание информации происходит с другой стороны диска. Увеличение емкости стало возможным в основном за счет использования более тонкого лазерного луча (синий лазер). Однослойный односторонний диск с DVD-фильмом обозначают как DVD5, двухслойный односторонний – DVD9, а двухсторонний – DVD10.

Далее для записи фильмов на диск в HD качестве стали разрабатывать диски еще больше емкости HD-DVD (Toshiba) и Blu-Ray (Sony). Диски HD-DVD сейчас больше не выпускаются, но их емкость была 15 Гб, а Blu-Ray 25 Гб (это однослойный односторонний диск). Это стало возможным из-за использования так называемого «голубого» лазера, который еще более тонкий. На такие диски помимо фильма в HD-качестве помещается еще несколько высококачественных звуковых дорожек (лучше качество звука, чем в DVD) и множество дополнительных материалов.

Цифровой звук, оцифровка звука

Оцифровка звука осуществляется Аналого-цифровым преобразователем (АЦП). Технология оцифровки в принципе проста: замеряется амплитуда аналогового сигнала (через определенные промежутки времени), а при воспроизведении амлитуда восстанавливается по полученным точкам (это делает уже Цифро-аналоговый преобразователь).

 

 

У цифрового звука есть несколько основных характеристик:

Частота дискретизации (кГц) — частота, с которой АЦП измеряет оцифровываемый аналоговый сигнал, поданный ему на вход извне. Другими словами, это количество промеров входящего аналогового сигнала, выполняемых за одну секунду. Соответственно, и при воспроизведении оцифрованного звука он выдаётся из файла или звукового компакт-диска на ЦАП с той же частотой, с какой был промерен и записан. Для звуковых компакт-дисков этот параметр равен 44,1 кГц.

Битность или битность счетчика(бит) — количество бит, которое отводится на хранение результата каждого промера. Для записей на звуковых компакт-дисках этот параметр равен 16 битам. Таким образом, громкость сигнала на звуковом компакт-диске может иметь до 65535 градаций.

Помимо Audio CD существую более продвинутые аудио форматы. Их разработали, т.к. CD все таки не дает отличного звука, многие жалуются на жесткость звучания и недостаточный динамический диапазон (разница в громкости между самым тихим и самым громким звуком). Для аудиофилов разработали форматы DVD-Audio и Super Audio CD. В этих форматах звук оцифровывается с другими параметрами частоты дискретизации и битности. Занимают такие форматы больше места, поэтому записываются на DVD диски, так же они поддерживают многоканальность (о ней ниже). Разницу в качестве по сравнению с AudioCD можно будет услышать если только у вас музыкальный слух и очень, подчеркиваю ОЧЕНЬ качественная аппаратура для воспроизведения музыки.

 

Зная частоту дискретизации и битность можно вычислить битрейт –т.е. количество бит, приходящихся на секунду композиции или объем одной секунды композиции. Битрейт иногда называют потоком и влияет он только на конечный объем файла. Битрейт Audio CD составляет около 1400 кбит/с, т.е. каждая секунда записи «весит» 1400 кбит или 175 кбайт.

Постоянный Битрейт или Constant Bitrate (CBR)

· Означает, что скорость записи не меняется.

· CBR позволяет рассчитать: на какое время записи хватит того или иного объёмапамяти – объём делим на скорость, получается время. Пример:

1) Объём памяти - 128 МБайт, BR (скорость) 256 - Кбит/сек.

2) Переводим биты в байты: 256 делим на 8, получается 32КБайта/сек.

3) 128МБайт – это примерно 128000КБайт (более верно использовать коэффициент не 1000, а 1024 – округляем для упрощения).

4) Делим объём на скорость и получаем время: 128000 делим на 32, получается 4000 секунд.

5) Чтобы секунды перевести в минуты, делим на 60; чтобы в часы – на 3600.

6) ИТОГ: чуть больше 66 минут, или 1 час 6 минут.

· Есть форматы, которые поддерживают только CBR: Audio CD, WAV и ATRAC.

Переменный Битрейтили Variable Bitrate (VBR)

· Скорость передачи данных в течении всей записи меняется (потому и называется - переменный). Если в песне в какой то момент времени используется не весь диапазон частот, например соло на бас гитаре, то имеет смысл понизить битрейт для экономии места, т.к. верхние частоты в данный момент не используются и надо тратить на них информацию.

· Основное назначение VBR: экономно использовать память и уместить на цифровом носителе больше музыки по времени.

· Часто используется в MP3, WMA, AAC - в этих форматах возможен и CBR.

· Есть форматы, в которых возможен только VBR – OGG Vorbis (и AMR).

· Существует ещё и ABR (Average Bitrate) – это разновидность VBR, у которого заданы верхняя и нижняя границы.

Преимущество переменного битрейта – либо меньший объем файла при таком же качестве как у постоянного, либо лучшее качество при таком же объеме файла.

Форматы сжатия звука

По сути дела, та или иная цифровая форма представления аналоговых аудио сигналов уже является способом кодирования – последовательность чисел, описывающая аналоговый аудио сигнал, сама по себе является цифровым кодом. Однако кодирование, о котором мы будем сейчас говорить, - это нечто другое. Сейчас рассмотрим методы кодирования цифровых аудио сигналов.

Оцифрованный аудио сигнал «в чистом виде» является достаточно точной, но не самой компактной формой записи исходного аналогового сигнала.

Чтобы получить полную информацию об оригинальном аналоговом сигнале в частотной полосе от 20 до 20 кГц (в слышимом диапазоне частот), аналоговый сигнал необходимо дискретизовать с частотой не менее 40 кГц. Так, стандарт CD - DA (стандарт записи данных на привычных для всех аудио компакт-дисках) устанавливает следующие параметры кодирования: двух- или одноканальная запись в формате с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит. Один час музыки в таком формате занимает объем около 600 Мб (60 минут * 60 секунд * 2 канала * 44100 отсчетов в секунду * 2 байта на отсчет = около 605 Мб). Учитывая, что, например, музыкальная коллекция рядового любителя музыки вполне может насчитывать 5000 треков средней продолжительностью около 3 минут каждый, объем памяти, требуемый для ее хранения в исходном цифровом виде, оказывается очень внушительным. Поэтому хранение относительно больших объемов аудио данных, гарантирующее достаточно хорошее качество звучания, требует применения разных «ухищрений», позволяющих уплотнить данные.

Форматы цифрового звука можно разделить на 2 больших типа.

1. Сжатие данных без потерь (англ. «lossless coding») - это способ кодирования (уплотнения) цифровой аудио информации, позволяющий осуществлять стопроцентное восстановление исходных данных из сжатого потока (под понятием «исходные данные» здесь подразумевается исходный вид оцифрованных аудио данных). К такому способу уплотнения данных прибегают в случаях, когда требуется абсолютное, стопроцентное сохранение качества оригинального звучания аудио данных. Существующие сегодня алгоритмы беспотерьного сжатия позволяют сократить занимаемый данными объем на 20-50% и при этом гарантировать стопроцентное восстановление исходного цифрового материала из сжатых данных. Механизмы работы подобных кодеров сходны с механизмами работы архиваторов общих данных, таких, как, например, ZIP или RAR, но при этом адаптированы специально для сжатия аудио данных. Беспотерьное кодирование, хотя и идеально с точки зрения сохранности качества аудио материалов, но оказывается неспособным обеспечить высокий уровень компрессии. Самыми известными и распространенными форматами беспотерьного сжатия являются FLAC и APE. Они обеспечивают сжатие в среднем на 30%, т.е. если сжать обычный CD в формат FLAC, то битрейт будет вместо 1400 кбит/с, примерно 900 кбит/с, а качество соответственно остается исходным.

2. Существует другой, более современный путь уплотнения данных. Это так называемое сжатие данных с потерями (англ. «lossy coding»).Цель такого кодирования заключается в достижении любыми путями максимально высокого коэффициента компрессии данных при сохранении качества их звучания на приемлемом уровне. В основе идеи кодирования с потерями лежит два простых основополагающих соображения:

исходные цифровые аудио данные избыточны – они содержат много лишней, бесполезной для слуха информации, которую можно удалить, тем самым, повысив коэффициент компрессии;

требования к качеству звучания аудио материала могут быть разными и зависят от конкретных целей и сфер использования.

Кодирование с потерями потому и называется «с потерями», что приводит к утрате некоторой части аудио информации. Такое кодирование приводит к тому, что декодированный сигнал при воспроизведении звучит похоже на оригинальный, но фактически перестает быть ему идентичным. В основе большинства методов кодирования с потерями лежит использование психоакустических свойств слуховой системы человека, а также различных хитростей, связанных с переквантованием и передискретизацией сигнала. В частотности, в процессе компрессии аудио данные анализируются кодером на предмет выявления различных деталей звучания, которыми можно пренебречь. Замаскированные частоты, неслышимые и слабослышимые детали звучания – всем этим можно пожертвовать с целью достижения более высокого значения коэффициента компрессии. Там, где в звучании важна лишь разборчивость (например, в телефонии, где наличие частот выше 4 кГц не является необходимым), аудио информация в процессе кодирования подвергается серьезному «упрощению», что вкупе с использованием «умных» квантователей и удачных «жадных» алгоритмов компрессии данных позволяет достичь высочайших степеней компрессии (1 : 50 и выше). Там, где качеству звучания предъявляются более высокие требования (например, в портативных и бытовых аудио устройствах), аудио материалы подвергают более щадящему кодированию. Надо отметить, что степень агрессивности кодера по отношению к деталям звучания может регулироваться (эта способность, впрочем, зависит от конкретной реализации). В среднем, современные кодеры даже при столь высокой степени компрессии, как 1 : 10 позволяют обеспечить отличное звучание, качество которого средним слушателем на средней аппаратуре оценивается как равное качеству звучания исходных аудио данных.

Сегодня существует множество кодеров аудио данных, основанных на идее кодирования с потерями. Вот только некоторые из них: MPEG-1 Audio Layer 3 (всем известный как MP3), Windows Media Audio (WMA), Ogg Vorbis (OGG), MPEG-2/4 AAC и другие. Рассмотрим их поподробнее.

 

Форматы сжатия с потерями

MPEG-1 Layer 3

Известный сегодня фактически каждому пользователю компьютера под незамысловатой маркой « MP3» кодек MPEG-1 Layer 3 – это наиболее старый из всех распространенных на сегодня lossy-кодеков. Своим названием он обязан группе MPEG, которая занималась его разработкой и которая продолжает разрабатывать новые аудио и видео кодеки. О ней стоит упомянуть отдельно.

MPEG расшифровывается как «Moving Picture Coding Experts Group», дословно – «группа экспертов по кодированию подвижных изображений». Группа MPEG ведет свою историю с января 1988 года и занимается разработкой различных алгоритмов и стандартов кодирования аудио и видео информации. В собраниях MPEG принимают участие несколько сотен специалистов из более чем двухсот крупных и мелких компаний. При этом большая часть участников MPEG - это специалисты, занятые в тех или иных научных и академических учреждениях. На сегодняшний день группой MPEG разработаны следующие стандарты:

MPEG-1 (принят в ноябре 1992 г.) - стандарт кодирования, хранения и декодирования подвижных изображений и аудио информации;

MPEG-2 (принят в ноябре 1994 г.) - стандарт кодирования данных для цифрового телевещания;

MPEG-4 - стандарт для мультимедиа приложений (в его разработке еще далеко не поставлена точка);

MPEG-7 - универсализованный стандарт работы с мультимедиа информацией, предназначенный для обработки, компоновки и управления мультимедиа информацией.

Стандарт MPEG-1 представляет собой, по сути, целый комплект аудио и видео стандартов. Согласно стандартам ISO (International Standards Organization), аудио часть MPEG-1 включает в себя три алгоритма различных уровней сложности: Layer 1 (уровень 1), Layer 2 (уровень 2) и Layer 3 (уровень 3, называемый большинством просто «MP3»). Общая структура процесса кодирования одинакова для всех уровней MPEG-1. Вместе с тем, несмотря на схожесть уровней в общем подходе к кодированию, уровни различаются по целевому использованию и задействованным в кодировании внутренним механизмам. Для каждого уровня определен свой формат записи выходного потока данных и, соответственно, свой алгоритм декодирования. Алгоритмы MPEG-1 основаны в целом на изученных свойствах восприятия звуковых сигналов слуховым аппаратом человека.

Процедура кодирования аудио информации, вкратце, представляет собой следующий процесс. В начале кодирования входной цифровой аудио поток в формате WAV с помощью цифровых фильтров разделяется на несколько частотных полос. Дальнейший процесс зависит от Layer ' a .

В случае Layer 3 (то есть, в случае MP3) в каждой полосе сигнал раскладывается на частотные составляющие спектра. Спектр входного сигнала очищается от заведомо неслышных составляющих - низкочастотных шумов и наивысших гармоник. На следующем этапе производится психоакустический анализ кодируемого аудио материала в диапазоне слышимых частот. Вышеописанные процессы преобразования позволяют исключить из исходного аудио материала больше половины информации. На заключительном этапе кодирования производится сжатие уже готового потока данных (архивация).

Комплект MPEG-1 предусмотрен для кодирования аудио сигналов, оцифрованных с частотой дискретизации 32, 44.1 и 48 КГц. Три упомянутых выше уровня MPEG-1 различаются свой целевой направленностью, механизмами кодирования и, таким образом, обеспечивают различные степени сжатия. Так, например, аудио данные в формате [44.1 кГц / 16 бит / стерео], Layer 1 позволяет сохранить без особо ощутимых потерь качества при скорости потока (битрейте) 384 Кбит/с, что составляет 4-х кратный выигрыш в занимаемом данными объеме; Layer 2 обеспечивает субъективно такое же качество при 192 - 224 Кбит/с, а Layer III (MP3) - при 128-160. Нельзя говорить о выигрыше или проигрыше одного уровня перед другим, так как каждый уровень разработан для достижения своей собственной цели. Например, преимущество Layer 3 заключается в том, что фактически он позволяет сжимать информацию в 8-12 раз (в зависимости от битрейта) без сильно ощутимых потерь качества исходного звучания. При этом, однако, обеспечиваемая им скорость компрессии является самой низкой среди всех уровней. Layer 2 потенциально способен обеспечить более высокое качество кодирования в виду более «легкой» внутренней обработки сигнала в процессе преобразования. В то же время, Layer 2 не позволяет достичь таких высоких степеней компрессии, какие достигаются при использовании Layer 3.

Ogg Vorbis Одной из негативных сторон кодека MP3 являлась и является его коммерческая основа, заключающаяся как минимум в том, что каждый производитель, создающий новый программный или аппаратный MP3-кодер, обязан платить отчисления изобретателям кодека. Эта ситуация не могла не вызывать недовольство среди пользователей и разработчиков. Так появились независимые разработки в области компрессии аудио.

Кодек Ogg Vorbis вышел в свет в июне 2000 года. Он является частью проекта Ogg Squish, нацеленного на создание полностью открытой системы мультимедиа. Разработчиком проекта является группа, именующаяся Xiphophorus. В основе Ogg Vorbis лежат те же идеи, что и в основе MPEG-1 Layer II, при этом Ogg Vorbis использует свои собственные оригинальные математические алгоритмы, а также собственную психоакустическую модель, что освобождает его разработчиков от необходимости выплачивать какие-то лицензионные отчисления или производить иные выплаты сторонним фирмам-производителям. Кодек Ogg Vorbis, будучи созданным позже MPEG-1, является несколько более развитым. Он рассчитан на сжатие данных на всех возможных битрейтах без ограничений, от 8 Кбит/с до 512 Кбит/с. Кодер позволяет хранить внутри файлов-контейнеров подробные комментарии об исполнителе и названии композиции, а также предусматривает возможность кодирования нескольких каналов аудио (более двух), возможность редактирования содержимого файлов и поддержку техники «масштабируемых битрейтов» - возможности изменения битрейта аудио потока без необходимости его декодирования. Стоит отметить, что при кодировании в этот формат нет возможности выставить битрейт, можно выставить только уровень качества от 1 до 10, соостветственно 10- наивысшее качество, но и объем файла тоже будет довольно большой.

 

Windows Media Audio (WMA) Кодек Windows Media Audio (сокращенно WMA) является сегодня собственной разработкой компании Microsoft и успешно ею продвигается. Изначально, кодек WMA разрабатывался фирмой Voxware и имел название Voxware Audio Codec, однако впоследствии компания забросила его доработку, остановившись на v4.0. Разработки Voxware были выкуплены компанией Microsoft, серьезно доработаны и представлены общественности в виде аудио кодека под названием Windows Media Audio (сокращенно WMA).

Если кодек MP3 был изначально стандартизован на предмет разрешенных значений битрейтов и других основных параметров, то WMA изменялся параллельно своему становлению и развитию. На сегодняшний день существует несколько версий кодека WMA: v1, v2, v7, v8 и v9. Внутреннее устройство и механизмы кодирования кодека держатся компанией Microsoft в секрете, однако, опираясь на результаты некоторых тестов, можно предположить, что идеи, легшие в основу WMA, не сильно отличаются от идей, на которых базируются методы MPEG-1.

AAC (Advanced Audio Coding) Группа MPEG, конечно, не удовлетворилась разработкой аудио кодека, включенного в стандарт MPEG-1. Исследования в области кодирования аудио продолжались и вылились в создание новых стандартов кодирования аудио от MPEG.

Общий стандарт MPEG-2 разрабатывался специально для кодирования телевизионных сигналов. В апреле 1997 комплект MPEG-2 получил «продолжение» в виде алгоритма MPEG-2 AAC (MPEG-2 Advanced Audio Coding – продвинутое аудио кодирование).

Так же, как и в комплекте аудио стандартов MPEG-1, в основе алгоритма AAC лежит психоакустический анализ сигнала. Вместе с тем, алгоритм AAC имеет в своем механизме множество дополнений, направленных на улучшение качества выходного аудио сигнала. В частности, используется другой тип преобразований, улучшены методы шумовой обработки, модернизирован метод записи выходного бит-потока и т.д. Следует отметить, что кодек AAC не является обратно совместимым с уровнями MPEG-1, а значит, аудио материалы в формате MPEG-2 AAC не могут быть декодированы с помощью декодера MPEG-1.

Спустя несколько лет после стандартизации MPEG-2, свет увидел новый комплект стандартов, комплект MPEG-4 . По обыкновению, стандарт MPEG-4, помимо прочего, описывает и методы кодирования аудио. Эти методы объединены под общим названием MPEG-4 AAC.

Расширение AAC под именем aacPlus было анонсировано компанией Coding Technologies 9 октября 2002 года. aacPlus основан на использовании технологии SBR (Spectral Band Replication). Технология SBR предназначена для улучшения качества передачи верхнего частотного диапазона. Идея технологии и предпосылки к ее созданию состоят вот в чем. Дело в том, что кодеки, использующие психоакустическую модель, как показывает практика, имеют один общий недостаток: все они обеспечивают довольно хорошее качество звучания во всем диапазоне слышимых частот, но только до битрейта 128-112 Кбит/с. Компрессия на более низких битрейтах приводит к очень заметной деградации качества звучания, что заставляет разработчиков кодеков при использовании низких битрейтов принудительно ограничивать кодируемый диапазон частот. Технология SBR является попыткой устранить этот досадный недостаток за счет сохранения ограниченной информации о верхней полосе частотного спектра сигнала в процессе кодирования и последующего искусственного синтеза (воссоздания) верхних частот в процессе декодирования. Технология хоть и является очень искусственным методом решения проблемы, но, тем не менее, оказывает благотворное влияние на восприятие закодированных таким образом аудио материалов.

Надо сказать, что «комплектация» MPEG-4 новыми подстандартами и дополнениями продолжается, так что список механизмов и инструментарий кодирования MPEG-4 может постепенно расширяться. Кроме того, нужно заметить, что не все стандартизованные в MPEG-4 методы кодирования нашли отражение в реально существующих аппаратных или программных продуктах. Это связано с тем, что многое из описанного в MPEG-4 стандартизует способы обмена информации, но не сами способы кодирования. Многие идеи кодирования (в особенности, это касается компрессии видео) требуют даже по сегодняшним меркам гигантских вычислительных способностей, так что до полной реализации всего предусмотренного в MPEG-4 еще далеко.

Перечисленные форматы конечно не все, существует множество кодеков, но они в основном используют принципы, заложенные в этих основных форматах.

В заключении разговора о lossy-кодировании стоить заметить следующее. Кодирование с потерями – это очень удобный инструмент. Однако в отличие от беспотерьного кодирования – достаточно опасный инструмент. Применяться lossy -кодирования должно там, где ему место. Совершенно очевидно, что кодированию с потерями ввиду самой его сути не место, например, в студийной звукозаписи. При этом совершенно нелогично отказываться от его использования, например, в телефонии.

Для уменьшения объема файла есть некоторые способы двухканального кодирования:

Dual Channel - самый простой способ кодирования стерео сигнала, каждому каналу отдается ровно половина потока.

Stereo - при использовании данного способа кодирования каждый канал кодируется отдельно, так же как и в предыдущем способе. Единственное отличие заключается в том, что размеры потоков являются величиной динамической. Кодер в процессе сжатия определяет, какому каналу отдать приоритет на каждом конкретном участке записи. Это, например, позволяет избежать кодирования тишины в одном из каналов. В это время другой канал кодируется качественней. Обычно такой вид кодирования позволяет получить более качественный звук.

Joint Stereo

· (MS Stereo) - в данном случае сигнал раскладывается на средний между каналами и разностный. Далее один из каналов кодируется очень качественно, а другой - очень некачественно. Если каналы практически совпадают (как в попсе), то можно получить очень хорошее качество сигнала. Используется при средних и низких BR.

· (MS/IS Stereo) - этот метод может применяться для низких BR. Здесь кодируется только средний сигнал между каналами (фактически становится моно). Сохраняется только разность в мощности сигнала между каналами. Такая потеря качества на высоких BR неприемлема, но на низких BR данная методика позволяет получить достаточно качественный сигнал.

Дополнительно

Многие форматы поддерживают возможность записывать в сам файл песни дополнительную текстовую или даже графическую информацию: ID3 tag.В Тэгах может содержаться информация об исполнителе песни, жанре, альбоме, годе выхода и т.д. Нужно не путать Тэги с названием файлов – это разные вещи. Они бывает двух версий: версия 1 и 2. Во 2-ой версии больше различный полей для записи.

В некоторых форматах может использоваться DRM (формат защиты авторских прав). Т.е. файл может быть защищен от копирования, не воспроизводиться на каких-либо устройствах и т.д.

Многие форматы поддерживают многоканальный звук, т.е. не только стерео, а большее количество каналов. Часто, например на DVD диске с фильмом можно увидеть надпись: звук DD 5.1. Что же означают цифры 5.1 – это значит, что звук закодирован в 5 каналов+специальный низкочастотный – итого 6 каналов. Низкочастотный канал (сигнал) предназначен для низкочастотной колонки (сабвуфера). Эта колонка служит только для воспроизведения басов, причем ее можно поставить практически в любое местов комнате, т.к. человеческое ухо не может спозиционировать низкочастотный источник звука. Сабвуфер придумали для того, что бы уменьшить размеры остальных колонок, т.к. для вопроизведения басов требуется динамик большого размера.

Если написано, что звук в формате DD 2.0. это значит, что это просто стерео и нет отдельной дорожки для сабвуфера. Буквы DD означают Dolby Digital – формат звука в DVD-фильмах, формат неплохой, но в большинстве случаев лучше звучит DTS (Digital Theater System), т.к. он оптимизирован именно для фильмов и имеет больший битрейт.

 

Портативная аудиотехника, плееры и их особенности

СD – MP3 плееры

Очень вкратце, т.к. сейчас их практически нет в продаже.

При считывании информации с диска важно, чтобы луч лазера не сбивался с дорожки, а так как эти дорожки очень маленькие а механическая система несовершенна, то в CD-MP3 плеерах используется система антишока (что бы звук не прерывался).

Антишоковая система или Electronic Skip Protection– система защиты от тряски, основанная на буферной памяти. Плеер постоянно считывает информацию на некоторое время вперёд в буферную память. Если из-за тряски луч сбивается, пользователь слушает музыку, предварительно записанную в буферную память, и у плеера есть время для поиска нужного места. Измеряется в секундах. Продолжительность антишока зависит: от ёмкости буферной памяти, от воспроизводимого формата и от битрейта записи. В Panasonic “Anti – Skip – Sistem”, Philips и BBK “ESP”, SAMSUNG “Anti Shock” или “VEOS”, iRiver “Shock Free” – и любое сочетание слова «Anti» со словами «Shock» «Skip». Все производители (кроме Sony и Aiwa) делают ставку на объём буферной памяти – эта система действенна при коротких сильных толчках.

«G-ProtectionJog Proof»от Sony – механическая защита от тряски. Основной принцип работы система механически компенсирует колебания, появляющиеся из-за тряски, а считывающая лазерная головка после каждой встряски автоматически «подруливает» к тому месту, на котором произошел сбой. Буферная память значительно меньше.

Flash плееры (и диктофоны)

В настоящее время функционал МР3-плеера существенно расширился, в продаже уже проблематично найти просто плеер для воспроизведения музыки, большинство современных моделей поддерживают отображение картинок, видео и текста. Плюс практически в каждую модель плеера встроены радио и диктофон.

Разберем функциональные особенности плееров.

Поддержка видео.

Часто в характеристиках плеера можно увидеть очень много поддерживаемых видео форматов (avi, mpeg4 и тд.), но в большинстве случаев плеера поддерживают видео строго определенного формата, разрешения и с определенной частотой кадров, т.е. для 95% плееров видео необходимо конвертировать. Делается это с помощью специальной программы, котороя идет в комплекте с плеером (на диске или в памяти плеера). Поэтому просто так посмотреть любимый фильм или концерт не получится, нужно еще потратить время на его конвертацию.

Поддержка графических форматов.

Здесь все проще – большинство плееров с сенсорным дисплеем поддерживают отображение JPEG файлов, некоторые могут это делать в режиме слайд-шоу во время проигрывания музыки.

Поддержка текста.

В настоящий момент плееры поддерживают только файлы в формате ТХТ и в определенной кодировке. Из-за небольшого дисплея читать на плеере не очень удобно (есть конечно исключения: плееры с большим дисплеем).

Беспроводные технологии

Существуют плееры с Bluetooth и Wi-Fi. Наличие Bluetooth позволяет напрямую к плееру подключать bluetooth-наушники, передавать файлы и даже соединять плеер с телефоном и использовать плеер в качестве гарнитуры. Wi-Fi позволяет плееру выходить в интернет и даже скачивать файлы оттуда.

Радио

Во Flash-плеерах используется только FM-приемник (ультракороткие волны) чаще всего диапазона 87,5 – 108 МГц, что позволяет принимать большинство радиостанций (даже не обязательно в крупных городах). AM-приемник (средние волны) в плеера не встраивают, т.к. для него нужна специальная антенна (для FM-достаточно провода для наушников).

Диктофон

Возможность записи на встроенный в плеер диктофон. Иногда спрашивают, какой плеер лучше всего подойдет для, например, записи лекций? Можно сказать, что все современные плееры пишут примерно одинаково, т.е. разборчиво записывают голос с расстояния в несколько метров (в тихом помещении). На качество диктофона влияет очень многое, начиная от качества самого микрофона и расположением его в корпусе плеера, и заканчивая форматом записи. Диктофонные записи в большинстве плееров сохраняются в формате WAV (несжатом), т.к. это проще всего реализовать технически. Для уменьшения объема записи применяется пониженная (по сравнению с CD) частота дискретизации и битность. При записи голоса качественная оцифровка не очень важна. Иногда плееры записывают в формате МР3, в таком случае запись при том же качестве занимает существенно меньше места.

Системы навигации в плеерах

Найти нужную композицию для воспроизведения можно двумя способами:

1. Когда плеер предлагает выбрать исполнителя или альбом, или может вывести список всех песен. Эти данные плеер берет из ID3 тэгов. В большинстве случаев такой способ навигации удобен (можно выбрать исполнителя и проиграть все его песни), но иногда он не подходит. Например, если вы слушаете сборник с разными исполнителями (тут поможет создание плейлистов, но это занимает время) или у вас не прописаны тэги. Такая система навигации называется «навигация по тэгам».

2. Когда плеер отображает папки именно так, как вы их в него закачивали и может проигрывать содержимое этих папок (вы видите именно названия файлов и папок). Такая система навигации называется «навигация по файлам».

Часто в плеерах применяется обе системы навигации.

Подключение к ПК

Большинство плееров при подключении к компьютеру определяются как «съемный диск» и с ними можно работать как с флешкой. Такой способ подключения называет MSC, есть еще протокол MTP (синхронизация с Windows Media Player) и так же возможность просмотра файлов. В плееры iPod музыка закачивается с помощью программы iTunes или какой-либо сторонней программой (Winamp).

HDD плееры или плееры на базе жёсткого диска

Жесткий диск по принципу работы похож на CD, но в этом случае на диске дорожки с разной намагниченностью. Скорость вращения выше и головка диска не касается, а парит над ним. Антишок таким плеерам не нужен, т.к. головка жестко позиционируется с помощью электромагнитов. Но буфер есть, используется для экономии аккумулятора, т.е. при включении плеера он загоняет информацию в буфер и воспроизведение идет из него, а сам жесткий диск не работает в этот момент. Преимущество – большой объем (до 160 Гб) при небольших размерах и большая скорость обмена данными с компьютером. Недостатки – некоторая хрупкость, энергопотребление, размеры и вес.

Устройство цифрового фотоаппарата

Матрица. Характеристики матрицы – разрешение, физический размер, основы цветопередачи. ISO, Светочувствительность

Определяется числом светочувствительных элементов – пикселей. Например: 1600 на 1200 пикселей – это 1.920.000 пикселя, или 1,92 Мп, или округлённо – 2 Мп.

Разрешение матрицы иногда можно определить по первой цифре названия модели. Современные цифровые фотоаппараты, которые продаются в «Связном», имеют разрешения от 6Мп и больше.

В фотоаппарате, кроме максимального разрешения можно выбрать меньше. Чем меньше выбрано разрешение, тем меньше он будет занимать место в памяти фотоаппарата и в памяти сохранится большее число снимков.

От разрешения матрицы зависит будущий максимальный размер снимка при распечатке на бумаге: размер снимка тем больше, чем больше разрешение матрицы.

Разрешающая способность человеческого глаза такова, что с расстояния 20-25 см (а именно с такого расстояния обычно рассматриваются фотографии в альбомах) он не различает детали размером менее 0,01см. Дальше – проще: умножаем разрешение кадра на 0,01см и получаем размер фотографии, которую можно напечатать без потери качества.

Существует ещё один важный критерий качества, за который отвечает принтер при распечатке фотографии: число точек на квадратный дюйм для нанесения изображения, который измеряется в dpi. Дюйм – это 2,54 см, соответственно, квадратный дюйм – это квадрат 2,54 на 2,54.

Чем больше dpi, тем выше качество:

300 dpi – это 300 точек в ширину и в высоту на квадратный дюйм, всего 90.000. Если используется такое dpi – качество фотографии считается полиграфическим и превосходит качество стандартных фотографий.

 

Количество эффективных пикселей матрицы (Класс) Размер снимка в пикселях Формат отпечатка при разрешении фотопечати 300 dpi (118 точек/см) Ближайший "стандартный" размер фотобумаги, см
4 МП 2272 х 1704 19,3 х 14,4 20 х 15 (А5)
5 МП 2560 х 1920 21,7 х 16,3 20 х 15 (А5)
6 МП 2816 x 2112 23,9 х 17,9 24 х 18
7 МП 3072 x 2304 26,0 х 19,5 24 х 18
8 МП 3264 x 2448 27,7 х 20,7 29,7 х 21 (А4)
10 МП 3648 x 2736 30,9 х 23,2 29,7 х 21 (А4)

Матрица. Физический размер

Под характеристикой физический размер подразумевается именно тот размер, который можно измерить.

Размер матрицы указывается чаще всего по диагонали (как размер экрана телевизора) в дюймах. Используется не стандартный дюйм (1”=25,4мм), для измерения размеров матрицы используется другая величина 1”=16,9мм. Пример: 1/2”=8,45мм. Размер по диагонали – размер по ширине/высоте в мм (пропорция 4х3): 4/3"=22,5мм - 18,00x13,50мм; 1"=17мм - 12,80х9,60мм; 2/3"=11мм - 8,80х6,60мм; 1/1,8"=8,95мм - 7,18х5,35мм; 1/2,5"=6,76мм – 5,41х4,05мм; 1/2,7"=6,26мм - 5,01x3,76мм; 1/3,2"=5,28мм - 4,22x3,17мм. Для 1/2,5” и 1/3,2” используется вторая пропорция 3х2: 5,62х3,75 и 4,39х2,93мм.

Чем больше размер матрицы, при одинаковом разрешении, тем больше размер отдельного светочувствительного элемента (пикселя). Чем больше размер отдельного элемента, тем больше он захватывает света – вырабатывает более мощный электрический заряд и в итоге, лучше подавляет «шумы». Общий итог: меньше шумов и более чёткое изображение.

APS-C – матрицы зеркальных фотоаппаратов, большой размер которых (отдельных пикселей, в том числе) обеспечивает высокое качество снимков. Размеры варьируются от 20,7х13,8 и до 25,1х16,7мм и соответствуют значениям (пропорция 3х2).

Full Frame или APS– матрица по размерам равна плёночному кадру: 36х24мм, с диагональю 43 мм. Используется в профессиональных зеркальных фотоаппаратах.

Существует APS-H — «Высокого Разрешения», или High Definition. Размер 30,2 x 16.7мм; пропорции 16:9.

Кроп фактор (Kf) –отношение диагонали 35-мм пленки к диагонали матрицы. Большинство сенсоров выпускаемых цифровых камер имеют размер, меньший, чем у обычного кадра 24×36 мм. При использовании объектива, расчитанного на 35 мм кадр, на сенсор проецируется только центральная часть изображения, а оставшаяся часть «обрезается» краем матрицы.

 

Чтобы примерно рассчитать Кроп-фактор, нужно диагональ пленки поделить на диагональ матрицы.

 

Основы цветопередачи

Для начала стоит отметить, что пиксель матрицы – монохромный, т.е. может фиксировать только один цвет. Но, несмотря на это, даже ранние цифровые камеры регистрировали цветное изображение. Достигалось это посредством тройного экспонирования, при этом перед объективом располагалось так называемое цветовое колесо, представлявшее собой диск с тремя разноцветными - красной, синей и зелёной – именно благодаря смешению этих трех цветов можно получить всю цветовую палитру - стеклянными вставками. Поворот колеса производился сервоприводом после каждого экспонирования, затем три полученных снимка «складывались» в полноцветное изображение.

Вышеописанная техника, разумеется, совершенно не годилась для фотографирования движущихся объектов. В свою очередь, используемое оборудование представляло собой средне- и крупноформатную фототехнику и применялась только при студийной съёмке. Для репортажной съёмки требовалось другое решение.

Для регистрации цветного изображения за одно экспонирование была предложена схема с дихроичной призмой, расщепляющей световой поток на красную, синюю и зелёную составляющие. Каждая из этих составляющих регистрировалась своей ПЗС-матрицей, а при их комбинировании получалось полноцветное изображение. Данный вариант отлично подошёл для видеокамер, однако для регистрации статического изображения он не годился. Во-первых, при использовании дихроичной призмы падала яркость светового потока, что требовало удлинения выдержки либо раскрытия диафрагмы. Во-вторых, три матрицы высокого разрешения заметно повышали стоимость фотоаппарата. В-третьих, шумы всех трёх матриц складывались воедино, значительно ухудшая качество снимка.

В конечном итоге наибольшую популярность получили методы с интерполяцией цвета. Самой известной является аддитивная схема, разработанная в 1976 году доктором Брайсом Байером, сотрудником концерна Kodak.