Динамичен диапазон: компресиран или стандартен. Динамична компресия. Принцип на работа на компресора

Нека помислим върху въпроса - защо трябва да увеличаваме звука? За да чуете тихи звуци, които не се чуват в нашите условия (например, ако не можете да слушате силно, ако има външен шумв стаята и др.). Възможно ли е да усилите тихите звуци, като оставите силните сами? Оказва се, че е възможно. Тази техника се нарича компресия на динамичен обхват (DRC). За да направите това, трябва постоянно да променяте текущата сила на звука - усилвайте тихите звуци, силните - не. Най-простият закон за промяна на обема е линеен, т.е. Силата на звука се променя според закона output_loudness = k * input_loudness, където k е коефициентът на компресия на динамичния диапазон:

Фигура 18. Компресия на динамичния диапазон.

Когато k = 1, не се правят промени (изходният обем е равен на входния обем). На к< 1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k >1 - силата на звука ще намалее и динамичният обхват ще се увеличи.

Нека да разгледаме графиките на обема (k = 1/2: DD компресията се удвоява):

Фигура 19. Графики на силата на звука.

Както можете да видите в оригинала имаше както много тихи звуци, 30 dB под нивото на диалога, така и много силни - 30 dB над нивото на диалога. Че. динамичният обхват беше 60dB. След компресия силни звуцисамо с 15 dB по-високи, а тихите с 15 dB по-ниски от диалога (динамичният диапазон вече е 30 dB). Така силните звуци станаха значително по-тихи, а тихите станаха значително по-силни. В този случай няма преливане!

Сега нека да разгледаме хистограмите:

Фигура 20. Пример за компресиране.

Както можете ясно да видите, с усилване до +30dB, формата на хистограмата е добре запазена, което означава, че силните звуци остават добре изразени (те не отиват на максимум и не се отрязват, както се случва при обикновеното усилване) . Това произвежда тихи звуци. Хистограмата показва това зле, но разликата е много забележима на ухо. Недостатъкът на този метод е същите скокове на обема. Механизмът на тяхното възникване обаче се различава от скоковете на силата на звука, които се появяват при рязане, и техният характер е различен - те се появяват главно при много силно усилване на тихи звуци (а не при отрязване на силни, както при нормалното усилване). Прекомерното ниво на компресия води до изравняване на звуковата картина - всички звуци са склонни да бъдат с еднаква сила и неизразителност.

Прекомерното усилване на тихи звуци може да доведе до чуване на шум при запис. Следователно филтърът използва леко модифициран алгоритъм, така че нивото на шума да се повишава по-малко:

Фигура 21. Увеличаване на звука без увеличаване на шума.

Тези. при ниво на звука -50dB има инфлексия трансферна функцияи шумът ще се усили по-малко (жълта линия). При липса на такова огъване, шумът ще бъде много по-силен (сива линия). Тази проста модификация значително намалява количеството шум дори при много високи нива на компресия (1:5 компресия на картината). Нивото “DRC” във филтъра задава нивото на усилване за тихи звуци (при -50dB), т.е. Нивото на компресия 1/5, показано на фигурата, съответства на ниво +40dB в настройките на филтъра.

Динамична компресия(компресия на динамичния обхват, DRC) - стесняване (или разширяване в случай на разширител) на динамичния обхват на фонограмата. Динамичен диапазон, е разликата между най-тихия и най-силния звук. Понякога най-тихият звук в саундтрака ще бъде малко по-силен от нивото на шума, а понякога малко по-тих от най-силния. Хардуерните устройства и програми, които извършват динамична компресия, се наричат компресори, като се разграничават четири основни групи: самите компресори, ограничители, разширители и гейтове.

Тръбен аналогов компресор DBX 566

Компресия надолу и нагоре

Компресия надолу(Компресия надолу) намалява силата на звука, когато той започне да надвишава определен праг, оставяйки по-тихите звуци непроменени. Екстремна версия на компресията надолу е ограничител. Увеличете компресиятаКомпресията нагоре, от друга страна, увеличава силата на звука, ако е под прага, без да засяга по-силните звуци. В същото време и двата вида компресия стесняват динамичния диапазон на аудио сигнала.

Компресия надолу

Увеличете компресията

Разширител и порта

Ако компресорът намалява динамичния обхват, разширителят го увеличава. Когато нивото на сигнала се повиши над праговото ниво, разширителят го увеличава допълнително, като по този начин увеличава разликата между силни и тихи звуци. Устройства като това често се използват при записване на комплект барабани, за да се разделят звуците на един барабан от друг.

Тип разширител, който се използва не за усилване на силни звуци, а за намаляване на тихи звуци, които не надвишават прагово ниво (например фонов шум), се нарича Шумна врата. В такова устройство, веднага щом нивото на звука стане по-малко от прага, сигналът спира да преминава. Обикновено гейт се използва за потискане на шума по време на паузи. При някои модели можете да се уверите, че звукът не спира внезапно, когато достигне прагово ниво, а постепенно изчезва. В този случай скоростта на затихване се задава от контрола за затихване.

Портата, подобно на други видове компресори, може да бъде зависим от честотата(т.е. третира определени честотни ленти по различен начин) и може да работи в странична верига(виж отдолу).

Принцип на работа на компресора

Сигналът, влизащ в компресора, се разделя на две копия. Едно копие се изпраща към усилвател, в който степента на усилване се контролира от външен сигнал, а второто копие генерира този сигнал. Той влиза в устройство, наречено странична верига, където сигналът се измерва и въз основа на тези данни се създава обвивка, която описва промяната в неговия обем.
По този начин са проектирани повечето съвременни компресори, това е така нареченият feed-forward тип. При по-старите устройства (тип обратна връзка) нивото на сигнала се измерва след усилвателя.

Съществуват различни аналогови технологии за усилване с променливо усилване, всяка със своите предимства и недостатъци: лампови, оптични, използващи фоторезистори, и транзисторни. Когато работите с цифрово аудио (в звуков редактор или DAW), могат да се използват ваши собствени математически алгоритми или да се емулира работата на аналогови технологии.

Основни параметри на компресорите

Праг

Компресорът намалява нивото на аудио сигнала, ако амплитудата му надвишава определена прагова стойност (праг). Обикновено се посочва в децибели, с по-нисък праг (напр. -60 dB), което означава, че ще бъде обработено повече аудио от по-висок праг (напр. -5 dB).

съотношение

Степента на намаляване на нивото се определя от параметъра съотношение: съотношение 4:1 означава, че ако входното ниво е 4 dB над прага, изходното ниво ще бъде 1 dB над прага.
Например:
Праг = −10 dB
Вход = −6 dB (4 dB над прага)
Изход = −9 dB (1 dB над прага)

Важно е да се има предвид, че потискането на нивото на сигнала продължава известно време след като падне под праговото ниво и това време се определя от стойността на параметъра освобождаване.

Компресията с максимално съотношение ∞:1 се нарича ограничаваща. Това означава, че всеки сигнал над праговото ниво се отслабва до праговото ниво (с изключение на кратък период след внезапно увеличаване на входния обем). Вижте „Ограничител“ по-долу за повече подробности.

Примери за различни стойности на Ratio

Атака и освобождаване

Компресорът осигурява известен контрол върху това колко бързо реагира на промените в динамиката на сигнала. Параметърът Attack определя времето, необходимо на компресора да намали усилването до ниво, определено от параметъра Ratio. Освобождаването определя времето, през което компресорът, напротив, увеличава усилването или се връща към нормалното, ако нивото на входния сигнал падне под праговата стойност.

Фази на атака и освобождаване

Тези параметри показват времето (обикновено в милисекунди), необходимо за промяна на усилването с определено количество децибели, обикновено 10 dB. Например, в този случай, ако Attack е настроен на 1 ms, ще са необходими 1 ms, за да се намали усилването с 10 dB, и 2 ms, за да се намали усилването с 20 dB.

При много компресори параметрите Attack и Release могат да се регулират, но при някои те са предварително зададени и не могат да се регулират. Понякога те се обозначават като „автоматични“ или „зависими от програмата“, т.е. промяна в зависимост от входния сигнал.

Коляно

Друг параметър на компресора: твърдо/меко коляно. Той определя дали началото на компресията ще бъде рязко (твърдо) или постепенно (меко). Мекото коляно намалява забележимостта на прехода от сухия сигнал към компресирания сигнал, особено при високи стойности на съотношението и внезапни увеличения на силата на звука.

Твърда компресия на коляното и мека компресия на коляното

Пик и RMS

Компресорът може да реагира на пикови (краткосрочни максимални) стойности или на средното ниво на входния сигнал. Използването на пикови стойности може да доведе до резки колебания в степента на компресия и дори до изкривяване. Следователно компресорите прилагат средна функция (обикновено RMS) към входния сигнал, когато го сравняват с прагова стойност. Това дава по-комфортна компресия, по-близка до човешкото възприятие за сила на звука.

RMS е параметър, който отразява средната сила на звука на саундтрак. От математическа гледна точка RMS (средноквадратичен корен) е средната квадратична стойност на амплитудата на определен брой проби:

Стерео свързване

Компресор в режим на стерео свързване прилага еднакво усилване към двата стерео канала. Това избягва стерео смени, които могат да възникнат в резултат на индивидуална обработка на левия и десния канал. Това изместване се получава, ако например силен елемент се панорамира извън центъра.

Усилване на грима

Тъй като компресорът намалява общото ниво на сигнала, той обикновено добавя опция за фиксирано изходно усилване, за да постигне оптималното ниво.

Гледам напред

Функцията за прогнозиране е предназначена да решава проблеми, свързани както с твърде високи, така и с твърде ниски стойности на атака и освобождаване. Твърде много многоатаките не могат да прихващат ефективно преходни процеси и твърде малките може да не са удобни за слушателя. Когато използвате функцията за предварителен преглед, основният сигнал се забавя спрямо контролния сигнал, което ви позволява да започнете компресията предварително, дори преди сигналът да достигне праговата стойност.
Единственият недостатък на този метод е забавянето на сигнала, което в някои случаи е нежелателно.

Използване на динамична компресия

Компресията се използва навсякъде, не само в музикални саундтраци, но и навсякъде, където е необходимо да се увеличи общият обем без увеличаване на пиковите нива, където се използва евтино оборудване за възпроизвеждане на звук или ограничен канал за предаване (системи за публично оповестяване и комуникация, любителско радио, и т.н.).

Компресията се използва при възпроизвеждане на фонова музика (в магазини, ресторанти и др.), където забележими промени в силата на звука са нежелателни.

Но най-важната област на приложение на динамичната компресия е музикалното производство и излъчване. Компресията се използва, за да придаде на звука "плътност" и "драйв", за по-добро комбиниране на инструментите един с друг и особено при обработка на вокали.

Вокалите в рок и поп музиката често се компресират, за да се откроят от акомпанимента и да добавят яснота. Специален тип компресор, настроен само на определени честоти - де-есер - се използва за потискане на сибилантните фонеми.

В инструменталните части компресията се използва и за ефекти, които не са пряко свързани с силата на звука, например, бързо затихващите барабанни звуци могат да бъдат направени по-дълготрайни.

Електронната денс музика (EDM) често използва странични вериги (вижте по-долу) - например, бас линията може да се управлява от барабан или подобен, за да се предотврати сблъсък на баса и барабаните и да се създаде динамична пулсация.

Компресията се използва широко при излъчване (радио, телевизия, интернет излъчване) за увеличаване на възприеманата сила на звука, като същевременно се намалява динамичният обхват на аудио източника (обикновено CD). Повечето държави имат законови ограничения за максималния моментален обем, който може да се излъчва. Обикновено тези ограничения се изпълняват от постоянни хардуерни компресори във въздушната верига. Освен това увеличаването на възприеманата сила на звука подобрява „качеството“ на звука от гледна точка на повечето слушатели.

Вижте също Война на шума.

Последователно увеличаване на звука на същата песен, ремастерирана за CD от 1983 до 2000 г.

Странично свързване

Друг често срещан превключвател на компресора е „страничната верига“. В този режим компресията на звука не се извършва в зависимост от собственото му ниво, а в зависимост от нивото на сигнала, влизащ в конектора, който обикновено се нарича странична верига.

Има няколко приложения за това. Например, вокалистът шепне и всички "s" се открояват от общата картина. Прекарвате гласа му през компресор и подавате същия звук към конектора на страничната верига, но преминава през еквалайзер. С еквалайзера изрязвате всички честоти, с изключение на тези, използвани от вокалиста при произнасяне на буквата „s“. Обикновено около 5 kHz, но може да варира от 3 kHz до 8 kHz. Ако след това поставите компресора в режим на странична верига, гласът ще бъде компресиран в онези моменти, когато се произнася буквата „s“. Това доведе до устройство, известно като де-есер. Този начин на работа се нарича "честотно зависим".

Друга употреба на тази функция се нарича "ducker". Например в радиостанция музиката минава през компресор, а думите на диджея идват през странична верига. Когато диджеят започне да чати, силата на звука на музиката автоматично намалява. Този ефект може успешно да се използва и при записване, например за намаляване на силата на звука на партиите на клавиатурата по време на пеене.

Ограничаване на тухлена стена

Компресорът и лимитерът работят приблизително по същия начин; можем да кажем, че лимитерът е компресор с високо съотношение (от 10:1) и обикновено ниско време на атака.

Има концепция за ограничаване на тухлената стена - ограничаване с много високо съотношение (20:1 и повече) и много бърза атака. В идеалния случай той изобщо не позволява на сигнала да надвишава праговото ниво. Резултатът ще бъде неприятен за ухото, но това ще предотврати повреда на звуковъзпроизвеждащото оборудване или излишък честотна лентаканал. Много производители интегрират ограничители в своите устройства точно за тази цел.

Clipper vs. Ограничител, мек и твърд клипс

Технология за кодиране, използвана в DVD плейъри със собствена

звукови декодери и приемници. Компресията (или намаляването) на динамичния обхват се използва за ограничаване на звуковите пикове при гледане на филми. Ако зрителят иска да гледа филм, в който са възможни внезапни промени в силата на звука (филм за война,

например), но не иска да безпокои членовете на семейството си, тогава режимът DRC трябва да бъде включен. Субективно на слух след включване на DRC пропорцията в звука намалява ниски честотии високите звуци губят прозрачност, така че не трябва да включвате режима DRC, освен ако не е необходимо.

DreamWeaver (вижте – Първа страница)

Визуален редактор за хипертекстови документи, разработен от софтуерната компания Macromedia Inc. Мощен професионална програма DreamWeaver съдържа възможност за генериране на HTML страници с всякаква сложност и мащаб, а също така има вградена поддръжка за големи мрежови проекти. Това е инструмент за визуален дизайн, който поддържа усъвършенствани WYSIWYG концепции.

Шофьор (виж Шофьор)

Софтуерен компонент, който ви позволява да взаимодействате с устройства

компютри, като напр LAN карта(NIC), клавиатура, принтер или монитор. Мрежовото оборудване (като хъб), свързано към компютър, изисква драйвери, за да може компютърът да комуникира с оборудването.

DRM (Управление на цифрови права - Управление на достъпа и копиране на защитена с авторски права информация, Управление на цифрови права)

u Концепция, която включва използването на специални технологии и методи за защита на цифрови материали, за да се гарантира, че те се предоставят само на оторизирани потребители.

v Клиентска програма за взаимодействие с услугите за управление на цифрови права, която е проектирана да контролира достъпа до и копирането на информация, защитена с авторски права. DRM Services работи в Windows среда Server 2003: Клиентският софтуер ще работи на Windows 98, Me, 2000 и XP, позволявайки на приложения като Office 2003 да имат достъп до свързани услуги. Microsoft трябва да пусне модул за управление на цифрови права за браузъра в бъдеще Internet Explorer. В бъдеще се планира такава програма да бъде необходима на компютъра за работа с всяко съдържание, което използва DRM технологии за защита срещу незаконно копиране.

Дроид (робот) (виж. агент)

DSA(Алгоритъм за цифров подпис – Алгоритъм цифров подпис)

Алгоритъм за цифров подпис с публичен ключ. Разработено от NIST (САЩ) през 1991 г.

DSL (линия за цифрово подписване)

Модерна технология, поддържана от градски телефонни централи за обмен на сигнали по повече високи честоти, в сравнение с използваните в конвенционалните аналогови модеми. DSL модемът може да работи едновременно с телефон ( аналогов сигнал) и със цифрова линия. Тъй като спектрите гласов сигналот телефона и цифровия DSL сигнал не се „пресичат“, т.е. не си влияят взаимно, DSL ви позволява да сърфирате в интернет и да говорите по телефона на една и съща физическа линия. Освен това DSL технологията обикновено използва няколко честоти и DSL модемите от двете страни на линията се опитват да намерят най-добрите за предаване на данни. DSL модемът не само предава данни, но и действа като рутер. Оборудван с Ethernet порт, DSL модемът дава възможност за свързване на няколко компютъра към него.

DSOM(Разпределен системен обектен модел, Разпределен SOM – Разпределен системен обектен модел)

IBM технология с подходяща софтуерна поддръжка.

DSR? (Готов набор от данни – Сигнал за готовност на данните, DSR сигнал)

Сигнал на сериен интерфейс, показващ, че устройство (напр.

модем) е готов да изпрати малко данни към компютъра.

DSR? (Състояние на устройствотоДоклад - Доклад за състоянието на устройството)

DSR? (Регистър на състоянието на устройството - регистър на състоянието на устройството)

DSS? (Decision Support System - система за подпомагане на вземането на решения) (Вж.

Тази група методи се основава на факта, че предаваните сигнали претърпяват нелинейни амплитудни трансформации, а в предавателната и приемащата част нелинейностите са реципрочни. Например, ако нелинейната функция Öu се използва в предавателя, u 2 се използва в приемника. Последователното прилагане на реципрочни функции ще гарантира, че цялостната трансформация остава линейна.

Идеята на нелинейните методи за компресиране на данни е, че предавателят може със същата амплитуда на изходните сигнали да предава по-голям диапазон от промени в предавания параметър (т.е. по-голям динамичен диапазон). Динамичен диапазон- това е отношението на най-голямата допустима амплитуда на сигнала към най-малката, изразено в относителни единици или децибели:

;	(2.17)
.	(2.18)

Естественото желание за увеличаване на динамичния диапазон чрез намаляване на U min е ограничено от чувствителността на оборудването и нарастващото влияние на смущенията и собствения шум.

Най-често компресията на динамичния диапазон се извършва с помощта на двойка реципрочни функции на логаритъм и потенциране. Първата операция за промяна на амплитудата се извиква компресия(чрез компресия), втората - разширение(разтягане). Изборът на тези конкретни функции е свързан с техните най-големи възможности за компресиране.

В същото време тези методи имат и недостатъци. Първият от тях е, че логаритъма на малко число е отрицателен и е в границата:

това означава, че чувствителността е много нелинейна.

За да се намалят тези недостатъци, и двете функции са модифицирани чрез изместване и приближение. Например за телефонните канали апроксимираната функция има формата (тип А):

с А=87,6. Печалбата от компресията е 24 dB.

Компресирането на данни с помощта на нелинейни процедури се осъществява по аналогов начин с големи грешки. Приложение дигитална медияможе значително да подобри точността или ефективността на преобразуването. В същото време директното използване на компютърна технология (т.е. директно изчисляване на логаритми и експоненти) няма да даде най-добрия резултат поради ниската производителност и натрупването на грешки в изчисленията.

Поради ограниченията на точността, компресирането на данни чрез компресиране се използва в некритични случаи, например за предаване на реч по телефонни и радио канали.

Ефективно кодиране

Ефективни кодове бяха предложени от К. Шанън, Фано и Хъфман. Същността на кодовете е, че те са неравномерни, тоест с различен брой битове, а дължината на кода е обратно пропорционална на вероятността за възникването му. Друга страхотна характеристика на ефективните кодове е, че те не изискват разделители, тоест специални знаци, които разделят съседни кодови комбинации. Това се постига чрез спазване на просто правило: по-кратките кодове не са началото на по-дългите. В този случай непрекъснатият поток от битове се декодира уникално, тъй като декодерът първо открива по-кратките кодови думи. Ефективни кодове за дълго времебяха чисто академични, но в напоследъксе използват успешно при създаване на бази данни, както и при компресиране на информация в съвременни модеми и софтуерни архиватори.

Поради неравномерност се въвежда средната дължина на кода. Средна дължина - математическо очакване на дължината на кода:

освен това l av клони към H(x) отгоре (т.е. l av > H(x)).

Изпълнението на условие (2.23) става по-силно с увеличаване на N.

Има два вида ефективни кодове: Шанън-Фано и Хъфман. Нека да разгледаме как да ги получим с помощта на пример. Да приемем, че вероятностите на символите в последователността имат стойностите, дадени в таблица 2.1.

Таблица 2.1.

Символни вероятности

н
p i	0.1	0.2	0.1	0.3	0.05	0.15	0.03	0.02	0.05

Символите се класират, тоест представени в ред в низходящ ред на вероятностите. След това, използвайки метода на Шанън-Фано, периодично се повтаря следната процедура: цялата група събития се разделя на две подгрупи с еднакви (или приблизително еднакви) общи вероятности. Процедурата продължава докато остане един елемент в следващата подгрупа, след което този елемент се елиминира, а посочените действия продължават с останалите. Това се случва, докато в последните две подгрупи остане само един елемент. Нека продължим с нашия пример, който е обобщен в таблица 2.2.

Таблица 2.2.

Кодиране на Шанън-Фано

н	P i
4	0.3		аз
	0.2	аз	II
6	0.15		аз	аз
	0.1			II
1	0.1			аз	аз
9	0.05	II			II
5	0.05		II		аз
7	0.03			II	II	аз
8	0.02					II

Както се вижда от таблица 2.2, първият символ с вероятност p 4 = 0,3 участва в две процедури за разделяне на групи и двата пъти попада в група номер I. В съответствие с това той е кодиран с двуцифрен код II. Вторият елемент на първия етап на разделяне принадлежи към група I, на втория - към група II. Следователно неговият код е 10. Кодовете на останалите символи не се нуждаят от допълнителни коментари.

Обикновено нееднородните кодове се изобразяват като кодови дървета. Кодовото дърво е графика, показваща разрешените кодови комбинации. Посоките на ръбовете на този график са предварително зададени, както е показано на фиг. 2.11 (изборът на посоки е произволен).

Те навигират в графиката, както следва: създават маршрут за избрания символ; броят на битовете за него е равен на броя на ръбовете в маршрута, а стойността на всеки бит е равна на посоката на съответния ръб. Маршрутът се изготвя от началната точка (на чертежа е отбелязана с буквата А). Например маршрутът до връх 5 се състои от пет ръба, всички с изключение на последния имат посока 0; получаваме код 00001.

Нека изчислим ентропията и средната дължина на думата за този пример.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 бита

l ср. = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Както можете да видите, средната дължина на думата е близка до ентропията.

Кодовете на Huffman се конструират с помощта на различен алгоритъм. Процедурата за кодиране се състои от два етапа. На първия етап се извършват последователни единични компресии на азбуката. Еднократна компресия - замяна на последните два символа (с най-ниска вероятност) с един, с пълна вероятност. Компресиите се извършват, докато останат два знака. В същото време се попълва таблица за кодиране, в която се въвеждат получените вероятности и се изобразяват маршрутите, по които се движат новите символи на следващия етап.

На втория етап се извършва същинското кодиране, което започва от последния етап: на първия от двата символа се присвоява код 1, на втория - 0. След това те преминават към предишния етап. Кодовете от следващия етап се присвояват на символите, които не са участвали в компресията на този етап, а кодът на символа, получен след залепването, се присвоява два пъти на последните два символа и се добавя към кода на горния символ 1, по-ниска - 0. Ако символът не участва по-нататък в залепването, кодът му остава непроменен. Процедурата продължава до края (т.е. до първия етап).

Таблица 2.3 показва кодирането на Huffman. Както се вижда от таблицата, кодирането е извършено на 7 етапа. Отляво са вероятностите на символите, отдясно са междинните кодове. Стрелките показват движението на новообразуваните символи. На всеки етап последните два символа се различават само в най-малкия бит, който съответства на техниката на кодиране. Нека изчислим средната дължина на думата:

l ср. = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Това е още по-близо до ентропията: кодът е още по-ефективен. На фиг. Фигура 2.12 показва кодовото дърво на Huffman.

Таблица 2.3.

Кодиране на Хъфман

н	p i	код	аз	II	III	IV	V	VI	VII
	0.3		0.3 11	0.3 11	0.3 11	0.3 11	0.3 11	0.4 0	0.6 1
	0.2		0.2 01	0.2 01	0.2 01	0.2 01	0.3 10	0.3 11	0.4 0
	0.15		0.15 101	0.15 101	0.15 101	0.2 00	0.2 01	0.3 10
	0.1		0.1 001	0.1 001	0.15 100	0.15 101	0.2 00
	0.1		0.1 000	0.1 000	0.1 001	0.15 100
	0.05		0.05 1000	0.1 1001	0.1 000
	0.05		0.05 10011	0.05 1000
	0.03		0.05 10010
	0.02

И двата кода отговарят на изискването за недвусмислено декодиране: както може да се види от таблиците, по-кратките комбинации не са началото на по-дългите кодове.

С увеличаването на броя на знаците ефективността на кодовете се увеличава, така че в някои случаи се кодират по-големи блокове (например, ако говорим за текстове, могат да бъдат кодирани някои от най-често срещаните срички, думи и дори фрази).

Ефектът от въвеждането на такива кодове се определя чрез сравняването им с единен код:

(2.24)

където n е броят битове от унифицирания код, който се заменя с ефективния.

Модификации на кодовете на Хъфман

Класическият алгоритъм на Хъфман е алгоритъм с две преминавания, т.е. изисква първо събиране на статистически данни за символи и съобщения, а след това процедурите, описани по-горе. Това е неудобно на практика, защото увеличава времето, необходимо за обработка на съобщения и натрупване на речник. По-често се използват еднопроходни методи, при които се комбинират процедурите за натрупване и кодиране. Такива методи се наричат още адаптивна компресия според Huffman [46].

Същността на адаптивната компресия според Хъфман се свежда до изграждането на първоначално кодово дърво и неговата последователна промяна след пристигането на всеки следващ символ. Както и преди, дърветата тук са двоични, т.е. Най-много две дъги излизат от всеки връх на дървовидната графика. Обичайно е първоначалният връх да се нарича родител, а двата следващи върха, свързани с него, като деца. Нека въведем понятието тегло на върха - това е броят символи (думи), съответстващи на даден връх, получени при захранване на оригиналната последователност. Очевидно сборът от теглата на децата е равен на теглото на родителя.

След въвеждане на следващия символ на входната последователност, кодовото дърво се преразглежда: теглата на върховете се преизчисляват и, ако е необходимо, върховете се пренареждат. Правилото за пермутиране на върховете е следното: теглата на долните върхове са най-малки, а върховете, разположени отляво на графа, имат най-малко тегла.

В същото време върховете са номерирани. Номерирането започва от долните (висящи, т.е. без деца) върхове отляво надясно, след което се премества до Най-високо нивои т.н. преди да номерирате последния, оригинален връх. В този случай се постига следният резултат: колкото по-малко е теглото на един връх, толкова по-малък е неговият номер.

Пермутацията се извършва главно за висящи върхове. При пермутиране трябва да се вземе предвид правилото, формулирано по-горе: върховете с по-голямо тегло имат по-голям брой.

След преминаване на последователността (наричана още контролна или тестова), на всички висящи върхове се присвояват кодови комбинации. Правилото за присвояване на кодове е подобно на горното: броят на битовете на кода е равен на броя на върховете, през които преминава маршрутът от източника до дадения висящ връх, а стойността на конкретен бит съответства на посоката от родителя към „детето“ (да речем, отиването вляво от родителя съответства на стойността 1, вдясно - 0).

Получените кодови комбинации се съхраняват в паметта на компресорното устройство заедно с техните аналози и образуват речник. Използването на алгоритъма е както следва. Компресираната последователност от символи се разделя на фрагменти в съответствие със съществуващия речник, след което всеки от фрагментите се заменя със своя код от речника. Фрагменти, които не се намират в речника, образуват нови висящи върхове, придобиват тежест и също се въвеждат в речника. По този начин се формира адаптивен алгоритъм за попълване на речника.

За повишаване на ефективността на метода е желателно да се увеличи размерът на речника; в този случай степента на компресия се увеличава. На практика размерът на речника е 4 - 16 KB памет.

Нека илюстрираме дадения алгоритъм с пример. На фиг. Фигура 2.13 показва оригиналната диаграма (наричана още дървото на Хъфман). Всеки връх на дървото е показан с правоъгълник, в който през дроб са вписани две числа: първото означава номер на върха, второто означава неговото тегло. Както можете да видите, съответствието между теглата на върховете и техните номера е изпълнено.

Нека сега приемем, че символът, съответстващ на връх 1, се появява втори път в тестовата последователност. Теглото на върха се е променило, както е показано на фиг. 2.14, в резултат на което е нарушено правилото за номериране на върховете. На следващия етап променяме местоположението на висящите върхове, за което разменяме върхове 1 и 4 и преномерираме всички върхове на дървото. Получената графика е показана на фиг. 2.15. След това процедурата продължава по същия начин.

Трябва да се помни, че всеки висящ връх в дървото на Хъфман съответства на определен символ или група от символи. Родителят се различава от децата по това, че групата от символи, съответстваща на него, е с един символ по-къса от тази на неговите деца и тези деца се различават по последния символ. Например символите "кола" съответстват на родителя; тогава децата могат да имат последователностите "кара" и "карп".

Даденият алгоритъм не е академичен и се използва активно в програми за архивиране, включително при компресиране на графични данни (те ще бъдат разгледани по-долу).

Алгоритми на Лемпел–Зив

Това са най-често използваните алгоритми за компресиране днес. Те се използват в повечето програми за архивиране (например PKZIP. ARJ, LHA). Същността на алгоритмите е, че определен набор от символи се заменя по време на архивиране с неговия номер в специално генериран речник. Например, често се среща в делова кореспонденцияфразата „Изходящият номер за вашето писмо...“ може да заеме позиция 121 в речника; тогава, вместо да предавате или съхранявате споменатата фраза (30 байта), можете да съхраните номера на фразата (1,5 байта в двоична десетична форма или 1 байт в двоична).

Алгоритмите са кръстени на авторите, които първи са ги предложили през 1977 г. От тях първият е LZ77. За архивиране се създава така нареченият плъзгащ се прозорец за съобщения, състоящ се от две части. Първата част, по-голям формат, служи за формиране на речник и е с размер около няколко килобайта. Втората, по-малка част (обикновено с размер до 100 байта) получава текущите символи на разглеждания текст. Алгоритъмът се опитва да намери набор от знаци в речника, който съответства на получените в прозореца за преглед. Ако това е успешно, се генерира код, състоящ се от три части: отместването в речника спрямо първоначалния му подниз, дължината на този подниз и знака след този подниз. Например избраният подниз се състои от знаците "app" (общо 6 знака), следващият знак е "e". Тогава, ако поднизът има адрес (място в речника) 45, тогава записът в речника изглежда като „45, 6. e“. След това съдържанието на прозореца се измества по позиции и търсенето продължава. Така се образува речник.

Предимството на алгоритъма е лесно формализиран алгоритъм за съставяне на речник. Освен това е възможно да се разархивира без оригиналния речник (препоръчително е да има тестова последователност) - речникът се формира по време на разархивирането.

Недостатъците на алгоритъма се проявяват с увеличаване на размера на речника - времето за търсене се увеличава. Освен това, ако в текущия прозорец се появи низ от знаци, който не е в речника, всеки знак се записва с код от три елемента, т.е. Резултатът не е компресия, а разтягане.

Най-добри функцииима алгоритъма LZSS, предложен през 1978 г. Има разлики в поддръжката на плъзгащи се прозорци и изходните кодове на компресора. В допълнение към прозореца, алгоритъмът генерира двоично дърво, подобно на дърво на Хъфман, за да ускори търсенето на съвпадения: всеки подниз, напускащ текущия прозорец, се добавя към дървото като едно от децата. Този алгоритъм ви позволява допълнително да увеличите размера на текущия прозорец (желателно е размерът му да е равен на степен две: 128, 256 и т.н. байта). Кодовете на последователността също се формират по различен начин: въвежда се допълнителен 1-битов префикс, за да се разграничат некодираните знаци от двойките „отместване, дължина“.

Още по-висока степен на компресия се получава при използване на алгоритми като LZW. Описаните по-горе алгоритми имат фиксиран размер на прозореца, което прави невъзможно въвеждането на фрази, по-дълги от размера на прозореца в речника. В алгоритмите LZW (и техния предшественик LZ78) прозорецът за преглед има неограничен размер, а речникът натрупва фрази (а не колекция от знаци, както преди). Речникът е с неограничена дължина, а енкодерът (декодерът) работи в режим на изчакване на фраза. Когато се формира фраза, която съвпада с речника, се издава код за съвпадение (т.е. кодът на тази фраза в речника) и кодът на знака след нея. Ако с натрупването на символи се формира нова фраза, тя също се въвежда в речника, като по-кратката. Резултатът е рекурсивна процедура, която осигурява бързо кодиране и декодиране.

Допълнителна възможносткомпресията осигурява компресирано кодиране на повтарящи се знаци. Ако в последователност някои знаци следват подред (например в текста това могат да бъдат знаци за интервал, в числова последователност - последователни нули и т.н.), тогава има смисъл да ги замените с двойката „символ; дължина" или "знак, дължина" ". В първия случай кодът показва знака, че последователността ще бъде кодирана (обикновено 1 бит), след това кода на повтарящия се знак и дължината на последователността. Във втория случай (предоставен за най-често срещаните повтарящи се знаци), префиксът просто показва знак за повторение.

Или фотографска ширинафотографският материал е съотношението между максималните и минималните стойности на експозицията, които могат да бъдат правилно заснети на снимката. Когато се прилага към цифровата фотография, динамичният обхват всъщност е еквивалентен на съотношението на максималните и минималните възможни стойности на полезния електрически сигнал, генериран от фотосензора по време на експозиция.

Динамичният обхват се измерва в спирания на експозицията (). Всяка стъпка съответства на удвояване на количеството светлина. Така например, ако определена камера има динамичен обхват от 8 EV, това означава, че максималната възможна стойност на полезния сигнал на нейната матрица е свързана с минималната като 2 8: 1, което означава, че камерата е в състояние да заснема обекти, които се различават по яркост в рамките на един кадър не повече от 256 пъти. По-точно, той може да заснеме обекти с всякаква яркост, но обектите, чиято яркост надвишава максимално допустимата стойност, ще изглеждат ослепително бели на снимката, а обектите, чиято яркост ще бъде по-ниска минимална стойност, – черни въглища. Детайли и текстура ще се виждат само върху онези обекти, чиято яркост попада в динамичния обхват на камерата.

За да се опише връзката между яркостта на най-светлите и най-тъмните обекти, които се снимат, често се използва не съвсем правилният термин „динамичен диапазон на сцената“. Би било по-правилно да говорим за диапазон на яркост или ниво на контраст, тъй като динамичният диапазон обикновено е характеристика на измервателното устройство (в в такъв случай, матрици на цифров фотоапарат).

За съжаление диапазонът на яркост на много от красивите сцени, на които се натъкваме Истински живот, може значително да надхвърли динамичния обхват на цифров фотоапарат. В такива случаи фотографът е принуден да реши кои обекти трябва да бъдат разработени в пълни детайли и кои могат да бъдат оставени извън динамичния диапазон, без да се компрометира творческият замисъл. За да се възползвате максимално от динамичния обхват на вашия фотоапарат, понякога може да се нуждаете не толкова от задълбочено разбиране на това как работи фотосензорът, а по-скоро от развит артистичен усет.

Фактори, ограничаващи динамичния обхват

Долната граница на динамичния диапазон се определя от нивото на собствения шум на фотосензора. Дори неосветена матрица генерира фонов електрически сигнал, наречен тъмен шум. Също така, смущения възникват, когато зарядът се прехвърля към аналогово-цифровия преобразувател, а самият ADC внася известна грешка в цифровизирания сигнал - т.нар. шум при вземане на проби.

Ако снимате в пълна тъмнина или с капачка на обектива, камерата ще запише само този безсмислен шум. Ако позволите минимално количество светлина да достигне сензора, фотодиодите ще започнат да се натрупват електрически заряд. Големината на заряда, а оттам и интензитетът на полезния сигнал, ще бъдат пропорционални на броя на уловените фотони. За да се появят значими детайли в изображението, е необходимо нивото на полезния сигнал да надвишава нивото на фоновия шум.

По този начин долната граница на динамичния диапазон или, с други думи, прагът на чувствителност на сензора може формално да се определи като нивото на изходния сигнал, при което съотношението сигнал/шум е по-голямо от единица.

Горната граница на динамичния диапазон се определя от капацитета на отделен фотодиод. Ако по време на експозицията някой фотодиод натрупа електрически заряд с максималната си стойност, тогава пикселът на изображението, съответстващ на претоварения фотодиод, ще стане напълно бял и по-нататъшното облъчване няма да повлияе по никакъв начин на неговата яркост. Това явление се нарича клипинг. Колкото по-голям е капацитетът на претоварване на фотодиода, толкова по-голям е изходният сигнал, който той може да произведе, преди да достигне насищане.

За по-голяма яснота нека се обърнем към характеристичната крива, която е графика на изходния сигнал спрямо експозицията. Хоризонталната ос представлява двоичния логаритъм на радиацията, получена от сензора, а вертикалната ос представлява двоичния логаритъм на големината на електрическия сигнал, генериран от сензора в отговор на това излъчване. Моята рисунка е до голяма степен конвенционална и служи само за илюстративни цели. Характеристичната крива на истински фотосензор има малко по-сложна форма и нивото на шума рядко е толкова високо.

Графиката ясно показва две критични повратни точки: в първата от тях нивото на полезния сигнал преминава прага на шума, а във втората фотодиодите достигат насищане. Стойностите на експозицията, които се намират между тези две точки, съставляват динамичния диапазон. В този абстрактен пример тя е равна, както е лесно да се види, на 5 EV, т.е. Камерата може да се справи с пет удвоявания на експозицията, което е еквивалентно на 32-кратна (2 5 = 32) разлика в яркостта.

Зоните на експозиция, които съставляват динамичния диапазон, са неравни. Горните зони имат по-високо съотношение сигнал/шум и следователно изглеждат по-чисти и по-подробни от долните. В резултат на това горната граница на динамичния диапазон е много значителна и забележима - изрязването прекъсва светлината при най-малкото преекспониране, докато долната граница е незабележимо удавена в шум, а преходът към черно не е толкова остър, колкото към бялото.

Линейната зависимост на сигнала от експозицията, както и рязкото покачване до плато, са уникални характеристики на цифровия фотографски процес. За сравнение, погледнете характеристичната крива на традиционния фотографски филм.

Формата на кривата и особено ъгълът на наклон силно зависят от вида на филма и от процедурата за неговото проявяване, но основната, забележителна разлика между филмовата графика и цифровата остава непроменена - нелинейният характер на зависимостта на оптичната плътност на филма върху стойността на експозицията.

Долната граница на фотографската ширина на негативния филм се определя от плътността на воала, а горната граница се определя от максималната постижима оптична плътност на фотографския слой; за реверсивните филми е обратното. Както в сенките, така и в светлите части се наблюдават плавни завои на характерната крива, което показва спад на контраста при приближаване до границите на динамичния диапазон, тъй като наклонът на кривата е пропорционален на контраста на изображението. По този начин зоните на експозиция, разположени в средната част на графиката, имат максимален контраст, докато в светлите и сенките контрастът е намален. На практика разликата между филм и цифрова матрица е особено забележима в светлите части: когато в цифрово изображение светлите точки са изгорени чрез изрязване, на филма детайлите все още са видими, макар и с нисък контраст, и преходът към чисто бял цвятизглежда гладка и естествена.

В сенситометрията се използват дори два независими термина: всъщност фотографска ширина, ограничена от относително линейна част от характеристичната крива, и полезна фотографска ширина, която освен линейния участък включва още основата и рамото на диаграмата.

Трябва да се отбележи, че при обработката на цифрови снимки, като правило, към тях се прилага повече или по-малко изразена S-образна крива, увеличавайки контраста в средните тонове за сметка на намаляването му в сенките и светлите точки, което придава на цифровото изображение по-голяма естествен и приятен за окото вид.

Битова дълбочина

За разлика от матрицата на цифров фотоапарат, човешкото зрение се характеризира с, да кажем, логаритмичен поглед върху света. Последователните удвоявания на количеството светлина се възприемат от нас като еднакви промени в яркостта. Леките числа дори могат да бъдат сравнени с музикални октави, тъй като двойните промени в честотата на звука се възприемат от ухото като единичен музикален интервал. Други сетива работят на този принцип. Нелинейността на възприятието значително разширява обхвата на човешката чувствителност към стимули с различна интензивност.

При конвертиране на RAW файл (няма значение - с помощта на камерата или в RAW конвертор), съдържащ линейни данни, т.нар. гама крива, която е предназначена за нелинейно увеличаване на яркостта цифрово изображение, привеждайки го в съответствие с характеристиките на човешкото зрение.

При линейно преобразуване изображението е твърде тъмно.

След гама корекция яркостта се връща към нормалното.

Гама-кривата разтяга тъмните тонове и компресира светлите, което прави разпределението на градациите по-равномерно. Резултатът е естествено изглеждащо изображение, но шумът и артефактите на семплиране в сенките неизбежно стават по-забележими, което само се влошава от малкия брой нива на яркост в долните зони.

Линейно разпределение на градациите на яркостта.

Равномерно разпределение след прилагане на гама кривата.

ISO и динамичен диапазон

Въпреки факта, че цифровата фотография използва същата концепция за фоточувствителност на фотографския материал, както във филмовата фотография, трябва да се разбере, че това се случва единствено поради традицията, тъй като подходите за промяна на фоточувствителността в цифровата и филмовата фотография са коренно различни.

Увеличаването на ISO чувствителността в традиционната фотография означава замяна на един филм с друг с по-едро зърно, т.е. Налице е обективна промяна в свойствата на самия снимков материал. В цифровия фотоапарат светлочувствителността на сензора е строго определена от неговите физически характеристики и не може да се променя в буквалния смисъл на думата. Когато увеличава ISO, фотоапаратът не променя действителната чувствителност на сензора, а само усилва електрическия сигнал, генериран от сензора в отговор на облъчване, и съответно настройва алгоритъма за цифровизация за този сигнал.

Важна последица от това е, че ефективният динамичен диапазон намалява пропорционално на нарастването на ISO, тъй като заедно с полезния сигнал се увеличава и шумът. Ако при ISO 100 целият диапазон от стойности на сигнала е цифровизиран - от нула до точката на насищане, тогава при ISO 200 само половината от капацитета на фотодиодите се приема като максимум. При всяко удвояване на ISO чувствителността горната стъпка на динамичния диапазон се отрязва и останалите стъпки се изтеглят на нейно място. Ето защо използването на свръхвисоки ISO стойности няма практически смисъл. Със същия успех можете да осветите снимката в RAW конвертор и да получите сравнимо ниво на шума. Разликата между увеличаването на ISO и изкуственото осветяване на изображението е, че при увеличаване на ISO, сигналът се усилва преди да влезе в ADC, което означава, че шумът от квантуване не се усилва, за разлика от собствения шум на сензора, докато в RAW конвертора е подлежи на усилване, включително ADC грешки. В допълнение, намаляването на обхвата на семплиране означава по-точно семплиране на оставащите стойности на входния сигнал.

Между другото, намаляването на ISO под базовата стойност (например до ISO 50), налично на някои устройства, изобщо не разширява динамичния диапазон, а просто намалява сигнала наполовина, което е еквивалентно на потъмняване на изображението в RAW конвертора. Тази функция дори може да се счита за вредна, тъй като използването на подминимална ISO стойност провокира камерата да увеличи експозицията, което, докато прагът на насищане на сензора остава непроменен, увеличава риска от изрязване в светлите моменти.

Истински динамичен обхват

Има редица програми като (DxO Analyzer, Imatest, RawDigger и т.н.), които ви позволяват да измервате динамичния обхват на цифров фотоапарат у дома. По принцип това не е много необходимо, тъй като данните за повечето камери могат да бъдат намерени свободно в Интернет, например на уебсайта DxOMark.com.

Трябва ли да вярваме на резултатите от подобни тестове? Съвсем. С единствената уговорка, че всички тези тестове определят ефективния или, така да се каже, технически динамичен диапазон, т.е. връзката между нивото на насищане и нивото на шума на матрицата. За един фотограф най-важен е полезният динамичен диапазон, т.е. броя на зоните на експозиция, които наистина ви позволяват да заснемете полезна информация.

Както си спомняте, прагът на динамичния обхват се определя от нивото на шума на фотосензора. Проблемът е, че на практика долните зони, които технически вече са включени в динамичния диапазон, все още съдържат твърде много шум, за да бъдат използвани полезно. Тук много зависи от индивидуалното отвращение - всеки определя приемливото ниво на шум за себе си.

Моето субективно мнение е, че детайлите в сенките започват да изглеждат повече или по-малко прилични, когато съотношението сигнал / шум е поне осем. На тази основа определям полезния динамичен обхват като технически динамичен обхват минус около три стопа.

Например, ако една DSLR камера, според надеждни тестове, има динамичен обхват от 13 EV, което е много добро за днешните стандарти, тогава нейният полезен динамичен обхват ще бъде около 10 EV, което като цяло също е доста добро. Разбира се, говорим за снимане в RAW, с минимално ISO и максимална битова дълбочина. Когато снимате JPEG, динамичният обхват е силно зависим от настройките на контраста, но средно трябва да се откажете от още две или три спирания.

За сравнение: филмите с обръщане на цвета имат полезна фотографска ширина от 5-6 стопа; черно-белите негативни филми дават 9-10 стопа при стандартни процедури за проявяване и печат, а при определени манипулации - до 16-18 стопа.

За да обобщим горното, нека се опитаме да формулираме няколко прости правила, чието спазване ще ви помогне да изстискате максимална производителност от сензора на вашия фотоапарат:

Динамичният обхват на цифров фотоапарат е напълно достъпен само при снимане в RAW.
Динамичният диапазон намалява с увеличаване на светлочувствителността, така че избягвайте високи ISO настройки, освен ако не е абсолютно необходимо.
Използването на по-висока битова дълбочина за RAW файлове не увеличава истинския динамичен диапазон, но подобрява разделянето на тоновете в сенките чрез Повече ▼нива на яркост.
Изложение вдясно. Горните зони на експозиция винаги съдържат максимума полезна информацияс минимален шум и трябва да се използва най-ефективно. В същото време не забравяйте за опасността от изрязване - пикселите, които са достигнали насищане, са абсолютно безполезни.

И най-важното: не се притеснявайте твърде много за динамичния обхват на вашата камера. Динамичният му диапазон е добър. Вашата способност да виждате светлина и да управлявате правилно експозицията е много по-важна. Добрият фотограф няма да се оплаква от липсата на фотографска свобода, но ще се опита да изчака по-удобно осветление, или да промени ъгъла, или да използва светкавицата, с една дума, ще действа в съответствие с обстоятелствата. Ще ви кажа повече: някои сцени печелят само от факта, че не се вписват в динамичния диапазон на камерата. Често ненужното изобилие от детайли просто трябва да се скрие в полу-абстрактен черен силует, което прави снимката едновременно по-лаконична и по-богата.

Високият контраст не винаги е нещо лошо – просто трябва да знаете как да работите с него. Научете се да използвате както недостатъците на оборудването, така и неговите предимства и ще се изненадате колко ще се разширят вашите творчески възможности.

Благодаря за вниманието!

Василий А.

Post scriptum

Ако сте намерили статията за полезна и информативна, можете любезно да подкрепите проекта, като допринесете за неговото развитие. Ако статията не ви е харесала, но имате мисли как да я подобрите, вашата критика ще бъде приета с не по-малка благодарност.

Моля, не забравяйте, че тази статия е обект на авторско право. Препечатването и цитирането са допустими при наличие на валидна връзка към източника и използвания текст не трябва да бъде изкривен или модифициран по никакъв начин.