Основы цифрового звука
Основы цифрового звука
Напомним основные принципы и понятия, связанные со звукозаписью и обработкой звука. Звук – это колебания плотной среды, в частности воздуха, которые распространяются в виде волн – области сжатия чередуются с областями разрежения. Частота колебаний измеряется в герцах – частота 1 герц (Гц, Hz) соответствует одному колебанию в секунду. Человеческий слух воспринимает звуковые колебания частотой от десятков герц до десятков килогерц. Лучше всего человек слышит звуки в диапазоне частот примерно от 400 Гц до 5 кГц.
Понять природу звука и принцип звукозаписи поможет несколько умозрительных опытов. Когда-то, в эпоху великих физических открытий, подобные опыты и заложили базу для всей нынешней звукозаписи и связи.
Звуковое давление можно измерить. Образно говоря, нужно поставить на пути звуковой волны мембрану, связанную с очень чувствительными пружинными весами или динамометром (рис. 1.1).
Рис. 1.1. Звуковые волны и звуковое давление
Показания этого прибора будут циклически меняться много раз в секунду. Если вы сможете уследить за колебаниями стрелки, то по величине максимальных ее отклонений в ту и другую сторону, зная чувствительность весов и площадь мембраны, удастся рассчитать абсолютное звуковое давление, например в килограммах на квадратный метр.
На практике чаще говорят об относительном звуковом давлении или уровне звука. Было измерено звуковое давление или мощность самого тихого звука, который еще способен расслышать среднестатистический человек. Это значение приняли за ноль и назвали порогом слышимости. О любом другом звуке можно сказать, что его мощность или звуковое давление во столько-то раз выше порога слышимости. Максимальное звуковое давление, при котором звук вызывает уже болевые ощущения (болевой порог), примерно в 100 000 000 раз превышает порог слышимости. Для удобства отношение силы звука к порогу слышимости измеряют не в разах, а в логарифмических единицах – децибелах (дБ, dB). 1дБ = 20lg(p2/p1), где p2 – звуковое давление измеряемого звука, а p1 – звуковое давление, соответствующее порогу слышимости. Болевой порог в таком случае составляет примерно 140 дБ. С небольшими оговорками уровень звука можно называть и просто громкостью.
Слух человека устроен так, что субъективно мы оцениваем громкость именно в логарифмическом масштабе: увеличение мощности сигнала в десять раз ощущается как увеличение громкости всего в два раза. Минимальное различие уровня двух сигналов, которое способен заметить человек, составляет 1 дБ.
Отсюда вытекает понятие динамического диапазона, то есть разницы между самыми тихими и самыми громкими звуками. Человеческий слух обладает динамическим диапазоном около 120 дБ. Точно так же можно говорить о динамическом диапазоне какого-либо музыкального фрагмента. Если самые тихие звуки в нем имеют громкость 10 дБ, а самые громкие – 60 дБ, то динамический диапазон составит 60 – 10 = 50 дБ.
Если в воображаемом приборе, с помощью которого мы измеряли звуковое давление, вместо стрелки использовать острую иглу, а под этой иглой с постоянной скоростью протаскивать ленту, покрытую каким-нибудь мягким составом типа воска, то игла будет выцарапывать на нем извилистую бороздку – график изменения давления, или своеобразное графическое изображение звуковых колебаний, их временную развертку (рис. 1.2). Более того, если затем вновь провести иглой по бороздке, то мембрана начнет колебаться в соответствии с ее изгибами, и вы услышите звук. Именно так был устроен первый в истории звукозаписывающий аппарат – фонограф Эдисона. Только в нем звуковая дорожка процарапывалась на вращающемся валике, покрытом воском.
Рис. 1.2. Запись звуковых волн
Звуковые волны можно преобразовать в электрические колебания. Чувствительный элемент – мембрана микрофона – движется в соответствии с колебаниями воздуха и передает это движение на преобразователь – катушку, пластину конденсатора или пъезоэлемент. В любом случае на выходе микрофона возникают колебания электрического тока или напряжения, изменяющиеся во времени аналогично давлению на поверхности мембраны. В дальнейшем эти электрические колебания можно усиливать и записывать на какой-нибудь носитель, движущийся относительно записывающего элемента, например на магнитную ленту. Опять же, колебания намагниченности магнитной ленты почти точно повторяют форму звуковых колебаний – это аналоговая запись.
В процессе воспроизведения носитель движется относительно воспроизводящей головки, записанный на нем сигнал наводит в головке электрические колебания, которые затем усиливаются электроникой и заставляют колебаться диффузор динамика.
В качестве примера был приведен «чистый тон», то есть звук, представляющий собой колебания одной, строго определенной частоты. Развертка такого звука имеет форму правильной синусоиды (рис. 1.3), кривой, описываемой формулой y = sin(x).
Рис. 1.3. Синусоида – график звуковых колебаний
На практике подобные звуки встречаются редко – это, например, звук, издаваемый камертоном или вырабатываемый простейшим генератором, его еще называют гармоническим колебанием. Чистый тон характеризуется всего двумя параметрами – частотой и амплитудой. Субъективно частота воспринимается как высота тона, а амплитуда – как его громкость.
Реальные звуки, вроде звучания музыкальных инструментов, голоса или шума, образуются сочетанием множества колебаний разных частот. Графическая развертка таких колебаний выглядит как кривая сложной формы (рис. 1.4).
Рис. 1.4. Разложение колебания на гармонические составляющие
Именно так – графиком моментального значения сигнала – показывается звуковая дорожка в окне рабочей области программы Sound Forge (см. гл. 2, раздел «Окна рабочей области»). О средней за какой-то период времени амплитуде или уровне реального звука говорить уместно, но понятие частоты или тона здесь неприменимо.
Математическое описание сложения колебаний с разными частотами лежит далеко за пределами школьной программы, но практический вывод знать просто необходимо: любой, даже самый сложный, колебательный процесс можно представить как результат сложения нескольких гармонических колебаний или синусоид! Так называемое преобразование Фурье позволяет выделить из реального звука отдельные синусоидальные составляющие, то есть полностью разложить этот звук на множество отдельных синусоидальных колебаний, каждое со своей частотой и амплитудой. Если частоты составляющих кратны друг другу, то такие составляющие обычно называют гармониками.
Разложив звук на гармонические составляющие, можно (теоретически) измерить амплитуду каждой из них, а затем перечислить в порядке частот эти составляющие, указав амплитуду каждой из них. На практике поступают несколько иначе: разбивают весь диапазон слышимых частот на несколько участков (от… и до…) и указывают средние уровни всех составляющих, попадающих в каждый диапазон. Для музыканта совершенно естественно брать в качестве диапазонов октавы, а «техникам» свойственно указывать границы диапазонов частотами (в герцах). Уровень звука в пределах диапазона принято выражать в тех же децибелах. Такое описание звука называется спектром. Обычно спектр изображают в виде столбчатой диаграммы. Наглядное представление о спектре дают полосковые индикаторы звукозаписывающей аппаратуры. Субъективно спектр воспринимается как тембр или окраска звука: чем больше доля высших гармоник, тем более звонким, «металлическим» является звучание. В зависимости от наличия и соотношения разных гармонических составляющих звук может казаться «прозрачным» или, наоборот, хриплым.
Усиление или ослабление звукового сигнала в целом или изменение уровня отдельных его гармонических составляющих называют линейным преобразованием звука. В результате может меняться соотношение уровней отдельных гармоник, но новые гармоники при этом не возникают. В противоположность этому говорят о нелинейных преобразованиях, при которых в измененном звуковом сигнале появляются такие частоты или гармоники, которые в исходном звуке отсутствовали. Нелинейные преобразования специально используются для создания определенных эффектов, в противном случае их считают искажениями. Нелинейными искажениями сопровождается как оцифровка звука, так и восстановление сигнала из цифрового вида в аналоговый.
Данный текст является ознакомительным фрагментом.