Что такое кгц в звуке
Перейти к содержимому

Что такое кгц в звуке

  • автор:

Кодирование звука

Звук — это колебание воздуха и графически представляет из себя чередование волн разной частоты (длины), меняющихся во времени. Благодаря изменению частот мы различаем разные звуки. На видео ниже можно послушать звуки разной частоты в зоне восприимчивости человека (от 20 Гц до 20 кГц) и посмотреть их графическое обозначение.

Для того чтоб компьютер мог обрабатывать звук, его необходимо разбить на части как по времени, так и по амплитуде звучания. Параметр разбивки по времени (по оси x) называется частотой дискретизации — это количество делений за одну секунду и измеряется в Герцах (Гц). Разбивка по амплитуде называется глубиной и измеряется в битах. Из рисунка ниже видно, что чем больше делений мы применяем, тем происходит более качественная оцифровка звука, но при этом потребуется больше памяти.

На основании работ Шеннона и Котельникова частота дискретизации должна быть как минимум вдвое выше частоты звука, который мы хотим услышать, например, для звука частотой 5 кГц частота дискретизации должна быть минимум 10 кГц. Для качественной обработки звука и записи его на компакт-диск применяется частота дискретизации 44,1 кГц, а глубина 16 бит.

Из вышеизложенной информации получаем, что

размер звукового файла = частота дискретизации * время * глубина * количество дорожек звучания

при этом параметр частота дискретизации выражается в Гц, время в секундах, а глубина в битах (для упрощения расчётов можно сразу переводить в байты).

Например, для песни продолжительностью 3 мин 20 с, записанной в режиме стерео частотой дискретизации 44,1 кГц при глубине 16 бит

размер файла = (3*60+20) * 44100 * 16 * 2 = 282240000 бит
282240000 / 8 / 1024 / 1024 ≈ 33,6 Мб

Статьи

Как люди, непосредственно связанные с AV сферой, мы постоянно говорим об аудио-кодировании и аудиокодеках, а что же это такое? Аудиокодек – это, по сути, устройство или алгоритм, способный кодировать и декодировать цифровой аудиосигнал.

На практике аудиоволны, которые передаются по воздуху, являются продолжительными аналоговыми сигналами. Сигналы преобразуются в цифровой формат устройством, которое называется аналого-цифровой преобразователь (АЦП), а устройство обратного преобразования – цифро-аналоговый преобразователь (ЦАП). Кодек находится между этими двумя функциями и именно он позволяет откорректировать некоторые важные параметры для успешного захвата, записи и трансляции звукового сигнала: алгоритм кодека, частота дискретизации, разрядность и скорость передачи данных.

Три наиболее популярных аудиокодека: Pulse-Code Modulation ( PCM), MP3 и Advanced Audio Coding ( AAC ). Выбор кодека определяет степень сжатия и качество записи. PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками. Источник сигнала для PCM сэмплируется через равные интервалы, и каждый сэмпл представляет собой амплитуду аналогового сигнала в цифровом значении. PCM – это наиболее простой вариант для оцифровки аналогового сигнала.

При наличии правильных параметров этот оцифрованный сигнал может быть полностью реконструирован обратно в аналоговый без каких-либо потерь. Но этот кодек, обеспечивающий практически полную идентичность оригинальному аудио, к сожалению, не очень экономичен, что выражается в очень больших объемах файлов, а такие файлы не подходят для потокового вещания. Мы рекомендуем использовать PCM для записи цифровых образов для ваших источников или когда вы занимаетесь постобработкой аудио.

К счастью, у нас всегда есть возможность выбрать другой кодек, который может сжимать цифровые данные (по сравнению с PCM) на основании некоторых полезных наблюдений о поведении звуковых волн. Но в этом случае приходится идти на компромисс: все альтернативные алгоритмы сопряжены с «потерями», так как невозможно полностью восстановить исходный сигнал, но, тем не менее, результат всё равно хорош настолько, что большинство пользователей не смогут уловить разницу.

MP3 – это формат аудио-кодирования с использованием как раз такого алгоритма сжатия цифровых данных, который позволяет сохранять аудиосигнал в меньшие по объему файлы. Кодек MP3 чаще всего используется пользователями для записи и хранения музыкальных файлов. Мы рекомендуем применять MP3 для трансляций аудио-контента, так как ему требуется меньшая пропускная способность сети.

AAC – это более новый алгоритм кодирования аудиосигнала, ставший «преемником» MP3. AAC стал стандартом для форматов MPEG-2 и MPEG-4. По сути это тоже кодек сжатия цифровых данных, но с меньшей, чем у MP3, потерей качества при кодировании с одинаковыми битрейтами. Мы рекомендуем использовать этот кодек для онлайн трансляций.

Частота дискретизации (кГц, kHz)

Частота дискретизации (или частота сэмплирования) — частота, с которой происходит оцифровка, хранение, обработка или конвертация сигнала из аналога в цифру. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (сэмплов), взятых через равные промежутки времени.

Измеряется в герцах (Гц, Hz) или килогерцах (кГц, kHz,) 1 кГц равен 1000 Гц. Например, 44 100 сэмплов в секунду можно обозначить как 44 100 Гц или 44,1 кГц. Выбранная частота дискретизации будет определять максимальную частоту воспроизведения, и, как следует из теоремы Котельникова, для того, чтобы полностью восстановить исходный сигнал, частота дискретизации должна в два раза превышать наибольшую частоту в спектре сигнала.

Как известно, человеческое ухо способно улавливать частоты между 20 Гц и 20 кГц. Учитывая эти параметры и значения, показанные в таблице ниже, можно понять, почему именно частота 44,1 кГц была выбрана в качестве частоты дискретизации для CD и до сих пор считается очень хорошей частотой для записи.

Есть ряд причин для выбора более высокой частоты дискретизации, хотя может показаться, что воспроизводить звук вне диапазона человеческого слуха – пустая трата сил и времени. При этом среднестатистическому слушателю будет вполне достаточно 44,1 – 48 кГц для качественного решения большинства задач.

Разрядность

Наряду с частотой дискретизации есть такое понятие как разрядность или глубина звука. Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла. Проще говоря, разрядность определяет «точность» измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. С минимальной возможной разрядностью есть только два варианта измерения точности звука: 0 для полной тишины и 1 для звучания в полном объеме. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 = 65 536) различных значений.

Разрядность закреплена в кодеке PCM, но для кодеков, которые предполагают сжатие (например, MP3 и AAC) этот параметр рассчитывается при кодировании и может меняться от сэмпла к сэмплу.

Битрейт

Битрейт — это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Для линейного PCM битрейт рассчитывается очень просто.

битрейт = частота дискретизации × разрядность × каналы

Для таких систем как Epiphan Pearl Mini, которые кодируют линейный PCM 16-бит (разрядность 16), этот расчет может быть использован для определения, сколько дополнительных полос пропускания может потребоваться для PCM аудио. Например, для стерео (два канала) оцифровка сигнала производится с частотой 44,1 кГц на 16-бит, а битрейт при этом рассчитывается таким образом:

44,1 кГц × 16 бит × 2 = 1 411,2 кбит/с

Между тем алгоритмы сжатия аудиосигнала, такие как AAC и MP3, имеют меньшее количество бит для передачи сигнала (в этом и заключается их цель), поэтому они используют небольшие битрейты. Обычно значения находятся в диапазоне от 96 кбит/с до 320 кбит/с. Для этих кодеков чем выше битрейт вы выбираете, тем больше аудио бит вы получаете на сэмпл, и тем выше будет качество звучания.

Частота дискретизации, разрядность и битрейты в реальной жизни.

Аудио CD-диски, одни из первых наиболее популярных изобретений для простых пользователей для хранения цифрового аудио, использовали частоту 44,1 кГц (20 Гц – 20 кГц, диапазон человеческого уха) и разрядность 16-бит. Данные значения были выбраны, чтобы при хорошем качестве звука иметь возможность сохранять как можно больше аудио на диске.

Когда к аудио добавилось видео и появились DVD, а позднее Blu-Ray диски, был создан новый стандарт. Записи для DVD и Blu-Rays обычно используют линейный формат PCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.1 Surround) и разрядность 24. Эти значения были выбраны в качестве идеального варианта, чтобы сохранять аудио с синхронизацией с видео и при этом получать максимально возможное качество с использованием дополнительного доступного дискового пространства.

Наши рекомендации

CD, DVD и Blu-Ray диски преследовали одну цель – дать потребителю высококачественный механизм воспроизведения. Задачей всех разработок было предоставить высокое качество аудио и видео, не заботясь о величине файла (лишь бы он умещался на диск). Такое качество мог обеспечить линейный PCM.

Напротив, у мобильных средств информации и потокового медиа совсем другая цель – использовать максимально низкий битрейт, при этом достаточный для поддержания приемлемого для слушателя качества. Для этой задачи лучше всего подходят алгоритмы сжатия. Теми же принципами вы можете руководствоваться для своих записей.

При записи аудио с видео…

В случае если запись будет использоваться для последующей обработки , выбирайте кодек PCM с частотой 48 кГц и максимальной разрядностью (16 или 24), чтобы обеспечить наилучшее качество аудио. Мы рекомендуем данные параметры для Epiphan Pearl Mini.

При потоковой передаче аудио с видео…

При потоковой передаче или записи для последующей трансляции можно получить хорошее звучание аудио при меньшей полосе пропускания, используя кодеки AAC или MP3 с частотой 44,1 кГц и битрейт 128 кбит/с или выше. Такие параметры гарантируют, что звук будет достаточно хорош и не скажется на качестве трансляции.

Последние статьи

Подпишитесь на нашу рассылку, чтобы узнавать о новых статьях:

  • H.264/AVC или H.265/HEVC: Краткий гид по сжатию видео
  • SRT или NDI для удалённого видеопроизводства
  • Новинки Pearl: Новый MultiViewer и улучшения в CMS
  • NDI и NDI|HX для сетевого производства видео
  • Поддержка NDI для «комнат» в Zoom и производство видео в реальном времени
  • Pearl Nano: улучшенное качество записи и трансляций
  • Почему виртуальные мероприятия будут в выигрыше и после пандемии
  • 5 причин, почему виртуальные мероприятия останутся с нами
  • Дикий Запад удаленного видеопроизводства
  • Выбор камеры для стримов в 2021 году
  • Epiphan Cloud: простое управление несколькими устройствами
  • Аудиооборудование для трансляций
  • 7 непростых уроков о видеопроизводстве
  • Видео 4K для онлайн трансляций
  • Искусственный интеллект и транскрибирование в реальном времени
  • HyFlex: новый формат в образовании
  • Удалённый гость на стриме: что и как
  • Где может пригодиться кадрирование?
  • KVM2USB: 6 лет работы в космосе
  • Как лучше выглядеть в Скайпе и Зуме: 5 простых советов

Частоты, которые полезно помнить!

Классически звуковой спектр делится на три части: низкие, средние и высокие частоты. Границы частот, хотя и не все с этим согласны, можно обозначить следующим образом: низкиеот 10 Гц до 200 Гц, средние от 200 Гц до 5 кГц, а от 5 кГц — высокие.Для более точного определения, давайте разделим эти три част на более мелкие и рассмотрим х по отдельности.

1) Низкие басы (от 10 Гц до 80 Гц) — это самые низкие ноты, от которых резонирует комната, а провода начинают гудеть. Если ваша звуковоспроизводящая аппаратура не воспроизводит эти частоты, вы должны ощутить потерю насыщенности и глубины звука. Естественно, при записи и сведении потеря этих частот вызовет тот же эффект.

2) Верхние басы (от 80 Гц до 200 Гц) — это верхние ноты басовых инструментов и самые низкие ноты таких инструментов, как гитара. Если потерять этот регистр, то вместе с ним потеряется и ощущение силы звука. А ведь именно в этих частотах содержится энергия звука, которая заставляет вас пританцовывать под музыку, недаром основная энергия ритм-секции сконцентрирована именно в этом регистре.

3) Низкие средние (от 200 Гц до 500 Гц) — здесь размещается почти весь ритм и аккомпанимент, это регистр гитары.

4) Средние средние ( от 500 Гц до 2.500 Гц) — соло скрипок, соло гитар, фортепиано, вокал. Музыку, в которой не хватает этих частот обычно называют «занудной» или «смурной».

5) Вехние средние (от 2.500 Гц до 5 кГц). Хотя в этом диапазоне мало нот, только самые верхние ноты фортепиано и некоторых других инструментов, здесь много гармоник и обертонов. Усиление этой части спектра позволяет достичь яркого, искрящегося звука, создающего эффект присутствия. Однако, если энергия этой полосы частот чрезмерна, то это режет слух. Это и называется «слушательской утомляемостью» и является проблемой большинства недорогих аккустических систем, которые искуственно усиливают данную часть спектра для «яркости» звучания. Ну это уже коммерческие штучки!

6) Низкие высокие (около 5 кГц до 10 кГц), где мы встречаемся с самым сильным искажением высоких частот и где шипение пленки (для любителей кассетной записи) становится самым заметным, так как здесь очень мало других звуков, способных скрыть это. Хотя люди, теоретически могут слышать и более высокие тона, эти частоты считаются пределом восприятия. Но по большому счету, для хорошего звука — это маловато.

7) Верхние высокие (около 10 кГц до 20 кГц) наша последняя октава, это самые тонкие и нежные высокие частоты. Если этот диапазон частот будет неполноценен, то вы ощутите некий дискомфорт при прослушивании записей (если, конечно, медведь не наступил вам на ухо).

Электрическая сеть шумит на частоте 50 Гц. Для устранения этого надо убрать частоты 50 и 100 Гц при помощи параметрического эквалайзера, ширина полосы которого достаточно узка. Это устранит шумы сети, но не повлияет заметно на общий звук. Графический эквалайзер (треть октавы) тоже эффективен в этой ситуации, но остальными типами эквалайзеров для этого лучше не пользоваться, так как они имеют слишком широкую зону влияния и регулировка может существенно изменить звучание бас-гитары, в том числе не в лучшуюсторону. Нижние частоты бас-гитары и басового барабана лежат в области 40 Гц и ниже. Чтобы придать их звучанию мощь (атаку), регулируйте частоту 80 Гц. Нижняя частота электрогитары — 80 Гц. Для устранения «бочковатости» надо вырезать частоту 200 Гц; для устранения резкого, неприятного призвука — ослабить в районе 1Кгц. Чтобы добавить «ду», сделать «жалящим» звучание рок-гитары, просмотрите область от 1,5 кГц до 4 кГц, найдите нужную частоту и убирайте ее до тех пор, пока атака станет такой, как вы желаете. Основная проблема с акустическими гитарами, как правило, состоит в том, что они звучат «бочковато» — из-за неподходящих микрофонов, неудачного расположения микрофона, акустических характеристик помещения или просто из-за того, что инструмент плохой. Область «вредной» частоты находится обычно между 200 Гц и 500 Гц — ее и надо вырезать. Вокал также занимает большую зону частотного диапазона, при этом область 2-4 кГц регулируется для улучшения артикуляции.

Что означает диапазон Гц-кГц для динамиков и наушников?

Если вы смотрели на высококачественные наушники или динамики, вы, вероятно, заметили цифры в спецификации, которые гласят что-то вроде «20 Гц-20 кГц». Что означают эти цифры?

Для любого устройства, использующего стандартный драйвер динамика, значение Гц-кГц представляет собой диапазон слышимых звуковых колебаний, которые может производить динамик. Обычно он обозначается как «частотная характеристика» и выражается в герцах, где килогерц равен тысяче герц. Так что типичная частотная характеристика для наушников, от двадцати до двадцати тысяч герц, действительно весьма насыщена. Более дорогие модели могут идти ещё выше и ниже; набор Sony за 700 долларов на изображении выше имеет диапазон от 4 Гц до 100 кГц.

Чтобы понять, как все это работает, нужно немного знать о физике звука. Звук распространяется волнами. Расстояние между гребнями (самыми верхними точками) одной волны и следующей называется длиной волны. Волны с более высокими частотами имеют более короткие длины волн. Волны с более низкими частотами имеют более длинные волны. Герц — единица измерения частоты. Один герц определяется как один цикл в секунду. Итак, частота, измеренная на уровне 20 Гц, движется со скоростью 20 циклов (или волн) в секунду.

Большинство динамиков и наушников преобразуют электрические сигналы в звук, используя магнитное поле для очень быстрого перемещения гибкой диафрагмы вперёд и назад. Эти вибрации создают звуковые волны, которые достигают наших ушей. То, как быстро происходят эти вибрации, влияет на длину волны звуковых волн, и наши уши воспринимают эти разные частоты как звуки в разных диапазонах.

Вибрации, которые создают звук на частоте 20 герц, очень низкие — басовый гул — и имеют большую длину волны. Устройство воспроизведения имеет мембрану, которая вибрирует двадцать раз в секунду. Большая часть музыки и аудио воспроизводится в диапазоне от 80 до 15 000 герц. На частоте 15 000 герц из-за чрезвычайно короткой длины волны высота звука очень высока, как сигнал пожарной сигнализации.

Существуют динамики разных типов — низкочастотные, среднечастотные и высокочастотные, — которые предназначены для воспроизведения звука на определённых длинах волн.

Вы можете легко протестировать свои динамики или наушники. Видео выше проходит через спектр звука от 20 Гц до 20 кГц. Обратите внимание, что в нижней и верхней частях диапазона ваши динамики могут не воспроизводить звук, особенно если у них драйверы меньшего размера, например, на основном динамике вашего мобильного телефона. Вы можете протестировать его с различными наушниками и динамиками, чтобы увидеть, какие из них могут воспроизводить самый широкий диапазон звука.

Чем лучше диапазон для ваших динамиков или наушников, тем шире спектр слышимого звука, который они могут воспроизвести. Некоторые могут быть выше и ниже стандартного диапазона 20 Гц-20 кГц, например 16 Гц-22 кГц. Но так ли это важно?

Только если вы имеете исключительно хороший слух, в противном случае нет. Видите ли, диапазон человеческого слуха составляет около 20 Гц-20 кГц. Но это идеальный диапазон, охватывающий почти всё население. Большинство младенцев смогут слышать этот полный диапазон, а некоторые люди могут слышать частоты немного выше или ниже. Но так же, как и зрение, ваша способность слышать ухудшается с возрастом, особенно в отношении высокочастотных тонов. Если вам больше 25 лет или около того, вы, вероятно, не слышите выше 18 000 герц. Или даже ещё меньше, если ваш слух повреждён в результате воздействия очень громких звуков.

Таким образом, вы можете тестировать свои динамики в течение всего дня, но вы не сможете отличить комплект с диапазоном 20 Гц-20 кГц от комплекта с диапазоном 16 Гц-22 кГц, если ваши уши физически не способны слышать самые высокие и самые низкие частоты. Но не нужно считать эту характеристику бесполезной, поскольку наушники или динамики с более высоким диапазоном частотной характеристики, как правило, будет более качественным, чем наушники с более низким диапазоном. Они изготавливаются с использованием лучших компонентов и технологий и воспроизвоодят более точные, насыщенные тона для музыки и видео. Думайте об этом так же, как вы думаете о лошадиных силах для двигателя автомобиля: важная характеристика, которую люди обычно хотят знать, даже если они вряд ли когда-либо будут использовать все 300 лошадиных сил на шоссе.

Обратите внимание, что этот диапазон касается тона или высоты звука, который вы слышите, а не громкости звука, которая выражается в децибелах (дБ). Другой способ выразить способность к выходной громкости — это электрические ватты на драйвер или общие ватты для всех драйверов вместе взятых. Это не очень точно в отношении звука, но это неплохое сокращение для понимания того, насколько мощные динамики.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *