Розмір тригодинний записи в якості 192 kbps. Найбільш поширені помилки на тему цифрового звуку. Ліцензійні Audio CD звучать краще, ніж їх копії

Бітрейт вказується як одна з головних характеристик відео і аудіозаписів. Більшість користувачів звикло думати, що він визначає якість завантаження. Але що таке бітрейти і як вони насправді характеризують музичні файли і відеоролики? Розглянемо це докладніше.

Що таке бітрейти?

Бітрейт - це величина, яка відображає кількість одиниць інформації (мегабіт або кілобіт), вміщених в одну секунду відтворення файлу. Відповідно, він вимірюється в мегабитах в секунду (Mbps) або кілобітах в секунду (Kbps). Інакше бітрейт можна охарактеризувати як ширину пропускної смуги. Ця характеристика важлива для тих, хто хоче конвертувати файли, тому що при одній і тій же тривалості більший бітрейт призведе до збільшення файлу. Крім розміру, змінюється і якість звуку. Зменшення розміру при зниженні бітрейта називається стисненням.

Поширений музичний є аудіофайл, стиснений до такої міри, що на стандартний диск поміщається до 12-ї години музики. При цьому якість залишається досить високим завдяки психоакустичного стиску: з усього діапазону прибираються звуки з тими частотами і рівнями гучності, які уловлюються людським вухом. Відібрані звуки формуються в відокремлені блоки, звані кадрами. Фрейми мають однакову тривалість звучання і стискаються за заданим алгоритмом. Коли програється музика, сигнал відтворюється з декодованих блоків в певній послідовності.

Яке зазвичай використовується стиснення?

Бітрейт аудіо найчастіше становить 256 Кбіт / с. При такому значенні аудіозапис стискається в розмірі приблизно в 6 разів, завдяки чому на один диск можна записати в 6 разів більше музики, ніж до стиснення. Якщо бітрейт знизити до 128 Кбіт / с, то на один диск поміститься вже в 12 раз більше музики, проте якість звучання буде помітно нижче. Музика, записана в якості 128 Кбіт / с, найчастіше пропонується для прослуховування в інтернеті, т. К. В гонитві за підвищенням швидкості завантаження сторінок власники ресурсів йдуть на будь-які жертви. Багато користувачів відзначають, що її якість далеко від ідеального.

Тепер, коли стало ясно, що таке бітрейти, саме час визначити їх оптимальний рівень. Як любителі, так і професіонали нескінченно сперечаються, як бітрейт впливає на якість звуку і чи впливає взагалі. На музичних альбомах, як правило, вказується бітрейт. Один і той же диск, записаний в якості 128 Кбіт / с і 256 Кбіт / с, буде відрізнятися за ціною в два рази.

Оптимальний бітрейт при різних умовах прослуховування

Для багатьох людей двенадцатикратного стиск не представляє будь-якої шкоди, в той час як інші стверджують, що не можуть слухати музику з бітрейтом нижче, ніж 320 Кбіт / с. Парадоксально, але мають рацію і ті й інші. Справа в тому, що в кінцевому рахунку якість відтворення залежить не від а від умов відтворення і навіть від типу музики.

Наприклад, пісня програється на магнітофоні, встановленому у вітчизняному автомобілі. В такому випадку якість на рівні 192 Кбіт / с буде цілком достатнім. Більш високий бітрейт поліпшить якість звуку, але різниця не буде помітна через високого рівня шуму під час поїздки. Якщо ж музика грає на домашньому комп'ютері або портативному плеєрі, То потрібно не менше 256 Кбіт / с. Якщо ж сигнал не береться змін, передається на зовнішні пристрої і виводиться на дорогі імпортні колонки, то слід по можливості вдаватися до мінімального стиску. Воно можливо при бітрейте 320 Кбіт / с.

Оптимальний бітрейт для різних музичних стилів

Музика з високим бітрейтом потрібна не завжди. Популярна музика, як правило, досить добре звучить при бітрейте 192-256 Кбіт / с. більш висока якість встановити можна, але сенсу в цьому немає: поп-композиції недовговічні, тому збереження місця на дисках повинно бути пріоритетним. Крім того, якість вихідних записів теж посереднє, тому підвищення бітрейту може ніяк не вплинути на якість відтвореного файлу. Для прослуховування в транспорті і на неофіційних вечірках середньої якості цілком вистачить.

Якщо ж мова йде про класичну музику, творах легендарних рок-груп або окремих авторських піснях, то якість повинна бути понад усе. При придбанні такої музики потрібно подивитися на бітрейт, вказаний на упаковці диска. Якщо пісня завантажується з Інтернету, то така інформація повинна бути присутнім на сторінці скачування. Крім того, бітрейт відображається в плеєрі під час програвання.

бітрейти відеофайлів

Вище йшлося про те, що таке бітрейти аудіозаписів. Але що таке бітрейт відео? З огляду на, що відео відтворюється як послідовність звуків і зображень, то визначення бітрейта буде аналогічним. Наявність відеоряду ускладнює файл, але в кінцевому рахунку зображення для процесора - це такі ж нулі і одиниці, як і звуки. Принцип шифрування інформації однаковий для всіх типів файлів.

За останні кілька років став жахливо модним і популярним формат MP3. На будь-якому лотку, що торгує комп'ютерними CD-дисками, ви легко знайдете не один десяток дисків типу «Повна антологія групи XXX», і внизу скромненько такий напис - MP3. Найчастіше для повної картини на обкладинках красується модне словосполучення CD quality - то пак якість, як у Audio-CD. Саме про це і не тільки буде далі нашу розповідь - про MP3, які вони бувають, про якість звуку в MP3.

Про формат MP3

Для початку трохи розберемося з предметною областю. Що взагалі з себе таке представляє цей MP3?

MP3, більш правильна назва MPEG-1 Layer 3 - стандарт на стиск аудіоінформації з втратами. При цьому основною метою при створенні стандарту було забезпечення максимально «ідентичного» вихідного звуку, а також зведення до мінімуму обсягу збережених даних. Для цього була створена оригінальна схема кодування - на першому етапі оцифрований звук розбивається на частотні складові, які проходять через ряд фільтрів.

Основна відмінність MP3 від раніше існуючих стандартів - саме в фільтрації. Розробники стандарту створили так звану психоакустичного модель - модель, яка враховує деякі особливості людського слуху, і на підставі цієї моделі з аудиосигнала фільтруються ті частоти, відсутність яких слух майже не помічає. На другому етапі отриманий потік кодується за алгоритмом Хаффмена зі статичної таблицею. Результат і буде потоком MP3.

Крім цього в файл MP3 можуть бути додані також теги ID3 (мітки, які містять назву пісні, виконавця, іншу інформацію) і різна сервісна інформація.

Режими стиснення і бітрейти

Ширина потоку - бітрейт визначає, скільки біт необхідно для кодування 1 секунди музики. Стандарт MP3 регламентує потоки від 8kbit / s до 320kbit / s. Найбільш типовий бітрейт - 128kbit / s.

Виходячи з потоку, легко підрахувати, скільки буде займати одна хвилина музики - треба бітрейт розділити на 8 (число біт в байті) і помножити на 60 (секунд в хвилині) - отримаємо число кілобайт. Для вже згаданого потоку 128kbit / s це буде 128/8 * 60 \u003d 960 кілобайт або близько мегабайта на кожну хвилину записи.

Цілком природно, що чим більше бітрейт, тим більше деталей звуку вдається зберегти, тим він звучить реалістичніше. У виборі бітрейта при кодуванні доводиться чимось жертвувати - або якістю на користь малого розміру, або розміром на користь якості.

Найпростіший режим стиснення MP3 - це режим з постійним бітрейтом (CBR, Constant BitRate). Раніше на збірках MP3 майже на 100% використовувався вже згаданий вище бітрейт 128kbit / s - і при цьому на дисках була присутня напис CD quality. Відверто кажучи, це просто нахабна брехня. На практиці відрізнити звучання такої MP3 від звучання аудіо компакт-диска можна хіба тільки що на найдешевшої акустиці.

Рівень якості на бітрейте 128kbit / s - це приблизно рівень звучання середнього магнітофона на не свіжої плівці, може трохи краще. Ще можна додати, що саме такий бітрейт широко поширений в записах, доступних по Internet.

Для спрощення розбору більш високих бітрейтів напишу їх сіточку: 128kbit / s, 160kbit / s, 192kbit / s, 224kbit / s, 256kbit / s, 320kbit / s. Отже, бітрейти 160 і 192kbit / s вже помітно краще за якістю, ніж 128kbit / s, але одержувані файли все ще не такі великі. «Артефакти» (огріхи) кодека вже майже непомітні (принаймні на моїй системі).

З бітрейтом 224 мені в чистому вигляді ні разу зустрітися не довелося, тому про його якість нічого не можу сказати, але воно повинно бути вище, ніж на попередній сходинці драбинки бітрейтів. Крім того, мені не зустрічалися огляди, які охоплювали і цей бітрейт. Мабуть це якось пов'язано з тим, що наступний за ним бітрейт 256kbit / s є визнаним в плані точності передачі звуку, майже повною відсутністю спотворень. В інструкції до кодеку Lame цей бітрейт навіть названий як Studio Quality. І саму стелю - 320kbit / s призначений для тих, кому якість найдорожче, або для власників дуже якісної Hi-Fi або навіть Hi-End апаратури.

Тепер перейдемо до більш складного питання - режиму змінного бітрейта (VBR, Variable BitRate). Тут поняття бітрейта дуже розмито, кодеки «для користувача» взагалі використовують регулювання тільки за якістю (як наприклад в Xing Audio Catalyst). Інші ж (Lame) дозволяють задавати додаткові параметри - мінімальний і максимальний бітрейти, знову ж якість.

При кодуванні VBR кодек сам вибирає потрібний бітрейт, виходячи із заданих йому параметрів, причому протягом кодованого фрагмента бітрейт може змінюватися. Для оцінки потрібного бітрейта використовується вже згадувана психоакустична модель. Однак модель (так як не є ідеальною, ніщо в нашому світі не ідеально) іноді показує невірні результати. Це призводить до заниження оцінки, і відповідно падіння реально чутного якості звуку.

Розробники кодека Lame радять в такому випадку встановлювати поріг мінімального бітрейту, щоб уникнути зовсім поганих результатів. До різновидів VBR відноситься і кодування ABR (Average BitRate), усередненого бітрейта. Останнім часом в оглядах чутні тільки позитивні відгуки про цей режим, особливо ABR на 256kbit / s. Працює цей режим майже також, як і VBR, з тим винятком, що кодек дотримується середнього заданого значення. На даний момент мені відомий тільки один кодек, який має режим ABR - це Lame.

вибір кодека

Буквально зовсім недавно у користувача, який бажав отримати пристойне якість MP3, був не дуже великий вибір - це будь-якої ISO-based кодек (заснований на коді зразка кодека MP3, випущеного International Standarts Organization), або кодек від IIS Fraunhofer (інститут - розробник MP3). Плюс кодеки в продуктах від Xing.

почитавши різних оглядів, І зробивши невеликі власні дослідження, я прийшов до висновку про гілці продуктів фірми Xing - це ... їх краще не використовувати. Навіть у відносно нових версіях все їх продукти, які вміють створювати MP3 вбудованими засобами, роблять це максимально неякісно.

Існує також маса «піонерських» виробів, зліплених на краденому у Xing кодеку (майже всі містять в складі файл tompg.exe). Довгий час їх основною перевагою була швидкість (на шкоду якості), але сьогодні кодек Lame показує порівнянну швидкість при більш високій якості. Крім того, продукція фірми Xing взагалі кажучи коштує грошей, тоді як Lame безкоштовний по визначенню.

Далі пройдуся по продукції IIS Fraunhofer. Всі їх програми для стиснення MP3, доступні безкоштовно, є сильно урізаними за можливостями версіями їх же комерційних продуктів. Потім, все їх кодеки нерозвивалися протягом довгого часу, і не містять нових засобів, підтримки VBR / ABR, крім того не відрізняючись особливим швидкодією. Єдине їх виправдане застосування - стиснення на бітрейтах нижче 128kbit / s - у них проведена спеціальна оптимізація під низькі бітрейти (місцями, правда, з порушенням стандарту).

Різні кодеки на базі коду ISO страждають в принципі одним і тим же недоліком - низькоякісним стисненням на бітрейтах нижче 192kbit / s. Крім того, більшість з них (в т.ч. і BladeEnc) - неабияк повільні.

На мій погляд, найбільш оптимальним варіантом є кодек Lame. Починав як вільний кодек на базі ISO-коду, в процесі розробки він виріс і тепер все огляди при порівнянні MP3 з іншими форматами використовують саме його в якості еталонного для MP3. Трохи більше року тому проект Lame остаточно позбувся ISO-коду і тепер може вважатися повністю незалежним кодеком.

Розвиток кодека досить інтенсивне, його постійно оновлюють, виправляють помилки. Крім того, можливо використовувати Lame не тільки під Windows, але і під різні варіанти Unix-систем, він також працює в чистому DOS. Знову ж, повністю безкоштовний, доступний вихідний код (для любителів в оном покопатися), з кількох сайтів доступні вже скомпільовані бінарні файли (.exe і.dll), оптимізовані під різні процесори.

Існує також кілька урізана версія Lame - енкодер GOGO-no-coda, який показує за швидкістю фантастичні результати (в два рази швидше, ніж та так швидкий Lame).

То який же бітрейт і який режим використовувати?

З огляду на все вищесказане, я б порекомендував класти в архів MP3 або з потоком 320Kbit / s, режим CBR, або 256kbit / s, ABR. Перший на мій погляд дещо краще, тому що ви отримуєте максимально доступне якість в рамках формату. Для записів на «пару раз послухати і стерти» розумно використовувати ABR 192kbit / s.

І ще одне - краще не використовувати для скільки-небудь довгого зберігання бітрейти нижче 192kbit / s - якщо тільки запис, з якої була зроблена MP3, у вас не постійно під рукою (хоча пам'ятаєте, що аналогова запис на магнітній стрічці з плином часу погіршується) .

Дуже часто аргумент, який я чую на користь низьких бітрейтів і «кривого» стиснення - «у мене погана акустика, і я все одно не чую різниці». Все може змінитися, або вам доведеться використовувати свій архів на пристойній апаратурі, а до вихідного запису буде дістатися не можна. Відповідь абсолютно надуманий, я можу навести випадок із власної практики.

У нашому місті Павлово був колись невеликий клуб, де музику відтворювали з комп'ютера (MP3 з бітрейтом не вище 160kbit / s). Далі клуб благополучно помер, а комп'ютер з архівами музики переїхав в іншу фірму, що займалася проведенням масових заходів. Уявіть собі, що вони взялися крутити цю музику на дні міста! Жах, коли на більш-менш пристойному акустиці було чутно все дефекти, привнесені упаковкою на такий маленький бітрейт. Звук був гірше, ніж з їх же бувалого касетного магнітофона з полупережеваннимі касетами. Було б розумно уникати повтору чужих помилок, вірно?

Тестове обладнання та комплектуючі, ПЗ

Комп'ютер: Athlon TB 650MHz, M / B Acorp 7KTA 100MHz FSB, 128Mb RAM PC-133, HDD Quantum 40Gb 5400rpm, SoundBlaster 16 Vibra, AC97 codec.
Аудіосистема: підсилювач Radiotehnika У-7111, пара колонок Radiotehnika S-90B.
ПО: ОС Windows98 SE, Winamp 2.75, Eac 0.9pb11, Lame 3.90a, GOGO-no-coda 3.07a

Тріумфальний хід формату запису звуку MPEG-1 Layer 3 (в просторіччі отримав позначення MP3) пояснюється тим, що був запропонований простий і ефективний спосіб стиснення звукових файл, Що дозволяє зберігати на стандартному диску CD-ROM до 12 годин музики прийнятної якості.

Якщо говорити спрощено, алгоритм MPEG-1 Layer 3 заснований на методі так званого «психоакустичного» стиснення, коли зі звуків спектра виключаються які не сприймаються слухом частоти та рівня гучності. «Очищений» таким способом спектр розбивається на окремі блоки (фрейми) однакової тривалості і стискається відповідно до заданих вимог. При відтворенні сигнал формується з послідовності декодованих фреймів.

Ступінь стиснення залежить від параметрів звукового потоку, який необхідно отримати на виході, після декодування файлу.

Основним параметром, що визначає якість звучання і ступінь стиснення, виступає так званий (що таке) бітрейт - ширина смуги пропускання, яка вимірюється в бітах в секунду.

Чим більше цей показник, тим краще якість звуку і менше ступінь стиснення. Так як практично всі файли MP3 записують в режимі стерео з частотою кодування 44 КГц і глибиною 16 біт, визначальними факторами чистого звуку стають: джерело записи, застосовуваний кодек і вибраний бітрейт.

Слово кодек утворено поєднанням слів кодер + декодер. Це программ-, ний модуль, що дозволяє кодувати або декодувати файли звуку або відео, відповідно до власного алгоритмом.

Середнє значення потоку 256 Кбіт / с забезпечує коефіцієнт стиснення приблизно 6: 1, для інших величин ступінь стиснення змінюється пропорційно. Таким чином, при потоці 256 Кбіт / с можна записати на компакт-диск музику з шести звичайних Audio CD, а при потоці 128 Кбіт / с - з дванадцяти звичайних музичних дисків.

З приводу величини бітрейта, що забезпечує хорошу якість звучання, відповідне якості відтворення Audio CD, йдуть нескінченні суперечки серед любителів і професіоналів.

деякі вважають достатнім рівень 128 Кбіт / с, інших задовольняє тільки максимальне значення потоку - 320 Кбіт / с. Цілком ймовірно, мають рацію і ті й інші - різниця тільки в тому, що записано і в яких умовах відтворюється.

Величина бітрейта, з якої кодувався оцифрований звук, зазвичай вказується на обкладинці компакт-дисків. Наприклад, повну колекцію музики групи Beatles можна придбати на трьох дисках з бітрейтом 128 Кбіт / с або на шести дисках з бітрейтом 256 Кбіт / с.

Зрозуміло, що в другому випадку вартість покупки буде вдвічі дорожче, але і якість краща.

Якщо музика звучить в автомобілі вітчизняного виробництва, потік 192 Кбіт / с забезпечить достатню якість звуку, кращого ви все одно не почуєте через сторонніх шумів. Для прослуховування на комп'ютері або автономному програвачі ( МРЗ-плеєри) прийнятний потік 256 Кбіт / с.

А ось якщо сигнал без змін надходить на зовнішній пристрій і виводиться на колонки високої якості, бажаний максимально можливий потік - 320 Кбіт / с. Виходячи з перерахованих міркувань, універсальним можна вважати потік 256 Кбіт / с: при хорошій якості запису він забезпечить адекватне відтворення в більшості випадків.

Для трансляції музики через Інтернет зазвичай використовують величину потоку 128 Кбіт / с. При цьому якість звучання «як би» залишає бажати кращого.

Записувати популярну музику з бітрейтом вище 192-256 Кбіт / с не має сенсу: пісеньки живуть недовго, та й вихідні записи часто не відрізняються високою якістю. Зрештою, потанцювати можна і під звук «магнітофонного» якості.

Зовсім інша справа класика і рідкісні авторські твори. Причому під класикою ми розуміємо не тільки Баха або Моцарта. Сьогодні класикою можна вважати і The Beatles, і Led, Zeppelin, і Висоцького, і Цоя, і багато інших авторів (виконавців).

Якщо при покупці компакт-диска ви не звернули уваги на величину бітрейта, зазначену на упаковці, то подивитися значення можна в рядку програвача під час відтворення файлу.

Бітрейтом (від англ. bitrate) Аудіофайлів називають кількість біт (одиниць інформації), які використовуються для зберігання однієї секунди звукозапису. Найбільш поширеною одиницею виміру бітрейта є кількість кілобіт в секунду (Кбіт / с, Kbps). Бітрейт є однією з ключових характеристик файлів мультимедіа, що впливає на їх якість і розмір. Чим з більшим бітрейтом були записані музика або відео, тим краще буде їх якість і тим "об'ємніше" будуть файли записів.

Відповідно, зміна величини бітрейта в ту чи іншу сторону може збільшити або зменшити розмір файлу. А ось з впливом на якість записів все трохи складніше. Тоді як зменшення величини бітрейта закономірно призводить до погіршення якості вихідного файлу, Протилежна операція на якість ніяк не впливає. Навіть якщо ви встановите максимальну величину бітрейта, якість звуку і відеоряду вашого файлу залишаться колишніми.

Як бачите, збільшувати бітрейт записи особливого сенсу немає: в результаті ви отримаєте файл більшого розміру при колишній якості. А ось знизити бітрейт з метою зменшення розміру записи дуже навіть можна. Хочете спробувати змінити бітрейт ваших пісень або фільмів? Скачайте Movavi Конвертор Відео - зручну програму, за допомогою якої ви легко змініть бітрейт відео- і аудіозаписів, будь то файли в популярних форматах MP3, WMA, AVI і MP4 або записи, поміщені в більш екзотичні контейнери. Інструкція написана на прикладі роботи з аудіофайлами.

1. Встановіть програму для зміни бітрейту

Скачайте і запустіть дистрибутив Movavi Конвертера Відео. Дотримуйтесь інструкцій на екрані, щоб інсталювати програму. Після закінчення установки конвертер запуститься автоматично.

2. Додайте файли в програму

Натисніть кнопку Додати файли, Виберіть пункт Додати аудіо і помістіть в програму потрібні файли . Програма підтримує безліч форматів медіа, тому формат вхідних файлів може бути практично будь-яким. Змінюйте бітрейт аудіофайлів MP3, WMA, AAC і інших. Спробуйте знизити бітрейт відео: працюйте з відеозаписами в AVI, MP4, DIVX і різними форматами HD-відео. Програма допоможе вам впоратися з широким спектром завдань по конвертації медіафайлів!

3. Виберіть формат збереження

Перед зміною бітрейта потрібно вибрати формат, в якому будуть збережені ваші аудіозаписи. Для цього клікніть по вкладці Аудіо і виберіть відповідний формат зі списку. Зробивши вибір на користь того чи іншого аудіоформату, клацніть по його назві і з розкрився списку виберіть одну з доступних величин бітрейта (опція недоступна для форматів FLAC, OGG, WAV і M4A). Якщо ви не хочете змінювати стандартну величину бітрейта, зазначену в обраному профілі, ви можете пропустити наступний крок і приступити до конвертації.

4. Встановіть потрібну величину бітрейта

Натисніть кнопку-шестірню праворуч від поля Формат на виході. В списку Тип бітрейта Оберіть

надійна і ефективна програма для запису відео з екрану в HD. Захоплює відео з програм, онлайн-трансляції і навіть розмови в Skype і зберігайте кліпи в будь-якому популярному форматі, а також для перегляду на мобільних пристроях.

Бітрейт прийнято використовувати при вимірюванні ефективної швидкості передачі потоку даних по каналу, тобто мінімального розміру каналу, який зможе пропустити цей потік без затримок.

Бітрейт виражається битами в секунду (біт / c, bps), А також похідними величинами з приставками кило- (кбіт / с, kbps), Мега- (Мбіт / с, Mbps) і т.д.

Швидкість передачі даних з використанням бітів в секунду блоку (символ: «біт / с»), часто застосовується в поєднанні з приставками з міжнародної системи вимірювання одиниць (СІ), такими як «кіло» (1 кбіт / с \u003d 1024 біт / с) , «мега» (1 Мбіт / с \u003d 1024 кбіт / с), «гіга» (1 Гбіт / с \u003d 1024 Мбіт / с) або «тера» (1 Тбіт / с \u003d 1024 Гбіт / с). Нестандартна абревіатура «bps» часто використовується для заміни стандартного символу «біт / с», так що, наприклад, «1 Мбіт» використовується для позначення одного мільйона біт в секунду. Один байт в секунду (1 Б / с) відповідає 8 біт / с.

Характеристики

У форматах потокового відео і аудіо (наприклад, MPEG і MP3), що використовують стиснення c втратою якості, параметр «бітрейт» висловлює ступінь стиснення потоку і, тим самим, визначає розмір каналу, для якого стиснутий потік даних. Найчастіше бітрейт звуку і відео вимірюють в кілобітах в секунду (англ. kilobit per second, kbps), Рідше - в мегабитах в секунду (тільки для відео).

Існує три режими стиснення потокових даних:

CBR (Англ. Constant bitrate) - з постійним бітрейтом;
VBR (Англ. Variable bitrate) - зі змінним бітрейтом;
ABR (Англ. Average bitrate) - з усередненим бітрейтом.

Швидкість передачі інформації

Фізичний рівень чистого бітрейта, швидкість передачі інформації, корисної бітрейт, частота корисного навантаження, чиста швидкість передачі даних, швидкість передачі кодованих передач, ефективна швидкість передачі даних або швидкість подачі дроту (неофіційний мову) цифрового каналу зв'язку є здатність без урахування накладного протоколу фізичного рівня, для мультиплексу приклад з тимчасовим поділом каналів (TDM) обрамляють бітів, що резервуються з прямим виправленням помилок (FEC) кодів, еквалайзер навчальних символів та іншого канального кодування. Перешкодостійкі коди є загальними, особливо в системах бездротового зв'язку , Стандартів широкосмугового модему або сучасних високошвидкісних локальних мереж на основі міді. Фізичний рівень чистого бітрейта є швидкість передачі даних, виміряна в контрольній точці на межі поділу між канальним рівнем і фізичним рівнем, і, отже, може включати в себе лінію передачі даних, а також навантаження рівня.

У модемах і бездротових системах, Адаптації лінії зв'язку (автоматична адаптація швидкості передачі даних і модуляції і / або помилок схеми кодування, якість сигналу) часто застосовується. У цьому контексті термін пік бітрейта означає чистий бітрейт найшвидшою і найменш надійним режимом передачі, використовуваний, наприклад, [коли відстань дуже коротке замикання] Між відправником і передавачем. Деякі операційні системи і мережеве обладнання може виявити «швидкість з'єднання» (неофіційний мову) тієї чи іншої технології доступу до мережі або пристрою зв'язку, що передбачає поточну чисту швидкість передачі даних. Слід зазначити, що термін швидкість лінії в деяких підручниках визначається як валовий швидкості передачі в бітах, а в інших, як чистої швидкості передачі даних.

Взаємозв'язок між сукупним бітрейтом і чистої швидкості передачі даних залежить від швидкості ПІО коду у відповідності з наступним.

постійний бітрейт

постійний бітрейт - варіант кодування потокових даних, при якому користувач спочатку задає необхідний бітрейт, який не змінюється протягом усього файлу.

Його головна перевага - можливість досить точно передбачити розмір кінцевого файлу.

Однак варіант з постійним бітрейтом не дуже підходить для музичних творів, звучання яких динамічно змінюється в часі, так як не забезпечує оптимального співвідношення розмір / якість.

змінний бітрейт

З змінним бітрейтом кодек вибирає значення бітрейту виходячи з параметрів (рівня бажаної якості), причому протягом кодованого фрагмента бітрейт може змінюватися. При стисненні звуку потрібний бітрейт визначається на основі психоакустической моделі. даний метод дає найкраще співвідношення якість / розмір вихідного файлу, однак точний його розмір виявляється дуже погано передбачуваний. Залежно від характеру звуку (або зображення, в разі кодування відео), розмір отриманого файлу може відрізнятися в кілька разів.

усереднений бітрейт

усереднений бітрейт є гібридом постійного і змінного бітрейтів: значення в кбіт / c задається користувачем, а програма варіює його в деяких межах. Однак, на відміну від VBR, кодек з обережністю використовує максимально і мінімально можливі значення, не ризикуючи вийти за задану користувачем середню величину. Цей метод дозволяє найбільш гнучко задавати швидкість обробки (для аудіо це може бути будь-яким числом між 8 і 320 кбіт / с, проти чисел, кратних 16 в методі CBR) і з набагато більшою (порівняно з VBR) точністю передбачати розмір вихідного файлу.

MP3

Формат MP3 стиснення аудіо з втратами даних. Якість звуку поліпшується зі збільшенням бітрейту:

32 кбіт / с - як правило, прийнятно тільки для мови
96 кбіт / с - як правило, використовується для передачі мови або потокового звуку низької якості
128 або 160 кбіт / с - початковий рівень кодування музики
192 кбіт / с - прийнятну якість кодування музики
256 кбіт / с - висока якість кодування музики
320 кбіт / с - найвищу якість кодування, яка підтримується стандартом MP3

Інша аудіо

700 біт / с - найнижчий бітрейт, використовуваний мовним кодеком Codec2 з відкритим вихідним кодом; голос ледь розпізнається, бітрейт 1,2 кбіт / с дає набагато кращий звук
800 біт / с - мінімально необхідний рівень для розпізнавання мови, використовується в спеціалізованих мовних кодеків FS-1015
2,15 кбіт / с - мінімальний бітрейт кодека Speex з відкритим вихідним кодом
6 кбіт / с - мінімальний бітрейт кодека Opus з відкритим вихідним кодом
8 кбіт / с - телефонне якість звуку з використанням мовних кодеків

високоякісного аудіо

Тут ми розглянемо як правильно підібрати бітрейт для своєї інтернет трансляції. І так, Бітрейт - це якість відео. Чим він вищий, тим вище якість. Якщо зробити якісний стрім потік з чудовою картинкою, то потрібно просто підвищити бітрейт і все? Як би не так. Стрім потік то йде в режимі онлайн, відповідно, весь цей високий бітрейт займає інтернет канал і дивитися його буде неможливо. Тому потрібно враховувати можливості свого інтернету і інтернету вашої аудиторії. Не у всіх протягнуто оптоволокно. Так що вище 2 Мбіт / с бітрейн ставити не рекомендується.

Друге, на що варто звернути увагу, це, так зване, співвідношення біт / піксель. Дана Формула виглядає просто:

біт / (пікселі * кадри)

Що означає ця формула? Припустимо, ми кодируем стрім потік з дозволом 100px х 100px, на 25 fps (кадрів в секунду) і поставили бітрейт 250 kbps (кілобіт в секунду). Отже, на секунду відео розміром 10000 пікселів (сто множимо на сто) виділяється 25 кадрів і 250 кілобіт. Виходить по 10 кілобіт (10000 біт) на кожний кадр (250/25). Ділимо біти, що виділяються на кадр, на розмір в пікселях - отримаємо відношення біт / піксель - скільки інформації виділяється для «кодування» одного пікселя.

Чим більше інформації виділяється - тим вище якість.

У нашому прикладі ставлення біт / піксель становить: (по 10000 біт на кадр) / (10000 пікселів) \u003d 1. Забагато буде. цілком відмінна якість можна отримати при відносно 0,1 -0,15 . Для нашого прикладу було б досить бітрейта ~ 32-35 kbps.

Порахуємо орієнтовні співвідношення біт / піксель для найбільш поширених дозволів:

720p: 1280 × 720 точок:

Бітрейт 1500kbps - 1500000 / ((1280 * 720) * 25) \u003d 1500000/23040000 \u003d 0,065
Бітрейт 2500kbps - 2500000 / ((1280 * 720) * 25) \u003d 2500000/23040000 \u003d 0,109
Бітрейт 3500kbps - 3500000 / ((1280 * 720) * 25) \u003d 3500000/23040000 \u003d 0,152

1080p: 1920 × 1080 пікселів:

Бітрейт 1500kbps - 1500000 / ((1920 * 1080) * 25) \u003d 1500000/51840000 \u003d 0,029 ( як бачимо, якість при тому самому бітрейте буде гірше десь в 2,5 рази, тому для 1080р потрібен більший бітрейт, ніж для 720р)
Бітрейт 5000kbps - 5000000 / ((1920 * 1080) * 25) \u003d 5000000/23040000 \u003d 0,096
Бітрейт 7500kbps - 7500000 / ((1920 * 1080) * 25) \u003d 7500000/23040000 \u003d 0,145
Бітрейт 10000kbps - 10000000 / ((1920 * 1080) * 25) \u003d 10000000/23040000 \u003d 0,192

Які ж висновки можна зробити? Перше, воно ж головне, не можеш забезпечити дозвіл необхідним бітрейтом - не берися стрім. Все одно хочеш стрім? Знижуй або дозвіл або fps. Добий біт / піксель хочаб до 0,075-0,1, а краще більше.

якість

Розширення

Відео Бітрейт,kbps

Аудіо Бітрейт,kbps

FPS кадрів / сек

Відео-кодек

h.264профіль

Аудіо-кодек

Аудіо-канал

240 p (426 x 240)

400 (300-700)

AAC або MP3

270p (480x270)

400 (300-700)

AAC або MP3

360p (640x360)

750 (400-1000)

AAC або MP3

480p (854x480)

1000 (500-2000)

AAC або MP3

540p (960x540)

1000 (800 - 2000)

AAC або MP3

Mono або
Stereo

720p (1280x720)

2500 (1560-4000)

AAC або MP3

Mono або
Stereo

720p (1280x720)

3800 (2500-6000)

AAC або MP3

Mono або
Stereo

1080p (1920x1080)

4500 (3000-6000)

AAC або MP3

Mono або
Stereo

1080p (1920x1080)

6800 (4500-9000)

AAC або MP3

Mono або
Stereo

1440p) (2560x1440)

9000 (6000-13000)

AAC або MP3

Mono або
Stereo

1440p (2560x1440)

13000 (9000-18000)

AAC або MP3

Mono або
Stereo

4K / 2160р (3840x2106)

23000 (13000-34000)

AAC або MP3

Mono або
Stereo

4K / 2160р (3840x2106)

35000 (20000-51000)

AAC або MP3

Mono або
Stereo

Головна / Інструкції / Підбираємо бітрейт для стріму

Примітка: Для кращого розуміння викладеного нижче тексту дуже рекомендую ознайомитися з основами цифрового звуку.

S: Чим більше бітрейт, тим якісніше трек

R: Це далеко не завжди так. Для початку нагадаю, що таке бітрейте т (Bitrate, а не bitraid). Фактично це швидкість потоку даних в кілобітах на секунду при відтворенні. Т. е., Якщо ми візьмемо розмір треку в кілобітах і розділимо на його тривалість в секундах, отримаємо його бітрейт - т. Зв. file-based bitrate (FBR), зазвичай він не дуже відрізняється від бітрейта аудиопотока (причиною відмінностей є наявність в треку метаданих - тегів, «вшитих» зображень і т. п.).

Тепер візьмемо приклад: бітрейт нестислого PCM аудіо, записаного на звичайному Audio CD, розраховується наступним чином: 2 (каналу) * 16 (біт на кожен семпл) * 44100 (семплів в секунду) \u003d 1411200 (біт / с) \u003d 1411.2 кбіт / с . А тепер візьмемо і стиснемо трек будь-яким lossless кодеком ( «lossless» - «беспотерьний», т. Е. Такий, який не призводить до втрати будь-яких даних), наприклад кодеком FLAC. В результаті ми отримаємо бітрейт нижче вихідного, але якість при цьому залишиться незмінним - ось вам і перше спростування.

Сюди ще дещо варто додати. Бітрейт на виході при lossless стисненні може вийти найрізноманітніший (але, як правило він менше, ніж у нестислого аудіо) - залежить це від складності стискається сигналу, а точніше від надмірності даних. Таким чином, більш прості сигнали будуть стискуватися краще (т. Е. Маємо менший розмір файлу при такій же тривалості \u003d\u003e менший бітрейт), а більш складні - гірше. Саме тому класична музика в lossless має менший бітрейт, ніж, скажімо, рок. Але треба підкреслити, що бітрейт тут ні в якому разі не є показником якості звукового матеріалу.

Тепер поговоримо про lossy стисненні (з втратами). Насамперед треба розуміти, що існує безліч різних кодерів і форматів, і навіть в межах одного формату якість кодування у різних кодерів може відрізнятися (наприклад, QuickTime AAC кодує набагато якісніше застарілого FAAC), не кажучи вже про перевагу сучасних форматів (OGG Vorbis, AAC , Opus) над MP3. Простіше кажучи, з двох однакових треків, закодованих різними кодерами з одним бітрейтом, якийсь буде звучати краще, а якийсь - гірше.

Крім того, існує таке поняття, як апконверт. Т. е. Можна взяти трек у форматі MP3 з бітрейтом 96 кбіт / с і конвертувати його в MP3 320 кбіт / с. Мало того, що при цьому якість не покращиться (адже втрачені при попередньому кодуванні в 96 кбіт / с дані вже не повернути), воно навіть погіршиться. Тут варто вказати, що на кожному етапі lossy кодування (з будь-яким бітрейтом і будь-яким кодером) в аудіо вноситься певна порція спотворень.

І навіть більше. Є ще один нюанс. Якщо, скажімо, бітрейт аудіо потоку - 320 кбіт / с, це не означає, що всі 320 кбіт пішли на кодування тієї самої секунди. Це характерно для кодування з постійним бітрейтом і для тих випадків, коли людина, сподіваючись отримати максимальне, якість форсує занадто великий постійний бітрейт (як приклад - установка 512 кбіт / с CBR для Nero AAC). Як відомо, кількість біт, що виділяється на той чи інший фрейм, регулюється психоакустической моделлю. Але в разі, коли виділене кількість набагато нижче встановленого бітрейта, то не рятує навіть резервуар біт (про терміни читайте в статті «Що таке CBR, ABR, VBR?») - в результаті ми отримуємо непотрібні «нульові біти», які просто «добивають »розмір фрейма до потрібного (т. е. збільшують розмір потоку до заданого). До речі, це легко перевірити - стисніть отриманий файл архіватором (краще 7z) і подивіться на ступінь стиснення - чим вона більша - тим більше нульових бітів (т. К. Вони призводять до надмірності), тим більше даремно витраченого місця.

S: DVD-Audio звучить краще, ніж Audio CD (24 bit vs 16, 96 kHz vs 44.1 і т. П.)

R: в принципі, це цілком логічно, і навіть почасти правда, але ось тільки люди зазвичай дивляться тільки на цифри і дуже рідко замислюються про вплив того чи іншого параметра.

Отже, розглянемо для початку розрядність. Цей параметр відповідає ні за що інше, як за динамічний діапазон, тобто за різницю між самим тихим і найгучнішим звуками (в дБ). У цифровому аудіо максимальний рівень - це 0 dBFS, а мінімальний - обмежений рівнем шумів, т. Е. Фактично динамічний діапазон по модулю дорівнює рівню шумів. Для 16-бітного аудіо динамічний діапазон розраховується як 20 * log (2 ^ 16)? 96.33 (dB). При цьому динамічний діапазон симфонічного оркестру - до 75 дБ (в основному близько 40-50 дБ).

А тепер уявімо реальні умови. Рівень шуму в кімнаті - близько 40 дБ (не забуваємо, що дБ - величина відносна. У даному випадку за 0 дБ приймається поріг чутності), максимальна гучність музики досягає 110 дБ (щоб не було дискомфорту) - отримуємо різницю 70 дБ. Таким чином виходить, що динамічний діапазон більше 70 дБ в даному випадку просто не потрібний. Т. е. При діапазоні вище або гучні звуки досягатимуть больового порогу, або тихі звуки поглинатимуться оточуючими шумами. Досягти рівня навколишніх шумів менше 15 дБ дуже важко (так як на цьому рівні знаходиться гучність людського дихання та інших шумів обумовлених людським фактором), в результаті діапазон в 95 дБ для прослуховування музики виявляється абсолютно достатнім.

Тепер про частоту дискретизації (частота семплірованія, sample rate). Цей параметр відповідає за частоту квантування за часом і безпосередньо впливає на максимальну частоту сигналу, яку можна описати даним поданням аудіо. По теоремі Котельникова вона дорівнює половині частоти дискретизації. Т. е. Для звичайної частоти семплірованія в 44100 Гц максимальна частота складових сигналу - 22050 Гц. Максимальна ж частота. яка сприймається людським вухом - трохи вище 20000 Гц (і то, при народженні; у міру дорослішання поріг опускається до 16000 Гц).

Читайте Завантаження в форматі 24/192 - чому вони не мають сенсу.

S: Різні програмні плеєри звучать по-різному (e. G. Foobar2000 краще Winamp і т. П.)

R: Щоб зрозуміти, чому це не так, треба розібратися, що собою являє програмний плеєр. По суті це декодер, обробники (опціонально), плагін виведення (на один з інтерфейсів: ASIO, DirectSound, WASAPI. Etc.), ну і звичайно ж GUI (користувача). Т. к. Декодер в 99.9% випадків працює за стандартним алгоритмом, а плагін виведення - це всього лише частина програми, яка передає потік звукової карти через один з інтерфейсів, то причиною відмінностей можуть бути тільки обробники. Але справа в тому, що обробники зазвичай за замовчуванням вимкнені (або повинні бути вимкнені, т. К. Головне для хорошого плеєра - вміти передати звук в «первозданному» вигляді). У підсумку, предметом порівняння тут можуть бути тільки можливості обробки і виведення, в яких, до речі кажучи, необхідність дуже часто взагалі немає. Але навіть якщо така необхідність і є - то це вже порівняння оброблювачів, а ніяк не плеєрів.

Тут я ще хотів би згадати свою і, мабуть, засмутити користувачів, захоплюються «колосальними» змінами в звучанні після описаної в ній налаштування - в 95% випадків це самонавіювання (крім звичайно тих випадків, коли в ході її налаштування був вимкнений який-небудь « улучшайзеров »або інший обробник, що псує всю картину). Як це не сумно, виграш від всіх цих хитрувань з ReplayGain, ресемплерамі і лімітерамі - мізерний. Висновок: хочете дійсно якісного звуку - купіть собі Hi-Fi акустику і професійну звукову карту.

S: різні версії драйвера звучать по-різному

R: В основі цього твердження лежить банальне незнання принципів роботи звукової карти. Драйвер - це програмне забезпечення , Необхідне для ефективної взаємодії пристрою з операційною системою , А також зазвичай надає графічний інтерфейс користувача для можливості управління пристроєм, його параметрами і т. д. Драйвер звукової карти забезпечує розпізнавання звукової карти як звукового, повідомляє ОС про підтримуваних картою форматах, забезпечує передачу нестислого PCM (зазвичай) потоку на карту, а також дає доступ до налаштувань. Крім того, в разі наявності софтової обробки (засобами CPU), драйвер може містити різні DSP (обробники). Тому, по-перше, при відключених ефектах і обробці, якщо драйвер не забезпечує точну передачу PCM на карту, це вважається грубою помилкою, критичним багом. І трапляється це вкрай рідко. З іншого боку, відмінності між драйверами можуть в оновленні алгоритмів обробки (ресемплеров, ефектів), хоча це трапляється теж вельми рідко. До того ж ефекти і будь-яку обробку драйвером все одно слід відключити / обійти для досягнення найвищої якості.

Таким чином, оновлення драйверів в основному орієнтовані на підвищення стабільності роботи і усунення помилок, пов'язаних з обробкою. Ні те, ні інше в нашому випадку на якість відтворення не впливає, тому в 999 випадках з 1000 драйвер впливу на звук не робить.

S: Ліцензійні Audio CD звучать краще, ніж їх копії

R: Якщо при копіюванні не відбулося помилок (непереборних) читання / запису і у оптичного приводу пристрою, на якому буде відтворюється диск-копія, немає проблем з його читанням, то таке твердження хибне і легко спростовується.

S: Режим кодування Stereo дає найкраща якість , Ніж Joint Stereo

R: Це помилка головним чином стосується LAME MP3, так як всі сучасні кодери (AAC, Vorbis, Musepack) використовують тількирежим Joint Stereo (і це вже про щось говорить)

Для початку варто згадати, що режим Joint Stereo успішно використовується при lossless стисненні. Суть його полягає в тому, що сигнал перед кодуванням розкладається на суму правого і лівого каналу (Mid) і на їх різницю (Side), а потім відбувається окреме кодування цих сигналів. У межі (для однакової інформації в правому і лівому каналі) виходить подвійна економія даних. А так як в більшості музики інформація в правому і лівому каналах досить схожа, то цей метод виявляється дуже ефективним і дозволяє значно збільшити ступінь стиснення.

У lossy принцип той же. Але тут в режимі постійного бітрейта якість фрагментів зі схожою інформацією в двох каналах буде збільшуватися (в межі - подвоюватися), а для VBR режиму в таких місцях буде просто зменшуватися бітрейт (не забуваємо, що головне завдання VBR режиму - стабільно підтримувати задану якість кодування, використовуючи мінімально можливий бітрейт). Так як під час lossy кодування пріоритет (при розподілі бітів) віддається сумі каналів, щоб уникнути погіршення стереопанорами, використовується динамічне перемикання між режимами Joint Stereo (Mid / Side) і звичайним (Left / Right) стерео на базі фреймів. До речі кажучи, причиною цієї помилки послужило недосконалість алгоритму перемикання в старих версіях LAME, а також наявність режиму Forced Joint, в якому автопереключеніе відсутня. В останніх версіях LAME режим Joint включений за замовчуванням і змінювати його не рекомендується.

S: Чим ширше спектр, тим якісніше запис (про спектрограмах, auCDtect і частотному діапазоні)

R: В наш час на форумах, на жаль, дуже поширене вимір якості треку «лінійкою по спектрограмі». Очевидно, через простоти такого способу. Але, як показує практика, в дійсності все набагато складніше.

А справа тут ось в чому. Спектрограма візуально демонструє розподіл потужності сигналу по частотах, але не може дати повного уявлення про звучання запису, наявності в ній спотворень і артефактів компресії. Т. е. По суті все що можна визначити по спектрограмі - це частотний діапазон (І частково - щільність спектра в районі ВЧ). Т. е., В кращому випадку, шляхом аналізу спектрограми можна виявити апконверт. Порівняння ж спектрограм треків, отриманих шляхом кодування різними кодерами, з оригіналом - цілковитий абсурд. Так, ви зможете виявити відмінності в спектрі, але ось визначити, чи будуть вони (і якою мірою) сприйматися людським вухом - практично неможливо. Не можна забувати, що завдання lossy кодування - забезпечити результат не відрізняється людським вухом від оригіналу (не оком).

Це саме можна сказати і до оцінки якості кодування шляхом аналізу треків на виході програмою auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - це лише оболонки для єдиною в своєму роді консольної програми auCDtect). Алгоритм auCDtect теж фактично аналізує частотний діапазон і всього лише дозволяє визначити (з певною часткою ймовірності), чи було на будь-якому з етапів кодування застосоване MPEG стиснення. Алгоритм заточений під MP3, тому його легко «обдурити» за допомогою кодеків Vorbis, AAC і Musepack, так що навіть якщо програма пише «100% CDDA» - це не означає, що закодоване аудіо на 100% відповідає початковому.

І, повертаючись безпосередньо до спектрами. Популярно також прагнення деяких «ентузіастів» будь-що там не було відключити lowpass (НЧ) фільтр в кодере LAME. Тут на обличчя нерозуміння принципів кодування та психоакустики. По-перше, кодер обрізає високі частоти тільки з однією метою - заощадити дані і використовувати їх для кодування найбільш чутного діапазону частот. Розширений частотний діапазон може фатально позначитися на загальній якості звучання і привести до чутним артефактів кодування. Більш того, відключення зрізу на 20 кГц - взагалі абсолютно невиправдано, тому що частоти вище людина просто не чує.

S: Існує якась «чарівна» попереднє встановлення еквалайзера, здатна значно поліпшити звучання

R: Це не зовсім так, по-перше, тому, що кожна окремо взята конфігурація (навушники, акустика, звукова карта) Має свої власні параметрами (зокрема, своєю амплітудно-частотної характеристикою). І тому до кожної конфігурації повинен бути свій, унікальний підхід. Простіше кажучи, така попереднє встановлення еквалайзера існує, але вона відрізняється для різних конфігурацій. Суть же її полягає в коригуванні АЧХ тракту, а саме - в «вирівнюванні» небажаних провалів і сплесків.

Також, серед людей далеких від безпосередньої роботи зі звуком дуже популярна настройка графічного еквалайзера «галочкою», що фактично являє собою підвищення рівня НЧ і ВЧ складових, але в той же час призводить до приглушення вокалу і інструментів, спектр звучання яких знаходиться в районі середніх частот .

S: Перед конвертацією музики в інший формат слід «розтискати» її в WAV

R: Відразу зазначу, що під WAV маються на увазі PCM дані (імпульсно-кодова модуляція) в контейнері WAVE (файл з розширенням * .wav). Ці дані представляють собою ні що інше, як послідовність бітів (нулів і одиниць) групами по 16, 24 або 32 (в залежності від розрядності), кожна з яких представляє собою двійковий код амплітуди відповідного їй семпли (наприклад, для 16 біт в десятковому поданні це значення від -32768 до +32768).

Так ось, справа в тому, що будь-який обробник звуку - будь то фільтр або кодер - як правило працює тільки з цими значеннями, тобто тільки з незжатими даними. Це означає, що для перетворення звуку, скажімо, з FLAC в APE, просто необхідно спочатку декодувати FLAC в PCM, а потім вже закодувати PCM в APE. Це як для перепаковки файлів з ZIP в RAR, треба спочатку розпакувати ZIP.

Однак, якщо ви користуєтеся конвертером або просто просунутим консольним кодером, проміжне перетворення в PCM відбувається на льоту, іноді навіть без запису в тимчасовий WAV файл. Саме це і вводить людей в оману - здається, що формати конвертуються безпосередньо один в інший, але насправді в такій програмі обов'язково є декодер вхідного формату, який виконує помежуточное перетворення в PCM.

Таким чином, ручне перетворення в WAV не дасть вам абсолютно нічого, крім зайвої витрати часу.

Розвінчання популярних міфів про цифрове звуці.

2017-10-01T15: 27

Audiophile "s Software

Також багато порушених нижче моменти висвітлені в моїй публікації «Ще раз про сумну правду: звідки насправді береться гарне звучання?» .

Чим більше бітрейт, тим якісніше трек

Це далеко не завжди так. Для початку нагадаю, що таке бітрейте т (Bitrate, а не bitraid). Фактично це швидкість потоку даних в кілобітах на секунду при відтворенні. Т. е., Якщо ми візьмемо розмір треку в кілобітах і розділимо на його тривалість в секундах, отримаємо його бітрейт - т. Зв. file-based bitrate (FBR), зазвичай він не дуже відрізняється від бітрейта аудиопотока (причиною відмінностей є наявність в треку метаданих - тегів, «вшитих» зображень і т. п.).

Тепер візьмемо приклад: бітрейт нестислого PCM аудіо, записаного на звичайному Audio CD, розраховується наступним чином: 2 (каналу) × 16 (біт на кожен семпл) × 44100 (семплів в секунду) \u003d 1411200 (біт / с) \u003d 1411.2 кбіт / с . А тепер візьмемо і стиснемо трек будь-яким lossless кодеком ( «lossless» - «беспотерьний», т. Е. Такий, який не призводить до втрати будь-якої інформації), наприклад кодеком FLAC. В результаті ми отримаємо бітрейт нижче вихідного, але якість при цьому залишиться незмінним - ось вам і перше спростування.

Тепер поговоримо про lossy стисненні (з втратами). Перш за все треба розуміти, що існує безліч різних кодерів і форматів, і навіть в межах одного формату якість кодування у різних кодерів може відрізнятися (наприклад, QuickTime AAC кодує набагато якісніше застарілого FAAC), не кажучи вже про перевагу сучасних форматів (OGG Vorbis, AAC , Opus) над MP3. Простіше кажучи, з двох однакових треків, закодованих різними кодерами з одним бітрейтом, якийсь буде звучати краще, а якийсь - гірше.

Крім того, існує таке поняття, як апконверт. Т. е., Можна взяти трек у форматі MP3 з бітрейтом 96 кбіт / с і конвертувати його в MP3 320 кбіт / с. Мало того, що при цьому якість не покращиться (адже втрачені при попередньому кодуванні в 96 кбіт / с дані вже не повернути), воно навіть погіршиться. Тут варто вказати, що на кожному етапі lossy кодування (з будь-яким бітрейтом і будь-яким кодером) в аудіо вноситься певна порція спотворень.

І навіть більше. Є ще один нюанс. Якщо, скажімо, бітрейт аудіопотоку - 320 кбіт / с, це не означає, що всі 320 кбіт пішли на кодування тієї самої секунди. Це характерно для кодування з постійним бітрейтом і для тих випадків, коли людина, сподіваючись отримати максимальну якість, форсує занадто великий постійний бітрейт (як приклад - установка 512 кбіт / с CBR для Nero AAC). Як відомо, кількість біт, що виділяється на той чи інший фрейм, регулюється психоакустической моделлю. Але в разі, коли виділене кількість набагато нижче встановленого бітрейта, то не рятує навіть резервуар біт (про терміни читайте в статті «Що таке CBR, ABR, VBR?») - в результаті ми отримуємо непотрібні «нульові біти», які просто «добивають »розмір фрейма до потрібного (т. е. збільшують розмір потоку до заданого). До речі, це легко перевірити - стисніть отриманий файл архіватором (краще 7z) і подивіться на ступінь стиснення - чим вона більша - тим більше нульових бітів (т. К. Вони призводять до надмірності), тим більше даремно витраченого місця.

Кодеки lossy (MP3 і інші) здатні справітьcя c сучасної електронної музикою, але не здатні якісно закодувати класичну (академічну), живу, інструментальну музику

«Іронія долі» тут в тому, що насправді все з точністю до навпаки. Як відомо, академічна музика в переважній більшості випадків слід мелодійним і гармонійним принципам, а також інструментальному складу. З математичної точки зору це обумовлює відносно простий гармонійний склад музики. Так переважання консонансів продукує меншу кількість побічних гармонік: наприклад, для квінти (інтервал, в якому основні частоти двох звуків розрізняються в півтора рази) загальною для двох звуків буде кожна друга гармоніка, для кварти, де частоти відрізняються на одну третину - кожна третя, і т. п. Крім того, наявність фіксованих співвідношень частот, обумовлених використанням рівномірно темперованого ладу, також спрощує спектральний склад класичної музики. Живий інструментальний склад класики обумовлює відсутність в ній шумів, характерних для електронної музики, спотворень, різких стрибків амплітуди, а також відсутність надлишку високочастотних складових.

Перераховані вище фактори призводять до того, що класична музика набагато легше стискується, перш за все, чисто математично. Якщо ви пам'ятаєте, математичне стиснення працює за рахунок усунення надмірності (описуючи схожі фрагменти інформації з використанням меншої кількості бітів), а також за рахунок передбачення (т. Зв. предиктори пророкують поведінку сигналу, а потім кодується тільки відхилення реального сигналу від передбаченого - чим точніше вони збіглися, тим менше бітів потрібно для кодування). В даному випадку відносно простий спектральний склад і гармонійність зумовлюють високу надмірність, усунення якої дає значний ступінь компресії, а мала кількість сплесків і шумових компонентів (є випадковими і непередбачуваними сигналами) обумовлює хорошу математичну передбачуваність переважної частини інформації. І це я вже не кажу про відносно невеликий середньої гучності класичних треків і про часто зустрічаються проміжках тиші, для кодування яких інформація практично не потрібно. У підсумку ми можемо без втрат стиснути, наприклад, деяку сольну інструментальну музику до бітрейтів нижче 320 кбіт / с (кодери TAK і OFR на таке цілком здатні).

Так ось, по-перше, справа в тому, що математичне стиснення, що лежить в основі lossless кодування, є також і одним з етапів lossy кодування (читайте Зрозуміло про MP3 кодуванні). А по-друге, т. К. В lossy використовується перетворення Фур'є (розкладання сигналу на гармоніки), то простота спектрального складу навіть подвійно полегшує кодеру роботу. У підсумку, порівнюючи оригінальний і закодований семпл класичної музики в сліпому тесті, ми з подивом виявляємо, що ніяких відмінностей знайти не можемо, навіть при відносно низькому бітрейті. І найсмішніше - що коли ми починаємо зовсім знижувати бітрейт кодування, перше, що виявляє відмінності - фонові шуми в запису.

Що ж стосується електронної музики - з нею кодерам доводиться дуже нелегко: шумові складові мають мінімальну надмірність, і разом з різкими стрибками (якимись пилкоподібними імпульсами) є вкрай непередбачуваними сигналами (для кодерів, які «заточені» під природні звуки, провідні себе абсолютно інакше), пряме ж і зворотне перетворення Фур'є з покидьком окремих гармонік психоакустической моделлю неминуче дає ефекти пре- і пост-відлуння, чутність яких кодеру далеко не завжди легко оцінити ... Додайте ще до цього високий рівень ВЧ складових - і отримаєте велика кількість кілер-семплів, з якими на середньо-низьких бітрейтах не справляються навіть найбільш просунуті кодери, як не дивно, саме серед електронної музики.

Також бавлять думки «досвідчених слухачем» та музикантів, які при повному нерозумінні принципів lossy кодування починають стверджувати, що вони чують, як інструменти в музиці після кодування починають фальшивити, частоти плавають і т. П. Це, можливо, ще було б справедливо для допотопних касетних плеєрів з детонацією, але в цифровому аудіо все точно: частотна складова або залишається, або відкидається, зміщувати тональність тут просто немає потреби. Більш того: наявність у людини музичного слуху зовсім не означає наявність у нього хорошого частотного слуху (наприклад, здатності сприймати частоти\u003e 16 кГц, яка з віком сходить нанівець) і аж ніяк не полегшує йому завдання пошуку артефактів lossy кодування, т. К. Спотворення ці мають характер дуже специфічний і вимагають досвіду сліпого порівняння саме lossy аудіо - треба знати, на чому і де шукати.

DVD-Audio звучить краще, ніж Audio CD (24 біта проти 16-ти, 96 кГц проти 44.1 і т. П.)

На жаль, люди зазвичай дивляться тільки на цифри і дуже рідко замислюються про вплив того чи іншого параметра на об'єктивне якість.

Розглянемо для початку розрядність. Цей параметр відповідає не за що інше, як за динамічний діапазон, т. Е., За різницю між самим тихим і найгучнішим звуками (в дБ). У цифровому аудіо максимальний рівень - це 0 dBFS (FS - full scale), а мінімальний - обмежений рівнем шумів, т. Е., Фактично динамічний діапазон по модулю дорівнює рівню шумів. Для 16-бітного аудіо динамічний діапазон розраховується як 20 × log 10 2 16, що дорівнює 96.33 СБ. При цьому динамічний діапазон симфонічного оркестру - до 75 дБ (в основному близько 40-50 дБ).

А тепер уявімо реальні умови. Рівень шуму в кімнаті - близько 40 дБ (не забуваємо, що дБ - величина відносна. У даному випадку за 0 дБ приймається поріг чутності), максимальна гучність музики досягає 110 дБ (щоб не було дискомфорту) - отримуємо різницю 70 дБ. Таким чином виходить, що динамічний діапазон більше 70 дБ в даному випадку просто не потрібний. Т. е. При діапазоні вище або гучні звуки досягатимуть больового порогу, або тихі звуки будуть поглинатися оточуючими шумами. Досягти рівня навколишніх шумів менше 15 дБ дуже важко (так як на цьому рівні знаходиться гучність людського дихання та інших шумів обумовлених, людської фізіологією), в результаті діапазон в 95 дБ для прослуховування музики виявляється абсолютно достатнім.

Найкраще дана тема розкрита в статті Завантаження в форматі 24/192 - чому вони не мають сенсу.

Різні програмні плеєри звучать по-різному (e. G. Foobar2000 краще Winamp і т. П.)

Щоб зрозуміти, чому це не так, треба розібратися, що собою являє програмний плеєр. По суті це декодер, обробники (опціонально), плагін виведення (на один з інтерфейсів: ASIO, DirectSound, WASAPI. Etc.), ну і звичайно ж GUI (графічний інтерфейс користувача). Т. к. Декодер в 99.9% випадків працює за стандартним алгоритмом, а плагін виведення - це всього лише частина програми, яка передає потік звукової карти через один з інтерфейсів, то причиною відмінностей можуть бути тільки обробники. Але справа в тому, що обробники зазвичай за замовчуванням вимкнені (або повинні бути вимкнені, т. К. Головне для хорошого плеєра - вміти передати звук в «первозданному» вигляді). У підсумку, предметом порівняння тут можуть бути тільки можливості обробки і виведення, в яких, до речі кажучи, необхідність дуже часто взагалі немає. Але навіть якщо така необхідність і є - то це вже порівняння оброблювачів, а ніяк не плеєрів.

Різні версії драйвера звучать по-різному

У підставі цього твердження лежить банальне незнання принципів роботи звукової карти. Драйвер - це програмне забезпечення, Необхідне для ефективної взаємодії пристрої з операційною системою, також зазвичай надає графічний інтерфейс користувача для можливості управління пристроєм, його параметрами і т. Д. Драйвер звукової карти забезпечує розпізнавання звукової карти як звукового пристрою Windows, Повідомляє ОС про підтримуваних картою форматах, забезпечує передачу нестислого PCM (в більшості випадків) потоку на карту, а також дає доступ до налаштувань. Крім того, в разі наявності софтової обробки (засобами CPU), драйвер може містити різні DSP (обробники). Тому, по-перше, при відключених ефектах і обробці, якщо драйвер не забезпечує точну передачу PCM на карту, це вважається грубою помилкою, критичним багом. І трапляється таке вкрай рідко. З іншого боку, відмінності між драйверами можуть бути в оновленні алгоритмів обробки (ресемплеров, ефектів), хоча це трапляється теж аж ніяк не часто. До того ж, для досягнення найвищої якості ефекти і будь-яку обробку драйвером все одно слід виключати.

Ліцензійні Audio CD звучать краще, ніж їх копії

Якщо при копіюванні не відбулося помилок (непереборних) читання / запису і у оптичного приводу пристрою, на якому буде відтворюється диск-копія, немає проблем з його читанням, то таке твердження хибне і легко спростовується.

Режим кодування Stereo дає кращу якість, ніж Joint Stereo

Це оману головним чином стосується LAME MP3, так як всі сучасні кодери (AAC, Vorbis, Musepack) використовують тільки режим Joint Stereo (і це вже про щось говорить)

Чим ширше спектр, тим якісніше запис (про спектрограмах, auCDtect і частотному діапазоні)

У наш час на форумах, на жаль, дуже поширене вимір якості треку «лінійкою по спектрограмі». Очевидно, через простоти такого способу. Але, як показує практика, в дійсності все набагато складніше.

А справа тут ось в чому. Спектрограма візуально демонструє розподіл потужності сигналу по частотах, але не може дати повного уявлення про звучання запису, наявності в ній спотворень і артефактів компресії. Т. е., По суті все, що можна визначити по спектрограмі, - це частотний діапазон (і частково - щільність спектра в районі ВЧ). Т. е., В кращому випадку, шляхом аналізу спектрограми можна виявити апконверт. Порівняння ж спектрограм треків, отриманих шляхом кодування різними кодерами, з оригіналом - цілковитий абсурд. Так, ви зможете виявити відмінності в спектрі, але ось визначити, чи будуть вони (і якою мірою) сприйматися людським вухом - практично неможливо. Не можна забувати, що завдання lossy кодування - забезпечити результат не відрізняється людським вухом від оригіналу (не оком).

І повертаючись безпосередньо до спектрами. Популярно також прагнення деяких «ентузіастів» будь-що там не було відключити lowpass (НЧ) фільтр в кодере LAME. Тут на обличчя нерозуміння принципів кодування та психоакустики. По-перше, кодер обрізає високі частоти тільки з однією метою - заощадити дані і використовувати їх для кодування найбільш чутного діапазону частот. Розширений частотний діапазон може фатально позначитися на загальній якості звучання і привести до чутним артефактів кодування. Більш того, відключення зрізу на 20 кГц - взагалі абсолютно невиправдано, тому що частоти вище людина просто не чує.

Існує якась «чарівна» попереднє встановлення еквалайзера, здатна значно поліпшити звучання

Це не зовсім так, по-перше, тому, що кожна окремо взята конфігурація (навушники, акустика, звукова карта) має свої власні параметрами (зокрема, своєю амплітудно-частотної характеристикою). І тому до кожної конфігурації повинен бути свій, унікальний підхід. Простіше кажучи, така попереднє встановлення еквалайзера існує, але вона відрізняється для різних конфігурацій. Суть же її полягає в коригуванні АЧХ тракту, а саме - в «вирівнюванні» небажаних провалів і сплесків.

Також серед людей далеких від безпосередньої роботи зі звуком дуже популярна настройка графічного еквалайзера «галочкою», що фактично являє собою підвищення рівня НЧ і ВЧ складових, але в той же час призводить до приглушення вокалу і інструментів, спектр звучання яких знаходиться в районі середніх частот.

Перед конвертацією музики в інший формат слід «розтискати» її в WAV

Відразу зазначу, що під WAV маються на увазі PCM дані (імпульсно-кодова модуляція) в контейнері WAVE (файл з розширенням * .wav). Ці дані являють собою не що інше, як послідовність бітів (нулів і одиниць) групами по 16, 24 або 32 (в залежності від розрядності), кожна з яких представляє собою двійковий код амплітуди відповідного їй семпли (наприклад, для 16 біт в десятковому поданні це значення від -32768 до +32768).

Однак, якщо ви користуєтеся конвертером або просто просунутим консольним кодером, проміжне перетворення в PCM відбувається на льоту, іноді навіть без запису в тимчасовий WAV файл. Саме це і вводить людей в оману: здається, що формати конвертуються безпосередньо один в інший, але насправді в такій програмі обов'язково є декодер вхідного формату, який виконує проміжне перетворення в PCM.

Таким чином, ручне перетворення в WAV не дасть вам абсолютно нічого, крім зайвої витрати часу.