Контакти

фундаментальні дослідження

адаптер

Оскільки лінійний вхід звукового адаптера є основним приймачем зовнішнього сигналу під час запису, кожен виробник прагне забезпечити на цьому вході достатню якість посилення сигналу. Чутливість лінійних входів більшості звукових адаптерів приблизно однакова, а параметри якості пропорційні загальній якості плат. Зовсім інакше йде справа з мікрофонними входами: плата вартістю 100 дол. Може мати набагато гірший за чутливості і якості вхід, ніж ширвжиткового за 8 дол. Причина тут в тому, що мікрофонний вхід для звукового адаптера є другорядним і його функціональність найчастіше обмежується підключенням найпростішого дешевого мікрофона для подачі голосових команд, де рівень шуму і АЧХ не настільки критичні.

Мікрофонні входи сучасних адаптерів розраховані, як правило, на підключення електретних мікрофонів з вбудованим підсилювачем, які отримують живлення від адаптера. Такий мікрофон має високий вихідний опір і розвиває на виході до 50-100 мВ, тому для посилення сигналу до рівня лінійного входу (близько 500 мВ) досить найпростішого підсилювача. Деякі адаптери, згідно з документацією, дозволяють підключати і динамічні мікрофони, які не потребують харчуванні, проте такий мікрофон розвиває на виході всього 1-3 мВ і вимагає досить чутливого і малошумящего підсилювача, який на звукових платах зустрічається досить рідко. Тому типова плата в кращому випадку дозволяє отримати з такого мікрофона недостатньо гучний, глухуватий звук, багатий шумами і наведеннями, а в гіршому випадку від динамічного мікрофона ви взагалі не досягнете звуку. Перевага електретний мікрофонів віддається внаслідок того, що комп'ютер є джерелом безлічі електромагнітних випромінювань, що створюють на чутливому мікрофонний вхід відчутні перешкоди, впоратися з якими досить складно. Створення малошумящего підсилювача зажадало б спеціальної компоновки плати, ретельної фільтрації напруги живлення, екранування області вхідних ланцюгів і інших складних і дорогих хитрувань.

Роз'єм мікрофонного входу більшості адаптерів - моно; в ньому для передачі сигналу використовується тільки кінцевий контакт (TIP) штекера, який в стереофонічному роз'ємі відповідає за сигнал лівого каналу. Середній контакт (RING), який в стереофонічному роз'ємі відповідає за правий канал, в мікрофонному роз'ємі або взагалі не використовується, або служить для передачі напруги живлення +5 В для електретного мікрофона. Коли окремий контакт для харчування мікрофона відсутня, напруга живлення подається прямо на сигнальний вхід, а підсилювачі в цьому випадку повинні мати емкостную розв'язку входу і виходу.

мікрофон

Як ми з'ясували, для безпосереднього підключення до адаптера найкраще підійдуть електретних мікрофони, які зазвичай випускаються в досить мініатюрному виконанні: у вигляді «олівців» з підставками або «кліпс», що прикріплюються до одягу або до корпусу монітора. Вони недорогі і продаються в магазинах комп'ютерних аксесуарів; а то й потрібно високої якості запису, близького до професійного, - таким мікрофоном цілком можна обійтися. В іншому випадку необхідний якісний професійний мікрофон, за яким доведеться йти в магазин музичної апаратури, і ціна його буде приблизно на порядок вище.

З підключенням професійного мікрофона обов'язково виникне кілька проблем. Такі мікрофони найчастіше є динамічними і видають сигнал амплітудою в одиниці мілівольт, а мікрофонний вхід більшості звукових адаптерів, як уже говорилося, не здатний нормально сприймати настільки слабкі сигнали. Виходів може бути два: або купити в тому ж музичному магазині мікрофонний передпідсилювач (який може виявитися досить дорогою іграшкою) і підключити його вихід вже не до мікрофонного, а до лінійного входу адаптера; або використовувати мікрофон з вбудованими предусилителем і харчуванням (батарейкою). При наявності радіотехнічних навичок можна зібрати нескладний підсилювач самостійно - варіанти схем досить часто зустрічаються в книгах і в Інтернеті.

Крім того, професійні мікрофони зазвичай мають роз'єми типу XLR, а комп'ютерні звукові адаптери - mini-DIN, так що буде потрібно перехідник; іноді такі перехідники продаються в музичних магазинах, проте не виключено, що доведеться паяти його самостійно.

І нарешті, цілком може так статися, що будь-який професійний мікрофон буде набагато перевершувати ваш звуковий адаптер за якісними параметрами і звук, який ви отримаєте за допомогою такого мікрофона, в підсумку буде не краще того, що може забезпечити простий електретний. Тому якщо у вас є сумніви в високій якості свого адаптера (а прості адаптери ціною близько 10 дол., Тим більше вбудовані, мають досить посередні параметри), то вам має сенс домовитися в магазині про можливе повернення купленого мікрофона, якщо не вдасться отримати з його допомогою досить якісний звук.

технологія запису

На відміну від джерел фіксованого сигналу, мікрофон має ряд особливостей, які необхідно враховувати при роботі з ним. Перш за все, він любить «фонить»: якщо посилений сигнал з мікрофона надходить на колонки, то мікрофон сприймає його, сигнал знову посилюється і т.д., тобто утворюється так звана позитивний зворотний зв'язок, яка «розгойдує» звуковий тракт, вводить його в режим самозбудження, що проявляється у вигляді гучного свисту, дзвону або гулу. Навіть якщо тракт не увійде в режим самозбудження, позитивний зв'язок може давати дзвінкий або свистячий призвук, який помітно псує сигнал. При цьому чутливий мікрофон може успішно ловити сигнал навіть з навушників, якщо звук у них досить гучний, а зовнішня звукоізоляція слабка. Тому необхідно експериментальним шляхом визначити такий стан / напрямок мікрофона і гучність посиленого звуку, при якому позитивний зв'язок проявляється найменше. Остаточну запис рекомендується проводити при відключених або хоча б максимально приглушених колонках.

Чутливі мікрофони, особливо прості і дешеві, відмінно сприймають сторонні звуки на зразок шереху пальців по корпусу мікрофона або легкого поскрипування самого корпусу навіть від незначного стиснення (напевно вам доводилося чути подібні звуки при телефонних розмовах). Щоб уникнути таких перешкод, мікрофон краще встановити на зручній підставці або тримати його вільно, не здавлюючи пальцями.

Ще один неприємний момент у використанні мікрофона - так зване заплевиваніе потоком повітря, яке особливо яскраво проявляється на вибухових приголосних, таких як «п», «б», «т» і їм подібних. В результаті попадання на мембрану інтенсивного звукового імпульсу утворюється різкий кидок амплітуди сигналу, перевантажують підсилювач і / або АЦП. Професійні мікрофони мають проти цього вітрозахист - сітку або м'яку прокладку, розташовану на деякій відстані від капсуля, але навіть вона не завжди рятує, тому до кожного мікрофона доводиться пристосовуватися, звикаючи тримати його або під правильним кутом, щоб прямі повітряні потоки проходили повз, або на достатній відстані, щоб вони досягали мікрофона в уже ослабленому стані.

Експериментуючи з мікрофоном, ви виявите, що тембр записаний голос досить сильно залежить від відстані від рота до мікрофона і від кута нахилу мікрофона щодо особи. Це викликано тим, що низькочастотні складові голоси найбільше розсіюються і послаблюються з відстанню, тоді як високочастотні послаблюються менше, зате мають більш виражену спрямованість. Найбільш соковитий і оксамитовий тембр голосу можна отримати, розмістивши мікрофон безпосередньо біля рота, але тоді доведеться добряче попрацювати з кутом нахилу і чимало потренуватися, щоб уникнути «заплевиванія».

Запис за допомогою зовнішніх пристроїв

Останнім часом з'явилися досить екзотичні способи запису звуку з мікрофону і перенесення його в комп'ютер. Так, Creative випускає цифровий програвач Jukebox, що містить мініатюрний накопичувач на жорсткому диску, автономний контролер і інтерфейс USB. Основна функція програвача - відтворення звукових файлів, які перекачуються в нього з комп'ютера, однак вбудований мікрофон дозволяє використовувати його в якості автономного диктофона: звук записується на жорсткий диск, що забезпечує безперервну запис протягом декількох годин, а згодом фонограма може бути перенесена в комп'ютер. Інший виріб Creative - PC Cam являє собою гібрид цифрового фотоапарата, відеокамери і диктофона і дозволяє записувати звук у вбудовану Flash-пам'ять, звідки він витягується за допомогою того ж інтерфейсу USB.

Видалення шумів і перешкод

оскольку голосовий сигнал має досить вузький спектр (сотні герц - одиниці кілогерц), до нього можна застосовувати операцію видалення шуму з більшою глибиною, ніж в разі довільного музичного сигналу. При записи може також опинитися, що в найбільш вдало записаному фрагменті (з художньої точки зору) мікрофон все-таки виявився «запльованим» в одному або в декількох місцях і спроби повторити фразу або куплет пісні з настільки ж вдалою розстановкою акцентів не дають бажаного результату. У таких випадках можна спробувати скруглить імпульси перевантаження, зберігши або зменшивши їх амплітуду. При незначній кількості імпульсів це зручно робити вручну, збільшивши зображення до появи вузлових точок, які можна чіпляти мишею.

Методи обробки голосу

ак ми вже говорили, складний музичний сигнал містить безліч різнорідних складових, на які більшість методів обробки звуку впливає з різним ефектом, тому спектр універсальних методів обробки сигналу досить вузький. Найбільш популярний метод реверберації, що імітує множинне відображення звукових хвиль і створює ефект простору - кімнати, залу, стадіону, гірського каньйону і т.п .; реверберація дозволяє надати «сухому» звуку соковитість і обсяг. решта універсальні методи обробки зводяться до маніпуляції АЧХ (еквалайзер), чищенні фонограми від шумів і перешкод.

Відносно ж первинного, простого звукового сигналу може бути досить успішно застосований весь спектр існуючих методів обробки - амплітудних, частотних, фазових, тимчасових, формантних і т.п. Ті методи, що на складному сигналі народжують неблагозвучную какофонію, на простих сигналах нерідко здатні привести до створення дуже цікавих і яскравих ефектів, широко використовуваних в звукової індустрії.

монтаж

Комп'ютерний монтаж мовних фонограм - типове заняття журналіста після запису інтерв'ю - одночасно і простий, і складний. Спочатку він здається простим, завдяки зручній для візуального аналізу структурі мови, наявності помітних пауз між словами, сплесків амплітуди в місцях акцентів і т.п. Однак при спробі, наприклад, переставити місцями дві фрази, розділені буквально секундами, з'ясовується, що вони не бажають стикуватися - встигли змінитися інтонація, фаза дихання, фоновий шум, і на стику чітко прослуховується збивання. Такі збивання легко помітні практично в будь-якому радіоінтерв'ю, коли записується мова людини, яка не є професійним радіожурналістом і, отже, не вміє говорити тільки те, що повинно піти в ефір. З промови вирізають зайве, деякі фрагменти переставляють місцями для більшої відповідності змісту, в результаті чого слух постійно «дивується», оскільки в потоці природної людської мови таких інтонаційних і динамічних переходів не буває.

Для згладжування ефектів переходу можна скористатися методом взаімоперекритія (crossfade), хоча він дозволить зістикувати фрагменти мови лише за амплітудою, але не по інтонації і фоновим шумів. Тому вважаємо за потрібне застерегти тих, кому комп'ютерний монтаж здасться зручним способом фальсифікації запису, наприклад, переговорів: експертиза здатна без зусиль виявити навіть неможливо розрізнити вухом місця склейки, як і в випадку з підробкою документів за допомогою сканера і принтера.

амплітудна обробка

Найпростіший вид динамічної амплітудної обробки голосу - модуляція його періодичним сигналом, коли амплітуди сигналів перемножуються і голос набуває амплітудні характеристики модулюючого сигналу. Модулюючи низькочастотних (одиниці герц) синусоїдальним сигналом, отримуємо «булькає» голос, підвищуючи частоту сигналу - вібруючий. Використовуючи замість синусоїдальної форми прямокутну, трикутну або пилкоподібну, можна надати голосові металеві, спотворені, «роботизовані» інтонації.

Амплітудна модуляція виділеного фрагмента фонограми виконується як частина операції генерації періодичних сигналів Generate g Tones. В поле Base Frequency задається основна частота сигналу в герцах, в поле Flavor - вид імпульсу, в поле Duration - тривалість в секундах. Регулятори Volume задають рівень сигналу.

Група движків Frequency Components визначає рівні гармонік основного сигналу з зазначеними при двигунах номерами. Частотну модуляцію сигналу можна отримати, використовуючи поля Modulate By - зміщення від основної частоти в герцах - і Modulation Frequency - частота модуляції. При позначеному поле Lock ... всі ці параметри, включаючи основну частоту, стаціонарні; при знятті позначки можна задати їх початкові / кінцеві значення в закладках Initial / Final Settings - вони будуть лінійно змінюватися протягом генерується відрізка.

Група полів Source Modulation визначає, як буде використовуватися згенерований сигнал. За замовчуванням, коли жодна з цих полів не відзначено, сигнал вставляється в фонограму або замінює собою виділений фрагмент; в іншому випадку він використовується для виконання заданої операції з виділеним фрагментом: Modulate - звичайна модуляція (множення), Demodulate - демодуляція (розподіл), Overlap (mix) - просте змішування сигналів. Послідовні модуляція і демодуляція з одним і тим же сигналом відновлюють вихідний сигнал (можливо, зі зміненим загальним рівнем). Експерименти з різними поєднаннями параметрів часом дають дуже кумедні і несподівані результати.

тимчасова обробка

Цей вид обробки заснований на зсуві вихідного сигналу в часі і змішуванні результату з вихідним сигналом, після чого знову можуть застосовуватися зрушення і змішування. При зрушеннях на малі проміжки часу, які можна порівняти з тривалістю періоду вихідного сигналу, виникають фазові ефекти типу інтерференції, чому звук набуває специфічного забарвлення; цей ефект отримав назву фленжера (flanger) і використовується як з фіксованою величиною зсуву, так і з періодично змінюється або навіть зовсім з випадковою. При зрушеннях на інтервали, що перевищують тривалість періоду, але не більше 20 мс, виникає хорової ефект (chorus). Завдяки спільності технології, ці два ефекту нерідко реалізуються одним програмним блоком з різними параметрами.

При множинних зрушення з інтервалами 20 ... 50 мс виникає ефект реверберації (reverb) - гулкости, обсягу, тому що слуховий апарат трактує затримані копії сигналу як відображення від навколишніх предметів. При інтервалах понад 50 мс вухо перестає чітко пов'язувати окремі копії між собою, внаслідок чого виникає ефект луни (echo).

У Cool Edit 2000 ефекти, засновані на тимчасових затримках, об'єднані в групу Transform g Delay Effects. Ефекти flanger і chorus створюються операцією flanger:

Движок Original / Delayed управляє співвідношенням вихідного і затриманого сигналів (інтенсивність, або глибина ефекту). Initial / Final Mix Delay - початкова і кінцева затримка копії - змінюється в цих межах циклічно. Stereo Phasing - кут фазового зсуву між каналами - дозволяє створити цікавий ефект «скручування» звуку, особливо в навушниках. Feedback - глибина зворотнього зв'язку (Кількість результуючого сигналу, підмішуваного до вихідного перед застосуванням операції) - дозволяє управляти виразністю, різкістю ефекту.

Група Rate задає параметри циклічності ефекту. Period - інтервал часу, за який фленжер проходить від початкової затримки до кінцевої і назад; Frequency - зворотна величина, частота проходів туди-назад; Total Cycles - кількість повних проходів по виділеному фрагменту. Завдання будь-якого параметра викликає автоматичний перерахунок інших.

Група Mode керує особливостями ефекту: Inverted - інверсія затриманого сигналу, Special EFX - додаткова інверсія вихідного і затриманого сигналів, Sinusoidal - синусоїдальний закон зміни затримки від початкової до кінцевої (якщо він відключений - затримка змінюється лінійно).

Набір пресетів дозволяє наочно вивчити особливості операції. Спробуйте вибрати кілька пресетів, змінюючи в кожному з них встановлені параметри і не забуваючи щоразу «відкочуватися» (Undo), щоб порівняти вплив на звук різних комбінацій параметрів.

Ефект реверберації в Cool Edit 2000 може бути реалізований двома способами: за допомогою Echo Chamber - імітатора кімнати з заданими розмірами і акустичними властивостями, і Reverb - генератора ефекту обсягу на основі вбудованого в редактор алгоритму імітації множинних відображень в просторі. Оскільки даний вид обробки є універсальним і застосовується до будь-якого звукового матеріалу, опишемо коротко другий спосіб як найбільш популярний.

Поле / движок Total Reverb Length визначає час реверберації, протягом якого відбиті сигнали повністю затухають; воно побічно пов'язане з об'ємом простору, в якому поширюється звук. Attack Time - час наростання глибини реверберації до номінального рівня; служить для плавного прояви ефекту протягом оброблюваного фрагмента. High Frequency Absorbtion Time - час поглинання обсягом високочастотних складових, пропорційно «м'якості» і «заглушених» обсягу. Perception - ступінь розбірливості: менші значення (smooth) - слабкі і м'які відображення, що не перебивають основного сигналу, великі значення (echoey) - чіткі і сильні, чітко чутні відображення, здатні погіршити розбірливість мови.

Двигуни / поля Mixing визначають співвідношення вихідного (dry) і обробленого (wet) сигналів в результуючому.

Ефект відлуння реалізується операцією Echo і додає до сигналу його поступово затухаючі копії, зрушені на рівні проміжки часу. Регулятор Decay задає величину загасання - рівень кожної чергової копії у відсотках від рівня попередньої. Initial Echo Volume - рівень першої копії у відсотках від рівня вихідного сигналу. Delay - затримка між копіями в мілісекундах. Група регуляторів Successive Echo Equalization управляє еквалайзером, через який пропускається кожна чергова копія, що дозволяє задавати різні акустичні характеристики імітованого простору.

Оскільки ефект є «триваючим» в часі, він може створити звуковий фрагмент, по тривалості перевищує вихідний. Для цього передбачений пункт Continue echo beyond selection - дозвіл підмішувати луна-сигнал до ділянки фонограми, що триває за кордоном виділеного фрагмента. При цьому в якості вихідного сигналу буде взятий тільки виділений фрагмент, а частина, що залишилася фонограми буде використана виключно для розміщення «хвоста». Якщо у фонограмі не вистачає місця для «хвоста» - буде видано повідомлення про помилку і доведеться додати в кінець фонограми ділянку тиші операцією Generate g Silence.

Ефект найкраще сприймається на відносно коротких звуках. На довгих словах або фразах, щоб виключити виникнення «тарабарщини» - множинних повторень різних складів або слів, перебивають один одного, ефект краще робити «кінцевим», вибираючи для повторення тільки короткий завершальний фрагмент фрази або навіть останній ударний склад слова. Спробуйте поекспериментувати з різними словами і фразами, щоб відчути, яку завершальну частину краще використовувати для «розмноження» в кожному конкретному випадку.

спектральна обробка

Найбільш яскравим і цікавим ефектом з цього класу, реалізованим в Cool Edit 2000, є зміна висоти і швидкості. Всім відомий ефект підвищення або зниження висоти сигналу при зміні швидкості протягання стрічки в магнітофоні або обертання пластинки. З розвитком цифрових методів обробки сигналів стало можливим правдоподібно реалізувати кожен з цих ефектів окремо - зміна висоти при збереженні тимчасових характеристик або навпаки.

Обробку цього типу в Cool Edit 2000 здійснює операція Transform g Time / Pitch g Stretch. Можливо два варіанти - з постійним (constant) або зі змінним (gliding) коефіцієнтом. Коефіцієнти задаються полями Initial / Final Ratio, які пов'язані також з двигунами для зручності зміни. Коефіцієнт може, крім того, задаватися побічно полем Transpose у вигляді кількості музичних хроматичних півтонів вгору (дієз) або вниз (бемоль). У режимі зміни тривалості поряд з цим є поле Length, в якому можна задати необхідну довжину результуючого фрагмента.

Перемикач Precision задає точність обробки: низьку (Low), середню (Medium) і високу (High) - це необхідно тому, що операція спектральної обробки вимагає безлічі обчислень і зниження точності дозволяє домогтися прискорення обробки - хоча б на етапі експериментів. Перемикач Stretching Mode задає вид обробки: Time Stretch - прискорення / уповільнення в часі, Pitch Shift - зсув по висоті, Resample - проста передискретизація, аналогічна зміни швидкості стрічки / пластинки.

Група параметрів Pitch and Time Settings управляє особливостями операції. Обробка виконується шляхом розбиття фрагмента на маленькі звукові блоки; параметр Splicing Frequency задає кількість таких блоків в одній секунді фрагмента. Збільшення цієї «частоти дискретизації» робить блоки дрібнішими, підвищуючи натуральність обробки, але одночасно посилюється і ефект дроблення, породжуючи неприємні призвуки. Параметр Overlapping задає ступінь перекриття сусідніх блоків при складанні результуючого сигналу - невелике взаємне перекриття дозволяє згладити призвуки від їх стикування. Пункт Choose appropriate defaults служить для автоматичної установки цих параметрів в найбільш підходящі, з точки зору редактора, значення.

Ця стаття завершує короткий цикл, присвячений записи і обробці звуку на домашньому комп'ютері.

КомпьютерПресс 12 "2002

Крім того, до цифрових фонограм застосовуються різні математичні методи, Наприклад, інтерполяція відліків (Repair) або їх пропорційна корекція (Normalize).

спектральні перетворення впливають на тембр звуку. До них відносяться різні фільтри: high pass, low pass або band pass (смуговий) і еквалайзери - параметричні або графічні.
Важливим окремим випадком спектральних перетворень є формантного перетворення - маніпуляції з формантами - характерними смугами частот, зустрічаються в звуках, вимовлених людиною. Змінюючи параметри формант, можна підкреслювати або затушовувати окремі звуки, змінювати одну голосну на іншу, зрушувати регістр голосу і т.п.

ефекти затримки засновані на временнóй затримки однієї копії сигналу щодо іншого. Такі ефекти можуть створювати ілюзію простору або приміщення, як реверберація, луна і т.п., ілюзію множинності джерел звуку (хорус) або ілюзію руху (фейзер, фленжер).

Модуляція параметрів сигналу. У таких ефектах, як, наприклад, фейзер, фаза сигналу модулюється низькочастотним коливанням (з частотою значно нижче мінімальної звуковий частоти 20 Гц). За допомогою модуляції амплітуди реалізується ефект тремоло, а за допомогою модуляції частоти - вібрато.

звукові редактори

До цього типу програм відносять ПЗ, що дозволяє редагувати і генерувати звукові дані. Звуковий редактор може бути використаний у повному обсязі або частково у вигляді бібліотеки, додатки, веб-додатки або модуля розширення ядра ОС.

програма типу Wave Editor це цифровий звуковий редактор, який звичайно призначений для запису і редагування музики, накладення ефектів і фільтрів, призначення стереоканалов і т.п.

Digital Audio Workstation (DAW) це програма з більш широкими можливостями, яка зазвичай складається з безлічі компонентів, об'єднаних єдиним графічним інтерфейсом. Практичним і найочевиднішим відмітною ознакою DAW є наявність повнофункціонального MIDI-секвенсор. У багатьох DAW є також інструменти відеомонтажу, призначені для створення музичного відео.

Звукові редактори, призначені для роботи з музикою, як правило, дозволяють користувачеві:

  • імпортувати і експортувати аудіофайли різних форматів,
  • записувати звук з одного або більше входів, і зберігати його в пам'яті комп'ютера в цифровому вигляді,
  • виробляти монтаж фонограм на часовій шкалі (timeline) з застосуванням переходів (fade in, fade out, crossfading),
  • змішувати декілька джерел звуку / треків з різними рівнями гучності, панорами і т.п., і направляти на один або більше вихідних каналів,
  • застосовувати різні ефекти і фільтри, включаючи компресію, експансію, різні види модуляції, реверберацію, придушення шуму, еквалізацію і т.д.
  • відтворювати звук, направляючи його на вихідні пристрої, такі як динаміки, зовнішні процесори або записуючі пристрої,
  • конвертувати звук з одних аудіоформатів в інші і міняти характеристики аналого-цифрового перетворення (розрядність і частоту дискретизації)

«Деструктивна» і «Недеструктивні» редагування

Звукові редактори дозволяють здійснювати як «Недеструктивні редагування» в режимі реального часу, так і «деструктивний», тобто як окремий процес перетворення, не пов'язаний з відтворенням або експортом фонограми, а також поєднувати обидва ці типу.

Деструктивна редагування змінює вихідний аудіофайл, а Недеструктивні лише змінює параметри його відтворення. Наприклад, якщо в процесі деструктивного редагування видалена частина треку, ці дані дійсно видаляються. Якщо ж використовується Недеструктивні або real-time редагування, віддалені дані залишаються, але не відтворюються.

Переваги деструктивного редагування:

  • У графічному редакторі всі зроблені зміни можна спостерігати візуально.
  • Кількість ефектів, які можуть бути застосовані, практично необмежено (або обмежена тільки дисковим простором, Виділеним для History).
  • Редагування зазвичай точне, в масштабі до окремого семпли.
  • Ефекти можуть застосовуватися до строго певного регіону - з точністю до семпли.
  • Мікшування і експорт відредагованого звуку відбувається швидко, так як при цьому не потрібно розрахунку застосованих ефектів.

Обмеження деструктивного редагування:

  • Після застосування ефект можна змінити. Правда, є можливість «скасувати» останню виконану дію. Зазвичай редактор підтримує безліч рівнів «історії скасування», так що кілька дій можуть бути скасовані в порядку, зворотному тому, в якому вони були застосовані.
  • Порядок скасування не можна змінити (спочатку скасовується останнє редагування і т.д.).

Переваги real-time редагування (в реальному часі):

  • Ефекти зазвичай можна налаштовувати під час відтворення або в будь-яке інше.
  • Редагування може бути скасовано або скоригована в будь-який момент в будь-якому порядку.
  • Кілька ефектів можуть бути застосовані послідовно, при цьому їх послідовність може бути змінена, ефекти можуть бути видалені з ланцюжка або додані.
  • Багато редактори підтримують автоматизацію ефекту, тобто автоматичне зміни його параметрів під час відтворення.

Обмеження real-time редагування:

  • Форма сигналу, що відображається на Timeline залишається колишньою, застосовані ефекти не впливають на неї.
  • Кількість ефектів, які можуть бути застосовані, обмежена потужністю комп'ютера або пристрою. У деяких редакторах є функція «заморожування» доріжки (руйнування стека ефектів).
  • Як правило, ефект не може бути застосований лише до частини доріжки. Щоб застосувати real-time ефект до частини треку, ефект включається в одній точці і вимикається в інший.
  • У Многодорожечной редакторах, якщо аудіо копіюється або переміщається з однієї доріжки на іншу, звук на новому треку може відрізнятися від того, як він звучав на вихідному треку, так як до кожного треку можуть бути застосовані різні ефекти реального часу.
  • Мікшування і експорт відбувається повільно, так як потрібно додатково розраховувати застосовані ефекти реального часу.

Б. Блессер, Дж. М. Кейтіс

2.1. Вступ

До завдань звукової техніки відносяться запис, зберігання, передача і відтворення сигналів, які сприймаються людьми за допомогою органів слуху. На практиці найчастіше такими сигналами є звичайна музика, хоча до них слід віднести також спів птахів, електронну музику, театральні вистави, гідроакустичні сигнали і т. Д. На відміну від задач цифрової обробки мовних сигналів, де основною вимогою є розбірливість мови, при цифровий обробці звуків в більшості випадків мають бути враховані якісь критерії точності відтворення звуків. Подібні критерії неминуче мають суб'єктивний характер, так як остаточний висновок про якість звуку складається на основі сприйняття сигналів слухачами. З цієї причини в цьому розділі часто йтиметься про людське сприйняття, причому для фахівців з акустики однією з основних проблем є визначення технічних параметрів звукових сигналів, що впливають на сприйняття цих звуків людиною. В силу широкої поширеності та важливості пристроїв для відтворення музики велика частина робіт в області цифрових звукових систем пов'язана з музикою. Далі в цій главі музика, перетворена в цифровий сигнал, Буде розглядатися як представник широкого класу сигналів, які називаються звуковими сигналами.

З моменту свого виникнення звукова техніка знаходилася на стику різних галузей науки і користувалася досягненнями Хімії і фізики, особливо таких областей, як електроніка, магнетизм і акустика. Цифрова обробка сигналів, яка за своєю сутністю, мабуть, найбільше тяжіє до математики, є новітньою галуззю науки, що увійшла в «звукове сімейство». Багато фахівців вважають, що це призведе до стрибка в якісних характеристиках звукових систем. Хоча методи цифрової обробки сигналів тільки починають застосовуватися в області звукової техніки, вже зараз видно пов'язані з цим

потенційні можливості. До моменту написання книги дана область техніки перебувала на початковій стадії свого розвитку; багато з найбільш складних методів цифрової обробки поки ще не знайшли застосування в звукових системах. Можна не сумніватися, що в найближчому майбутньому ця ситуація зміниться.

Необхідність цифрової обробки звукових сигналів з першого погляду не очевидна. Тому слід проаналізувати хоча б частину тих труднощів, з якими пов'язана поява музики в квартирі слухача. Ланцюжок технічних пристроїв при проходженні звуку від мікрофона до акустичної колонки виявляється дуже довгою. У неї може бути включено до 100 самостійних систем, кожна з яких виконує свою корисну функцію, Але вносить при цьому спотворення. Досить часто кожен інструмент ансамблю записується на окрему доріжку багатоканального магнітофона, причому число цих каналів може доходити до 24. Такий процес дає звукооператору великі можливості: можна, наприклад, при необхідності заново записати партію будь-якого інструменту. Це також допомагає виконавцю позбутися фонового акустичного шуму. Однак при такому записі звучання стає кілька неприродним і відрізняється від того, яке чується при виконанні в концертному залі, оскільки в запису відсутня реверберація і можуть з'явитися помітні спектральні спотворення, залежні від положення мікрофона. Подібні недоліки часто можна усунути шляхом корекції сигналів при їх змішуванні (микшировании). Мікшерний пульт дає можливість звукооператору по-різному обробляти кожну доріжку первинного запису. До числа найбільш поширених методів обробки звукових сигналів відносяться введення штучної реверберації і інших спеціальних ефектів, вирівнювання спектрів, стиснення динамічного діапазону, придушення шумів, обмеження. За своєю складністю цей процес і виконують його пристрої наближаються до функцій і апаратурі Центру управління космічними польотами (NASA).

Після того як висококваліфікований звукооператор об'єднає оброблені первинні сигнали у вторинну стереофонічну або квадрафоніческую запис, її піддають додатковій обробці з тим, щоб сформувати сигнал, придатний для запису на грамплатівку або магнітну стрічку. Отримана робоча стрічка використовується для управління різцем точного рекордера або магнітокопірователем. В останнім часом в рекордерах також з'явилися свої власні складні системи обробки сигналів, призначені для динамічного управління різцем і створюють компенсацію і предискаженія в рамках нелінійної обробки, що застосовується як при виготовленні, так і при відтворенні записів. Більш того, первинна копія, отримана в рекордері, є лише результатом першого етапу складного процесу, в результаті якого виходить запис,

програється будинку або на студії. Настільки ж довгий шлях звук проходить і на радіомовлення. Акустична система в будинку слухача і гучномовці утворюють важливе остання ланка звуковідтворювальної ланцюга. Таким чином, процес звуковідтворення можна представити у вигляді трьох основних етапів:

1. Створення і запис первинних сигналів.

2. Зберігання і передача цих сигналів.

3. Відтворення сигналів у формі акустичних хвиль.

Може здатися, що деякі складні елементи процесу звуковідтворення є необов'язковими, однак виявляється, що кожен етап процесу важливий, причому часто як засіб виправлення технічних помилок, що вносяться на іншому етапі процесу. Наприклад, стиснення сигналу на етапі початкової записи необхідно тому, що запам'ятовують пристрої зберігання мають обмежений динамічний діапазон.

Багато розробок в області цифрової звукотехніки мають на меті заміну слабких елементів ланцюга звукозапису або звукопередачи. Прикладами можуть служити цифрові магнітофони і цифрові системи передачі звукових сигналів. Нескладні по ідеї, ці системи виявляються складними в реалізації. Одйайо їх створення привело до різкого поліпшення якості відтворення звуків. Управління пультом мікшера також було переведено, на цифрову техніку, щоб звільнити звукооператора від важкої обов'язки фактичного регулювання сотень параметрів в реальному масштабі часу. На зміну механічним ревербераційній пристроям прийшли цифрові електронний ревербератори. Створено синтезатори, що дозволяють з пари стереофонічних сигналів в домашніх умовах створювати певні акустичні поля, характерні для великих залів.

У лабораторіях знайшли застосування більш досконалі методи для відновлення старих звукозаписів. В даний час є відновлені записи виступів Карузо, зроблених на початку століття, причому після виправлень записи вкрай низької якості стали звучати набагато краще. Цифрова обробка застосовується також у дослідженнях, спрямованих на удосконалення електроакустичних перетворювачів. У звуковідтворювальної ланцюга гучномовець є одним з найслабших і найменш досліджених ланок. Він впливає на амплітудні, фазові і просторові характеристики одержуваного звукового сигналу, а також обумовлює різного виду спотворення сигналів. Цифрова обробка сигналів застосовується для експериментального визначення фізичних характеристик акустичних перетворювачів, а також для оцінки впливу цих характеристик на сприйняття звуку.

У всіх подібних системах є загальні блоки -аналого-цифровий і цифро-аналоговий перетворювачі (АЦП і ЦАП). Вісілу свого фундаментального характеру питання про ці

преобразователях буде розглянуто тут самостійно. Будь-які спотворення, що вносяться на даному етапі обробки сигналу, можуть істотно знецінити гідності цифрової обробки. Характеристики перетворювачів необхідно узгоджувати з особливостями сприйняття звукових сигналів по ряду причин.

1, Надмірно велика розрядність при квантуванні відліків в АЦП досягається за рахунок великих економічних витрат, а через великій швидкості надходження інформації на наступних етапах може знадобитися занадто велику швидкодію.

2. Спотворення, що визначаються приладами, не завжди помічаються на слух.

Питання ускладнюється також конструктивними проблемами, які можуть істотно вплинути на якість роботи системи. Тому існують різні способи перетворення і вибір визначається призначенням всієї системи.

Інженер повинен знати співвідношення між фізичними і електричними характеристиками системи і позірним якістю звуку. Класичне визначення відносини сигнал / шум, наприклад »засноване на обчисленні відносини максимальної потужності сигналу до потужності шуму, виміряної за відсутності сигналу. Однак сприйняття шуму залежить від ступеня його спектрального подібності або відмінності з сигналом, від виду розподілу ймовірностей і характеру зміни шуму в часі. Так, два різних шумових процесу, що відрізняються по потужності на 20 дБ, можуть створювати перешкоди, на слух сприймаються як однакові.

Подібні приклади вказують, що теорія звукових систем в більшій мірі повинна спиратися на психоакустические дослідження, ніж на теорію систем. Теорія систем розглядає шляхи вирішення завдання, а Психоакустика в даному випадку описує характер бажаного результату. Так, у вищезгаданому прикладі мета полягає в тому, щоб зробити шум нечутним, хоча повністю пригнічувати його не обов'язково. Економічні наслідки неправильного вибору кінцевої мети можуть бути дуже сумними. Як правило, шуми 16-розрядного АЦП не сприймаються вухом і не помічаються приладами, однак варто цей перетворювач раз в 100 більше, ніж 12-розрядний АЦП. Тому звукова техніка повинна будуватися з урахуванням особливостей і апаратури, і слуховий системи людини з тим, щоб в результаті оптимізувати суб'єктивні оцінки якості звуковідтворення.

Семплірування - це запис зразків звучання (семплів) того чи іншого реального музичного інструменту. Семплірування є основою хвильового синтезу (WT-синтезу) музичних звуків. Якщо при частотному синтезі (FM-синтез) нові звучання отримують за рахунок різноманітної обробки найпростіших стандартних коливань, то основою WT-синтезу є заздалегідь записані звуки традиційних музичних інструментів або звуки, які супроводжують різні процеси в природі і техніці. З семплами можна робити все, що завгодно. Можна залишити їх такими, як є, і WT-синтезатор звучатиме голосами, майже не відрізнятись від голосів інструментів-першоджерел. Можна піддати семпли модуляції, фільтрації, впливу ефектів і отримати найфантастичніші, неземні звуки.

В принципі, семпл - це ні що інше, як збережена в пам'яті синтезатора послідовність цифрових відліків, одержані в результаті аналого-цифрового перетворення звуку музичного інструменту. Якби не існувала проблема економії пам'яті, то звучання кожної ноти можна було б записати у виконанні кожного музичного інструменту. А гра на такому синтезаторі представляла б собою відтворення цих записів в необхідні моменти часу. Семпли зберігаються в пам'яті не в тому вигляді, в якому вони виходять відразу ж після проходження АЦП. Запис піддається хірургічному впливу, ділиться на характерні частини (фази): початок, протяжна ділянка, завершення звуку. Залежно від застосовуваної фірмової технології ці частини можуть ділитися на ще більш дрібні фрагменти. У пам'яті зберігається не вся запис, а лише мінімально необхідна для її відновлення інформація про кожного з фрагментів. Зміна протяжності звучання виробляється за рахунок керування числом повторень окремих фрагментів.

З метою ще більшої економії пам'яті був розроблений спосіб синтезу, що дозволяє зберігати семпли не для кожної ноти, а лише для деяких. У цьому випадку зміни висоти звучання досягається шляхом зміни швидкості відтворення семпли.

Для створення і відтворення семплів служить синтезатор. В наші дні синтезатор конструктивно реалізований в одному-двох корпусах мікросхем, які є спеціалізований процесор для здійснення всіх необхідних перетворенні. З закодованих і стислих за допомогою спеціальних алгоритмів фрагментів він збирає семпл, задає висоту його звучання, змінює відповідно до задуму музиканта форму обвідної коливання, імітуючи або майже невідчутне дотик, або удар по клавіші або струні. Крім того, процесор додає різні ефекти, змінює тембр за допомогою фільтрів і модуляторів.

В звукових картах знаходять застосування кілька синтезаторів різних фірм.

Поряд з семплами, записаними в ПЗП звукової карти, в даний час стали доступними набори семплів (банки), створені як в лабораторіях фірм, що спеціалізуються на синтезаторах, так і любителями комп'ютерної музики. Ці банки можна знайти на численних лазерних дисках і в Internet.

Модуляційні ефекти:

Ділей (Delay) в перекладі означає "затримка". Необхідність в цьому ефекті виникла з появою стереофонии. Сама природа слухового апарату людини передбачає в більшості ситуацій надходження в мозок двох звукових сигналів, що відрізняються часом приходу. Якщо джерело звуку знаходиться "перед очима", на перпендикуляре, проведеному до лінії, що проходить через вуха, то прямий звук від джерела досягає обох вух в один і той же час. У всіх інших випадках відстані від джерела до вух різні, тому або одне, або інше вухо сприймає звук першим.

Час затримки (різниці в часі прийому сигналів вухами) буде максимальним в тому випадку, коли джерело розташоване навпроти одного з вух. Так як відстань між вухами близько 20 см, то максимальна затримка може становити близько 8 мс. Цим величинам відповідає хвиля звукового коливання з частотою близько 1,1 кГц. Для більш високочастотних звукових коливань довжина хвилі стає менше, ніж відстань між вухами, і різниця в часі прийому сигналів вухами стає непомітним. Гранична частота коливань, затримка яких сприймається людиною, залежить від напрямку на джерело. Вона росте в міру того, як джерело зміщується від точки, розташованої навпроти одного з вух, до точки, розташованої перед людиною.

Ділей застосовується, перш за все, в тому випадку, коли запис голосу або акустичного музичного інструменту, виконану за допомогою єдиного мікрофона, вбудовують в стереофонічну композицію. Цей ефект є основою технології створення стереозаписи. Ділей може застосовуватися і для отримання ефекту одноразового повторення будь-яких звуків. Величина затримки між прямим сигналом і його затриманої копією в цьому випадку вибирається більшою, ніж природна затримка в 8 мс. Для коротких і різких звуків час затримки, при якому основний сигнал і його копія помітні менше, ніж для протяжних звуків. Для творів, що виконуються в повільному темпі, затримка може бути більше, ніж для швидких композицій,

При певних співвідношеннях громкостей прямого і затриманого сигналу може мати місце психоакустичний ефект зміни удаваного розташування джерела звуку на Стереопанорама.

Цей ефект реалізується за допомогою пристроїв, здатних здійснювати затримку акустичного або електричного сигналів. Таким пристроєм зараз найчастіше служить цифрова лінія затримки, що представляє собою ланцюжок з елементарних осередків - тригерів затримки. Для наших цілей достатньо знати, що принцип дії тригера затримки зводиться до наступного: двійковий сигнал, що надійшов в деякий тактовий момент часу на його вхід, з'явиться на його виході не миттєво, а тільки в черговий тактовий момент. Загальний час затримки в лінії тим більше, чим більше тригерів затримки включено в ланцюжок, і тим менше, чим менше тактовий інтервал (чим більше тактова частота). В якості цифрових ліній затримки можна використовувати пристрої, що запам'ятовують.

Зрозуміло, для застосування цифрової лінії затримки сигнал повинен бути спочатку перетворений в цифрову форму. А після проходження його копії через лінію затримки відбувається зворотне, цифро-аналогове перетворення. Вихідний сигнал і його затримана копія можуть бути окремо спрямовані в різні стереоканали, але можуть бути і змішані в різних пропорціях. Сумарний сигнал може бути направлений або в один з стереоканалов, або в обидва.

У звукових редакторах ділей реалізується програмним (математичним) шляхом за рахунок зміни відносної нумерації відліків вихідного сигналу і його копії.

В основу звукових ефектів фленжер (Flanger) і фейзер (Phaser) також покладена затримка сигналу.

Ефект повторного звучання може бути викликаний і поширенням звуку від джерела до приймача різними шляхами (наприклад, звук може приходити, по-перше, безпосередньо і, по-друге, відбившись від перешкоди, що знаходиться трохи в стороні від прямого шляху). І в тому, і в іншому випадках час затримки залишається постійним. У реальному житті цьому відповідає малоймовірна ситуація, коли джерело звуку, приймач звуку і відображають предмети нерухомі відносно один одного. При цьому частота звуку не змінюється, яким би шляхом і в який би вухо він не приходив.

Якщо ж який-небудь з трьох елементів рухливий, то частота прийнятого звуку не може залишатися тією ж, що і частота звуку переданого. Це є ні що інше, як прояв ефекту Доплера.

І фленжер, і фейзер імітують прояви взаємного переміщення трьох елементів: джерела, приймача і відбивача звуку. По суті справи, і той, і інший ефекти являють собою поєднання затримки звукового сигналу з частотною або фазовою модуляцією. Різниця між ними чисто кількісна, фленжер відрізняється від фейзера тим, що для першого ефекту час затримки копії (або часи затримок копій) і зміна частот, сигналу значно більше, ніж для другого. Образно кажучи, фленжер спостерігався б у тому випадку, коли співак мчав би до глядача, що сидить в залі, зі швидкістю автомобіля. А ось для того, щоб відчути фейзер в його, так би мовити, первозданному вигляді, рухомого джерела звуку не потрібно, глядачеві досить часто-часто крутити головою з боку в бік.

Згадані кількісні відмінності ефектів призводять і до відмінностей якісним: по-перше, звуки, оброблені ними, набувають різні акустичні і музичні властивості, по-друге, ефекти реалізуються різними технічними засобами.

Значення часу затримок, характерних для фленжера, істотно перевищують період звукового коливання, тому для реалізації ефекту використовують багаторозрядні і багатовідвідні цифрові лінії затримки. З кожного з відводів знімається свій сигнал, який в свою чергу піддається частотної модуляції.

Для фейзер, навпаки, характерно дуже маленьке час затримки. Воно настільки мало, що виявляється порівняно з періодом звукового коливання. При таких малих відносних зрушеннях прийнято говорити вже не про затримку копій сигналу в часі, а про різниці їх фаз. Якщо ця різниця фаз не залишається постійною, а змінюється по періодичному закону, то ми маємо справу з ефектом фейзера. Так що можна вважати фейзер граничним випадком фленжера.

Щоб отримати фленжер, замість однієї акустичної системи використовували кілька систем, розміщених на різних відстанях від слухачів. У необхідні моменти виробляли почергове підключення джерела сигналу до акустичних систем таким чином, що створювалося враження наближення або видалення джерела звуку. Затримку звуку виконували і з допомогою магнітофонів з наскрізним трактом запис / відтворення. Одна головка записує, інша - відтворює звук з затримкою на час, необхідний для переміщення стрічки від головки до голівки. Для частотної модуляції особливих заходів можна було і не придумувати. Кожному аналоговому магнітофону притаманний природний недолік, званий детонацією, яка проявляється у вигляді "плавання" звуку. Варто було трохи спеціально посилити цей ефект, змінюючи напругу, що живить двигун, і виходила частотна модуляція.

Для реалізації фейзер методами аналогової техніки використовували ланцюжка фазовращателей, керованих електричним шляхом. А іноді можна було спостерігати і таку картину: в акустичній системі, підключеної до ЕМІ або електрогітарі, раптом починало обертатися щось на зразок вентилятора. Звук перетинався з рухомими лопатями і відбивався від них, виходила фазова модуляція.

Відлуння відноситься до найбільш цікавим і популярним звукових ефектів. Сутність реверберації полягає в тому, що вихідний звуковий сигнал змішується зі своїми копіями, затриманими щодо нього на різні часові інтервали. Цим реверберація нагадує ділей. Однак при реверберації число затриманих копій сигналу може бути значно більше, ніж для ділея. Теоретично число копій може бути нескінченним. Крім того, при реверберації, чим більше час запізнювання копії сигналу, тим менше її амплітуда (гучність). Ефект залежить від того, які тимчасові проміжки між копіями сигналів і яка швидкість зменшення рівнів їх гучності. Якщо проміжки між копіями малі, то виходить власне ефект реверберації. Виникає відчуття об'ємного гучного приміщення. Звуки музичних інструментів стають соковитими, об'ємними, з багатим тембровим складом. Голоси співаків набувають пісенність, недоліки, властиві їм, стають малопомітними.

Якщо проміжки між копіями великі (понад 100 мс), то правильніше говорити не про ефект реверберації, а про ефект "луна". Інтервали між відповідними звуками при цьому стають помітними. Звуки перестають зливатися, здаються відображеннями від віддалених перешкод.

Основним елементом, що реалізує ефект реверберації, є пристрій, що створює луна-сигнал.

Відлуння-камера являє собою кімнату з сильно відбивають стінами, в яку поміщений джерело звукового сигналу (гучномовець) і приймач (мікрофон). Перевага луна-камери полягає в тому, що загасання звуку відбувається в ній природним шляхом (що дуже важко забезпечити іншими способами). У той час як звук продовжує реверберіровать в трьох вимірах, вихідна хвиля розбивається на безліч відбитих, які досягають мікрофона за дедалі менші проміжки часу.

Поряд з луна-камерами для імітації реверберації використовували сталеві пластини, точніше, досить великі за розміром листи. Коливання в них вводили і знімали за допомогою пристроїв, по конструкції і принципу дії схожих на електромагнітні головні телефони. Для отримання задовільною рівномірності амплітудно-частотної характеристики товщина листа повинна бути витримана з точністю, яку не забезпечують звичайні технології прокату сталі. Відлуння тут була тривимірної, а плоскою. Сигнал мав характерний металевий відтінок.

В середині 60-х років для отримання ефекту реверберації стали застосовувати пружинні ревербератори. За допомогою електромагнітного перетворювача, поєднаного з одним з кінців пружини, в ній порушувалися механічні коливання, які з затримкою досягали другого кінця пружини, пов'язаного з датчиком. Ефект повторення звуку обумовлений багатократним віддзеркаленням хвиль механічних коливань від кінців пружини.

На зміну цим недосконалим пристроям прийшли ревербератори магнітофонні. Принцип формування в них луна-сигналу полягає в тому, що вихідний сигнал записується на стрічку записуючої магнітної голівкою, а через час, необхідний для переміщення стрічки до відтворюючої голівці, зчитується нею. Через ланцюг зворотного зв'язку зменшений за амплітудою затриманий сигнал знову подається на запис, що і створює ефект багаторазового відлуння з поступовим загасанням. Якість звуку визначається параметрами магнітофона. Недолік магнітофонного ревербератора полягає в тому, що при прийнятних швидкостях протягання стрічки вдається отримати тільки ефект луни. Для отримання власне реверберації потрібно або ще сильніше зблизити магнітні головки (чого не дозволяє зробити їх конструкція), або значно збільшити швидкість руху стрічки.

З розвитком цифрової техніки і появою інтегральних мікросхем, Що містять в одному корпусі сотні і тисячі цифрових тригерів (про які ми вже говорили) з'явилася можливість створювати високоякісні цифрові ревербератори. У таких пристроях сигнал може бути затриманий на будь-який час, необхідне як для отримання реверберації, так і для отримання луни.

У звукових картах реверберація, в кінцевому рахунку, заснована саме на цифровий затримки сигналів.

Спостерігаючи етапи розвитку засобів реверберації, можна припустити, що коли-небудь з'являться і математичні моделі пружинних і магнітофонних ревербераторів. Адже не виключено, що є люди, які відчувають ностальгічні почуття по відношенню до звуків музики, пофарбованим дребезгом пружин або шипінням магнітної стрічки.

Методи, які використовуються для обробки звуку:

1. Монтаж. Складається в вирізанні із запису одних ділянок, вставки інших, їх заміни, розмноженні і т.п. Називається також редагуванням. Всі сучасні звуко- та відеозапису в тій чи іншій мірі піддаються монтажу.

2. Амплітудні перетворення. Виконуються за допомогою різних дій над амплітудою сигналу, які в кінцевому рахунку зводяться до множення значень семплів на постійний коефіцієнт (посилення / ослаблення) або змінюється в часі функцію-модулятор (амплітудна модуляція). Окремим випадком амплітудної модуляції є формування обвідної для додання стаціонарного звучанням розвитку в часі.

Амплітудні перетворення виконуються послідовно з окремими семплами, тому вони прості в реалізації і не вимагають великого обсягу обчислень.

3. Частотні (спектральні) перетворення. Виконуються над частотними складовими звуку. Якщо використовувати спектральне розкладання - форму представлення звуку, в якій по горизонталі відраховуються частоти, а по вертикалі - інтенсивності складових цих частот, то багато частотні перетворення стають схожими на амплітудні перетворенням над спектром. Hапример, фільтрація - посилення або ослаблення певних смуг частот - зводиться до накладенню на спектр відповідної амплітудної обвідної. Однак частотну модуляцію таким чином уявити не можна - вона виглядає, як зсув усього спектра або його окремих ділянок в часі за певним законом.

Для реалізації частотних перетворень зазвичай застосовується спектральне розкладання по методу Фур'є, яке вимагає значних ресурсів. Однак є алгоритм швидкого перетворення Фур'є (ШПФ, FFT), який робиться в целочисленной арифметиці і дозволяє вже на молодших моделях 486 розгортати в реальному часі спектр сигналу середньої якості. При частотних перетвореннях, крім цього, потрібно обробка і подальша згортка, тому фільтрація в реальному часі поки не реалізується на процесорах загального призначення. Замість цього існує велика кількість цифpовая сигнальних процесорів (Digital Signal Processor - DSP), якому виконують ці опеpации в реальному часі і по декількох каналах.

4. Фазові пpеобpазования. Зводяться в основному до постійного зсуву фази сигналу або її модуляції некотоpой функцією або дpугим сигналом. Благодаpя того, що слуховий аппаpат людини використовує фазу для визначених напряму на джерело звуку, фазові пpеобpазования стеpеозвука дозволяють отримати ефект обертатися звуку, хоpа і йому подібні.

5. часової пpеобpазования. Полягають в додаванні до основного сигналу його копій, зсунутих в часі на pазличного величини. Пpи невеликих зрушеннях (поpядка менше 20 мс) це дає ефект pазмноженія джерела звуку (ефект хоpа), пpи великих - ефект відлуння.

6. Фоpмантние пpеобpазования. Є окремим випадком частотних і опеpіpуют з фоpмант - хаpактеpно смугами частот, зустрічає в звуках, пpоізносімих людиною. Кожному звуку соот- ветствует своє співвідношення амплітуд і частот декількох фоpмант, якому опpеделяет тембp і pазбоpчівость голосу. Змінюючи параметри фоpмант, можна подчеpкивает або затушовувати окремі звуки, змінювати одну голосну на дpугую, зрушувати pегистp голосу і т.п.

На основі цих методів реалізовано безліч апаратних і програмних засобів обробки звуку. Нижче наведено опис деяких з них.

1. Компресор (від англ. «Compress» - стискати, здавлювати) - це електронний пристрій або комп'ютерна програма, Яка використовується для зменшення динамічного діапазону звукового сигналу. Понижаюча компресія зменшує амплітуду гучних звуків, які знаходяться вище певного порогу, а звуки знаходяться нижче цього порога залишаються незмінними. Що підвищує компресія навпаки збільшує гучність звуків знаходяться нижче певного порогу, в той час як звуки, що перевищують цей поріг залишаються незмінними. Ці дії зменшують різницю між тихими і гучними звуками, Звужуючи динамічний діапазон.

Параметри компресора:

Threshold (поріг) - це рівень, вище якого сигнал починає придушуватися. Зазвичай встановлюється в дБ.

Ratio (співвідношення) - визначає співвідношення вхідного / вихідного сигналів, що перевищують поріг (Threshold). Наприклад, співвідношення 4: 1 означає, що сигнал перевищує поріг на 4 дБ, стиснеться до рівня 1 дБ вище порога. Найвище співвідношення ∞: 1 зазвичай досягається за допомогою співвідношення 60: 1, і фактично означає, що будь-який сигнал, що перевищує поріг буде знижено до порогового рівня (за винятком коротких різких перепадів гучності, званих "атакою").

Attack і Release (атака і відновлення, рис. 1.3). Компресор може забезпечити певну ступінь контролю над тим, як швидко він діє. "Фаза атаки" це період, коли компресор знижує гучність до рівня, який визначається співвідношенням. "Фаза відновлення" це період, коли компресор збільшує гучність до рівня певного співвідношенням, або до нуля дБ, коли рівень падає нижче порогового значення. Тривалість кожного періоду визначається швидкістю зміни рівня сигналу.

Мал. 1.3. Атака і відновлення компресора.

У багатьох компресорах атака і відновлення регулюються користувачем. Однак в деяких компресорах вони визначаються розробленої схеми і не можуть бути змінені користувачем. Іноді параметри атаки і відновлення є "автоматичними" або "програмно-залежними", це означає, що їх час змінюється в залежності від вхідного сигналу.

Коліно компресії (Knee) управляє вигином компресії на пороговому значенні, воно може бути гострим або округлим (рис. 1.4). М'яке коліно повільно збільшує співвідношення стиснення, і в кінцевому підсумку досягає стиснення заданого користувачем. При жорсткому коліні компресія починається і припиняється різко, що робить її більш помітною.

Мал. 1.4. М'яке і тверде коліно.

2. Експандер. Якщо компресор пригнічує звук після того як його рівень перевищує певне значення, - то експандер пригнічує звук після того як його рівень стане менше певного значення. У всьому іншому експандер схожий з компресором (параметри обробки звуку).

3. Дісторшн (англ. «Distortion» - спотворення) - це штучне грубе звуження динамічного діапазону з метою збагачення звуку гармоніками. При компресії хвилі все більше приймають не синусоїдальні, а квадратні форми за рахунок штучного обмеження рівня звуку, які володіють найбільшою кількістю гармонік.

4. Ділей (англ. Delay) або відлуння (англ. Echo) - звуковий ефект або відповідний пристрій, що імітує чіткі затухаючі повтори вихідного сигналу. Ефект реалізується додаванням до вихідного сигналу його копії або декількох копій, затриманих за часом. Під дилеї зазвичай мається на увазі одноразова затримка сигналу, в той час як ефект «відлуння» - багаторазові повтори.

5. Відлуння - це процес поступового зменшення інтенсивності звуку при його багатократних відображеннях. У віртуальних ревербераторах існує безліч параметрів, що дозволяють отримати потрібне звучання, характерне для будь-якого приміщення.

6. Еквалайзер (англ. «Equalize» - «вирівнювати», загальне скорочення - «EQ») - пристрій або комп'ютерна програма, що дозволяє змінювати амплітудно-частотну характеристику звукового сигналу, тобто коректувати його (сигналу) амплітуду вибірково, залежно від частоти . Перш за все еквалайзери характеризуються кількістю регульованих по рівню частотних фільтрів (смуг).

Існує два основних типи многополосних еквалайзерів: графічний і параметричний. Графічний еквалайзер має певну кількість регульованих по рівню частотних смуг, кожна з яких характеризується постійною робочою частотою, фіксованою шириною смуги навколо робочої частоти, а також діапазоном регулювання рівня (однаковий для всіх смуг). Як правило, крайні смуги (найнижча і висока) представляють собою фільтри «поличного» типу, а всі інші мають «колоколообразную» характеристику. Графічні еквалайзери, що застосовуються в професійних областях, зазвичай мають 15 або 31 смугу на канал, і нерідко оснащуються аналізаторами спектра для зручності коригування.

Параметричний еквалайзер дає набагато більші можливості коригування частотної характеристики сигналу. Кожна його смуга має три основних регульованих параметра:

Центральна (або робоча) частота в герцах (Гц);

Добротність (ширина робочої смуги навколо центральної частоти, позначається буквою «Q») - безрозмірна величина;

Рівень посилення або ослаблення обраної смуги в децибелах (дБ).

7. Хорус (англ. Chorus) - звуковий ефект, що імітує хоровий звучання музичних інструментів. Ефект реалізується шляхом додавання до вихідного сигналу його власної копії або копій, зсунутих за часом на величини порядку 20-30 мілісекунд, причому час зсуву безперервно змінюється.

Спочатку вхідний сигнал розділяється на два незалежних сигналу, один з яких залишається без змін, в той час як інший надходить на лінію затримки. У лінії затримки здійснюється затримка сигналу на 20-30 мс, причому час затримки змінюється відповідно до сигналом генератора низьких частот. На виході затриманий сигнал змішується з вихідним. Генератор низьких частот здійснює модуляцію часу затримки сигналу. Він виробляє коливання певної форми, що лежать в межах від 3 Гц і нижче. Змінюючи частоту, форму і амплітуду коливань низькочастотного генератора, можна отримувати різний вихідний сигнал.

Параметри ефекту:

Глибина (depth) - характеризує діапазон зміни часу затримки.

Швидкість (speed, rate) - швидкість зміни «плавання» звуку, регулюється частотою низькочастотного генератора.

Форма хвилі генератора низької частоти (LFO waveform) - буває синусоїдальної (sin), трикутної (triangle) і логарифмічною (log).

Баланс (balance, mix, dry / wet) - співвідношення необробленого і обробленого сигналів.

8. Фейзер (англ. Phaser), також часто званий фазовим вібрато - звуковий ефект, який досягається фільтрацією звукового сигналу зі створенням серії максимумів і мінімумів в його спектрі. Положення цих максимумів і мінімумів варіюється протягом звучання, що створює специфічний кругової (англ. Sweeping) ефект. Також фейзер називають відповідний пристрій. За принципом роботи схожий з хорусом і відрізняється від нього часом затримки (1-5 мс). Крім цього затримка сигналу у фейзер на різних частотах неоднакова і змінюється за певним законом.

Електронний ефект фейзер створюється шляхом поділу звукового сигналу на два потоки. Один потік обробляється фазовим фільтром, який змінює фазу звукового сигналу, зберігаючи його частоту. Величина зміни фази залежить від частоти. Після мікшування обробленого і необробленого сигналів, частоти, що знаходяться в протифазі, погашають один одного, створюючи характерні провали в спектрі звуку. Зміна ставлення оригінального і обробленого сигналу дозволяє змінити глибину ефекту, причому максимальна глибина досягається при відношенні 50%.

Ефект фейзер подібний ефектів Фленжер і хоруса, які також використовують додавання до звукового сигналу його копій, що подаються з певною затримкою (т. Н. Лінію затримки). Однак на відміну від Фленжер і хоруса, де величина затримки може приймати довільне значення (зазвичай від 0 до 20 мс), величина затримки в фейзер залежить від частоти сигналу і лежить в межах однієї фази коливання. Таким чином, фейзер можна розглядати як окремий випадок Фленжер.

9. Фленжер (англ. Flange - фланець, гребінь) - звуковий ефект, що нагадує «летить» звучання. За принципом роботи схожий з хорусом, і відрізняється від нього часом затримки (5-15 мс) і наявністю зворотного зв'язку (feedback). Частина вихідного сигналу подається назад на вхід і в лінію затримки. В результаті резонансу сигналів виходить Фленжер-ефект. При цьому в спектрі сигналу деякі частоти посилюються, а деякі - послаблюються. В результаті частотна характеристика являє ряд максимумів і мінімумів, нагадуючи гребінь, звідки і походить назва. Фаза сигналу зворотного зв'язку іноді інвертується, тим самим досягається додаткова варіація звукового сигналу.

10. Вокодер (англ. «Voice coder» - кодировщик голосу) - пристрій синтезу мови на основі довільного сигналу з багатим спектром. Спочатку вокодер були розроблені з метою економії частотних ресурсів радіолінії системи зв'язку при передачі мовних повідомлень. Економія досягається за рахунок того, що замість власне мовного сигналу передають тільки значення його певних параметрів, Які на приймальній стороні керують синтезатором мови.

Основу синтезатора мови складають три елементи: генератор тонального сигналу для формування голосних звуків, генератор шуму для формування приголосних і система формантних фільтрів для відтворення голосу абонента. Після всіх перетворень голос людини стає схожим на голос робота, що цілком терпимо для засобів зв'язку і цікаво для музичної сфери. Так було лише в найпримітивніших вокодера першої половини минулого століття. Сучасні зв'язкові вокодер забезпечують найвищу якість голосу при істотно більш сильному ступені стиснення в порівнянні зі згаданими вище.

Вокодер як музичний ефект дозволяє перенести властивості одного (модулюючого) сигналу на інший сигнал, який називають носієм. Як сигнал-модулятора використовується голос людини, а як носій - сигнал, що формується музичним синтезатором або іншим музичним інструментом. Так досягається ефект «говорить» або «співаючого» музичного інструменту. Крім голосу модулюючий сигнал може бути і гітарою, клавішними, барабанами і взагалі будь-яким звуком синтетичного і «живого» походження. Так само немає обмежень і на що має сигнал. Експериментуючи з моделюючим і несучим сигналом можна отримувати абсолютно різні ефекти - говорить гітара, барабани зі звуком фортепіано, гітара, яка звучить як ксилофон.



Сподобалася стаття? поділіться їй