Задачі і етапи реставрації музичних сигналів

Розвиток сучасних засобів опрацювання звукових сигналів передбачає їх зберігання в цифровому виді. Для зберігання інформації старих фонограм сигнали перетворюють в цифрову форму з використанням високоякісних АЦП (наприклад, 24-бітове квантування і дискретизація з частотою 192 КГц) і переносяться на довговічний носій (компакт-диск). Такий підхід приводить до втрат частини інформації фонограм, які були записані на магнітні стрічки, параметри яких з часом деградували: обмежена смуга частот, втрачені фрагменти фонограми, зменшено відношення сигнал/шум за рахунок старіння магнітного носія, наявність нелінійних спотворень. Для якісного відтворення таких фонограм необхідно розв’язати такі задачі:

1. Усунення „зайвих” спектральних складових (компонентів спектру, що не містяться у вихідній фонограмі по закінченню процесу її формування, - продуктів нелінійних спотворень, різних завад, шумів тощо).

2. Відновлення компонентів спектра, що втрачені із-за лінійних спотворень - обмеження смуги частот сигналу, „провали” амплітудно-частотних характеристик (АЧХ) тракту „запис-відтворення”.

Очевидно, що вихідна форма сигналу невідома і тому відтворення можливе з деякою ймовірністю. Достовірність відтворення залежить від достовірності розпізнавання, яка залежить від:

- кількості інформації, що міститься в досліджуваному фрагменті носія інформації;

- кількості апріорної інформації, яку має суб’єкт (людина) про об’єкт, що розпізнається (набір знань, якими володіє людина).

При відновленні музичного сигналу ми володіємо меншою кількістю інформації, ніж міститься у вихідному об’єкті. Одним з шляхів відновлення втраченої інформації є її інтерполяція і екстраполяція на основі даних, які отримані при розпізнаванні.

Першим етапом відновлення сигналу є фільтрація. Необхідність виконання початкової фільтрації пояснюється тим, що простіше спочатку подавити шум, а потім провести синтез спектральних складових, ніж навпаки. Такий підхід суттєво зменшує обсяг обчислень та час їх проведення. При розпізнаванні сигналу необхідно локалізувати в частотній області корисні складові – основні тони і обертони. Тоді вважається, що область частот, яка не зайнята корисним сигналом, зайнята шумом.

Після фільтрації виконується відновлення втрачених компонент спектра – синтез обертонів. Відомі приблизні частоти недостаючих обертонів, а їх амплітуда повинна визначатися користувачем, чи визначатися в результаті аналізу спектру (передбачення, інтерполяція, екстраполяція), чи визначатися у відповідності з апріорними відомостями про оброблювальний сигнал.

Застосування розпізнавання образів надає можливість обробляти окремий звуковий об’єкт (реалізацію окремої ноти). По суті окремий звуковий об’єкт є мінімальним елементом сприйняття звукового сигналу.

Принципове припущення, яке робиться в сучасних розпізнавачах є те, що мовний сигнал розглядається як стаціонарний (тобто його спектральні характеристики відносно постійні) на певному часовому інтервалі. Тому основною функцією попереднього опрацювання є розбити вхідну мовний сигнал на інтервали і для кожного інтервалу отримати згладжені спектральні оцінки.

Проте, в досліджуваних сигналах, можуть бути значні спотворення. Тому процедура розпізнавання і відновлення сигналів буде складнішою. Блок-схема процесу керування і процесів опрацювання при відновленні музичного сигналу з використанням розпізнавання наведена на рис.1. В схемі виділяють канал керування і канал опрацювання. Процеси, які входять до каналу керування формують дані (параметри фільтра і перелік недостаючих – втрачених обертонів) що керують процесами каналу опрацювання. Решту процесів керування (використовують простіші алгоритми) механічно виконують вказівки процесу розпізнавання, який формує інформації, що необхідна для роботи решту процесів. На виході схеми отримується музичний сигнал з доданими обертонами, які були відсутні в первинному носії. Необхідно зауважити, що здійснюється ручне налаштування параметрів фільтра і амплітуд обертонів.