Розробка алгоритму опрацювання сигналу на основі розпізнавання

Згідно з концепцією відновлення музичних сигналів в процесі опрацювання сигналу необхідно провести фільтрацію (подавлення шумових компонентів) і синтез втрачених компонентів звукових об’єктів. Принцип формування амплітудно-частотної характеристики (АЧХ) фільтра шумоподавлення нам основі даних, що отримані при розпізнаванні такий.

Відомі приблизні значення частот обертонів звукових об’єктів, амплітуди яких залишаються без змін, тобто коефіцієнт передачі фільтра на кожній з цих частот і в деякій області (справа і зліва) кожної з цих частот повинен бути рівний 1. Ширина смуги частот Df, яка містить обертон корисного сигналу, повинна бути регульованою, оскільки відхилення частот обертонів від середніх значень не однакові для різних музичних інструментів.

В решту області частот коефіцієнт передачі повинен бути меншим від одиниці: |H(f)| =Hпод. < 1.для подавлення шумів.

Недолік підходу: музична фонограма має крім шумів носія запису і шумів тракту формування-запис-відтворення і „корисні” шуми – акустичний фон приміщення, де проводилось записування, негармонійні призвуки, які виникли в ході виконання і зумовлені особливостями звукоутворення в певному інструменті.

Найпростішим способом сформувати фільтр з АЧХ складного виду цифровими методами є використання швидкого перетворення Фур’є (ШПФ). АЧХ фільтра H(fk) = 0, K=0…N-1 (N – кількість відліків вибірки). Вирази для АЧХ фільтру на етапі подавлення компонентів, які не відносяться до і-го звукового об’єкту:

(1)

H(fk ) = Hпод, , якщо умова (3. ) не виконується , де (2

- Fk=(k*FД)/N – частота і-го коефіцієнту ряду Фур’є;

- FД – частота дискретизації відновлювального сигналу;

- N – довжина вибірки;

- - частота основного тону і-го звукового об’єкту;

- ціла частина ;

- Q – величина еквівалентної добротності, яка характеризує ширину смуги пропускання фільтра в околі m-го обертону ;

- - відносне відхилення частоти k-го коефіцієнту ряду Фур’є від частоти m-го обертону ;

- Hпод – модуль коефіцієнта передачі фільтра в області подавлення.

За виразами (1), (2), якщо частота k-го коефіцієнта ряду Фур’є відхиляється від частоти ближнього обертону на величину меншу, ніж задано смугою пропускання в околі цього обертону, то модуль коефіцієнта передачі фільтра шумоподавлення на частоті k-го коефіцієнта встановлюється рівним 1. Якщо H(fk ) =1, тобто частота k-го коефіцієнта ряду Фур’є попала в область пропускання іншого звукового об’єкту, що є на оброблювальній вибірці, то H(fk) залишається без змін. На частотах всіх решту коефіцієнтів H(fk ) =встановлюється рівним Hпод.

Необхідно вияснити, яким чином можна встановити втрату обертонів і відновити втрачені обертони на основі даних, що отримані при розпізнаванні. Оскільки, не маючи додаткових даних (відомі лише частоти основних тонів звукових об’єктів) обмежимося лише порівнянням потужності спектру в областях, в яких знаходяться гармонійні складові, найбільш близькі за частотою до частоти гармонік основних тонів розпізнаних звукових об’єктів. Ми приймаємо їх за обертони. За результатами порівняння можна константувати наявність чи відсутність обертону. Тобто, для кожного виявленого звукового об’єкта стає можливим скласти перелік недостаючих обертонів. Відповідно, відсутні обертони необхідно синтезувати. Для цього необхідно визначитися з амплітудою, частотою, і початковою фазою гармонійного коливання, яке замінить втрачений обертон.

Для Формування амплітудної огинаючої синтезованих обертонів використовуються вихідні сигнали системи сегментації. Причому доцільно вручну регулювати амплітуди окремих обертонів, якщо для синтезу кожного обертону використовувати окремих генератор. Кількість генерованих обертонів може бути більше від одного.

Частота синтезованого обертону визначається частотою основного тону того звукового об’єкта, до якого обертон відноситься, і цілочисельним множником –порядком обертону. Хоча частота синтезованого обертона отримується цілочисельним множенням частоти основного тону розпізнаного звукового об’єкта, така спектральна складова не може бути названа гармонікою - завжди є похибка в визначенні частоти обертонів, тобто частота синтезованого обертону не обов’язково є кратною істинній частоті основного тону. Необхідно також ручне регулювання частоти обертонів (наприклад, її відхилення від значення, кратного частоті ОТ, отриманої при розпізнаванню.

Для кращого натурального звучання доцільно синтезувати різні обертони з різними початковими фазами. Тобто необхідний генератор випадкових чисел, який вносить додатковий зсув фази окремих обертонів. Необхідна і можливість ручного керування початкової фази окремого обертону. Необхідно забезпечити неперервність миттєвої фази обертону. Для цього при переході від одної часової вибірки до іншої необхідно запам’ятати значення миттєвої фази на останньому відліку і використовувати його, як опорний на початку синтезу на наступній вибірці.

Враховуючи наведені вимоги розроблена структурна схема синтезу обертонів, яка наведена на рис.9.

Вхідними сигналами синтезу обертонів є вихідні сигнали системи сегментації, вихідний сигнал – сума сигналів генераторів, промодульованих за амплітудою і фазою. Частоти основних тонів поступають на входи генератора, виходи генератора поступають на групу каналів, кожен з яких містить помножувачі частоти, регульовані підсилювачі і регулятори початкових фаз сигналів.

Рис.9. Структурна схема синтезу обертонів.