скачать doc
1.5. АДАПТИВНАЯ ФИЛЬТРАЦИЯ
1.5.1. Адаптивные фильтры
Адаптивными называют фильтры, частотные характеристики которых зависят от спектров обрабатываемых сигналов. Основная задача адаптивного фильтра (АФ) — повысить качество приема или обработки сигнала. Требования к АЧХ адаптивных фильтров не задаются, поскольку их характеристики изменяются во времени.
Процедура конструирования АФ состоит в выборе класса фильтра (КИХ, БИХ, одномерный, двумерный) и оптимального алгоритма корректировки (адаптации) переменных коэффициентов. Именно выбор и построение оптимального алгоритма является наиболее сложной задачей, связанной с большими затратами вычислительных ресурсов и обеспечением работы устройства в реальном времени.
АФ состоит из трех элементов (рис. 1.15):
цифрового фильтра с переменными коэффициентами;
устройства определения ошибки (сумматор на схеме);
устройства, реализующего алгоритм адаптации.
Принцип работы АФ ясен из рисунка. Выходной сигнал фильтра у(п), отличающийся от эталонного у0(л), вычитается из у0(п). Получаемая ошибка е(п) подается на устройство адаптации, которое так изменяет коэффициенты ЦФ, чтобы свести е(п) к минимуму.
В более сложных системах с целью получения лучших характеристик сигнала у(п) используется иной принцип адаптации, получившей название обратной. Этот вариант изображен на рис. 1.15 штриховыми линиями. По сигналу у(п) восстанавливается сигнал х’(п), который будет отличаться от входного сигнала х(п) на величину ошибки е(и), которая и управляет адаптацией. Введение линии задержки необходимо для временного согласования сигналов х(п) и х’(п).

Рис. 1.15. Структурная схема адаптивного фильтра
Процесс адаптации может быть как одноцикловым (одношаговым), так и итеративным, когда адаптация осуществляется шаг за шагом. Основными характеристиками алгоритма адаптации являются скорость сходимости при заданной ошибке и сложность (объем вычислений). На практике из множества алгоритмов адаптации наиболее часто применяются алгоритмы, основанные на одном из двух критериев: минимума среднеквадратической ошибки (СКО) и метода наименьших квадратов (МНК).
В зависимости от характера усреднения ошибки фильтрации по заданному критерию выделяют глобально-адаптивные и локально-адаптивные фильтры. Если ошибка усредняется по всему обрабатываемому сигналу, фильтр называется глобально-адаптивным (обычно это КИХ-фильтры); если адаптация осуществляется в пределах отдельных фрагментов (кадров) сигнала, фильтр называется локально-адаптивным (обычно это БИХ-фильтры).
Среди многочисленных областей применения АФ можно выделить основные:
коррекция искажений при передаче сигнала по каналам связи; в этом случае АФ моделирует обратную характеристику системы: известный на передаче и приеме эталонный сигнал подается на вход канала связи, его искаженная копия с выхода канала связи проходит через ЦФ, далее из сигнала, полученного на выходе ЦФ, вычитается эталонный сигнал; в результате перестройки коэффициентов частотная характеристика цифрового фильтра оказывается обратной относительно частотной характеристики канала связи;
подавление шумов — в этом случае сигнал, содержащий помеху, подается непосредственно на сумматор, на вход ЦФ подается образец помехи, которая после прохождения через ЦФ вычитается из сигнала, содержащего помеху; в результате на выходе получается искомый сигнал;
компрессия (сжатие) речевых сигналов в системах с линейным предсказанием (вокодерах), которые рассматриваются ниже.
1.5.2. Линейное предсказание
Линейное предсказание (ЛП) — это вычислительная процедура, позволяющая по некоторой линейной комбинации L предшествующих взвешенных отсчетов сигнала предсказать (с некоторой точностью) будущее значение отсчета. Практическая важность линейного предсказания для спектрального анализа состоит в получении оценки спектра исследуемого сигнала на его отрезке (кадре) длиной в L отсчетов, а с точки зрения фильтрации — в получении рекурсивного адаптивного фильтра порядка M-1 на участке квазистационарности, т. е. на том временном отрезке длительностью LT(Т— период дискретизации), где коэффициенты фильтра остаются постоянными. Итогом решения задачи ЛП является получение коэффициентов адаптивного фильтра, АЧХ которого с хорошей степенью приближения соответствует спектру сигнала на кадре.
Задача линейного предсказания может быть сформулирована следующим образом: на выходе некоторой системы наблюдается сигнал у(п); известно, что это система полюсного типа с передаточной функцией вида

имеет порядок К-М-1 и возбуждается белым шумом. Требуется найти коэффициенты аК.
Суть процедуры решения состоит в следующем (рис. 1.16). Согласно (1.57) отсчеты сигнала у(п) на выходе системы определяются выражением


Рис. 1.16. Решение задачи линейного предсказания
Включим последовательно с искомой системой КИХ-фильтр с передаточной функцией

Коэффициенты которой ak’ = ak. Общая передаточная функция получит вид:

Фильтр с передаточной функцией A(z) называется фильтром линейного предсказания или фильтром-предсказателем.
В действительности коэффициенты ak будут отличаться от точных аk’, поэтому предсказываемое значение сигнала у(п) будет отличаться от точного на величину ошибки предсказания (при n > 0)

которую называют остатком. Отсюда нетрудно получить передаточную функцию КИХ-фильтра линейного предсказания (фильтр-предсказатель)

сигнал на выходе которого представляет собой остаток е(п). Выражения (1.57—1.60) показывают, что передаточная функция искомой системы

с точностью до коэффициента b0 представляет собой обратную передаточную функцию (а потому и частотную характеристику) фильтра-предсказателя.
Коэффициенты линейного предсказания ak вычисляются согласно критерию минимума среднеквадратической ошибки (СКО) предсказания:

Коэффициенты ak можно найти, положив

что приводит к системе из L уравнений для определения К коэффициентов:

где L — количество отсчетов на кадре, которое может существенно превосходить порядок предсказания К (например, для стандарта LPC-10 К = 10. L = 120). Это означает, что в процессе вычисления искомых коэффициентов необходимо на каждом кадре речи решать переопределенную систему уравнений. Переопределенные системы после ряда преобразований сводятся к симметричным системам уравнений вида

где

коэффициент корреляции; i = 1,2, ..., К; k = 1,2, ..., К.
Известен быстрый итеративный алгоритм Левинсона-Дарбина, в котором решение уравнения порядка К вида (1.67) выражается через решение уравнения того же вида порядка К-1.
Линейное предсказание является чрезвычайно эффективным при построй нии вокодеров — систем сжатия речи. Оно позволяет получать на приеме синтезированный речевой сигнал по качеству, очень близкому к естественному звучанию. Линейное предсказание нашло также широкое применение в обработке изображений для сжатия видеоданных.
Вокодеры с линейным предсказанием
Важнейшей областью применения линейного предсказания является сжатие речевого сигнала с целью снижения скорости передачи речи по каналам телекоммуникации. Необходимость постановки такой задачи объясняется следующим. Передача стандартного телефонного сигнала, ограниченного полосой (0,3—3,4) кГц, по цифровым каналам связи при стандартной частоте дискретизации 8 кГц и несложном АЦП с разрядностью 12 битов потребует скорости передачи
С = 12x8000 = 96 000 бит/с
и, следовательно, в идеальном случае полосы пропускания канала 48 кГц.

Здесь и далее под битом понимается один элемент передаваемого цифрового сигнала.
В то же время, желательно более экономно использовать частотный ресурс канала; кроме того, КВ-каналы вообще не допускают таких скоростей, их возможности значительно скромнее: скорость передачи в КВ-каналах не превосходит 2400 бит/с. Этот пример показывает, что необходимо так преобразовать информацию, содержащуюся в речевом сигнале, чтобы скорость передачи сократилась в 40 раз (!), т. е. коэффициент сжатия должен быть по крайней мере равен 40. Вообще, ничего удивительного в самой возможности сжатия речевого сигнала нет, поскольку в процессе сжатия устраняется некоторая избыточность, содержащаяся в речевом сигнале. Степень устранения избыточности при передаче отражается на качестве восстанавливаемого (синтезируемого) сигнала.
Устройства кодирования речи называются вокодерами (от англ. voice — голос, coder— кодировщик). Для их построения используются свойства голосового тракта.
Основным элементом модели голосового тракта (рис. 1.17) является адаптивный фильтр с дискретно меняющимися во времени коэффициентами. Фильтр подстраивает свою частотную характеристику под спектр короткого отрезка передаваемого речевого сигнала. Таким адаптивным фильтром является фильтр ЛП порядка К. Возбуждение подобного шума возможно основным тоном или шумом. Моделирование возбуждения осуществляется перестраиваемым генератором частот. Для моделирования сигнала возбуждения служит перестраиваемый генератор частот (генератор основного тона — частоты колебаний голосовых связок) и специальный генератор белого шума (генератор шума).
Вокодер (рис. 1.17) состоит из двух частей: анализатора и синтезатора.
Анализатор определяет параметры речи, синтезатор по принятым параметрам восстанавливает речь.
Анализатор обрабатывает цифровой речевой сигнал покадрово. Кадры вырезаются друг за другом с помощью гладкой функции типа "окна" (треугольного или Хэмминга). Длительность одного кадра и количество отсчетов речевого сигнала, содержащихся в одном кадре, определяется стандартом и находится в пределах от 15 мс до 30 мс. При частоте дискретизации 8 кГц в одном кадре содержится от 120 до 240 отсчетов соответственно.

Рис. 1.17. Обобщенная структурная схема вокодера с линейным предсказанием
К параметрам речевого сигнала, анализируемого на кадре, относятся:
параметры линейного предсказания (математически эквивалентные коэффициентам ЛП);
тип возбуждения голосового тракта тон/шум;
период основного тона и энергия сигнала возбуждения.
В ряде вокодеров новейших моделей применяется векторное квантование параметров ЛП по кодовой книге размерностью 1024 центроида.
В синтезаторе происходит обратный процесс: по параметрам линейного предсказания восстанавливаются коэффициенты {аk’} (конечно, они буду несколько отличаться от вычисленных на передаче, но устойчивость гарантируется), формируется полюсный фильтр, возбуждаемый либо шумом от генератора шума (если передавался неогласованный звук), либо основным тоном от генератора основного тона, вырабатывающим частоту ОТ по принятым параметрам.
Известно несколько типов вокодеров, отличающихся друг от друга способами представления параметров речевого сигнала на кадре, битовой скоростью в канале и, в связи с этим, качеством синтезируемого на приеме сигнала. Ниже дается краткая характеристика вокодеров согласно принятым международным стандартам и рекомендациям.
Стандарт LPC-10 (Linear Prediction Coder). В вокодерах этого типа используется фильтр-предсказатель 10-го порядка на кадрах речи, длительностью = 20 мс; коэффициенты предсказания преобразуются в математически эквивалентные параметры — спектральные корни, значения которых передаются по каналу связи. Вокодеры данного типа обеспечивают хорошую ( 92%) словесную разборчивость; используются на скоростях 1,2; 2,4 и 4,8 Кбит/с.
П Известна группа чрезвычайно сложных вокодеров с векторным квантованием параметров CELP (Code Excited Linear Prediction), из которой приведем три примера.
Стандарт ITU-T G.723.1 — двухскоростной вокодер для мультимедийных коммуникаций, является частью семейства стандартов Н.324. Вокодер работает на скоростях 5,3 и 6,3 Кбит/с. Применяется линейное предсказание LPC-10 с векторным квантованием параметров Л П.
Помимо собственно рекомендации G.723.1 существует Приложение А, согласно которому в кодер добавляется классификатор входного сигнала VAD (Voice Activity Detector, определитель активности голоса). Классификатор выясняет, какой сигнал присутствует на входе: речь или пауза. Во время пауз скорость передачи понижается с 6,3 (или 5,3) Кбит/с до 1 Кбит/с и менее.
Стандарт ITU-T G.728.1 — вокодер с векторным квантованием сигналов возбуждения и параметров линейного предсказания, предназначен для работы на скорости 16 Кбит/с. Входной сигнал (частота дискретизации 8 кГц) подвергается компандированию по А- или -закону (см. главу 7). Для вычисления параметров линейного предсказания служит предсказатель 50-го порядка, для вычисления коэффициентов усиления сигнала возбуждения используются линейные предсказатели 10-го порядка. Кодовая книга имеет размерность 1024.
Как видно из приведенных примеров, алгоритмы адаптивной фильтрации так или иначе включают в себя рассмотренные ранее алгоритмы и потому являются очень сложными как в функциональном, так и в вычислительном плане.