1 Код Фано-Шеннона

Учебное пособие Редактор А. В. Крейцер Издательство спбгэту «лэти» 1 97376, С. Петербург, ул. Проф. Попова, 5
2. Деревья поиска Идеально сбалансированные бинарные деревья
2 Случайные бинарные деревья поиска
Абракадабра!, содержащий 12 символов, включая специальный символ !
Задача кодирования сообщений. Префиксные коды и деревья Пусть задан алфавит
1 Код Фано-Шеннона
1 Метод Хаффмана
1 Реализация алгоритмов кодирования
1 Доказательство оптимальности кода Хаффмана Лемма 1
1 Энтропийная оценка средней длины кода
1 Динамическое кодирование по Хаффману
Абракадабра!, содержащий 12 символов, включая специальный символ !
Абракадабра!, содержащий 12 символов, включая специальный символ !
А. Ю. Алексеев с. А. Ивановский д. В. Куликов
При обучении программированию особую трудность вызывает работа с динамическими структурами данных
2. стеки и очереди спецификация стека и очереди
3 Определения дерева, леса, бинарного дерева. Скобочное представление
Примечания и библиографические указания
Списки
Задача о порядке перемножения матриц
С. А. Ивановский разработкакорректныхпрограм м санкт-Петербург 2003
Программирования
Разработка, доказательство корректности и анализ алгоритма
2. основы аналитической верификации программ основные правила аналитической верификации программ
3. индуктивные функции на последовательностях
4. корректность программ при работе с массивами
5. поиск в массиве линейный поиск
Разработка, доказательство корректности
Шень А. Программирование: теоремы и задачи: Учеб пособие

скачать doc

1.2. Код Фано-Шеннона
В методе, предложенном Р. Фано (R.M. Fano) и К. Шенноном (C.E. Shannon) префиксный код (и соответственно – кодовое дерево) строится следующим образом («сверху вниз»). Пусть набор (w_i)₁ⁿ – упорядочен, а именно: w₁  w₂  … w_n_₁  w_n. В качестве корня дерева выбирается такой узел (и соответственно набор (w_i)₁ⁿ разбивается на два поднабора

так), что веса поддеревьев различаются минимально, т. е. коды сообщений

оказываются в левом поддереве, а коды сообщений

оказываются в правом поддереве, если k =

. Эта процедура повторяется для поддеревьев до тех пор, пока не будет получен лист в качестве текущего поддерева.

Пример построения кода Фано-Шеннона. Пусть n = 5, m = 20 и

w_i	8	3	3	3	3
_i	А	Б	В	Г	Д

Тогда кодовое дерево Фано-Шеннона есть

Кодовые слова даны в таблице

w_i	8	3	3	3	3
_i	А	Б	В	Г	Д
c_i	00	01	10	110	111

Полная длина кода есть L = 2(8+3+3)+3(3+3) = 46 бит. Равномерный код (по 3 бита) дал бы суммарную длину L = 320 = 60 бит.

Отметим, что левые и правые поддеревья в кодовом дереве можно менять местами. При этом код будет изменяться, но величина L не изменится. Для определенности удобно, например, с целью облегчения проверки выполнения заданий, левым поддеревом выбирать поддерево с меньшим весом. Тогда в последнем примере будем иметь результирующее дерево следующего вида

Оказывается, что для рассмотренного примера можно найти более экономный (в смысле величины L) код. Действительно, следующее кодовое дерево

порождает код

w_i	8	3	3	3	3
_i	А	Б	В	Г	Д
c_i	0	100	101	110	111

Для этого кода имеем L = 81+3(3+3+3+3) = 44 бита, что меньше, чем дает код Фано-Шеннона. Этот пример показывает, что код Фано-Шеннона не является оптимальным кодом.
1.3. Задача оптимального кодирования
Итак, задача построения оптимального префиксного кода есть задача минимизации функции L = _i_=1.._n w_i l_i целочисленных положительных переменных (l_i)₁ⁿ при заданном наборе (w_i)₁ⁿ и при условии (пока не формализованном) выполнения свойства префиксности кода. Набор переменных (l_i)₁ⁿ, минимизирующий L, определяет структуру дерева (кода).

Интересно, что аналогичным образом формулируются и некоторые, казалось бы, совершенно другие задачи.

Задача поиска (тестирования). Производится поиск на основе последовательных сравнений (решений) или последовательных тестов: каждый новый вопрос (тест) задаётся (проводится) в зависимости от предыдущих ответов (от результатов предыдущих тестов). Рассматриваются бинарные тесты (задаются вопросы с ответами «да» или «нет»). Этот процесс можно описать с помощью бинарных деревьев решений. Узлы в таких деревьях соответствуют вопросам (тестам), ветви – исходам теста («да»/«нет» или 1/0). Деревья – строго бинарные. Лист дерева решений соответствует завершению (исходу) поиска (тестирования). В качестве примера можно привести анализ алгоритма бинарного поиска, приведенный в [*] (раздел 5.3). Пусть {₁, ₂, …, _n} – множество исходов поиска. Число шагов поиска (длина теста) есть длина пути l_i в дереве решений от корня до листа _i. Пусть w_i – вероятность P(x  _i) или частота предъявления элемента для поиска, приводящего к исходу поиска _i. Тогда M(l) = _i_=1.._n w_i l_i есть математическое ожидание времени поиска (среднее число шагов поиска или последовательного теста). Итак, задача поиска формулируется следующим образом: по заданным n, (_i)₁ⁿ и (w_i)₁ⁿ, где w_i = P(x  _i), построить стратегию поиска (дерево решений), минимизирующую математическое ожидание числа шагов поиска M(l) = _i_=1.._n w_i l_i.

Задача слияния множества упорядоченных списков. Заданы n упорядоченных списков S₁, S₂, …, S_n. Пусть  i  1..n: w_i = S_i  длина списка S_i. Требуется построить один упорядоченный список S путем попарного слияния исходных S₁, S₂, …, S_n и получаемых в процессе этих действий промежуточных упорядоченных списков. Базовая операция слияния двух упорядоченных списков Merge (S_i, S_j) требует w_i + w_j элементарных операций (сравнений и перемещений). Алгоритм Merge (S_i, S_j) можно найти, например, в [*], раздел 4.5. Общее количество операций зависит от порядка попарных слияний. Этот порядок можно задать строго бинарным деревом слияний. Например, дерево

описывает следующую последовательность слияний:

S_{1, 2} = Merge (S₁, S₂),

S_{5, 6} = Merge (S₅, S₆),

S_{1, 2, 3} = Merge (S_{1, 2}, S₃),

S_{4, 5, 6} = Merge (S_{5, 6}, S₄),

S = Merge (S_1,_2,₃, S_4,_5,₆).

Легко видеть, что здесь общее количество элементарных операций есть 3w₁ + 3w₂ + 2w₃ + 2w₄ + 3w₅ + 3w₆.

В общем случае совокупное количество элементарных операций есть _i_=1.._n w_i l_i , где l_i – количество слияний с участием элементов списка S_i или, что то же, уровень листа S_i в дереве слияний. Требуется построить дерево слияний, структура которого определит оптимальный порядок слияний, а минимальное общее число операций _i_=1.._n w_i l_i будет определяться величинами (l_i)₁ⁿ.

Учащимся

Учителям