Задача о порядке перемножения матриц

Учебное пособие Редактор А. В. Крейцер Издательство спбгэту «лэти» 1 97376, С. Петербург, ул. Проф. Попова, 5
2. Деревья поиска Идеально сбалансированные бинарные деревья
2 Случайные бинарные деревья поиска
Абракадабра!, содержащий 12 символов, включая специальный символ !
Задача кодирования сообщений. Префиксные коды и деревья Пусть задан алфавит
1 Код Фано-Шеннона
1 Метод Хаффмана
1 Реализация алгоритмов кодирования
1 Доказательство оптимальности кода Хаффмана Лемма 1
1 Энтропийная оценка средней длины кода
1 Динамическое кодирование по Хаффману
Абракадабра!, содержащий 12 символов, включая специальный символ !
Абракадабра!, содержащий 12 символов, включая специальный символ !
А. Ю. Алексеев с. А. Ивановский д. В. Куликов
При обучении программированию особую трудность вызывает работа с динамическими структурами данных
2. стеки и очереди спецификация стека и очереди
3 Определения дерева, леса, бинарного дерева. Скобочное представление
Примечания и библиографические указания
Списки
Задача о порядке перемножения матриц
С. А. Ивановский разработкакорректныхпрограм м санкт-Петербург 2003
Программирования
Разработка, доказательство корректности и анализ алгоритма
2. основы аналитической верификации программ основные правила аналитической верификации программ
3. индуктивные функции на последовательностях
4. корректность программ при работе с массивами
5. поиск в массиве линейный поиск
Разработка, доказательство корректности
Шень А. Программирование: теоремы и задачи: Учеб пособие

скачать doc

Динамическое программирование

Задача о порядке перемножения матриц
Рассмотрим произведение матриц M₁  M₂  M₃  ...  M_n_₁  M_n. Каждая матрица M_i имеет размер r_i_₁  r_i. Вычисление произведения двух матриц – размер первой l  m и размер второй m  n – требует l m n умножений их элементов. Общее количество элементарных операций умножения, требуемое при вычислении произведения цепочки матриц, зависит от порядка, в котором производятся попарные умножения матриц. Требуется найти такой порядок перемножения матриц, который минимизирует общее количество элементарных операций умножения.

Рассмотрим пример M₁  M₂  M₃  M₄, где M₁ имеет размер 1020, M₂  2050, M₃  501, а M₄  1100. Если умножения происходят в порядке, соответствующем расстановке скобок M₁  (M₂  (M₃  M₄)), то потребуется 125000 умножений, а если это же произведение вычислять как (M₁  (M₂  M₃))  M₄, то потребуется всего 2200 умножений.

Пусть m_ij – оптимальное количество умножений, требуемое для вычисления произведения цепочки матриц M(i, j) = M_i  M_i ₊₁  ...  M_j_₁  M_j, где 1 i  j  n. Очевидно, что M(i, i) = M_i и m_i_i = 0, а m₁_n – соответствует решению задачи для исходной цепочки M(1, n) . При 1 i  j  n справедливо следующее рекуррентное соотношение

m_ij = Min { m_ik + m_k_+1,_j + r_i_₁  r_k  r_j  i  k  j}. (*)

Действительно, при оптимальном вычислении M(i, j) последним будет перемножение ранее вычисленных матриц M(i, k) и M(k +1, j) при некотором k, таком, что i  k  j. Это перемножение потребует r_i_₁  r_k  r_j операций умножения. В свою очередь M(i, k) и M(k +1, j) также должны вычисляться оптимальным способом, т. е. за m_ik и m_k_+1,_j умножений соответственно.

Заметим, что в правой части равенства (*) разности индексов i – k и j – k –1 у слагаемых m_ik и m_k_+1,_j меньше, чем разность индексов i – j в m_ij. Таким образом, рекуррентное соотношение (*) следует решать, начиная с m_i_i = 0 и последовательно увеличивая разность индексов i – j, до тех пор, пока не получим m₁_n.

Удобно представлять результаты вычислений в виде таблицы. В этой таблице строка с номером l состоит из ячеек T(i, j), индексы которых связаны соотношением i – j = l. Таким образом, в ячейках этой строки j = i + l и T(i, j) = T(i, i + l), при этом номер i ячейки в строке принимает значения от 1 до n – l и всего в строке имеется n – l ячеек: T(1, 1 + l), T(2, 2 +l), …, T(n  l, n).

l = 0	Т(1, 1)	Т(2, 2)	Т(3, 3)	Т(4, 4)	…	Т(n1, n1)	Т(n, n)
l = 1	Т(1, 2)	Т(2, 3)	Т(3, 4)	…	Т(n2, n1)	Т(n 1, n)
l = 2	Т(1, 3)	Т(2, 4)	…	Т(n3, n1)	Т(n2, n)
…	…	…	…	…
l = n –3	Т(1, n2)	Т(2, n1)	Т(3, n)
l = n –2	Т(1, n1)	Т(2, n)
l = n –1	Т(1, n)

В ячейках таблицы T(i, j) будем хранить вычисленное значение m_ij и то значение q_ij = k в диапазоне i  k  j, при котором был получен Min{m_ik + m_k_+1,_j + r_i_₁  r_k  r_j}. Следующий алгоритм вычисляет оптимальное значение m₁_n и заполняет таблицу T по строкам сверху вниз:
for i := 1 to n do m[i, i] := 0; {заполнение первой строки}

for l := 1 to n –1 do

for i := 1 to n – l do

begin

j := i + l;

{заполнение T(i, j):}

m[i, j] := +;

for k := i to j – 1 do

begin

s := m[i, k] + m [k +1,j] + r_i_₁ * r_k * r_j;

if s  m[i, j] then

begin m[i, j] := s;

q[i, j] := k

end { if }

end { for k }

end { for i }
Этот алгоритм требует для хранения таблицы примерно n²/2 элементов памяти и около n³/3 выполнений тела внутреннего цикла.

Рассмотрим работу алгоритма для ранее приведенного примера вычисления M₁  M₂  M₃  M₄ (размеры матриц, как указано ранее). Для заполнения строки таблицы при l = 1 вычислим последовательно

m_1,2 = m_1,1 + m₂_,₂ + r₀  r₁  r₂= 102050=10000

m_2,3 = m_2,2 + m₃_,₃ + r₁  r₂ r₃= 20501=1000

m_3,4 = m_3,3 + m₄_,₄ + r₂  r₃ r₄= 501100=5000

Здесь фактически минимум находить не требуется, т. к. тело цикла по k выполняется лишь один раз (при k = i). Заполненная строка таблицы есть

l = 1

m_1,2 = 10000

q_1,2 = 1

m_2,3 = 1000

q_2,3 = 2

m_3,4 = 5000

q_3,4 = 3

Далее для заполнения строки таблицы при l = 2 вычислим последовательно

m_1,3 = Min {m₁_k + m_k_+1,₃ + r₀  r_k  r₃  k = 1, 2} =

Min {m_1,1 + m_2,₃ + r₀  r₁  r₃ , m_1,2 + m_3,₃ + r₀  r₂  r₃} =

Min {0 + 1000 + 200, 10000 + 0 + 500} =

Min{1200, 10500} = 1200 (при k = 1),

m_2,4 = Min {m₂_k + m_k_+1,4 + r₁ r_k  r₄ k = 2, 3} =

Min {m_2,2 + m_3,4 + r₁  r₂  r₄ , m_2,3 + m_4,4 + r₀  r₂  r₃} =

Min {0 + 5000 + 100000, 1000 + 0 + 2000} =

Min{105000, 3000} = 3000 (при k = 3),

и дополним таблицу следующей строкой:

l = 1	m_1,2 = 10000 q_1,2 = 1	m_2,3 = 1000 q_2,3 = 2	m_3,4 = 5000 q_3,4 = 3
l = 2	m_1,₃ = 1200 q_1,₃ = 1	m_2,₄ = 3000 q_2,₄ = 3

Наконец, вычислим последнюю строку таблицы, состоящую из одной ячейки Т(1, 4):

m_1,4 = Min { m₁_k + m_k_+1,4 + r₀  r_k  r₄  k = 1, 2, 3} =

Min { m_1,1 + m_2,4 + r₀  r₁  r₄, m_1,2 + m_3,4 + r₀  r₂  r₄,

m_1,3 + m_4,4 + r₀  r₃  r₄, } =

Min {0 + 3000 + 20000, 10000 + 5000 + 50000, 1200 + 0 + 1000} =

Min {23000, 65000, 2200} = 2200 (при k = 3).

Итак, вся таблица вычислена и имеет вид

l = 0	m_1,₁ = 0 q_1,₁ = 1	m_2,₂ = 0 q_2,₂ = 2	m_3,₃ = 0 q_3,₃ = 3	m₄_,₄ = 0 q₄_,₄ = 4
l = 1	m_1,2 = 10000 q_1,2 = 1	m_2,3 = 1000 q_2,3 = 2	m_3,4 = 5000 q_3,4 = 3
l = 2	m_1,₃ = 1200 q_1,₃ = 1	m_2,₄ = 3000 q_2,₄ = 3
l = 3	m_1,₄ = 2200 q_1,₄ = 3

Пока мы вычислили лишь оптимальное количество требуемых умножений m_1,4 = 2200 и записали в таблицу дополнительные данные q_ij, позволяющие получить собственно порядок перемножения матриц. В рассмотренном примере этот порядок можно получить, начиная от финальной ячейки и продвигаясь по закрашенным ячейкам. Действительно, поскольку q_1,4 = 3, то минимум был получен при m_1,3 + m_4,4 + r₀  r₃  r₄. Это значит, что последним по порядку должно производиться умножение матриц M(1, 3)  M₄. В свою очередь, поскольку q_1,3 = 1, то на предыдущем шаге минимум был получен при m_1,1 + m_2,₃ + r₀  r₁  r₃, т. е. матрица M(1, 3) должна вычисляться как M(1, 3) = M₁  M(2, 3), а M(2, 3) = M₂  M₃. Это в итоге дает оптимальный порядок перемножения матриц (M₁  (M₂  M₃))  M₄.

В общем случае порядок перемножений матриц легко определить рекурсивно. Пусть имеется функция перемножения двух матриц func Mult ( A, B: Matrix): Matrix. Тогда «набросок» функции перемножения цепочки матриц выглядит так

func MatrixSeqMult ( i, j: Index): Matrix;

{i  j}

global q: Tab_q;

var k: Index; var A, B: Matrix;

begin

if i  j then

begin

k := q[i, j];

A := MatrixSeqMult ( i, k);

B := MatrixSeqMult ( k +1, j);

Return Mult(A, B)

end

else {i = j} Return M_i

end {MatrixSeqMult}

Доступ к матрицам M_i заданной цепочки M₁  M₂  ...  M_n здесь не детализирован.
Полезно сравнить решение, полученное методом динамического программирования, с решением методом ветвей и границ. В рассмотренном примере возможны следующие 5 вариантов перемножения матриц M₁  M₂  M₃  M₄, а именно:

M₁  (M₂  (M₃  M₄)),

M₁  ((M₂  M₃)  M₄),

(M₁  M₂)  (M₃  M₄),

(M₁  (M₂  M₃))  M_4,

((M₁  M₂)  M₃)  M₄.

Все они получаются в дереве перебора вариантов, изображенном далее на рисунке. Некоторые узлы дерева встречаются повторно (выделены цветом). Отметим, что в методе динамического программирования повторных вычислений не производится. Вычисления проводятся так, как будто дерево сканируется снизу вверх, а результаты вычислений сохраняются в таблице и при необходимости используются.

M

(1,4)

M₁  M(2,4) M(1,2)  M(3,4) M(1,3)  M₄

M₂  M(3,4) M(2,3)  M₄M₁  M₂ M₃  M₄M₁  M(2,3) M(1,2)  M₃

M₃  M₄M₂  M₃ M₂  M₃ M₁  M₂
Оценку количества узлов дерева в общем случае можно получить, подсчитав все возможные варианты расстановок скобок в произведении матриц. Пусть p_n – число вариантов расстановок скобок в произведении n сомножителей (считая самые внешние скобки). Считая, что «последнее» по порядку умножение может оказаться на любом из n –1 мест, запишем следующее рекуррентное соотношение

p_n = p₁ p_n_–1 + p₂ p_n_–2 + … + p_n_–2 p₂ + p_n_–1 p₁.

Начальным условием является p₁ = 1. Далее p₂ = p₁ p₁ = 1, p₃ = p₁ p₂ + p₂ p₁ =2, p₄= p₁ p₃ + p₂ p₂ + p₃ p₁ = 4. Оказывается, что решением этого рекуррентного уравнения являются так называемые числа Каталана p_n = С_n_–1, где С_n =(2 k | k) / (k +1), а запись (n | m) обозначает биномиальный коэффициент (n | m) = n!/(m! (n – m)!). При больших значениях n справедливо С_n  4ⁿ / (n sqrt( n)), т. е. число узлов в дереве перебора есть экспоненциальная функция от n.

Приведем несколько первых чисел Каталана

n	0	1	2	3	4	5	6	7	8	9	10
C_n	1	1	2	5	14	42	132	429	1430	4862	16796

Учащимся

Учителям