NetNado
  Найти на сайте:

Учащимся

Учителям



Биологический факультет мгу им. М. В. Ломоносова


УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК

Том 26 №4 1995

УДК 612.8

А. Т. ТЕРЕХИН, Е. В. БУДИЛОВА


СЕТЕВЫЕ МЕХАНИЗМЫ ФИЗИОЛОГИЧЕСКОЙ РЕГУЛЯЦИИ

Биологический факультет МГУ им. М. В. Ломоносова



Дается обзор основных идей и понятий нового методологического подхода к описанию и пониманию регуляторных процессов в организме — так называемого коннекционистского, или сетевого, подхода. Рассматриваются сетевые модели нервной, иммунной, эн­докринной и генной регуляции, вводится представление об организме как о целостной сетевой системе. Предлагается новый подход к регуляции состояния организма, названный авторами ассоциативным управлением, и обсуждаются его возможные применения для коррекции состояния организма.

В течение последних лет, не явно с 1983 г. и явно с 1986, происходило взрывное нарастание исследовательской активности в области, получившей к настоящему времени устойчивое название «нейросетевые исследования» («neural network re­search»). Оно характеризовалось экспоненциальным, с периодом удвоения 1—2 года, ростом числа публикаций, научных конференций и новых журналов, а также частоты встречаемости в библиографических базах данных ключевых слов типа «нейронные сети» и цитирований основных авторов этого направления [4, 26]. Можно, однако, отметить парадоксальный факт — хотя уже из самого названия данного направления следует, что его первоисточником являются ней­рофизиологические исследования, бурный рост нейросетевых исследований в последнее десятилетие относится в основном к развитию математической теории нейроподобных сетей, разработке новых алгоритмов машинной обработки инфор­мации, в частности обработки изображений и речи, созданию принципиально новых типов вычислительных машин — нейрокомпьютеров [10]. Доля же нейро­сетевых работ, связанных непосредственно с физиологической тематикой, относительно невелика. Например, в собранной нами библиографии по нейрон­ным сетям, включающей несколько тысяч названий [14], их всего несколько десятков. Такая ситуация не представляется нормальной и, возможно, объясняет­ся чисто экономическими причинами, связанными с более интенсивным финансированием исследований технической направленности. Нам, однако, ка­жется, что новые идеи и подходы как общего, так и конкретного характера, разработанные в теории нейронных, или шире, когнитивных сетей, могут быть чрезвычайно полезными для более адекватного описания и понимания сущности многих процессов, протекающих в организме. Данная статья — попытка продвижения в этом направлении.

Мы начнем с описания основных понятий и свойств нейроподобных сетей (п. 1). Затем рассмотрим сетевые модели отдельных регуляторных систем организма — нервной, генетической, иммунной, эндокринной и обоснуем представление о сете­вом характере организации организма как целого (п. 2). Далее, в п. 3 будут предложены подходы к управлению состоянием когнитивной сети, основанные на ее свойстве ассоциативного восстановления своих устойчивых состояний, а в п. 4 будут рассмотрены возможности применения этих подходов к управлению состо­янием организма.

75

1. Основные идеи и понятия теории нейронных сетей

Суть сетевого подхода состоит в том, что изучаемый объект рассматривается как динамическая сеть связанных между собой и влияющих друг на друга элемен­тов. Оказывается, что даже сети из относительно простых элементов, взаимодей­ствующих по простым правилам, могут иметь очень сложное и разнообразное поведение. Это позволяет использовать сетевые модели для описания таких слож­ных биологических процессов, как когнитивная деятельность мозга, работа ге­нетического аппарата клетки, функционирование иммунной системы и др.

Исторически сетевые модели в наиболее явном виде впервые были рассмотре­ны Мак-Каллохом и Питтсом [25], которые ввели понятие формального нейрона и исследовали математически свойства сетей из таких нейронов. Хебб [16] выдвинул гипотезу о механизме формирования межнейронных связей, согласно которой в процессе обучения усиливаются связи между нейронами, одновременно находящимися в возбужденном состоянии. Розенблатт [9] предложил искусствен­ную нейронную сеть, названную им персептроном, которая обладала способно­стью обучаться распознаванию простых образов. Коффмэн [22] применил сетевой подход для описания работы генетической системы, а Джерн [21] — иммунной. Сильным стимулом к развитию исследований в области динамических сетей послужила работа Хопфилда [19], в которой для исследования свойств искусствен­ных нейронных сетей была применена математическая теория динамических систем, созданная в конце прошлого века А. Пуанкаре и широко используемая в механике, теоретической физике, химической кинетике и других областях.

В этом разделе на примере простой, но эффективной и активно используемой в кибернетике, вычислительной схемы — сети Хопфилда [19] рассматриваются основные понятия теории когнитивных динамических сетей и некоторые их свой­ства. Описываются два способа обучения сетей — правило Хебба и метод случай­ного отбора. Некоторые принципиальные ограничения детерминированной сети преодолеваются путем введения в нее стохастичности (машина Больцмана). Другим обобщением сети Хопфилда являются сети с асимметричными связями, допускающие циклические устойчивые состояния. Описывается также процедура разобучения, которая позволяет сети освобождаться от ложных устойчивых сос­тояний. Подчеркивается связь теории когнитивных динамических сетей с общей теорией динамических систем.

1.1. Сеть Хопфидда

Сеть Хопфилда — это просто некоторая формальная вычислительная схема. Однако, поскольку ее структура и функционирование в какой-то степени на­поминают структуру и функционирование нервной системы, она называется ней­ронной сетью и ее работа описывается в терминах когнитивной деятельности мозга. Работа других регуляторных систем реального живого организма будут рассмотрены в следующем разделе. Пока же будем рассматривать сеть Хопфилда просто как искусственную схему, которая может быть реализована, например, на компьютере.

Сеть Хопфилда состоит из некоторого числа N элементов, соединенных между собой связями. Каждый из элементов i характеризуется своим состоянием s(i), a каждая связь некоторого элемента i с другим элементом j характеризуется весом w (i, j). Предполагается, что имеется только два возможных состояния элемента: —1 и 1. Веса же могут быть любыми действительными числами. В общем случае веса w (i, j) и w (j, i) могут быть разными, однако в базовой модели Хопфилда они предполагаются равными: w (i, j) = w (j, i). Кроме того, предполагается, что для всех i выполняется условие w (i, i) = 0, т. е. веса связей элементов самих с собой равны нулю.

Такова структура сети Хопфилда. Ее характерная черта — полносвязанность (это, впрочем, не исключает отсутствия связей между отдельными элементами, поскольку любой из весов может быть равен нулю). Следующий шаг — описание

76

правил изменения сети во времени. Динамику сети определяют два правила: правило изменения весов связей и правило изменения состояний элементов. Динамика изменения весов определяется уравнением

(1)

Смысл этого уравнения, называемого правилом Хебба, состоит в том, что за один шаг времени от t до t +1 вес связи между элементами i и j либо увеличива­ется на 1, если s (i, t) и s (j, t) находятся в одинаковых состояниях, либо уменьша­ется на 1, если состояние s (i, t) и s (j, t) противоположны.

Изменение в момент t состояния элемента i определяется значением в этот момент величины



представляющей собой взвешенную сумму сигналов, приходящих к элементу i от всех остальных элементов. Состояние элемента i в момент t + 1 определяется в соответствии с правилом

(2)

т. е. элемент i сравнивает взвешенную сумму с нулем и в зависимости от резуль­тата принимает одно из двух своих возможных состояний.

Рассмотрим теперь некоторые свойства сетей, поведение которых определяется правилами (1) и (2). Удобно отдельно рассматривать ситуации, когда меняются только веса при неизменных состояниях элементов (режим 1) и когда меняются только состояния элементов (режим 2). Представим, что состояние элементов отражаются в виде панно из горящих лампочек (состояние элемента равно 1) или негорящих (состояние элемента равно —1). Будем называть «образом» произвольную конфигу­рацию горящих лампочек на фоне негорящих и допустим, что у нас есть возможность задать и зафиксировать или, как говорят, «предъявить» сети любой образ.

Итак, пусть начальные значения в момент t = 0 всех весов w (i, j) равны нулю и сети предъявлен некоторый образ. В соответствии с правилом Хебба (1) в следующий момент времени t = 1 веса изменятся таким образом, что вес связей между элементами, находившимися в одинаковых состояниях, будет единица, а между находившимися в разных состояниях — минус единица. Если предъявить сети второй образ, то веса связей вновь изменятся. Если два элемента находились в одинаковом состоянии при предъявлении как первого образа, так и второго, то вес связи между ними станет равным 2, а если они в обоих случаях были в противоположных состояниях, то соответствующий вес будет равен —2. Наконец, если при предъявлении одного образа элементы находились в одинаковых состо­яниях, а при предъявлении другого — в разных, то вес связи между ними окажется равным нулю. Этот процесс можно продолжать и предъявлять сети образ за образом — каждый раз соответственно будут модифицироваться веса связей.

Для выяснения свойств сети с полученными в режиме 1 весами изучим ее поведение в режиме 2 — режиме изменения состояний элементов. Рассмотрим конкретный пример. Пусть сети из 56 элементов, расположенных для наглядности в виде прямоугольной решетки из 8 строк и 7 столбцов и имеющих нулевые начальные веса связей, предъявлены последовательно четыре образа — буквы Е, Н, X и Y. Чтобы понять, как будет вести себя сеть с полученными в результате этих предъявлений весами связей, будем предъявлять ей в режиме 2, т. е. при неизменных весах, различные начальные образы и наблюдать за последующей динамикой этих образов, определяемой уравнениями (2).

На рисунке показано несколько типичных примеров такой динамики. В частности,

77





-t=o



Динамика состояний сети, обученной распознаванию образов Е, Н, X, Y, при предъявлении различных начальных образов в момент t=0

первые четыре начальных образа представляют собой искаженные вариан­ты предъявленных в режиме 1 букв Е, Н, X и Y. Мы видим, что всякий раз от искаженного образа сеть переходит к ранее предъявленному соответствующему неискаженному образу и потом постоянно остается в этом состоянии. Таким образом, в режиме 1 сеть как бы «запоминает» образ в изменениях весов связей, а в режиме 2 может его «вспомнить», если ей предъявить похожий образ, т. е. некоторую «ассоциацию», связанную с этим образом. Соответственно режим 1

78

называют режимом запоминания, или обучения, а режим 2 — режимом восп­роизведения, или распознавания.

Последние три примера динамики на рисунке получены при задании случай­ных начальных образов, не похожих или не очень похожих на образы, предъяв­ленные во время обучения. Тем не менее в одном случае система переходит в состояние, соответствующее одному из этих образов — X. Однако в двух других случаях мы получаем новые образы, которые не предъявлялись сети при ее обучении. Это говорит о том, что в числе устойчивых образов, к которым сеть стремится в режиме распознавания и которые называются ее аттракторами, кроме предъявленных при обучении образов имеются и другие. Часто их называют «ложными» и рассматривают как помехи осуществлению сетью функций ас­социативной памяти. Отчасти это действительно так, и мы еще вернемся к этой проблеме, рассматривая процедуру разобучения.

Однако появление «ложных» образов имеет и положительный аспект, посколь­ку резко расширяет когнитивные свойства сетей [2] . Действительно, можно за­метить, что последние два аттрактора на рисунке не случайны, а как бы состав­лены из частей образов, предъявленных при обучении, т. е. представляют собой своего рода химеры. Возможность появления таких «химер» наделяет сеть в некотором смысле способностью к «обобщению» и «творческой фантазии». Например, предпоследний «химерический» образ на рисунке можно рас­сматривать как обобщающий символ для Е и Н, а последний — для X и Y.

Поведение сети Хопфилда в режиме распознавания очень удобно интерп­ретировать в терминах так называемой «функции энергии», вид которой зависит от значений весов связей и которая определяется формулой

(3)

Аргументом этой функции является вектор состояний элементов, который мы для краткости будем называть состоянием сети и представлять наглядно в виде точки в N-мерном пространстве состояний элементов, Например, в случае сети из двух элементов, состояния которых могут быть любыми действительными числами, пространство состояний будет представлять собой плоскость, а функция энергии — поверхность над этой плоскостью в трехмерном пространстве.

Можно показать, что определяемое уравнениями (2) изменение состояния сети происходит в направлении уменьшения энергии (3). Действительно, пусть, например, элемент i находится в состоянии -1 и Q (i, t) > 0, тогда он должен на следующем шаге, в соответствии с правилом (2), перейти в состояние 1. В то же время, учитывая ( 3) , получаем для приращения энергии при этом переходе



т.е.

(4)

откуда следует, что это приращение действительно отрицательно.

Удобно наглядно представлять изменение состояния сети как движение соот­ветствующей точки в пространстве состояний, подобно тому как это происходит, например, с помещенным на неровную поверхность шариком, который всегда движется в направлении уменьшения своей потенциальной энергии. В точках пространства состояний, соответствующих образам-аттракторам, функция энергии имеет локальные минимумы, поэтому сеть, достигнув любого из таких состояний, остается в нем до тех пор, пока не будет принудительно переведена в

79

новое начальное состояние. Все пространство состояний распадается, таким обра­зом, на области, образующие так называемые бассейны притяжения аттракторов, и динамика сети, установленной в некоторое начальное состояние, полностью зависит от того, в бассейн притяжения какого из аттракторов она попала.

1.2. Генетическое обучение

Рассматривая выше свойства сети Хопфилда, мы предполагали, что ее веса формируются в соответствии с правилом Хебба (1). Однако это не единственный способ их получения. Другой возможный способ обучения сети — случайный отбор. Для его реализации необходимы механизм генерации случайных модификаций весов связей и механизм фиксации тех из них, которые в некотором смысле благоприятны для сети.

Рассмотрим в качестве примера сеть из N + 1 элементов, управляющую пове­дением некоего гипотетического организма. Пусть первые N элементов (или некоторые из них) играют роль «сенсоров», отражающих состояние внешней среды, а последний — роль «эффектора», одно из состояний которого, скажем, единица, соответствует оценке ситуации как опасной и включает механизм защиты, другое же — оценке ситуации как безопасной и позволяющей выполнять жизненно важные функции, например поиск пищи. Очевидно, что сеть должна максимально правильно оценивать ситуацию, поскольку организм может постра­дать как из-за игнорирования внешней опасности, так и из-за недостатка времени на функции жизнеобеспечения. Как обучить сеть правильной оценке ситуации?

Один путь может состоять в использовании правила Хебба. Для его приме­нения необходимо иметь набор учебных ситуаций — (N + 1)-мерных векторов, содержащих как N-мерный образ внешней среды, так и значение (N +1)-й ком­поненты — ее оценку. То, что мы уже знаем о свойствах сети, позволяет ожидать, что после предъявления ей достаточного числа примеров в режиме обучения она будет способна более или менее успешно решать поставленную задачу оценки ситуации в режиме распознавания.

Такой способ, однако, применим лишь при наличии, так сказать, «примеров с ответами». Если обучающих примеров нет или их недостаточно, то приходится «учиться на ошибках». Такое обучение состоит в том, что веса связей время от времени случайно меняются, но изменения сохраняются только в тех случаях, когда они повышают правильность оценки ситуации. Механизм фиксации положительных изменений естественным образом реализуется, например, в ситу­ации дарвиновского отбора, когда изменения, приводящие к более «правильному» поведению, имеют большие шансы сохраниться в последующих поколениях бла­годаря получаемым при этом преимуществам в размножении [24, 29, 30].

Можно предположить, что обучение путем случайного отбора играет основную роль в филогенезе, тогда как для онтогенеза более характерно обучение типа хеббовского.

1.3. Стохастические сети

Поведение сети Хопфилда полностью детерминировано. Однако легко по­лучить стохастический вариант этой сети, называемый машиной Больцмана [17] , если заменить ее элементы, изменяющие свое состояние в соответствии с правилами ( 2) , на их стохастические аналоги, изменяющие состояние случайным образом в соответствии с вероятностями, определяемыми формулами



и



80

или, учитывая (4),



и (5)



где Т — параметр, характеризующий степень стохастичности сети и называемый обычно «температурой».

При очень больших Т вероятности переходов в состояния 1 или —1, определя­емые (5), слабо зависят от соответствующих этим переходам изменений энергии и примерно равны 1/2, что говорит о практической независимости динамики сети от рельефа энергетической поверхности.

Наоборот, при Т = 0 динамика машины Еольцмана совпадает с динамикой нестохастической сети Хопфилда, определяемой (2).

Действительно, если, например, элемент i находится в состоянии —1 и Q(i, t) > 0, то имеем при Т ->0, в соответствии с (5),



т. е. элемент i с вероятностью, стремящейся к 1, перейдет в состояние 1. К такому же результату привело бы и применение детерминированного правила (2).

При промежуточных температурах сеть с высокой вероятностью остается в состояниях, соответствующих глубоким минимумам энергии, и относительно лег­ко выходит из состояний, соответствующих мелким минимумам. Это означает, что благодаря введению стохастичности сеть получает способность различать ло­кальные минимумы энергии по степени их выраженности, т. е. способность отличать надежные, многократно встреченные образы, которым соответствуют глубокие минимумы, от случайных.

Возможность свободного случайного блуждания сети в пространстве состояний расширяет возможности нахождения ею более глубоких минимумов энергии, т. е. способствует более успешному решению задач распознавания. Эффективная про­цедура такого блуждания, названная «отжигом», состоит в том, что поиск начина­ется при высокой температуре сети, которая постепенно снижается до нуля [23].

Сеть с элементами стохастичности как бы получает внутренний источник
движения. Машина Больцмана, в отличие от нестохастической сети Хопфилда,
достигнув ближайшего локального максимума энергии, уже не обречена на­ходиться в нем до тех пор, пока ее состояние не будет изменено извне, а может
сама выйти из этого состояния [6]. .

1.4. Асимметричные сети

Определяя архитектуру сети Хопфилда, мы приняли в качестве условия, что веса связей между ее элементами симметричны, т. е. w (i, j, t) = w (j, i, t). Что произойдет, если это ограничение снять? Оказывается, что у асимметричной сети появляется новое полезное свойство — такая сеть может иметь не только точеч­ные, но и циклические аттракторы и, соответственно, может запоминать не только отдельные образы, но и последовательности образов.

Для обеспечения возможности запоминания асимметричной сетью последова­тельности образов изменим правило Хебба (1) так, чтобы в весах связей фиксировались не отношения между состояниями элементов предъявляемого в момент t образа, а отношения между состояниями элементов образа, предъявлен­ного в момент t — 1, и образа, предъявляемого в момент t. Соответствующее обучающее правило запишется в виде следующей формулы:

(6)

Что касается правил, определяющих динамику состояний элементов, предпо­лагается, что она по-прежнему задается уравнениями (2).

81

Очевидно, что все ранее сказанное относительно возможности и целесообраз­ности обучения сети путем случайного отбора и введения в ее динамику стохастичности в равной степени относится и к асимметричным сетям.

К сожалению, интерпретация динамики сети в терминах движения состояния в направлении антиградиента функции энергии (3) на случай асимметричной сети непосредственно не переносится. Действительно, как мы можем возвратиться в прежнее состояние, если на каждом шаге энергия может только уменьшиться?

Можно, однако, использовать другой, более общий способ наглядного описания динамических свойств сети — векторное поле скоростей изменения состояния, заданное в пространстве состояний. Это поле легко строится по функции энергии, поскольку в каждой точке пространства состояний оно равно просто антиградиенту функции энергии. Поэтому в случае симметричных сетей мы можем наряду с функцией энергии использовать для описания динамики также и поле скоростей. Однако в случае несимметричных сетей, которые могут иметь циклическую динамику, годится лишь описание в терминах поля скоростей.

Более важно, однако, подчеркнуть, что в обоих случаях пространство состо­яний делится на непересекающиеся части, соответствующие бассейнам притя­жения разных аттракторов, и динамика сети определяется ее движением в соот­ветствии с полем скоростей по направлению к аттрактору, в бассейне притяжения которого находится ее состояние.

Отметим еще, что полное поле скоростей сети не исчерпывается полем скоростей в пространстве состояний элементов. Поскольку веса связей также изменя­ются в зависимости от состояний элементов (а через них, следовательно, и в
зависимости от значений других весов), то в принципе можно рассматривать поле
скоростей в объединенном пространстве состояний элементов и весов связей.
Далее, однако, мы ограничимся ссылками лишь на поле скоростей в пространстве
состояний, предполагая, что на рассматриваемом промежутке времени значения
весов существенно не меняются.

страница 1страница 2страница 3


скачать

Другие похожие работы: