Реферат: Нейросемантическое моделирование процессов мышления



НЕЙРОСЕМАНТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

ПРОЦЕССОВ МЫШЛЕНИЯ


Бодякин В.И. Институт проблем управления РАН им. В.А. Трапезникова, г.Москва,

Петров И.Б. Московский физико-технический институт (государственный университет), г.Долгопрудный


ВВЕДЕНИЕ. Во все времена исследователи задавались вопросом: как человек думает, какие физико-химические процессы происходят при обработке, поступающей к нему со всех сторон разнородной информации? Со второй половины ХХ века, после значительного прогресса в понимании работы нейронов, ученые стали строить натурные и компьютерные модели нервной системы. С одной стороны, они хотели понять на более простых моделях закономерности работы мозга, как самой сложной и успешной естественной биологической информационной системы. С другой,  попробовать построить с помощью искусственных нейронов устройство, гибко решающее некоторые прикладные задачи, которые сегодня доступно только биологическому мозгу.

Естественно возникает вопрос о принципиальной корректности постановки такой задачи. Предполагая, что изначально проект человека-разумного представляется материальным текстом ДНК и потом, во взаимодействии с такой же материальной средой, он становиться полноценной интеллектуальной личностью. Мы сводим всю задачу к тому, чтобы правильно написать проект (программу) интеллектуальной системы, которая во взаимодействии с окружающей средой становилась полноценной интеллектуальной системой. Хотя среди ряда философов и представителей естественнонаучных дисциплин сегодня распространено мнение, что человеческий мозг принципиально непознаваем. При этом основания для этого утвержде­ния различны: от религиозно-мистических до системно-кибернетичес­ких.

На практики же, с самого начала существования вычислительной техники (с конца 40-х годов двадцатого столетия) идет планомерное моделирование различных информационных аспектов функционирования мозга. Этот широкий фронт моделирования – получил название "Искусственный интеллект". Термин «искусственный интеллект» (Artificial Intelligence), был введен в 1956 году американским ученым Дж. Маккарти. Сегодня термин «искусственный интел­лект» (ИИ) рассматривается как система, выполняющая имитацию интеллектуальной деятельности человека на основе программных и аппаратных средств, моделирующих процессы мышления. Однако в настоящее время не существует достаточно четкого понимания сущности естественного интеллекта. И определить, что к нему ближе, а что дальше, не представляется удовлетворительно возможным.

Аналогичная неудовлетворенность ощущается, если мы попытаемся пользоваться терминами: сигнал, информация, знания. Отсутствие четких конструктивных определений особенно затрудняет построение информационных систем в слабоструктурированнованных и динамично изменяющихся предметных областях, характеризующихся при этом, большими объемами информационных потоков и их неполнотой. Как правило, количественные характеристики подобных предметных областей значительно превосходят ресурсы современного про­граммно-аппаратного обеспечения. К этому классу можно отнести геофизические, биологические, социально-экономи­ческие и многие другие предметные области.

Неразработанность технологий автоматизированной обработки неструктурированной информации (систем ИИ), а также отсутствие четких определений основных понятий информатики, является сдерживающим фактором современного этапа развития цивилизации, характеризующегося необычайным динамизмом смены всех основных ее параметров, от целевых установок и до инструментария их достижения. В настоящее время (конец XX и начало XXI веков) к наиболее острой проблеме можно отнести проблему автоматизированного охвата и осознания всего накопленного и лавинообразно нарастающего знания (информации, информационного ресурса).

Сегодняшнее доминирование информационного ресурса во всех социально-экономических процессах открывает принципиально новые перспективы развития цивилизации [1,2]. Будущее человеческой цивилизации во многом будут определяться глубиной нашего понимания сущности информационного ресурса. Информационное общество, в которое стихийно входят экономически развитые страны целиком базируется на эксплуатации информационного ресурса. Если оперирование понятиями "вещество" и "энергия" без их конструктивного определения на предыдущих вещественно-энергетических этапах развития человечества не было столь катастрофически сдерживающим, то активное использование всепроникающего понятия "информация" без должной его формализации уже в течение более полувека, становится серьезным камнем преткновения на пути осознанного прогресса. Соответственно, фундаментальное исследование общенаучной категории - "информация", "информационный ресурс", "интеллект", "мышление" и др., сегодня стало чрезвычайно актуальным.

Одно из научных направлений, занимающееся разработкой вычислительных систем, соответствующих вышеизложенной постановке, это разработка вычислительных систем шестого поколения - нейрокомпьютинг. Нейрокомпьютер – это вычислительная среда, состоящая из большого числа параллельно работающих простых вычислительных элементов (нейронов). Элементы связаны между собой и образуют нейронную сеть, выполняя единообразные вычислительные действия. Большое число параллельно работающих вычислительных элементов обеспечивают высокое быстродействие.

Хотя нейросети работают параллельно; способны к обучению; способны обрабатывать образы; являются некоторой моделью мозга, надо признать, что пока все попытки понять и смоделировать обработку мозгом информации находятся в начальной стадии, несмотря на то, что обширные работы по нейронному моделированию ведутся уже более 50 лет.

Проведенный нашей группой анализ теоретических наработок в области нейрокомпьютинга и искусственного интеллекта показывает их сегодняшнюю достаточность для формирования технического задания на построение искусственного разума (ИP). Появившиеся за последние полувека новые данные нейрофизиологии, лингвистики, психологии, computer science и других смежных дисциплин позволяют концептуально увидеть проект ИP, который по функциональным и количественным характеристикам будет превосходить биологический прототип. Стало понятно, что в основе становления ИP должно быть положено ограниченное число простых принципов, которые были бы способны его саморазвивать эволюционным путем. Наша группа предлагает рассмотреть тезисы проекта построения ИP на основе нейросемантической парадигмы. Основная цель предварительных обсуждений представленных тезисов, выявление возможных их концептуальных несоответствий заявленной задаче (инженерное задание по проектированию ИР). Проект находится в стадии разработки и подробное и формальное ознакомление с ним и его разделами (механизм эволюции, природа информации, текстовая энтропия, информационная система и пр.) будет возможен в Институте проблем управления РАН в ближайшие месяцы. Цель данного обсуждения, это выявление возможных некорректностей предлагаемого проекта современной научной парадигме или неполноты его изложения в рамках поставленной задачи, как инженерного проекта построения ИР.


^ 1. Зарождение и механизмы направленности эволюции простейших информационных систем (ИС). В качестве модели среды зарождения ИС предположим, что первоначальный "Большой символьный взрыв" порождает множество символов "а" алфавита А {a,b,c,d,…,w,x,y - аналоги химических элементов и z - как аналог пространства). Далее, символы в соответствии со своим "полупериодом синтеза" начинают эволюционировать в тексты (abbz; bbbccz; bbccccz; ccbddcbz; …). В результате порождается "текстовой бульон". Известно, что простейшие компьютерные вирусы состоят из нескольких сотен байт. Следовательно, таким случайным образом могут сформироваться простейшие самодублирующиеся ИС, которые за счет дальнейших мутаций могут начать эволюционный процесс в "символьной среде" ("текстовая жизнь").



Рис. 1.


Для оценки скорости экспансии ИС предлагается структура простейшей обобщенной самодублирующейся ИС (см. рис. 2) и формальное описание окружающей её среды (предметной области – ПО). При этом тексты среды рассматриваются одновременно: как строительный материал, как носитель энергетического ресурса (a>b>c>d>…>w>x>y>z=0) и как источник упреждающей информации.




Рис. 2.


Первый эволюционный аттрактор ИС – "рецепторный". Он выражается в тенденции к расширению диапазона рецепторного окна ИС, т.к. при линейном увеличении размеров окна (L   длины воспринимаемых текстов через "Ввод", см. рис. 2) разнообразие и количество воспринимаемых текстов увеличивается в степенной функции, как AL,где А – алфавит текстов (см. рис. 3).








А

L



Рис. 3.


Если бы например, в ИС эволюционировал блок "Выводы – воздействие" (см. рис. 2), увеличившись в n-раз, то при неограниченности ресурсов ПО, количество воспринимаемых текстов через "Ввод" могло бы возрасти, но только не более чем в n-раз, т.е. не более чем линейно. Поэтому на первых эволюционных ступенях первоочередность развития в ИС "рецепторного" блока очевидна. Это наглядный пример безальтернативности эволюции ИС через этапы эволюционных аттракторов.

Первый эволюционный аттрактор ИС, это пример положительной обратной связи, приводящий к экспоненциальному взрыву численности ИС, с естественной вынужденной последующей длительной стабилизацией, при использовании всего энерго-вещественного ресурса ниши, это уже пример отрицательной обратной связи. Т.е. положительная обратная связь,  революционный скачок эволюционного развития и отрицательная обратная связь,  эволюционный консерватизм.

Чем больше у ИС возможностей прогнозируемо получать энерго-вещественного ресурса, тем больше её эволюционный потенциал [2]. Величина эволюционного потенциала ИС измеряется в единицах располагаемой ею энергии и времени прогнозирования развития процессов. Будем считать, что при конкуренции за ресурс нескольких видов ИС всегда побеждает тот из них, у которого больший эволюционный потенциал. Численность вида самокопирующихся ИС для данной ПО пропорциональна их эволюционному потенциалу.

На примере эволюции биологических ИС, рассматривая её текущего лидера (например, "венца творения"), можно проследить его эволюционную траекторию от самого "начала". При этом можно аналитически отследить решающие этапы (аттракторы) его конкурентной борьбы и причины сохранения эволюционного лидерства. Мы попытаемся провести эту работу, но уже в рамках нашей модели, выявив все эволюционно прогрессивные шесть аттракторов (как относительные нелинейности в характеристиках ПО).


^ Кратко резюмируя материал этого раздела [2] отметим, что в нем:

- показана возможность начального описания модели ПО ("текстовой бульон");

- показана практическая возможность самозарождения простейшей ИС;

- приведена структура простейшей ИС;

- показан первый аттрактор (как нелинейность ПО) и механизм направленности эволюции простейшей ИС (расширение рецепторного окна);

- введено понятие эволюционного потенциала.


^ 2. Комплекс: "Предметная область  Информационный канал  Информационная система". Любую физическую ПО можно рассматривать как некоторую дискретную пространственно-временную область с взаимодействующими объектами (ai, aj, см. рис.4). При попадании нескольких объектов, в область взаимодействия, происходит процесс их взаимодействия, выражающийся в некотором физическом процессе (см. рис. 5а).




Рис. 4.


^ Процесс взаимодействия объектов осуществляется в течение нескольких тактов времени t2 t1 (такт времени, – это минимальная измеряемая ИС физическая дискретность времени, ее квант). Результат взаимодействия объектов выражается в изменении величины вектора параметров (W) характеризующих этот процесс. Этот процесс изменения одной из компонент вектора (Wi) может быть преобразован в текстовую форму, см. рис. 5.



Рис. 5.


Амплитуда изменения параметров процесса отображается в некотором алфавите А={a, b, c, …, z} с первоначальной физически допускаемой дискретизацией W = W / |A|, а число символов отображаемого процесса определяется его длительностью t2 - t1и дискретизацией по времени t. Очевидно, что произвольный физический процесс любой мерности (графической, акустической, текстовой и т.д.), можно взаимнооднозначно отобразить в текстовую форму (ТФ) и обратно, с любой наперед заданной степенью точности соответствия [3]. ТФ – это "цифровая" форма представления аналогового сигнала, со всеми вытекающими отсюда последствиями [3].

Таким образом, при анализе и моделировании ИС происходящих в ПО процессов, достаточно использования только текстовой формы (см. рис. 5г.), т.е. мы остаемся в рамках модели "текстовой жизни" (см. рис. 1).

При взаимодействии объектов (например, {ai*aj}), в соответствии с F(ПО) (см. рис. 4), порождается ЭСЕ - элементарная семантическая единица (s{ai*aj} = ), которая однозначно отображает процесс взаимодействия этих объектов, как "скрытых параметров" ПО. Все множество процессов, как совокупность ЭСЕ в данной ПО, представляет собой семантическое пространство – S (см. рис. 6.).

В качестве разноуровневых примеров ЭСЕ различных ПО можно привести: а) взаимодействие элементарных частиц – ; б) <Привет Петров, как дела? Нормально!> – взаимодействие объектов макроуровневых ПО; в) образование двойной звезды из двух астрообъектов – (на гигауровне) [3]

При анализе одновременного взаимодействия не более чем d объектов ("пар", "троек", … , "d", см. рис. 6.), мы получаем d-мерный куб со стороной n (n равно числу типов объектов ПО). В d-мерном кубе всевозможные одномоментные взаимодействия объектов {a1, a2, …, an}, детерминировано отображаются множеством элементарных информационных единиц S ={s1, s2, …, su}, где u  nd.




Рис. 6.


Если же в реальной ПО одновременно взаимодействуют d+1 или более объектов, а возможности анализа ИС не превышают d объектов, то получаем статистическое распределение ЭСЕ, например, < … >.

Порождаемые в ПО ЭСЕ, суперпозиционно "сливаются" в непрерывный информационный поток (см. рис. 7,8 – информационный канал (ИК)). В ИК происходит процесс формирования информационного ресурса, как в передающей субстанции между ПО и ИС. В отличие от ПО, в ИК осуществляется только суперпозиция и интерференция информационных компонент процессов произошедших в ПО и их транспортировка к ИС.

Физическая плотность объектов и особенности законов F(ПО) определяют частоту происходящих в ПО процессов. Понятно, что при постепенном увеличении плотности объектов, сначала в среднем, будет формироваться изолированное во времени следование ЭСЕ (см. рис. 7а), далее - слитное (см. рис. 7б) и до перекрытия в различной степени (см. рис. 7 в).



Рис. 7.


Эксперименты на тестовых ПО показали, что во всех трех случаях (см. рис. 7 а,б,в) ИС успешно выделяла ЭСЕ. Но в будущем, при теоретическом рассмотрении функционирования ИС, мы будем опираться только на анализ результатов полностью слитного, априорно неопределенного текстового потока (см. рис. 7б).

В рамках рассматриваемого комплекса: ПО  ИК  ИС, задача ИС (см. рис. 2) заключается в: а) восприятии (отображении), б) хранении (память), в) преобразовании (логика ИС) и г) выдаче (эффекторы) информации в ПО. Но в отличие от определяемого ранее как приоритетного энерго-вещественного ресурса (самокопирование) (см. рис. 2 и сравните его с рис.8), теперь в ИС все осуществляется уже с приоритетом информационного ресурса (ИнфР).

При этом, в саморазвивающихся ИС появляется дополнительное свойство - д) субъектность, которое проявляется в выборе более полезных для ИС процессов ПО (градуированной оценкой между "+" и "-", см. рис. 8). Блок субъектность эволюционно формируется в генетическую программу, управляющую начальным поведением ИС. Субъектность служит основанием для формирования оценки желательности или нежелательности любой семантической единицы (возможно даже очень сложной) для ИС (см. рис. 8).




Рис. 8.

Будем предполагать, что про ПО известно, только то, что в любой из них выполняются:

- принцип причинности (детерминированности во времени и пространстве), si  sj, т.е. процесс si всегда вызывает sj;

- принцип глобальной дискретности – сведение континуума значений параметра (Wi) к ограниченному числу качественно различных образов, например, всю температурную шкалу можно разбить на четыре образа: si="твердое", sj="жидкое", sk="газ", sl="плазма".

- принцип субъектности, различность полезности каждого процесса ПО (si) для ИС.


^ Задача восприятия усложняется тем, что остальные характеристики ПО априорно не определены и, соответственно, в ИК даже не заданы какие-либо маркеры-подсказки разделяющие ЭСЕ. Если в процессе квантования информационного потока на информационные единицы (образы) в памяти ИС не будет кратного вложения в них ЭСЕ, то потребность в ресурсе памяти ИС будет выражаться комбинаторными зависимостями от числа различных ЭСЕ в ПО и, в результате, невозможно будет построить практически ни одной ИС. Не решив эту задачу, классическое направление ИИ свелось к "игрушечным примерам".

Таким образом, для эффективного решения задачи восприятия необходимо предварительно решить проблему автоструктуризации непрерывного информационного потока (ИК) на образы в ИС кратные ЭСЕ (элементарным семантическим единицам) в ПО.

Первым шагом по решению проблемы автоструктуризации стало расширение понятия формального нейрона МакКаллока-Питтса, вводом в него относительности времени активации входов, что позволило получить нейроподобный N-элемент (см. рис. 9), который работает в векторном пространстве образов и уже в единственном числе может отражать причинно-следственные процессы реальных физических ПО.




U(t)= Fi (U(X,t)), Fi (t) = FИС(U(t-1))


Рис. 9.


Схемами на базе из N-элементов можно моделировать любые логические схемы, включающие "и", "или", "не", но основное их предназначение, это структурированное хранение подпоследовательностей текстовых форм. Из N-элементов можно образовать послойные структуры (см. рис. 10), открывающие возможность иерархического построения памяти ИС.





Рис. 10.

Объединив N-элементы в многодольный иерархический граф, удалось получить структуру аналогичную естественно-языковым. Первый слой (доля графа) N-элементов – терминальный, фактически отображает алфавит А ЭСЕ, второй слой – "псевдослоги" и строится на пространственно-временных ссылках на предыдущий (терминальный) слой - информационное содержание N элемента (см. рис. 9), слой "псевдослов" – ссылается на "псевдослоги" и т.д., до самого верхнего N элемента, отображающего в себе через связи всю ПО (см. рис. 11).



Рис. 11.


В зависимости от качества кратности вхождения ЭСЕ в образы, для памяти ИС требуются существенно различное число (М) N элементов. Для лучшего и худшего случаев это соотношение характеризуется как: М и М3-:-5 [6]. Анализ информационного содержимого N элементов в иерархической структуре НСС, в том числе и на тестовых ПО, показал, что при формировании ее алгоритмами минимизирующими ее физический ресурс (RИС в битах), одновременно достигается свойство кратности (тождественности) образов и ЭСЕ.


RИС = f(число N-элементов, число связей слоев)

1 / P(компрессия) = ---------------------------------------------------------  0, (1а)

при t   TИС = объем текстовой информации в ИС


или RИС / TИС  0 (1б)

при t  


RИС const ≤ м, при t  M (1в)


В работах [3,4,5] описаны алгоритмы автоструктуризации, которые из непрерывного, априорно неизвестного информационного потока, эффективно выделяют отрезки текста, соответствующие семантическим единицам (ЭСЕ) исследуемой ПО.

Например, уже начиная с 50 символьного отрезка - <ДОМЗЕБРЫСКИТНАДОМДОМВ НАДОМВСКИТВНАСКИТВВЗЕБРЫНАВНА>, на втором слое ИС правильно выделяются все ЭСЕ данной ПО в образы ИС: <ЗЕБРЫ> <СКИТ> <ДОМ> <НА> <В>. Все тестовые примеры при выполнении условий (1а и 1б) показывают 100% реализацию свойства автоструктуризации в рассмотренной ИС (см. рис. 11 и рис. 12).

Для желающих почувствовать себя в роли ИС, можно попытаться выделить ЭСЕ из двух текстов, семантически тождественных ваышеприведенному: <ЕПНИЖВСЬТЛЙУОБЕП НЕПНГОЕПНГТЛЙУГОБТЛЙУГГИЖВСЬОБГОБ>, или <?IGB@. Только первый получается сдвигом номера символа в алфавите А на +1 в ASCII кодах, относительно исходного текста, а второй на -133.

Структуру памяти ИС, в которой выполняется свойство изоморфного отображения ЭСЕ ПО и их структуры в образы ИС и обратно, будем называть нейросемантической структурой (НСС). Т.е. если информационные содержания N элементов ИС тождественны последовательной группе ЭСЕ, подчиняющимся принципу причинности и принципу подобия ПО (см. выше), то минимальную структуру (в битах) такой памяти ИС будем называть НСС (N элемент  ЭСЕ+ЭСЕ+…+ЭСЕ).

Минимизируя физическую ресурсоемкость памяти (RИС), мы автоматически получаем в ИС причинно-следственную структуру процессов ПО. НСС – это фактически готовая структура данных (процессов и объектов) произвольной ПО для любой ИС. Понятно, что автоматическое формирование НСС открывает широкие горизонты для инженерной практики при разработке различных АСУ. Назовем процесс формирования НСС – автоструктуризацией.

НСС – это пример 1-го формального преобразования количественной (естественной) текстовой формы представления информации в качественную форму, в которой из континуальной (практически непрерывной, неструктурированной) текстовой формы, образуется иерархическое множество образов данной ПО в виде многодольного графа, отображающего причинно-следственные связи образов (объектов-процессов) ПО.

Качество самой НСС отображается отношением числа корректных пар (N элемент  ЭСЕ) на общее число N элементов ИС(НСС). Естественно, что в процессе автоматической подстройки ИС под конкретную, априорно неизвестную ПО, на начальном этапе ввода текстового потока, "НСС-качество" невелико (<< 1), а далее, "НСС-качество" полностью зависит от алгоритмов ИС. На рис. 12, приведен характерный вид графика: "НСС-качество" – log (tn).




Рис. 12.


При достаточности текстового материала всегда достигаются величины "НСС-качество" близкие к 1. (Критерии достаточности: а) все возможное пространство состояний; б) если человек может правильно структурировать данный текстовой материал в непривычной форме записи; в) наличие характерных особенностей динамического процесса при минимизации ресурса RИС).

Скорость автоструктуризации можно существенно улуч­шить, выделив и введя уже известные экспертам ЭСЕ – "семантические затравки". Такой процесс автоструктуризации принято на­зывать обучением "с учителем" (см. рис. 12). Полезность обучения "с учителем" хорошо известна для биологических ИС. В работе [2] исследовано и показано, что высокое качество автоструктуризации (N-элемент  ЭСЕ) является необходимым условием для запуска возможных самоорганизующихся процессов в ИС.

Следует также отметить, что все технические характеристики памяти на базе НСС (время доступа, коэффициент компрессии-сжатия, надежность-пла­стичность хранения информации и др.) имеют тенденцию к улучшению, как в среднем, так и в абсолютных значениях по мере роста объема вводимой информации из ПО (см. рис. 13). Это пример второго эволюционного аттрактора самоорганизующихся ИС.




Рис. 13.


Предлагаемая модель нейроподобной структуры (см. рис. 11) функцио­нально является более близкой к естественному прототипу - централь­ной нервной системе, чем современные модели нейронных се­тей [1], за которыми исторически закрепилось направление нейрокомпьютинга. Особенности вышеперечисленных характеристик НСС являются основанием для построения на её базе крупномасштабной ассоциативной па­мяти (ИС), работающей со слабоструктурированными текстовыми пото­ками.

В завершении раздела, отметим, что к теоретическим результатам НСС-технологии можно отнести и формальную структуризацию информационного ресурса (ИнфР), как совокупности сигнала, информации и знания: "сигнал"  неструктурированная последовательная суперпозиция ЭСЕ; "информация"  сигнал, структурированный на иерархию последовательных ЭСЕ; "знание" – структурная иерархия НСС в ИС (см. рис. 15). Следует отметить, что функциональный характер компрессии ИнфР в структуре образов НСС (при постоянном потоке ИнфР и t) объективно подтверждает данную классификацию: "линейный – сигнал" (RИС= a*t +b1, где: RИС – объем памяти ИС; t – объем потока ТФ; a и b – константы), "логарифмический - информация" (RИС= logk(t) +b2) и "const - знание" (RИС= b3). При этом подчеркнем, что величина компрессии (P = t / RИС) отражает потенциальную интеллектуальность ИС (см. соотношения 1а и 1б), что в свою очередь, является аккумуляцией ее возможностей для управления по целенаправленному выбору физических параметров ПО: энергии и времени.


Резюмируя материал второго раздела отметим, что в нем:

- формализовано понятие ПО и ИК;

- расширено формальное описание ИС;

- расширено понятие элементарной функциональной единицы ИС – N-элемента;

- введена в рассмотрение иерархическая архитектура ИС, как многодольного графа;

- дано определение автоструктуризации и НСС;

- показано, что НСС открывают возможность построения памяти ИС практические неограниченной емкости и, соответственно, на базе НСС можно строить практические приложения: крупномасштабную ассоциативную память и высокоэффективный канал передачи данных ("Земля - Космос – Земля"), работающих в слабоструктурируемых информационных потоках.


^ 3. Интеллектуальное преобразование информационного ресурса (ИнфР) в ИС. Основной параметр задачи преобразования заключается в повышении компактности (компрессии) преобразуемого ИнфР в ИС, естественно, что без потерь.

На первом этапе эволюции ИС, ИнфР отображается только в фактографическую память ИС (см. рис. 11 и рис. 14). Имея генетически или конструктивно заложенное прагматическое отношение к конкретным ЭСЕ (<ожог-Х> – <боль-Ш>, <пища-С> – <ресурс-Е> и т.д.), ИС инстинктивно реагирует (<ожог-Х> – <движение-К> и т.д.) т.е., на каждое конкретное раздражение (Хi) – конкретная реакция (Уj).



Рис. 14.


Иерархическая НСС интегрирует конкретные ЭСЕ в более крупные (по длине текстовой формы) или декомпозирует в более мелкие образы (см. рис. 11). При этом в НСС формируется как контекстные образы (иерархически более высокие причинно-следственные связи), так и ассоциативные образы (многократно входящие в вышележащие образы (так, например, слог-суффикс "КИЙ" – характеризует в русскоязычных текстах наличие определенного качества у ЭСЕ). Так ассоциативность, позволяет ИС выдвигать гипотезы о семантической связанности ЭСЕ, исходя из принципа структурного подобия. Таким образом, перемещаясь по НСС можно виртуально ("мысленно") путешествовать по всей ПО, причем, за счет ассоциативности и контекстности можно существенно расширить изначально заданные генетически программы "стимул-реакция" (см. рис. 14).

На следующем этапе эволюции памяти ИС она строится уже как иерархическая структура из НСС. На фактографическую НСС, настраивается НСС2 ("логическая"), которая функционально воспринимает НСС, также как НСС воспринимает ПО. При этом у ИС появляется возможность реагировать не на конкретные образы (ЭСЕ) ПО, а на определенные состояния N элементов в НСС, вызываемые этими образами (ЭСЕ2) (см. рис. 15).



Рис. 15


Отметим, что механизмы иерархической организации НССi и НССi+1 регулярно однотипны и это снимает возможные проблемы при организации полного цикла обработки информации. При этом, с ростом иерархии НСС, уменьшается порог активации их N элементов, что дает соответствующий приоритет этим вышестоящим структурам. Это конструктивное свойство нейросемантической ИС можно назвать - "приоритетом контекста". Его особенность заключается в дополнительной добавочной величине Uk(t) от выше расположенного "полуактивированного" (U(t)>0, т.е. распознающего) N элемента, к U(t) N элемента рассматриваемого слоя НСС (см. рис.9,10,11).

Поясним примером. Допустим, что на вход ИС поступил образ "". Это может быть и "буква – О", может быть "цифра – 0", а может быть и "геометрическая фигура". Типичный пример омонимии и полисемии (многозначности слов естественного языка). Если перед этим шли цифры, или "шел разговор" о математических дисциплинах, то распознаваемый образ в НСС будет воспринят как цифра – "0". Соответственно, если шел буквенный поток, то как буква – "О", если же "шел разговор" о геометрии или картографии, то как – "геометрическая фигура", и т.д. В случае же, если образ "" идет первым в начале задачи, то его идентификация временно откладывается и уже последующие образы позволят извлечь его из оперативной памяти и "угадать" его.

В НСС все "полуактивированные" N элементы посылают по своим еще не активировавшимся связям "сигнал предвосхищения" – Uk(t), как бы "подсвечивая", всю контекстно ожидаемую область. Таким образом, "сигнал предвосхищения" становится решающим при многовариантном распознавании, решая практически снимая проблему полисемии (омонимии). Аналогичный механизм приоритета и при взаимодействии иерархии НСС. Реализация механизма контекста в нейросемантической ИС позволяет ей также удерживать "внимание" на решении одной задачи в сложных ПО.

Конструктивно иерархия НСС устроена так, что у самой верхней НССС порог возбуждения ее N элементов чуть более нуля и они случайным образом (спорадически) самовозбуждаются. (По нашим оценкам, 4-5-ти иерархических НСС вполне достаточно, чтобы моделировать основные психические функции человека). Информация в иерархию НСС поступает через НСС1. В НСС2 формируются "правила", в НСС3 – " правила правил". Чтобы между НССС иостальными НСС установилось функциональное взаимодействие, необходимы определенные требования к информационному потоку из ПО, а именно, в этом текстовом потоке должны отображаться "правила" и "правила правил" взаимодействия объектов и процессов ПО. Только в этом случае возможно существенное сжатие (компрессия) входных данных и контекстное (устойчивое) поведение ИС. Эмпирически дойдя до понимания этого, люди (социум ИС) в игровой форме стараются как можно быстрее обучением "прописать" связи в НСС2 и в НСС3 ("педагогика"). В процессе функционального соединения всех НСС, в верхних НСС формируются особые осциляторные структуры, контекстное управление которых начинает доминировать во всех информационных процессах ИС. Если ранее, все процессы в НСС1 были детерминированы информационным потоком из ПО, то теперь ИС может что-то "не замечать" в ПО, или к чему-то "стремиться", не ухудшая при этом своих интегральных характеристик по E+. Свойство доминирования "внутренних (встречных)" информационных процессов (от НССС  НСС1, см. рис. 14 и 15) над "внешними" информационными процессами идущими от НСС1, назовем сознанием ИС [5].

Рассматривая шкалу структур: НСС1 , НСС2, НСС3 , … , НССС, по функциональности обработки информации, мы видим (непрерывный) переход от "правополушарной" обработки информации к "левополушарной" в классификации психологов.

Особенностью нейросемантической ИС является то, что обрабатываемые тексты ("задачи") и обрабатывающие тексты ("правила") представляются в ней в виде подструктур из N элементов. В этих подструктурах, в рамках некоторого текущего контекста (N элемента), и происходит слияние общепринятых понятий данные и алгоритм, как неделимого пространственно-функционального элемента – образа.

С одной стороны, реакции двух ИС в условиях тождества ПО(t, t-1, t-2, …, 0) также будут алгоритмически тождественны, исходя из принципа причинности. Но, тождественных ПО в реальности не существует. Следовательно, практически мы не встретим двух тождественных реакций ИС (индивидуальность). С другой стороны, мы увидим целевую "разумность поведения" (реакций) всех ИС по параметру Е+. "Метаалгоритмом" этой общей целенаправленности поведения всех ИС будет асимптотическая (при t) минимизация отображения, всех значимых для ИС текстовых потоков. "В природе все устроено так, что все нужное в ней компактно и красиво, а все ненужное – громоздко и безобразно".

Во взаимопереводимости текстов "задач" и "правил" нейросемантической ИС прослеживается генетически связующая основа искусственного разума (ИP) и естественных языков (ЕЯ). Как в биологии: … организм  ДНК (текст) + ПО  организм  …, так и в языке: … ЕЯ  текст + ИС  ЕЯ  …, и скорее всего, эта дуальность характерна для всех самоорганизующихся систем.

Формальная схема иерархического построения памяти ИС (см. рис. 15), уже не подпадает под запрет теоремы Гёделя о неполноте формальных систем на неограниченное познание открытых ПО. Так, если язык фактографической ИС (см. рис. 14) представляет только +> (<стимул><реакция><оценка>), и соответственно, имеет возможность описывать только конкретные пары с оценкой +>, то иерархическая схема в НСС2 (см. рис. 15) позволяет дополнительно (к +>) описывать различные отношения R() физических характеристик активируемых N-элементов (образов) с объединением всего этого оценкой +>.


+>  < () >< R() >< E+>  < … (2)


Отметим, что максимальное число образов-траекторий выявляемых в такой ИС равно 1/6(5R+R3) от числа отношений R (см. приложение 1). Такой рекурсивный подход существенно расширяет первоначальный фактографический язык (НСС1), открывая неограниченную возможность ИС познания ПО. Этот пример третьего эволюционного аттрактора самоорганизующихся ИС демонстрирует кубическую нелинейность прироста возможности отображения ПО, при линейных затратах ресурса ИС на R-отношения (Y=R(X), X=R-1(Y)).

Интересно, что если взять всевозможные R-отношения реального физического мира во всем его многообразии, то мы получим структуру R-отношений, близкую к грамматикам естественных языков. Это свойство R-отношений, а также анализ корреляции смысловой близости слов с их относительными расстояниями в текстовом потоке, могут быть положены в основу методики автоматической нормализации естественного языка, что может иметь большое значение для практики языкознания.

В качестве примера использования R-отношений можно рассмотреть задачу - "формирование понятия 'абстрактного числа' в ИС" (неразрешимую для классического ИИ, и легко решаемую биологическими ИС, как высшими животными, так и человеком). Одно из физических свойств N элемента состоит в экспоненциальном падении величины возбуждения (U(t+1) = U(t) / , например, при =2) после его активации (U(t+1) = U(t) + 1*). На этом свойстве НСС построено функционирование ее в качестве кратковременной памяти (долговременная память НСС, – это связи между N-элементами).

Таким образом, если например, в слое "псевдослов" некоторый N-элемент неоднократно активируется, то уровень активации (*) на нем будет в диапазоне 1*< U(t+1) < 2*. Если по другому информационному каналу (например, акустическому) будет активация N-элемента с информационным содержанием <два>, <три> или <семь>, то <два>, <три> или <семь> в НСС2 будут связаны с данной величиной U(t+1). И следующий раз, когда будет такое же число распознаваемых объектов (совершенно новых, например, "марсиан-гостей") – ИС выдаст реакцию, что их <два>, <три> или <семь>.

Данным примером мы продемонстрировали один из основных принципов эволюции ИС от простейших форм до ИР – сведение информационных (семантических) характеристик ПО к физическим параметрам ИС, измеряемым в сантиметрах, битах, секундах (система СБС).


^ 4. Дальнейшая интеллектуализация (как целенаправленное ограничение перебора) ИС на базе НСС. Научный аспект нейросемантического подхода также базируется на следующих основных принципах:

- ограниченный перебор (максимальное число возможных вариантов определяется k числом входов N элемента);

- фрактальность образов (образ состоит из образов);

- иерархическая
еще рефераты
Еще работы по разное