Лекция: Практическое применение нейросетевых технологий.

В России сформировались три крупные научные школы в области нейротехнологий.

1. Центр нейрокомпьютеров РАН (А.И. Галушкин). Широкую извест­ность он получил благодаря изданию 28-томной серии книг «Нейрокомпью­теры и их применение», а также регулярно проводимым Всероссийским конференциям с одноименным названием.

2. Научная школа нейротехнологий МГУ (А.В. Чечкин). Известность получили разработанные в ее рамках нейромодели сенсорных и языковых систем человека, относящиеся к бионическому направлению в нейрокомпь­ютинге.

3. Научная школа нейротехнологий в Красноярском государственном университете (А.Н. Горбань). Ученые этой школы развивают оригинальные алгоритмы обучения нейросетей и проводят международные конференции по нейрокомпьютингу.

Потенциальными сферами применения нейротехнологий являются все плохо формализуемые предметные области, в которых классические математические моде­ли и алгоритмы оказываются мало эффективными по сравнению с челове­ком, демонстрирующим успешное решение задач. К областям использова­ния нейротехнологий, в которых уже получены значимые практические ре­зультаты, относятся: обработка изображений, реализация ассоциативной памяти, системы управления реального времени, распознавание образов и речи, системы безопасности, выявление профилей интересов пользователей Internet, системы анализа финансового рынка и др. Сегодня можно уверенно говорить о том, что нейротехнологии становятся неотъемлемым компонен­том нвых информационных технологий (НИТ).

Одной из характерных черт нейротехнологий является обучение ней­росеmи на пpuмepax. Эта же «технология» служит основой развития ребен­ка, который в первые годы жизни проходит гигантский путь формирования интеллекта и языковой системы, обучаясь на примерах. Мозг состоит из различных типов клеток. Большинство нейрофизио­логов считает, что объяснить феномены работы мозга можно, изучая функ­ционирование объединенных в единую сеть клеток, называемых нейронами.

Мозг включает 1010-1011 нейронов. Количество связей между ними может достигать 1021. Поэтому отображающие и моделирующие возможности ней­росети огромны.

Объем информации, хранящейся в мозге человека и других млекопи­таюшихся, превышает объем генетической информации, закодированной в ДНК. Строение мозга отражает его эволюцию. Наиболее древние участки мозга, доставшиеся человеку от рыб и амфибий, ответственны за поддержа­ние жизнедеятельности (гомеостазис) и размножение. Другие отделы мозга (рептильный комплекс) возникли несколько сот миллионов лет назад и обеспечивают ориентацию в пространстве. Третий слой – лимбическая система — сформировался около 150 млн. лет назад и отвечает за эмоцио­нальную сферу. Наконец, кора больших полушарий, возникшая несколько миллионов лет назад, обеспечивает функции речи и логического мышления.

Обычно лишь 2...3 % нейронов мозга активны. Поэтому мозг облада­ет огромным запасом «прочности» и «пластичности», позволяющих ему ра­ботать даже при серьезных повреждениях и приспосабливаться к значитель­но меняющимся внешним условиям.

Нейрофизиологи в высшей нервной системе (ВНС) человека явно различают три типа нейронных структур: сенсорные, внутренние и эффекторные. Первые обеспечивают по­ступление в мозг информации из внешнего мира, поддерживая шесть чувств: зрение, слух, вкус, обоняние, осязание и чувство равновесия. Но ес­ли первые пять сенсорных систем «вынесены наружу», то вестибулярный аппарат изолирован и скрыт от непосредственного наблюдения. Внутренние нейроны воспринимают информацию от сенсорных систем, перерабатывают ее и передают на эффекторные нейроны. Последние управляют мышцами, внутренними органами, сосудами и пр.

Качественное различие компьютерной обработки символьной и об­разной информации заключается в малом числе разрядов цифрового пред­ставления символа. Поэтому для символов в принципе можно комбинаторно описать любой способ их обработки. Для образов (из-за комбинаторного взрыва) это в принципе невозможно за исключением ряда типовых преобра­зований, поддающихся формализации и реализуемых в графических уско­рителях, пакетах обработки изображений и т. д. В общем случае операции с образами формализуемы не полностью, для их обработки применяются эв­ристические алгоритмы. Главный механизм обработки образов – обучение на множестве примеров (обучающем множестве).

С учетом сказанного парадигма нейрокомпьютингаформулируется следующим образом: алгоритмы, порождаемые данными в универсальном процессе обучения, специализированные для данного класса операций с об­разами, адаптированные под конкретные информационные задачи.

В отличие от памяти ЭВМ память человека адресуется по содержа­нию, является ассоциативной, распределенной, робастной (способность системы восстанавливаться при возникновении ошибок и сбоев) и активной. Полушария мозга человека имеют разное назначение. Левое полуша­рие отвечает за работу с абстрактными представлениями, математические вычисления и логический вывод, речь, письмо, восприятие времени. Эти процессы связаны с пошаговой обработкой информации. Правое полушарие оперирует с образами конкретных объектов. Все виденное нами в жизни хранится в правом полушарии, а все имена — в левом. Правое полушарие способно учиться узнавать предметы при их предъявлении, а не по описани­ям, как левое. У правого полушария данные и метод составляют единое це­лое. Оно также отвечает за воображение и интуицию. Это более древние механизмы мозга по сравнению с логическим мышлением. Правое полуша­рие поддерживает параллельную обработку информации, оно же отвечает за творчество.

К феноменам мозга относят:

. кодирование (представление) информации о внешнем мире;

. кратковременное и долговременное запоминание, хранение и из­влечение информации;

. ассоциативный поиск и самоорганизацию памяти;

. оперирование информацией в процессе решения мыслительных задач;

. симультанное (мгновенное) распознавание (например, узнавание человека, с которым не было встреч много лет);

. неожиданное творческое озарение (инсайт) и др.

Конструктивного научного объяснения этим феноменам до сих пор не найдено.

Структура работ в области нейрокибернетики приведена на рис. 8.

 

      Рис. 8. Структура работ в области нейрокибернетики  
   
Первое из выделенных направлений связано с построением и приме­нением нейросетей из искусственных нейронов. Для их программной реали­зации создаются Нейропакеты, а для их физической реализации Нейрокомпьютеры. Исследования в области нейрофизиологии показы­вают, что в мозге имеются разные типы нейронов, выполняющих весьма сложные функции. В качестве примера назовем нейроны, ответственные за определение скорости и ускорения движущегося тела, выделение признаков замкнутости и разомкнутости кривой и др. Однако в ИНС, как правило, ис­пользуются модели простых нейронов, реализующих элементарные нели­нейные функции (функцию знака, сигмоидальные функции и т. д.). Горбань А.Н. сформулировал вывод, согласно которому, если для какого-то класса задач требуются сложные специализированные нейроны, их проще ввести в модель сразу, нежели строить из простых. Если же такая необхо­димость не очевидна, то целесообразно использовать универсальную сеть из простых нейронов. Она сама «вырастит» нужные структуры в ходе обуче­ния. Заметим, что эти соображения лежат в основе декомпозиции НП на универсальные и специализированные. Сравнение основных характеристик традиционных компьютеров и нейрокомпьютеров приведено в табл. 8.1.    
Таблица 8.1
Основные характеристики Традиционные компьютеры Нейрокомпьютеры
Режим Функционирования В основном последовательный. Параллельный
Описание Функционирования Заданные алгоритмы Алгоритмы формируются на основе обучения ИНС на примерах.
Характер операций Иерархическая структура алгоритмов. Разбиение сложных задач на простые составляющие. «Жесткие» математиче- ские модели Непосредственное мани пулирование образами. «Мягкие» математиче- ские модели.
Аналог Левое полушарие Правое полушарие

 

 
   
   
Отметим следующие важные особенности ИНС. 1. ИНС содержит большое число (миллионы и миллиарды) параллельно работающих простых элементов — нейронов. Благодаря такой структуре обеспечивается высокое быстродействие при решении задач, традиционно требующих значительных вычислительных ресурсов. 2. Место программирования в ИНС занимает обучение. В связи с этим ожидается появление новых специальностей:. нейроконструктора, в задачи которого входят формирование уни­версальных компонентов — нейронных блоков — и конструирование из них НК (универсальных и специализированных);. учителя ИНС. 3. Выделяют два подхода к организации обучения ИНС:. обучение и самообучение на примерах;. обучение в процессе игры. Достижениями в области обучения ИНС считаются:. возможность управления процессом обучения в режиме двойственного функционирования ИНС, при котором НП (НК) самостоятельно оцени­вает ошибки и сообщает об этом учителю;. возможность восприятия и отражения на ИНС информации из внешней среды. Под обучением ИНС понимается процесс нахождения экстремума не­которой функции, отображающей взаимодействие типа вход-выход. Специ­фикой оптимизационных задач на ине является большая размерность, что обусловливает целесообразность применения алгоритмов оптимизации, ко­торые допускают параллельное выполнение аналогично естественным ней­росетям. Кроме методов оптимизации при обучении ИНС используют гене­тические алгоритмы. Базовыми поняmuями нейроmехнологий являются:. нейрон — базовый элемент сети, единственный ее нелинейный элемент;. синапс — элемент, обеспечивающий связь между нейронами; может обладать весом и «задержкой»;. сумматор, рассматриваемый как компонент нейрона или как спе­циализированный нейрон;. обучающие примеры, представляющие наборы значений вход- ­предписанный выход и целевую функцию, определяющую штраф за откло­нение реального выхода от предписанных значений при данных входах;. цвета и цветовые группы, ассоциируемые с нейронами (окрашен­ ные нейроны по разному участвуют в обучении);. алгоритмы обучения. В нейротехнологиях обучается не отдельный нейрон, а вся сеть в целом. В ходе ее обучения предъявляются примеры и их оценки. Для быстрого параллельного обучения в сеть вводятся элементы, оценивающие частные производные. В естественных нейросетях такие элементы также существуют. Выделяют три базовые подхода к представлению результатов обуче­ния нейросетью:. коннекционизм — модифицируются веса синаптических связей, параметры нейронов не меняются;. гетерогенные ИНС — модифицируются параметры нейронов, связи не меняются;. комплексный подход, объединяющий первые два подхода.  
Применение нейросетевых технологий целесообразно при решении задач, имеющих следующие признаки: отсутствие алгоритмов решения задач при наличии доста­точно большого числа примеров;. наличие большого объема входной информации, характери­зующей исследуемую проблему;. зашумленность, частичная противоречивость, неполнота или избыточность исходных данных. Нейросетевые технологии нашли широкое применение в та­ких направлениях, как распознавание печатного текста, кон­троль качества продукции на производстве, идентификация со­бытий в ускорителях частиц, разведка нефти, борьба с наркоти­ками, медицинские и военные приложения, управление и опти­мизация, финансовый анализ, прогнозирование и др. В сфере экономики нейросетевые технологии могут исполь­зоваться для классификации и анализа временных рядов пу­тем аппроксимации сложных нелинейных функций. Экспери­ментально установлено, что модели нейронных сетей обеспечивают большую точность при выявлении нелинейных закономерностей на фондовом рынке по сравнению с регрессионными мо­делями. Нейросетевые технологии активно используются в марке­тинге для моделирования поведения клиентов и распределения долей рынка. Нейросетевые технологии позволяют отыскивать в маркетинговых базах данных скрытые закономерности. Моделирование поведения клиентов позволяет определить характеристики людей, которые будут нужным образом реагиро­ вать на рекламу и совершать покупки определенного товара или услуги. Сегментирование и моделирование рынков на основе нейро­сетевых технологий дает возможность построения гибких классификационных систем, способных осуществлять сегментирование рынков с учетом многообразия факторов и особенностей каждо­го клиента. Технологии ИНС имеют хорошие перспективы при решении задач имитации и предсказания поведенческих характеристик менеджеров и задач прогнозирования рисков при выдаче креди­тов. Не менее актуально применение ИНС при выборе клиентов для ипотечного кредитования, предсказания банкротства клиентов банка, определения мошеннических сделок при использова­нии кредитных карточек, составления рейтингов клиентов при займах с фиксированными платежами и т.п. Следует помнить о том, что применение нейросетевых техно­логий не всегда возможно и сопряжено с определенными пробле­мами и недостатками. 1. Необходимо как минимум 50, а лучше 100 наблюдений для создания приемлемой модели. Это достаточно большое число данных, и они далеко не всегда доступны. Например, при произ­водстве сезонного товара истории предыдущих сезонов недоста­точно для прогноза на текущий сезон из-за изменения стиля про­дукта, политики продаж и т.д. Даже при прогнозировании спроса на достаточно стабильный продукт на основе информации о еже­месячных продажах трудно накопить исторические данные за период от 50 до 100 месяцев. Для сезонных товаров проблема еще более сложна, так как каждый сезон фактически представляет со­бой одно наблюдение. При дефиците информации модели ИНС строят в условиях неполных данных, а затем про водят их после­довательное уточнение. 2. Построение нейронных сетей требует значительных затрат труда и времени для получения удовлетворительной модели. Необ­ходимо учитывать, что излишне высокая точность, полученная на обучающей выборке, может обернуться неустойчивостью результа­тов на тестовой выборке — в этом случае происходит «переобуче­ние» сети. Чем лучше система адаптирована к конкретным условиям, тем меньше она способна к обобщению и экстраполяции и тем скорее может оказаться неработоспособной при изменении этих условий. Расширение объема обучающей выборки позволяет до­биться большей устойчивости, но за счет увеличения времени обу­чения. 3. При обучении нейронных сетей могут возникать «ловуш­ки», связанные с попаданием в локальные минимумы. Детерми­нированный алгоритм обучения не в силах обнаружить глобаль­ный экстремум или покинуть локальный минимум. Одним из приемов, который позволяет обходить ловушки, является рас­ширение размерности пространства весов за счет увеличения числа нейронов скрытых слоёв. Некоторые возможности для решения этой проблемы открывают стохастические методы обучения. При модификации весов сети только на основе ин­формации о направлении вектора градиента целевой функции в пространстве весов можно достичь локального минимума, но невозможно выйти из него, поскольку в точке экстремума«движущая сила> (градиент) обращается в нуль и причина дви­жения исчезает. Чтобы покинуть локальный экстремум и перейти к поиску глобального, нужно создать дополнительную силу, которая будет зависеть не от градиента целевой функции, а от каких-то других факторов. Один из простейших методов со­стоит в том, чтобы просто создать случайную силу и добавить ее к детерминистической. 4. Сигмоидальный характер передаточной функции нейрона является причиной того, что если в процессе обучения несколь­ко весовых коэффициентов стали слишком большими, то нейрон попадает на горизонтальный участок функции в область насыщения. При этом изменения других весов, даже достаточ­но большие, практически не сказываются на величине выход­ного сигнала такого нейрона, а значит, и на величине целевой функции. 5. Неудачный выбор диапазона входных переменных — доста­точно элементарная, но часто совершаемая ошибка. Если Хi­двоичная переменная со значениями О и 1, то примерно в поло­вине случаев она будет иметь нулевое значение: Хi­= О. Поскольку Хiвходит в выражение для модификации веса в виде сомножите­ля, то эффект будет тот же, что и при насыщении: модификация соответствующих весов будет блокирована. Правильный диапа­зон для входных переменных должен быть симметричным, на­пример от +l до -l. 6. Процесс решения задач нейронной сетью является «непро­зрачным» для пользователя, что может вызывать с его стороны недоверие к прогнозирующим способностям сети. 7. Предсказывающая способность сети существенно снижает­ся, если поступающие на вход факты (данные) имеют значитель­ные отличия от примеров, на которых обучалась сеть. Этот недо­статок ярко проявляется при решении задач экономического прогнозирования, в частности при определении тенденций коти­poвок ценных бумаг и стоимости валют на фондовых и финансо­вых рынках. 8. Отсутствуют теоретически обоснованные правила констру­ирования и эффективного обучения нейронных сетей. Этот не­достаток приводит, в частности, к потере нейронными сетями способности обобщать данные предметной области в состояниях переобучения (перетренировки).      
еще рефераты
Еще работы по информатике