Лекция: Простые рефлексные агенты.

Простейшим видом агента является простой рефлексный агент. Подобные агенты выбирают действия на основе текущего акта восприятия, игнорируя всю ос­тальную историю актов восприятия. Например, агент-студент, для которого резуль­таты табуляции функции агента приведены в табл. 9.1, представляет собой простой рефлексный агент, поскольку его решения основаны только на информации о теку­щем местонахождении преподавателя и о наличии допуска на экзамен. Программа для данного агента достаточно проста и может быть составлена самостоятельно.

Представьте себя на месте водителя автоматизированного такси. Если движу­щийся впереди автомобиль тормозит и загораются его тормозные огни, то вы долж­ны заметить это и тоже начать торможение. Иными словами, над визуальными входными данными выполняется определенная обработка для выявления условия, которое обозначается как «car-in-front-is-braking» (движущийся впереди автомобиль тормозит). Затем это условие активизирует некоторую связь с действием «ini tiate-braking» (начать торможение), установленную в программе агента. Такая связь называется правилом условие-действие и записывается следующим образом:

if car-iп-froпt-is-brakiпg then iпitiate-brakiпg

Люди также используют большое количество таких связей, причем некоторые из них представляют собой сложные отклики, освоенные в результате обучения (как при вождении автомобиля), а другие являются врожденными рефлексами (такими как моргание, которое происходит при приближении к глазу постороннего предме­та). Можно предложить несколько различных способов, с помощью которых можно организовать обучение агента и реализацию таких связей. Простые рефлексные агенты характеризуются той замечательной особенностью, что они чрезвычайно просты, но зато обладают весьма ограниченным интеллектом. Такой агент, работает, только если nра­вuльное решение может быть nринято на основе исключительно текущего восприятия, иначе говоря, только если среда является полностью наблюдаемой. Внесение даже не­большой доли не наблюдаемости может вызвать серьезное нарушение его работы. Например, в приведенном выше правиле торможения принято предположение, что условие car-in-front-is-braking может быть определено из текущего воспри­ятия (текущего видеоизображения), если движущийся автомобиль имеет тормозной сигнал, расположенный на центральном месте среди других сигналов. К сожалению, некоторые более старые модели имеют другие конфигурации задних фар, тормозных сигналов, габаритных огней, сигналов торможения и сигналов поворота, поэтому не всегда возможно определить из единственного изображения, тормозит ли этот авто­мобиль или нет. Простой рефлексный агент, ведущий свой автомобиль вслед за та­ким автомобилем, либо будет постоянно тормозить без всякой необходимости, либо, что еще хуже, вообще не станет тормозить.

 

Рис. 11 Схематическое изображение структуры простого рефлекс­ного агента

Возникновение аналогичной проблемы можно обнаружить и в мире отстающего студента. Предположим, что в простом рефлексном агенте-студенте испортился датчик наличия у него допуска на экзамен и работает только определения наличия преподавателя в институте. Такой агент бесконечно долго будет ходить к преподавателю для сдачи экзамена, если преподаватель будет выполнять требования учебной части: не принимать экзамен у студентов без соответствующего допуска. Для простых рефлексных агентов, действующих в частично наблюдаемых вариантах среды, часто бывают неизбежными бесконечные циклы.

Выход из бесконечных циклов становится возможным, если агент обладает спо­собностью рандомизировать свои действия (вводить в них элемент случайности). Например, если агент-студент может подбросить монету, чтобы выбрать между движениями к преподавателю или в учебную часть за допуском. Легко пока­зать, что агент сдаст экзамен (при наличии знаний) в среднем за два этапа. Поэтому рандомизированный простой рефлексный агент может превзойти по своей производительности детерминированного простого рефлексного агента, хотя это лишь полезный трюк, который помогает простому рефлексному агенту в неко­торых ситуациях, но в большинстве случаев можно добиться гораздо большего с по­мощью более сложных детерминированных агентов.

 

еще рефераты
Еще работы по информатике