Лекция: Простые рефлексные агенты.
Простейшим видом агента является простой рефлексный агент. Подобные агенты выбирают действия на основе текущего акта восприятия, игнорируя всю остальную историю актов восприятия. Например, агент-студент, для которого результаты табуляции функции агента приведены в табл. 9.1, представляет собой простой рефлексный агент, поскольку его решения основаны только на информации о текущем местонахождении преподавателя и о наличии допуска на экзамен. Программа для данного агента достаточно проста и может быть составлена самостоятельно.
Представьте себя на месте водителя автоматизированного такси. Если движущийся впереди автомобиль тормозит и загораются его тормозные огни, то вы должны заметить это и тоже начать торможение. Иными словами, над визуальными входными данными выполняется определенная обработка для выявления условия, которое обозначается как «car-in-front-is-braking» (движущийся впереди автомобиль тормозит). Затем это условие активизирует некоторую связь с действием «ini tiate-braking» (начать торможение), установленную в программе агента. Такая связь называется правилом условие-действие и записывается следующим образом:
if car-iп-froпt-is-brakiпg then iпitiate-brakiпg
Люди также используют большое количество таких связей, причем некоторые из них представляют собой сложные отклики, освоенные в результате обучения (как при вождении автомобиля), а другие являются врожденными рефлексами (такими как моргание, которое происходит при приближении к глазу постороннего предмета). Можно предложить несколько различных способов, с помощью которых можно организовать обучение агента и реализацию таких связей. Простые рефлексные агенты характеризуются той замечательной особенностью, что они чрезвычайно просты, но зато обладают весьма ограниченным интеллектом. Такой агент, работает, только если nравuльное решение может быть nринято на основе исключительно текущего восприятия, иначе говоря, только если среда является полностью наблюдаемой. Внесение даже небольшой доли не наблюдаемости может вызвать серьезное нарушение его работы. Например, в приведенном выше правиле торможения принято предположение, что условие car-in-front-is-braking может быть определено из текущего восприятия (текущего видеоизображения), если движущийся автомобиль имеет тормозной сигнал, расположенный на центральном месте среди других сигналов. К сожалению, некоторые более старые модели имеют другие конфигурации задних фар, тормозных сигналов, габаритных огней, сигналов торможения и сигналов поворота, поэтому не всегда возможно определить из единственного изображения, тормозит ли этот автомобиль или нет. Простой рефлексный агент, ведущий свой автомобиль вслед за таким автомобилем, либо будет постоянно тормозить без всякой необходимости, либо, что еще хуже, вообще не станет тормозить.
Рис. 11 Схематическое изображение структуры простого рефлексного агента
Возникновение аналогичной проблемы можно обнаружить и в мире отстающего студента. Предположим, что в простом рефлексном агенте-студенте испортился датчик наличия у него допуска на экзамен и работает только определения наличия преподавателя в институте. Такой агент бесконечно долго будет ходить к преподавателю для сдачи экзамена, если преподаватель будет выполнять требования учебной части: не принимать экзамен у студентов без соответствующего допуска. Для простых рефлексных агентов, действующих в частично наблюдаемых вариантах среды, часто бывают неизбежными бесконечные циклы.
Выход из бесконечных циклов становится возможным, если агент обладает способностью рандомизировать свои действия (вводить в них элемент случайности). Например, если агент-студент может подбросить монету, чтобы выбрать между движениями к преподавателю или в учебную часть за допуском. Легко показать, что агент сдаст экзамен (при наличии знаний) в среднем за два этапа. Поэтому рандомизированный простой рефлексный агент может превзойти по своей производительности детерминированного простого рефлексного агента, хотя это лишь полезный трюк, который помогает простому рефлексному агенту в некоторых ситуациях, но в большинстве случаев можно добиться гораздо большего с помощью более сложных детерминированных агентов.