Лекция: Новая точка зрения на V1

Следующий шаг в понимании архитектуры кортекса требует взглянуть на кортикальные области по-другому. Мы знаем, что высшие области кортикальной иерархии формируют инвариантное представление. Но почему эта важная функция должна возникать только наверху? Держа на задворках мысли замечание Монткастла о симметрии, я начал изучать различные способы, которыми могли бы соединяться кортикальные области.

Рисунок 1 изображает четыре классических области визуального пути, V1, V2, V4 и IT, где V1 внизу, на нем V2, V4 и на самом верху IT. Каждый из них условно рассматривается и изображен как единая, непрерывная область. Таким образом все клетки V1 предположительно делают одно и то же, хотя в различных частях визуального поля. Все клетки V2 решают задачу подобного типа. Все клетки V4 специализированы подобным же образом.

С традиционной точки зрения, когда изображение лица поступает в область V1, клетки в нем создают грубый набросок лица в терминах простых линейных сегментов и других элементарных деталей. Этот набросок поступает в V2. Затем V2 делает свое дело с изображением, производя более сложный анализ черт лица, и передает результат в V4, и т.д. Инвариантность и распознавание объекта достигается только тогда, когда информация достигает верхней точки, IT.

К несчастью, с такой точкой зрения на V1, V2 и V4 есть некоторые проблемы. Почему инвариантное представление должно возникать только в IT? Если все кортикальные области выполняют одну и ту же функцию, почему IT Должна быть особенной?

Во-вторых, лицо может появиться на левой стороне вашего V1 или на правой, и вы должны узнать его. Но эксперименты ясно показывают, что несмежные колонки V1 не имеют прямого соединения; левая сторона V1 не может знать, что видит правая. Отступите и подумайте над этим. Различные части V1 явно занимаются похожими вещами, так как все они участвуют в распознавании лица, но в то же время они физически независимы. Подобласти или кластеры V1 физически разъединены, но делают одно и то же.

В конечном счете эксперименты показывают, что все высшие области кортекса получают информацию, сходящуюся от двух или более сенсорных областей ниже по иерархии (рисунок 3). В настоящем мозге десятки областей могут сходиться к ассоциативной области. Но в традиционных интерпретациях нижние сенсорные области, наподобие V1, V2 и V4 имеют различные виды соединений. Каждая рассматривается, как если бы у нее был только один вход – только одна стрелка, идущая снизу – без явного схождения информации от других регионов. V2 получает информацию только от V1 и только. Почему некоторые кортикальные области получают сходящуюся информацию, а другие – нет? Это также несовместимо с идеей Монткастла о едином кортикальном алгоритме.

По этим и другим причинам я пришел к уверенности, что V1, V2 и V4 не должны рассматриваться как единые кортикальные области. Наоборот, каждая является набором множества мелких подобластей. Давайте вернемся к аналогии с обеденной салфеткой – плоской версией кортекса. Давайте воспользуемся авторучкой для разметки всех функциональных областей кортекса на нашей кортикальной салфетке. Наибольшей областью безоговорочно является V1, первичная визуальная область. Следующей была бы V2. Они огромны по сравнению с большинством других областей. Я полагаю, что V1 в действительности должна рассматриваться как множество очень маленьких областей. Вместо одной большой области на салфетке мы нарисовали бы множество маленьких областей, которые все вместе занимали бы область, предназначенную для V1. Другими словами, V1 состоит из нескольких отдельных маленьких кортикальных областей, которые не соединяются со своими соседями напрямую, а только через выше или ниже по иерархии. V1 имела бы наибольшее количество подобластей из всех визуальных областей. V2 также состояла бы из меньшего количества подобластей чуть большего размера. Это же было бы верным и для V4. Но со временем, когда вы доберетесь до области IT, это будет действительно единая область, вот почему у клеток в IT «птицеглазое» видение целого визуального мира.

В этом есть привлекательная симметрия. Давайте взглянем на рисунок 5, на котором показана та же самая иерархия, что и на рисунке 3, за исключением того, что там сенсорная иерархия изображена, как я описал выше. Заметьте, что теперь кортекс везде выглядит одинаковым образом. Возьмите любую область, и вы найдете множество нижних областей, обеспечивающих схождение информации. Принимающие области посылают проекции обратно к входным областям, говоря им, какие паттерны они должны ожидать увидеть далее. Высшие ассоциативные области объединяют информацию от нескольких чувств, таких как зрение или осязание. Нижние области, подобные подобластям V2 объединяют информацию от отдельных подобластей в V1. Области не знают – и, конечно же, не могут знать – что обозначает любой из их входов. Подобластям V2 не нужно знать, что они обрабатывают информацию от нескольких частей V1. Ассоциативным областям не нужно знать, что они обрабатывают информацию от зрения и слуха. Наоборот, цель любой кортикальной области – найти, как соотносятся ее входы, запомнить последовательности корреляций между ними и использовать эту память для предсказания того, как входы поведут себя в будущем. Кортекс есть кортекс. Везде происходит один и тот же процесс: общий кортикальный алгоритм.

Рисунок 5. Альтернативный взгляд на кортикальную иерархию.

Это новое иерархическое описание помогает нам понять процесс создания инвариантного представления. Давайте поближе взглянем на то, как это работает в зрительном канале. На первом уровне обработки левая сторона зрительного поля отличается от правой стороны таким же образом, как зрение отличается от слуха. Левый V1 и правый V1 формируют один и тот же вид представления только потому, что на них отображаются подобные паттерны в течение жизни. Как слух и зрение, они могут рассматриваться как отдельные сенсорные потоки, которые объединяются выше.

Подобный образом маленькие области в V2 и V4 являются ассоциативными областями зрения. (подобласти могут перекрываться, но это фундаментально не изменило бы способ работы этих областей). Интерпретация визуального кортекса подобным образом не противоречит и не изменяет что-либо, что нам известно о его анатомии. Информация течет вверх и вниз по всем ветвям иерархического дерева памяти. Паттерны в левом поле зрения могут привести к предсказанию в правом поле зрения тем же путем, как звон колокольчиков моей кошки ведет к визуальному предсказанию того, что она входит в мою спальню.

Наиболее важным результатом этой новой картины кортикальной иерархии является то, что теперь мы можем сказать, что каждая область кортекса формирует инвариантное представление. По-старому у нас не было завершенной картины инвариантного представления – такого, как лица – до тех пор, пока информация не достигала верхнего слоя, IT, который видит цельную картину мира. Теперь мы можем сказать, что инвариантное представление вездесуще. Инвариантное представление формируется в каждой кортикальной области. Инвариантность не является чем то магически проявляющимся, когда мы достигаем верхних областей кортекса, таких как IT. Каждая область формирует инвариантное представление из информации от областей ниже по иерархии. Таким образом, подобласти V4, V2 и V1 создают инвариантное представление на основе того, что поступает в них. Они могут видеть только крошечную часть мира, и словарь сенсорных объектов, с которыми они оперируют, является более простым, но они выполняют ту же самую функцию, что и IT. Также, ассоциативные области выше IT формируют инвариантное представление паттернов от нескольких органов чувств. Таким образом, все области кортекса формируют инвариантное представление мира в изображении нижестоящих областей. В этом есть определенная красота.

Наша головоломка стронулась с места. Мы больше не задаемся вопросом, как формируется инвариантное представление за четыре шага от верха до низа. Вместо этого мы задаемся вопросом, как инвариантное представление формируется в каждой кортикальной области. Это создает ощущение совершенства, если мы всерьез принимаем существование общего кортикального алгоритма. Если одна область хранит последовательность паттернов, то каждая область должна хранить последовательности. Если одна область создает инвариантное представление, но все области создают инвариантное представление. Переосознание кортикальной иерархии подобно тому, как изображено на рисунке 5, делает возможным такую интерпретацию.

еще рефераты
Еще работы по информатике