6. Как работает кортекс
6. Как работает кортекс
Попытки понять, как работает мозг, подобны решению гигантской головоломки из кусочков картинки. Вы можете подходить к ее решению двумя способами. Используя подход «сверху вниз», вы начинаете с того, что берете цельную картинку, и, пользуясь ей, решаете, какие кусочки игнорировать, а какие искать. Другой подход, «снизу вверх», когда вы фокусируетесь непосредственно на самих кусочках. Вы изучаете их на наличие особенностей и ищите наиболее подходящие среди других кусочков. Если у вас нет цельной картинки-решения, метод «снизу вверх» является иногда единственным путем.
Головоломка «познай мозг» особенно устрашающая. В отсутствии хорошего теоретического обоснования для понимания интеллекта ученые стараются придерживаться подхода «снизу вверх». Но задача очень трудна, если вообще не неосуществима, если головоломка такая сложная, как мозг. Чтобы ощутить трудность, вообразите головоломку с несколькими тысячами кусочков. Большинство кусочков могут быть интерпретированы различными путями, как если бы у каждого была подходящая картинка на обоих сторонах, но только одна из них правильная. Все кусочки почти одинаковы по форме, так что вы не смогли бы определенно сказать, подходят два кусочка или нет. Большинство из них не будет использовано в конечном решении, но вы не знаете, какие и сколько. Каждый месяц новые кусочки приходят по почте. Некоторые из этих новых кусочков заменяли бы более старые, как если бы разработчик головоломки сказал, «Я знаю, что вы работали с этими старыми кусочками несколько лет, но оказалось, что они не годятся. Извините. Вместо них используйте эти новые кусочки до будущих извещений». К сожалению, у вас нет идей, на что будет похож конечный результат; еще хуже, если у вас были идеи, но они оказались неправильными.
Эта аналогия с головоломкой является великолепным описанием сложности, с которой мы сталкиваемся при создании новой теории кортекса и интеллекта. Кусочки головоломки — это биологические и поведенческие данные, которые ученые собрали за сотни лет. Каждый месяц публикуются новые документы, создающие дополнительные кусочки головоломки. Иногда данные одного ученого противоречат данным другого. Поскольку данные могут быть интерпретированы различными способами, практически во всем есть разногласия. Без теоретических оснований «сверху вниз» не будет консенсуса в том, что искать, что наиболее важно или как интерпретировать горы накопленной информации. Наше понимание мозга застряло на подходе «снизу вверх». Все, что нам нужно — это теоретические обоснования для подхода «сверху вниз».
Модель «память-предсказание» может выступить в этой роли. Она может показать нам, как начинать складывать вместе кусочки головоломки. Чтобы делать предсказания, вашему кортексу нужен способ помнить и хранить знания о последовательностях событий. Чтобы делать предсказания новых событий, кортекс должен сформировать инвариантные представления. Вашему мозгу нужно создавать и хранить модель мира такого, какой он есть, независимо от того, как вы видите его в различных обстоятельствах. Зная, что должен делать кортекс, ведет нас к пониманию его архитектуры, особенно его иерархического дизайна и шестислойной формы.
Когда мы изучим эти теоретические основы, представленные здесь впервые, я перейду на детальный уровень, который может быть многообещающим для некоторых читателей. Большинство концепций, с которыми вы сейчас встретитесь, непривычны даже для экспертов в нейронауках. Но я верю, с небольшим усилием каждый сможет понять фундамент этих теоретических основ. Главы 7 и 8 этой книги гораздо менее технические и более широко исследуют следствия теории.
Наше решение головоломки может теперь обернуться к поиску биологических деталей, которые подтверждают гипотезу «память-предсказание»; это подобно тому, что мы оставим в стороне большой процент кусочков головоломки, зная, что относительно небольшой процент оставшихся кусочков приоткроет решение. Как только мы обнаружим, что ищем, задача станет управляемой.
В то же время я хочу заметить, что эти теоретические основания еще не завершены. Есть множество вещей, которые мне еще непонятны. Но многое я уже сделал, основываясь на дедуктивном выводе, экспериментах, выполненных во множестве различных лабораторий, и знании анатомии. Последние 5 — 10 лет исследователи из множества подобластей нейронаук исследовали идеи, подобные моим, хотя использовали другую терминологию и, насколько мне известно, не пытались сложить эти идеи в одну общую теорию. Они говорят об обработке «сверху вниз» и «снизу вверх», как паттерны распространяются через сенсорные области мозга и как важно инвариантное представление. Например, Габриэль Крейман и Кристоф Кох, нейрофизиологи из Кальтеха, совместно с нейрохирургом Ицхаком Фрейдом из UCLA, обнаружили клетки, которые возбуждаются, когда человек видит изображение Билла Клинтона. Одна из моих целей — объяснить, как образуются эти клетки Билла Клинтона. Конечно, все теории должны делать предсказания, которые могут быть протестированы в лаборатории. Я укажу несколько таких предсказаний в приложении. Сейчас мы знаем, что искать, и очень сложная система больше не выглядит такой сложной.
В следующих разделах этой главы мы глубже и глубже будем зондировать то, как работает модель «память-предсказание». Мы начнем с широкомасштабной структуры и широкомасштабных функций неокортекса, и будем двигаться к предстоящему пониманию более мелких кусочков и того, как они складываются в картинку.
Рисунок 1. Первые четыре области визуального распознавания объектов.
6.1. Инвариантное представление
Ранее я изобразил кортекс как слой клеток размером с обеденную салфетку, такой же толщины, как шесть визиток, где соединения между различными областями задают в целом иерархическую структуру. Сейчас я хочу нарисовать другую картину кортекса, которая высветит ее иерархические соединения. Вообразите, что мы разрезали обеденную салфетку на функциональные области — секции кортекса, которые специализируются на определенных задачах — и сложили эти области одна на другую подобно блинчикам. Если вы разрежете эту стопку и посмотрите со стороны, вы увидите рисунок1. Кортекс на самом деле не похож на это, как вы могли бы подумать, но картинка поможет вам увидеть, как проходит информация. Я показал четыре кортикальных области, в которые снизу поступает сенсорная информация и течет вверх от области к области. Заметьте, информация ходит в обоих направлениях.
Рисунок 1 представляет четыре визуальных области, задействованных в распознавании объектов — то, как вы видите и узнаете кошку, храм, вашу маму, Великую Китайскую Стену. Биологи обозначают их V1, V2, V4 и IT. Визуальная информация, представленная направленными вверх стрелками внизу рисунка 1, возникает в сетчатке обоих глаз и идет в V1. эта информация может рассматриваться как постоянно меняющиеся паттерны, распределенные приблизительно по миллиону аксонов, связанных вместе в оптический нерв.
Мы говорили ранее о пространственных и временных паттернах, но имеет смысл освежить вашу память, поскольку мы будем ссылаться на них очень часто. Вспомните, что ваш кортекс — это большой слой нервной ткани, который содержит функциональные области, специализированные на определенных задачах. Эти области соединяются большими связками аксонов или волокон, которые передают информацию от одного региона к другому, все одновременно. В любой момент времени некоторое множество волокон возбуждается электрическим импульсом, называемым потенциалом действия или спайком, тогда как другие остаются неактивными. Коллективная активность связки волокон и есть то, что обозначает паттерн. Паттерн, поступающий в V1, может быть пространственным, когда ваш взгляд задерживается на объекте, и временными, когда ваш взгляд движется по объекту.
Как отмечалось ранее, примерно три раза в секунду ваши глаза совершают быстрое движение, называемое саккадой, и остановку, называемую фиксацией. Если ученый подключит устройство, отслеживающее движение глаз, вы будете удивлены, какими отрывистыми являются саккады, хотя ваше визуальное ощущение непрерывно и стабильно. Рисунок 2 показывает, как у некоторого человека движутся глаза, когда он смотрит на лицо. Заметьте, что фиксации не произвольны. Теперь вообразите, что вы могли бы видеть паттерн активности, поступающие в V1 от глаз этого человека. Он меняется постоянно с каждой саккадой. Несколько раз в секунду кортекс видит совершенно новый паттерн.
Вы могли бы подумать, «хорошо, но это все еще то же самое лицо, просто смещающееся». В этом есть доля правды, но не так много, как вы думаете. Светочувствительные рецепторы в вашей сетчатке распределены неравномерно. Они плотно сконцентрированы в фовеальной области в центре, и постепенно редеют к периферии. В отличие от этого клетки кортекса распределены равномерно. В результате изображение с сетчатки, отображаемое в первичную визуальную область V1, сильно искажено. Когда ваши глаза фиксируются на носу, а не на глазу того же самого лица, картинка значительно отличается, как если бы ее рассматривали через искажающие линзы, которые постоянно дергаются туда-сюда. Но когда вы видите лицо, оно не кажется вам искаженным, и не кажется прыгающим. Большую часть времени вы даже не осознаете, что паттерны с сетчатки полностью изменяются. Вы видите «просто лицо». (Рисунок 2б показывает этот эффект на примере берегового ландшафта). Это подтверждение загадки инвариантного представления, о котором мы говорили в главе 4. То, что вы воспринимаете — это не то, что видит V1. Как же все таки ваш мозг узнает, что он видит одно и то же лицо, и почему вы не знаете, что поступающая информация изменяющаяся и искаженная?
Рисунок 2а. Как глаза совершают саккады по человеческому лицу.
Рисунок 2б. Искажение, вызванное неравномерным распределением рецепторов по сетчатке.
Если мы поместим электроды в V1 и будем наблюдать, как отвечают отдельные клетки, мы обнаружим, что каждая конкретная клетка возбуждается только в ответ на визуальную информацию от крошечной части сетчатки. Этот эксперимент был проделан много раз и является опорным в исследовании зрения. Каждый нейрон в области V1 имеет так называемое рецептивное поле, которое сильно специфично для каждой мельчайшей части общего поля зрения — то есть, цельного мира перед вашими глазами. Представляется, что клетки в V1 совсем не знают о лицах, машинах, книгах или других значительных объектах, которые вы видите все время; они «знают» о крошечных, с игольное ушко, порциях визуального мира.
Каждая клетка в V1 также настроены на специфические виды поступающих паттернов. Например, конкретная клетка может активно пульсировать, когда она видит линию или край, наклоненный под углом в 30 градусов. Эти края сами по себе имеют небольшое значение. Они могли бы быть частью любого объекта — половицы, стволом отдаленного пальмового дерева, стороной буквы М или одной из почти бесконечного числа возможностей. При каждой новой фиксации, рецептивное поле клетки попадает на новую и совершенно отличную порцию визуального пространства. При некоторых фиксациях клетка будет сильно возбуждаться, на других будет возбуждаться слабо или вообще не будет. Таким образом, каждый раз, когда вы совершаете саккаду, множество клеток в V1 вероятнее всего изменяет свою активность.
Однако, нечто волшебное происходит, если вы помещаете электрод в верхнюю область, показанную на рисунке 1, область IT. Здесь мы обнаруживаем некоторые клетки, которые становятся и остаются активными, когда объект полностью появляется где-нибудь в поле зрения. Например, мы могли бы найти клетки, которые возбуждаются только тогда, когда видно лицо. Эти клетки остаются активными до тех пор, пока ваши глаза видят лицо где-нибудь в поле вашего зрения. Они не включаются и не выключаются при каждой саккаде, как это делают клетки в V1. Рецептивное поле этих клеток в IT покрывает большую часть визуального пространства и настроено на возбуждение, когда видно лицо.
Давайте откроем тайну. Походу охвата четырех кортикальных этапов от сетчатки до IT, клетки изменяются от быстро изменяющихся, пространственно специфичных, распознающих крошечные кусочки ячеек, до постоянно возбужденных, пространственно неспецифичных, распознающих объекты. Клетки в IT говорят нам, что мы видим лицо где-то в поле нашего зрения. Эти клетки, называемые обычно нейронами лица, будут возбуждаться независимо от того, наклонено ли лицо, повернуто ли, или частично загорожено. Это часть инвариантного представления для «лиц».
Написать эти слова кажется так просто. Четыре коротких этапа, и Вуаля, мы узнали лицо. Ни одна компьютерная программа или математическая формула не решает эту задачу с надежностью и общностью, близкой к человеческому мозгу. Но мы знаем, что мозг решает ее за несколько шагов, так что ответ не может быть сложным. Одна из основных целей этой главы объяснить, как получаются нейроны лица, нейроны Билла Клинтона или другие. Мы доберемся до этого, но мы должны охватить сначала много другого.
Взглянем на рисунок 1 по-другому. Вы видите, что информация также течет от высших областей к низшим через сеть обратных связей. Эти связки аксонов, которые идут от областей вроде IT к низшим областям вроде V4, V2 и V1. Более того, обратных связей много, если не больше, чем прямых.
Много лет ученые игнорировали обратные связи. Если ваше понимание мозга сфокусировано на том, как кортекс принимает информацию, обрабатывает ее и затем действует на ее основе, вам не нужны обратные связи. Все что вам нужно — это прямые соединения, ведущие от сенсорных областей кортекса к моторным. Но когда вы начинаете понимать, что функция кортекса — предсказание, то вам необходимо ввести в модель обратные связи; мозг должен посылать поступающую информацию обратно к областям, которые получили информацию первыми. Предсказание требует сравнения того, что происходит и того, что вы ожидаете. То, что действительно происходит идет вверх, то, что вы ожидаете идет вниз.
Те же самые прямые и обратные процессы возникают во всех областях кортекса, задействованных во всех органах чувств. На рисунке 3 рядом с визуальной стопкой блинчиков изображены похожие стопки для слуха и осязания. Там также изображена чуть более высшая кортикальная область, ассоциативная, которая получает и интегрирует информацию от нескольких различных органов чувств. Тогда как рисунок 1 основан на знании соединений между четырьмя известными областями кортекса, рисунок 3 чисто концептуальная диаграмма, не пытающаяся охватить действительные кортикальные области. В реальном мозгу человека масса кортикальных областей соединены различными способами. Фактически, большая часть человеческого кортекса состоит из ассоциативных областей. Анимированная характеристика, показанная здесь и на следующих рисунках, предназначена для того, чтобы помочь вам понять, что происходит, не вводя сильно в заблуждение.
Рисунок 3. Формирование инвариантного представления для слуха, зрения и осязания.
Трансформация — от быстро изменяющихся к медленно меняющимся и от пространственно специфичных к пространственно инвариантным — очень хорошо изучена для зрения. И хотя это не так очевидно и требует доказательств, многие нейрофизиологи верят, что то же самое происходит во всех сенсорных областях кортекса, не только в визуальных.
Возьмем слух. Когда кто-то разговаривает с вами, изменения в звуковом давлении происходят очень быстро; паттерны, поступающие в первичную слуховую область, называемую A1, изменяются очень быстро. Но если мы могли бы поместить электроды чуть выше по слуховому потоку, мы нашли бы инвариантные клетки, которые отвечают на слова или даже на фразы. Ваш слуховой кортекс мог бы иметь группу клеток, которые возбуждаются, когда вы слышите «спасибо» и другую группу клеток, возбуждающуюся на фразу «доброе утро». Такие клетки должны оставались бы активными, в течение всего высказывания, полагая, что вы распознали фразу.
Паттерны, получаемые первой слуховой областью могут изменяться очень широко. Слово может быть произнесено с различным акцентом, на различной высоте или с различной скоростью. Но чем выше по кортикальной иерархии, тем менее значимыми становятся низкоуровневые особенности; слово есть слово, несмотря на акустические детали. То же самое верно и для музыки. Вы можете услышать «Three Blind Mice», сыгранное на пианино, на кларнете или спетое ребенком, и ваш A1 будет получать совершенно различные паттерны в каждом случае. Но электрод, помещенный в высшие слуховые области, должен обнаружить клетки, которые монотонно возбуждаются каждый раз, когда играют «Three Blind Mice», не зависимо от инструмента, темпа или других деталей. Такой конкретный эксперимент не был проведен, конечно, потому что он требует слишком больших вмешательств для человека, но если вы согласны, что должен существовать общий кортикальный алгоритм, вы можете быть уверены, что такие клетки существуют. Мы видим, что в слуховом кортексе тот же самый вид обратных связей, предсказания и инвариантного вспоминания, что и в визуальном.
Наконец, осязание должно вести себя точно также. Опять же, конкретные эксперименты не были проведены, хотя полным ходом идут исследования на обезьянах с помощью аппаратуры, отображающей мозг с высоким разрешением. Поскольку сейчас я сижу и пишу, у меня в руке авторучка. Я трогаю колпачок авторучки, и мои пальцы поглаживают его металлический держатель. Паттерны, поступающие в мой соматосенсорный кортекс от сенсорных рецепторов моей кожи, постоянно изменяются, пока мои пальцы двигаются, но у меня постоянное ощущение авторучки. В один момент я могу согнуть металлический держатель пальцами, в другой момент я это сделаю другим набором пальцев или вообще губами. Много информации, поступающей из различных в соматосенсорный кортекс. Однако, наш электрод снова должен найти клетки в областях, удаленных на несколько шагов от первичной, которые инвариантно отвечают на «авторучку». Они должны оставаться активными, пока я поглаживаю авторучку, и им должно быть все равно, от каких именно пальцев или частей моего тела я дотрагиваюсь до нее.
Подумайте над этим. Слухом или осязанием вы не можете опознать объект с одномоментного сенсорного потока. Паттерны, поступающие от ушей или рецепторов кожи содержат недостаточно информации в каждый конкретный момент времени, чтоб сказать вам, что вы слышите или чувствуете. Когда вы воспринимаете серию слуховых паттернов, такую как мелодия, произнесенное слово или хлопающую дверь, или когда вы тактильно ощущаете объект, такой как авторучка, единственный способ сделать это — использовать поток информации во времени. Вы не можете узнать мелодию, услышав одну ноту, вы не можете узнать ощущение авторучки одним прикосновением. Таким образом, нейронная активность, соответствующая ментальному восприятию объекта, такого как произнесенное слово, должно длиться по времени дольше, чем отдельный паттерн. Это просто другой способ прийти к тому же самому выводу, что чем выше область кортекса в иерархии, тем меньше изменений по времени вы должны видеть.
Зрение также базируется на потоках информации во времени и работает тем же самым общим образом, как слух или осязание, но поскольку мы способны узнавать индивидуальный объект за одну фиксацию, оно портит общую картину. Несомненно, эта способность распознавать пространственные паттерны за короткое время фиксации многие годы сбивала с пути исследователей, работавших над машинным зрением. Они в основном игнорировали критическое значение времени. Хотя можно в лабораторных условиях заставить человека узнавать объекты без движения глаз, это не является нормой. Нормальное зрение, такое как чтение этой книги, требует постоянного движения глаз.
6.2. Интеграция чувств
Что же насчет ассоциативных областей? До сих пор мы видели, как информационные потоки идут вверх и вниз по конкретной сенсорной области кортекса. Потоки, идущие вниз, замещают поступающую информацию и делают предсказание о том, что мы ощутим далее. Те же самые процессы возникают между различными чувствами — то есть, между зрением, слухом и осязанием. Например, что-то, что я слышу, может привести к предсказанию того, что я должен увидеть или почувствовать. Сейчас я пишу в моей спальне. У нашей кошки Кео есть ошейник, который позвякивает, когда она ходит. Я слышу ее приближающееся позвякивание из коридора. По этой звуковой информации я узнаю мою кошку, поворачиваю голову к коридору и входящей Кео. Я ожидаю увидеть ее на основании ее звука. Если Кео не войдет или появится другое животное, я буду удивлен. В этом примере, звуковая информация сначала привела к слуховому узнаванию Кео. Информация поднялась по слуховой иерархии к ассоциативной области и соединила зрение и слух. Затем образ спустился обратно по слуховой и зрительной иерархии, ведя и к слуховому, и к зрительному предсказанию. Рисунок 4 иллюстрирует это.
Такого рода мультисенсорные предсказания возникают все время. Я сгибаю держатель моей ручки, я чувствую, как держатель соскальзывает с пальцев и я ожидаю услышать щелкающий звук, когда держатель ударится о корпус ручки. Если я не слышу щелчка, следующего за отпусканием держателя, я буду удивлен. Мой мозг точно предсказывает, когда я услышу звук и на что он должен быть похож. Чтоб происходило такое предсказание, информация поднимается через соматосенсорный кортекс и спускается обратно и в соматосенсорный, и в слуховой кортекс, ведя к предсказанию звука и ощущения щелчка.
Другой пример: несколько дней я ездил на работу на велосипеде. В то утро я шел в гараж, брал велосипед и выкатывал его на подъездную дорожку. В процессе этого, я получал множество визуальных, тактильных и слуховых ощущений. Велосипед ударялся о дверной косяк, цепь трещала, педали ударяли по моим ногам, и колеса вращались, когда терлись об пол. В процессе выноса велосипеда из гаража мой мозг встречался с плотиной зрительных, слуховых и тактильных ощущений. Каждый сенсорный поток делает предсказания для других весьма скоординированным образом. То, что я вижу, ведет к точному предсказанию того, что я почувствую и услышу, другие чувства примерно также. Вид велосипеда, ударяющегося об косяк заставляет меня ожидать услышать определенный звук и почувствовать подскакивание велосипеда. Ощущение педалей, ударяющихся о мои ноги, заставляет меня взглянуть вниз и увидеть педали там, где я их почувствовал. Предсказания настолько точны, что я должен сразу заметить, если одно из этих ощущений будет немного не скоординированным или необычным. Информация одновременно течет вверх и вниз по сенсорной иерархии, чтобы создать единый сенсорный опыт, включающий предсказание по всем органам чувств.
Рисунок 4. Информация течет вверх и вниз по сенсорной иерархии, чтобы сформировать предсказания и создать единый сенсорный опыт.
Проведите такой эксперимент. Прекратите читать и сделайте что-нибудь, любое движение, которое включает движение вашего тела и манипулирование объектами. Например, подойдите к раковине и откройте кран. Теперь, когда вы сделали это, попробуйте заметить каждый звук, прикосновение и изменение в визуальной информации. Вы должны сконцентрироваться. Каждое действие глубоко связано со зрением, слухом и тактильными ощущениями. Поднимите или поверните кран, и ваш мозг будет ожидать почувствовать давление на вашу кожу и сопротивление ваших мышц. Вы ожидаете увидеть и почувствовать движение рукоятки крана и услышать звук воды в кране. Когда вода ударится о раковину, вы ожидаете услышать другой звук и увидеть и почувствовать брызги.
Каждый шаг создает звук, который вы предвидите осознанно или нет. Даже простейшее действие — держание книги — ведет к многочисленным сенсорным предсказаниям. Вообразите, что вы почувствовали и услышали закрытую книгу, но визуально она остается открытой. Вы должны быть шокированы и сбиты с толку. Как мы видели в эксперименте с измененной дверью в главе 5, вы постоянно делаете предсказания о мире, которые скоординированы по всем вашим чувствам. Когда я концентрируюсь на всех мелких ощущениях, я поражаюсь, как сильно интегрированы наши сенсорные предсказания. Хотя эти предсказания могут показаться простыми или тривиальными, обратите внимание, какие они всепроникающие и как только они могут происходить с такой координацией паттернов, следующих вверх и вниз по кортикальной иерархии.
Когда вы поймете, как взаимосвязаны чувства, вы придете к выводу, что неокортекс, все сенсорные и ассоциативные области работают как одно целое. Да, у нас есть визуальный кортекс, но он просто один из компонентов одной общей сенсорной системы — изображения, звуки, прикосновения и другие чувства, скомбинированные, текут вверх и вниз по единой иерархии со многими ветвями.
Следующий факт: все предсказания обретаются на опыте. Мы ожидаем в настоящем и в будущем, что держатель авторучки будет издавать щелкающий звук, потому что он так делал в прошлом. Велосипеды, ударяющиеся в гаражах, выглядят, чувствуются и звучат для нас предсказуемым образом. Вы не родились с этими знаниями; вы обрели их благодаря невероятной способности вашего кортекса помнить паттерны. Если для поступающего в ваш мозг паттерна есть соответствующий паттерн, ваш мозг использует его, чтобы предсказать будущие события.
Хотя рисунки 3 и 4 не отображают моторный кортекс, вы можете вообразить его как еще одну стопку блинчиков, также как и сенсорную стопку, подсоединенную к сенсорной системе через ассоциативные области (хотя с более тесными соединениями с соматосенсорным кортексом для выполнения движений тела). В этом смысле моторный кортекс ведет себя почти так же, как и сенсорные области. Информация из любой сенсорной области может подниматься к ассоциативным областям, что может вызвать паттерн, попадающий в моторный кортекс и приводящий к поведению. Точно так же, как визуальная информация может вызвать паттерны, идущие к слуховым и сенсорным областям, она может вызвать и паттерны, идущие к моторному кортексу. В первом случае мы интерпретируем эти потоки вверх-вниз как предсказание. В случае с моторным кортексом — как моторные команды. Как указал Монткастл, моторный кортекс выглядит точно так же, как и сенсорный. Следовательно, как кортекс обрабатывает возвращающиеся сенсорные предсказания, похожим образом обрабатывает и моторные команды.
Вскоре мы увидим, что в кортексе нет чисто моторных или чисто сенсорных областей. Сенсорные паттерны одновременно текут и там и там — и затем возвращаются по всем областям иерархии, ведя к предсказанию или моторному поведению. Хотя у моторного кортекса есть некоторые специальные атрибуты, о нем можно думать всего лишь как о части одной большой системы «память-предсказание». Он практически похож на другие органы чувств. Зрение, слух, осязание и поведение глубоко переплетены.
6.3. Новая точка зрения на v1
Следующий шаг в понимании архитектуры кортекса требует взглянуть на кортикальные области по-другому. Мы знаем, что высшие области кортикальной иерархии формируют инвариантное представление. Но почему эта важная функция должна возникать только наверху? Держа на задворках мысли замечание Монткастла о симметрии, я начал изучать различные способы, которыми могли бы соединяться кортикальные области.
Рисунок 1 изображает четыре классических области визуального пути, V1, V2, V4 и IT, где V1 внизу, на нем V2, V4 и на самом верху IT. Каждый из них условно рассматривается и изображен как единая, непрерывная область. Таким образом все клетки V1 предположительно делают одно и то же, хотя в различных частях визуального поля. Все клетки V2 решают задачу подобного типа. Все клетки V4 специализированы подобным же образом.
С традиционной точки зрения, когда изображение лица поступает в область V1, клетки в нем создают грубый набросок лица в терминах простых линейных сегментов и других элементарных деталей. Этот набросок поступает в V2. Затем V2 делает свое дело с изображением, производя более сложный анализ черт лица, и передает результат в V4, и т. д. Инвариантность и распознавание объекта достигается только тогда, когда информация достигает верхней точки, IT.
К несчастью, с такой точкой зрения на V1, V2 и V4 есть некоторые проблемы. Почему инвариантное представление должно возникать только в IT? Если все кортикальные области выполняют одну и ту же функцию, почему IT Должна быть особенной?
Во-вторых, лицо может появиться на левой стороне вашего V1 или на правой, и вы должны узнать его. Но эксперименты ясно показывают, что несмежные колонки V1 не имеют прямого соединения; левая сторона V1 не может знать, что видит правая. Отступите и подумайте над этим. Различные части V1 явно занимаются похожими вещами, так как все они участвуют в распознавании лица, но в то же время они физически независимы. Подобласти или кластеры V1 физически разъединены, но делают одно и то же.
В конечном счете эксперименты показывают, что все высшие области кортекса получают информацию, сходящуюся от двух или более сенсорных областей ниже по иерархии (рисунок 3). В настоящем мозге десятки областей могут сходиться к ассоциативной области. Но в традиционных интерпретациях нижние сенсорные области, наподобие V1, V2 и V4 имеют различные виды соединений. Каждая рассматривается, как если бы у нее был только один вход — только одна стрелка, идущая снизу — без явного схождения информации от других регионов. V2 получает информацию только от V1 и только. Почему некоторые кортикальные области получают сходящуюся информацию, а другие — нет? Это также несовместимо с идеей Монткастла о едином кортикальном алгоритме.
По этим и другим причинам я пришел к уверенности, что V1, V2 и V4 не должны рассматриваться как единые кортикальные области. Наоборот, каждая является набором множества мелких подобластей. Давайте вернемся к аналогии с обеденной салфеткой — плоской версией кортекса. Давайте воспользуемся авторучкой для разметки всех функциональных областей кортекса на нашей кортикальной салфетке. Наибольшей областью безоговорочно является V1, первичная визуальная область. Следующей была бы V2. Они огромны по сравнению с большинством других областей. Я полагаю, что V1 в действительности должна рассматриваться как множество очень маленьких областей. Вместо одной большой области на салфетке мы нарисовали бы множество маленьких областей, которые все вместе занимали бы область, предназначенную для V1. Другими словами, V1 состоит из нескольких отдельных маленьких кортикальных областей, которые не соединяются со своими соседями напрямую, а только через выше или ниже по иерархии. V1 имела бы наибольшее количество подобластей из всех визуальных областей. V2 также состояла бы из меньшего количества подобластей чуть большего размера. Это же было бы верным и для V4. Но со временем, когда вы доберетесь до области IT, это будет действительно единая область, вот почему у клеток в IT «птицеглазое» видение целого визуального мира.
В этом есть привлекательная симметрия. Давайте взглянем на рисунок 5, на котором показана та же самая иерархия, что и на рисунке 3, за исключением того, что там сенсорная иерархия изображена, как я описал выше. Заметьте, что теперь кортекс везде выглядит одинаковым образом. Возьмите любую область, и вы найдете множество нижних областей, обеспечивающих схождение информации. Принимающие области посылают проекции обратно к входным областям, говоря им, какие паттерны они должны ожидать увидеть далее. Высшие ассоциативные области объединяют информацию от нескольких чувств, таких как зрение или осязание. Нижние области, подобные подобластям V2 объединяют информацию от отдельных подобластей в V1. Области не знают — и, конечно же, не могут знать — что обозначает любой из их входов. Подобластям V2 не нужно знать, что они обрабатывают информацию от нескольких частей V1. Ассоциативным областям не нужно знать, что они обрабатывают информацию от зрения и слуха. Наоборот, цель любой кортикальной области — найти, как соотносятся ее входы, запомнить последовательности корреляций между ними и использовать эту память для предсказания того, как входы поведут себя в будущем. Кортекс есть кортекс. Везде происходит один и тот же процесс: общий кортикальный алгоритм.
Рисунок 5. Альтернативный взгляд на кортикальную иерархию.
Это новое иерархическое описание помогает нам понять процесс создания инвариантного представления. Давайте поближе взглянем на то, как это работает в зрительном канале. На первом уровне обработки левая сторона зрительного поля отличается от правой стороны таким же образом, как зрение отличается от слуха. Левый V1 и правый V1 формируют один и тот же вид представления только потому, что на них отображаются подобные паттерны в течение жизни. Как слух и зрение, они могут рассматриваться как отдельные сенсорные потоки, которые объединяются выше.
Подобный образом маленькие области в V2 и V4 являются ассоциативными областями зрения. (подобласти могут перекрываться, но это фундаментально не изменило бы способ работы этих областей). Интерпретация визуального кортекса подобным образом не противоречит и не изменяет что-либо, что нам известно о его анатомии. Информация течет вверх и вниз по всем ветвям иерархического дерева памяти. Паттерны в левом поле зрения могут привести к предсказанию в правом поле зрения тем же путем, как звон колокольчиков моей кошки ведет к визуальному предсказанию того, что она входит в мою спальню.
Наиболее важным результатом этой новой картины кортикальной иерархии является то, что теперь мы можем сказать, что каждая область кортекса формирует инвариантное представление. По-старому у нас не было завершенной картины инвариантного представления — такого, как лица — до тех пор, пока информация не достигала верхнего слоя, IT, который видит цельную картину мира. Теперь мы можем сказать, что инвариантное представление вездесуще. Инвариантное представление формируется в каждой кортикальной области. Инвариантность не является чем то магически проявляющимся, когда мы достигаем верхних областей кортекса, таких как IT. Каждая область формирует инвариантное представление из информации от областей ниже по иерархии. Таким образом, подобласти V4, V2 и V1 создают инвариантное представление на основе того, что поступает в них. Они могут видеть только крошечную часть мира, и словарь сенсорных объектов, с которыми они оперируют, является более простым, но они выполняют ту же самую функцию, что и IT. Также, ассоциативные области выше IT формируют инвариантное представление паттернов от нескольких органов чувств. Таким образом, все области кортекса формируют инвариантное представление мира в изображении нижестоящих областей. В этом есть определенная красота.
Наша головоломка стронулась с места. Мы больше не задаемся вопросом, как формируется инвариантное представление за четыре шага от верха до низа. Вместо этого мы задаемся вопросом, как инвариантное представление формируется в каждой кортикальной области. Это создает ощущение совершенства, если мы всерьез принимаем существование общего кортикального алгоритма. Если одна область хранит последовательность паттернов, то каждая область должна хранить последовательности. Если одна область создает инвариантное представление, но все области создают инвариантное представление. Переосознание кортикальной иерархии подобно тому, как изображено на рисунке 5, делает возможным такую интерпретацию.
6.4. Модель мира
Почему неокортекс построен иерархически?
Вы можете думать о мире, перемещаться в нем, делать предсказания будущего, потому что ваш кортекс строит модель мира. Одна из важнейших концепций этой книги — это то, что иерархическая структура кортекса хранит модель иерархической структуры мира. Вложенная структура реального мира отражается вложенной структурой кортекса.
Что я имел в виду под вложенной или иерархической структурой? Подумайте о музыке. Ноты комбинируются, формируя интервалы. Интервалы комбинируются, формируя мелодические фразы. Фразы комбинируются, формируя мелодии или песни. Песни комбинируются в сборники. Подумайте о письменном языке. Буквы комбинируются, формируя слоги. Слоги комбинируются, формируя слова. Слова комбинируются, формируя словосочетания и предложения. Глядя по-другому, подумайте о вашем окружении. Оно возможно состоит из дорог, домов. В домах есть комнаты. В каждой комнате есть стены, потолок, пол, дверь и одно или несколько окон. Каждая из этих частей состоит из еще более мелких объектов. Окна сделаны из стекла, рам, защелок и жалюзи. Защелки сделаны из еще более мелких частей, вроде шурупов.
На минуту взгляните на то, что вас окружает. Паттерны с сетчатки поступают в ваш первичный визуальный кортекс и комбинируются, чтоб сформировать линейные сегменты. Линейные сегменты комбинируются, чтоб сформировать формы. Эти сложные формы комбинируются, чтоб сформировать объекты, такие как нос. Нос комбинируется с глазами и ртом, чтоб сформировать лицо. Лицо комбинируется с другими частями тела, чтоб сформировать человека, который сидит в комнате напротив вас.
Все объекты в мире состоят из субобъектов, которые появляются вместе согласованно; это то самое определение объекта. Когда мы даем чему-то название, мы делаем это, потому что набор свойств согласованно движется вместе. Лицо является лицом именно потому, что два глаза, нос и рот всегда появляются вместе. Глаз является глазом именно потому, что зрачок, радужка, веки и остальное всегда появляются вместе. То же самое может быть сказано о стульях, машинах, деревьях, парках и ландшафте. И, наконец, песня есть песня, потому что серии интервалов всегда появляются вместе в последовательности.
В этом отношении мир похож на песню. Каждый объект в мире состоит из набора мелких объектов, и большинство объектов являются частями больших объектов. Это то, что я называю вложенной структурой. Поняв ее, вы увидите вложенную структуру во всем. В полной аналогии с этим, ваша память о вещах и способ, которым мозг представляет их, сохранены в иерархической структуре кортекса. Ваша память о вашем доме состоит не из одной области кортекса. Она хранится в иерархии кортикальных областей, которые отражают иерархическую структуру дома. Широкомасштабные отношения сохраняются в верхней части иерархии, а мелкомасштабные — в нижней.
Дизайн кортекса и метод, с помощью которого обучается, естественным путем раскрывают иерархические отношения в мире. Вы не родились со знанием языка, домов или музыки. У кортекса хитрый алгоритм обучения, который естественным путем обнаруживает любую существующую иерархическую структуру и захватывает ее. Когда структура отсутствует, мы впадаем в замешательство, даже в хаос.
В один момент времени вы можете ощущать только с подмножеством мира. Вы можете быть только в одной комнате дом, смотреть только в одном направлении. По причине иерархии кортекса, вы способны знать, что вы в доме, в комнате, смотрите в окно, даже хотя в этот момент ваши глаза фиксируются на защелке окна. Высшие области кортекса обрабатывают представление о вашем доме, тогда как нижние области представляют комнату, еще более нижние смотрят на окно. Аналогично, иерархия позволяет вам знать, что вы слушаете и песню и сборник, хотя в любой момент времени вы слышите только одну ноту, которая сама по себе говорит, какая нота будет следующей. Она позволяет вам знать, что вы с вашей лучшей подругой, хотя ваши глаза фиксируются на ее руках. Высшие области кортекса отслеживают большую картинку, тогда как низшие области активно работают с быстро изменяющимися маленькими деталями.
Поскольку мы можем трогать, слышать и видеть только очень маленькую часть мира в любой момент времени, информация, поступающая в мозг, является последовательностями паттернов. Кортексу необходимо изучать эти последовательности, которые возникают снова и снова. В некоторых случаях, таких как мелодия, последовательности паттернов приходят в жестком порядке, порядке интервалов. Большинство из нас знакомо с таким видом последовательностей. Но я собираюсь использовать слово последовательность в более общем смысле, ближе к значению математического термина множество. Последовательность это множество паттернов, которые обычно следуют один за другим, но не всегда в фиксированном порядке. Что важно, так это то, что паттерны в последовательности следуют один за другим во времени, даже если не в фиксированном порядке.
Некоторые примерны должны прояснить это. Когда я гляжу на лицо, последовательность входных паттернов, которую я вижу, не фиксирована, но определяется моими саккадами. В один момент времени я могу фиксировать в порядке «глаз глаз нос рот», а в другой момент — в порядке «рот глаз нос глаз». Компоненты лица — это последовательность. Они статистически соотносятся и обычно возникают во времени вместе, хотя порядок может меняться. Если вы воспринимаете «лицо», когда фиксируетесь на «нос», то вероятнее всего следующим паттерном будет «глаз» или «рот», но не «авторучка» или «автомобиль».
Каждая область кортекса видит потоки таких паттернов. Если паттерны соотносятся таким образом, что область может научиться предсказывать, какой паттерн будет следующим, кортикальная область формирует постоянное представление, или память для последовательности. Изучение последовательностей это наиболее базовый ингредиент для инвариантного представления объектов реального мира.
Объекты реального мира могут быть конкретными, вроде ящерицы, лица или двери, или они могут быть абстрактными, как слово или теория. Мозг обрабатывает абстрактные и конкретные объекты одинаковым образом. И те и другие просто последовательности паттернов, возникающих вместе во времени предсказуемым образом. Фактически, определенные входные паттерны повторяются, что позволяет кортикальной области знать, что эти образы вызваны реальными объектами мира.
Предсказуемость это определение реальности. Если область кортекса обнаруживает, что она может надежно и предсказуемо двигаться по этим паттернам, используя серии физических движений (таких как саккады глаз или скольжение пальца) и может аккуратно предсказывать их, когда они развертываются во времени (как звуки, составляющие песню или произнесенные слова), мозг интерпретирует их, как имеющие причинно-следственные отношения. Разногласия в многочисленных входных паттернах, возникающие в одном и том же отношении снова и снова без очевидной причинной связи, исчезающе малы. Предсказуемые последовательности паттернов должны быть частью большего реально существующего объекта. Таким образом, надежная предсказуемость является надежным способом узнать, что различные события мира физически связаны вместе. У каждого лица есть глаза, уши, рот и нос. Если мозг видит глаза, затем делает саккаду и видит другой глаз, затем еще одну саккаду и видит рот, он определенно чувствует, что видит лицо.
Если бы кортикальные области могли говорить, они могли бы сказать: «Я ощущаю множество различны паттернов. Иногда я могу предсказать, какой паттерн будет следующим. Но эти паттерны определенно соотносятся один с другим. Они всегда возникают вместе, и я могу надежно перепрыгивать между ними. Таким образом, когда я вижу любое из этих событий, я ссылаюсь на них общим названием. Именно это групповое имя, а не индивидуальные паттерны я передаю в высшие области кортекса».
Таким образом, можно было бы сказать, что мозг хранит последовательности последовательностей. Каждая область кортекса изучает последовательности, вырабатывает то, что я назвал «именами» для последовательностей, которые она знает, и передает эти имена в следующие области выше по кортикальной иерархии.
6.5. Последовательности последовательностей
Когда информация движется вверх от первичных сенсорных областей к высшим уровням, мы видим, что они все меньше и меньше изменяются во времени. В первичной визуальной области, типа V1, множество активных клеток быстро изменяется, поскольку новые паттерны падают на сетчатку несколько раз в секунду. В визуальной области IT клетки, возбуждающиеся на паттерны, более стабильны. Что там происходит? Каждая область кортекса имеет репертуар последовательностей, которые ей известны, аналогичные репертуару песен. Области хранят эти песнеподобные последовательности обо всем: звук прибоя, разбивающегося о пляж, лицо вашей матери, путь от дома до ближайшего магазина, как произносить слово «попкорн», как тасовать колоду карт.
У нас есть названия для песен, и подобным образом каждая кортикальная область имеет названия для каждой из последовательностей, которые она знает. Это «имя» — группа клеток, совместное возбуждение которых представляет набор объектов в последовательности. (Не задумывайтесь сейчас о том, как выбираются эти группы клеток; мы придем к этому позже). Эти клетки остаются активными, пока идет последовательность, и именно ее «имя» передается в следующую область по иерархии. Пока поступающие паттерны являются частью предсказуемой последовательности, область выдает постоянно «имя» для следующей области выше по иерархии.