Как ИИ и нейробиология двигают друг друга вперед
Объединение возможностей ИИ и наук о мозге обещает выгоды для обеих областей
Четан Пандаринах хочет дать людям с парализованными конечностями возможность оперировать предметами с помощью роботизированной руки так же естественно, как с собственной. Чтобы достичь этой цели, он собрал записи активности мозга у людей с параличом. Его надежда, которую разделяют многие исследователи, состоит в том, что можно установить закономерности электрической активности в нейронах, которые управляют движением руки, чтобы затем эти инструкции можно было подать на протез. По сути, это чтение мысли.
«Оказывается эти сигналы мозга очень сложны для понимания», — говорит инженер в области биомедицины из Института технологий Джорджии в Атланте Пандаринах. В поисках решения проблемы он обратился к ИИ. Свои записи мозговой активности он использовал для обучения искусственной нейронной сети — компьютерной архитектуры, идея которой заимствована у мозга, и поставил перед ней задачу воспроизведения данных.
Записи производились на небольшой группе нейронов в мозге — около 200 из 10-100 миллионов нейронов управляющих движением рук человека. Чтобы такая небольшая выборка имела смысл, компьютер должен был найти закономерности, которые исследователи называют скрытыми факторами, контролирующими общее поведение регистрируемой активности мозга. Это исследование выявило временную динамику нейронной активности, генерирующей более точный набор инструкций для движения руки, чем предыдущие методы. «Сейчас мы можем с точностью до миллисекунд сказать, что в данный момент подопытное животное пытается двигаться под этим точным углом», — объясняет Пандаринах, — «это именно то, что мы должны знать, чтобы контролировать роботизированную руку.»
Его работа является лишь одним из примеров растущего взаимодействия между ИИ и когнитивной наукой. ИИ с его способностью идентифицировать паттерны в больших, сложных наборах данных, добился замечательных успехов в последнее десятилетие, в частности, эмуляции процесса, с помощью которого мозг выполняет определенные вычисления. ИНС, аналогичные сетям нейронов составляющих мозг, дали компьютерам возможность отличать изображение кошки от других изображений, идентифицировать пешеходов с точностью достаточной, чтобы управлять беспилотными автомобилями, а также распознавать речь и реагировать на нее. Теперь когнитивная наука начинает извлекать пользу из мощи ИИ, как модели для разработки и тестирования идей того, как мозг выполняет вычисления, так и в качестве инструмента для обработки сложных массивов данных, которые получаются в исследованиях подобных проводимым Пандаринахом. «Технология в своем развитии сделала полный оборот и теперь применяется, чтобы понять, как работает сам мозг”, — говорит он [Chethan Pandarinath Pub.]. Этот цикл взаимного усиления, вероятно, будет продолжаться. Поскольку ИИ позволяет нейробиологам получить представление о том, как мозг производит вычисления, то их дальнейшие исследования могут привести к машинам, которые могут взять на себя больше возможностей человеческого интеллекта.
Вполне естественно, что эти две дисциплины сочетаются вместе, говорит Манеш Сахани, нейробиолог-теоретик и исследователь машинного обучения в Отделе вычислительной нейробиологии Гэтсби Университетского колледжа Лондона. „Мы эффективно изучаем одно и то же. В одном случае мы спрашиваем, как решить эту задачу обучения математически, чтобы она могла быть эффективно реализована в машине. В другом случае мы рассматриваем единственно существующее доказательство того, что задачу можно решить — это мозг “ [Maneesh Sahani Pub.].
Работа с данными
Методы ИИ пригодятся не только для создания моделей и генерации идей, но и как инструменты для обработки данных. „Нейронные данные очень сложны, и поэтому мы часто используем методы машинного обучения просто для того, чтобы найти в них структуру”, — говорит Сахани. Основная сила машинного обучения заключается в распознавании паттернов, которые могут быть слишком тонкими или слишком скрытыми в огромных наборах данных, чтобы люди могли их обнаружить.
Функциональная магнитно-резонансная томография, например, генерирует снимки активности по всему мозгу с разрешением 1-2 миллиметра каждую секунду или около того, потенциально в течение часов. “Задача когнитивной нейробиологии заключается в том, как найти полезный сигнал в изображениях, которые очень и очень велики», — говорит Николас Турк-Браун, когнитивный нейробиолог из Йельского университета в Нью-Хейвене, штат Коннектикут. Турк-Браун возглавляет один из нескольких проектов, в которых ищутся свежие идеи на стыке науки о данных и нейробиологии [Nicholas B Turk-Browne Pub.].
Использование машины для анализа этих данных ускоряет исследования. «Это огромное изменение в том, как производятся нейробиологические исследования», — говорит Давид Сусилло, специалист по нейровычислениям из команда Google Brain в Сан-Франциско, Калифорния. «Аспирантам не нужно делать лишней рутинной работы — они могут сосредоточиться на более крупных вопросах. Можно многое автоматизировать и получить более точные результаты».
Воспроизведение чувств
Создание искусственной системы, которая воспроизводила бы данные мозга, было подходом принятым Даниэлем Яминсом, вычислительным нейробиологом из Института нейронаук Ву Цай Стэнфордского университета. В 2014 году, когда Яминс, после получения докторской степени в Массачусетском технологическом институте в Кембридже, и его коллеги обучили нейронную сеть предсказывать мозговую активность обезьяны, когда та распознавала определенные объекты [Yamins, D. L. K. et al., 2014]. Распознавание объектов у людей и обезьян осуществляется системой мозга называемой вентральным зрительным потоком, которая имеет две основные архитектурные особенности. Во-первых, это ретинотопия, которая означает, что пути зрительной обработки в мозге организованы таким образом, как глаз воспринимает визуальную информацию. Во-вторых, система иерархична; определенные области кортекса выполняют все более сложные задачи от слоя, который идентифицирует только контуры объектов, до более высокого слоя, который распознает весь объект, такой, как автомобиль или лицо. Детали того, как работают высшие слои неизвестны, но в результате мозг может распознавать объект в различных положениях, при различных условиях освещения, когда он имеет разный размер из-за разного расстояния до него, и даже когда он частично скрыт. Компьютеры часто не могут справиться с такими трудностями.
Яминс и его коллеги построили свою нейронную сеть глубокого обучения в соответствии с той же ретинотопической иерархической архитектурой, что и в мозге, и показали ей тысячи изображений 64 объектов, которые различались по таким характеристикам, как размер и положение. Когда сеть научилась распознавать объекты — она вырабатывала несколько возможных паттернов нейронной активности. Затем исследователи сравнили эти компьютерные паттерны с паттернами, записанными на нейронах обезьян в то время, когда они выполняли аналогичную задачу. Оказалось, что те варианты сети, которые лучше всего распознали объекты, имели паттерны активности, наиболее близкие к паттернам мозга обезьяны. ”Мы обнаружили, что нейронная структура имитируется в структуре сети», — говорит Яминс. Исследователи смогли сопоставить области своей сети с областями мозга почти с 70%-ной точностью.
Результаты подтвердили, что архитектура вентрального визуального потока очень важна для процесса распознавания в зрительной системе мозга. В 2018 году Яминс и его коллеги совершили аналогичный прорыв исследуя слуховую кору, для которой они создали нейронную сеть глубокого обучения, которая смогла идентифицировать слова и жанры музыки в 2-секундных клипах с той же точностью, что и человек [Kell, A. J. E. et al. 2018]. Это помогло исследователям определить, какие области коры головного мозга выполняют распознавание речи, а какие распознают музыку — новый шаг в понимании слуховой системы мозга.
Нейробиологи все еще далеки от понимания того, как мозг справляется с такой задачей, как различение джаза и рок-музыки, но машинное обучение дает им возможность построения моделей, с помощью которых можно исследовать эти вопросы. Если исследователи смогут создать системы, которые работают аналогично мозгу, говорит Яминс, их структура может подсказать идеи, как мозг решает такие задачи. Это важно, так как ученые часто не имеют рабочей гипотезы, как мозг работает [Daniel Yamins Pub.].
После того, как исследователи построили гипотезу, следующим шагом является ее проверка. Меняя параметры моделей ИИ можно получить представление о деятельности мозга, и увидеть какие факторы могут быть важными для выполнения конкретной задачи. Исследователи ограничены этическими соображениями с точки зрения того, насколько они могут вмешиваться в процессы в здоровом человеческом мозге. Поэтому многие записи нейронной активности у людей делаются на мозге тех, кто страдает эпилепсией, и которым должны удалить мозговую ткань. Это связано с тем, что допускается имплантация электродов в мозговую ткань, которая будет удалена в любом случае. Подопытные животные позволяют исследователям использовать более инвазивные процедуры, но есть формы человеческого поведения, в частности речь, которые не могут быть воспроизведены другими видами. Системы ИИ, которые могут имитировать человеческое поведение и быть подвергнуты любым воздействиям, без возникновения этических проблем, предоставят ученым дополнительные инструменты для изучения того, как работает мозг. Исследователи, например, могут научить сеть воспроизводить речь, а затем ухудшить ее, чтобы исследовать, как это связано с воздействием (другой интересный пример нейросетевого моделирования чувства — чувства численности приведен в этой публикации на Хабре — прим. переводчика).
Общие соображения
Компьютерные и когнитивные науки решают некоторые важные вопросы, и понимание того, как ответить на них в любой из этих областей, может привести к продвижению вперед в обеих областях. Один из таких вопросов — как именно происходит обучение? Нейронные сети в основном выполняют контролируемое обучение — обучение с учителем. Например, для распознавании изображений они могут быть обучены с помощью изображений, полученных из базы данных ImageNet, состоящей из более чем 14 миллионов фотографий объектов, которые были классифицированы и аннотированы людьми. При обучении сеть создает статистическое описание того, что общего имеют изображения с одной и той же меткой — например, «кошка». Когда сети предъявляют новое изображение, происходит его проверка на наличие аналогичных числовых атрибутов, если совпадение найдется, то изображение объявляется кошкой.
Очевидно, это не то, как учатся дети, говорит Томазо Поджио, специалист по нейровычислениям из Центра мозга, разума и машин, являющегося частью Массачусетского технологического института. «Ребенок видит порядка одного миллиарда изображений в первые два года жизни”, — говорит он. Но лишь немногие из этих изображений как-то помечены или названы. “Мы пока не знаем, как с этим бороться”, — говорит Поджио, — “и как создать машины, которые учатся в основном на не маркированных данных.”
Его лаборатория находится на начальной стадии проекта, который позволит нейронной сети выполнять обучение без учителя, находить паттерны в не маркированных видео. „Мы знаем, что животные и человек могут это делать“, — говорит Поджио. — »Вопрос, как?”
Яминс занимается проблемой обучения без учителя, разрабатывая программы, которые ведут себя как дети в игре, которые опрашивают свое окружение через случайные взаимодействия, и постепенно развивают понимание того, как работает мир. По существу он программирует любопытство, чтобы мотивировать компьютер исследовать окружение в надежде, что появятся новые модели поведения.
Другой нерешенный вопрос заключается в том, являются ли некоторые аспекты интеллекта «установленными» эволюцией. Например, люди, вероятно, предрасположены к распознаванию лиц, дети делают это с первых часов жизни. Возможно, предполагает Поджио, наши гены кодируют механизм быстрого и раннего обучения этой задаче. Расшифровка того, является ли эта идея правильной, может позволить ученым выработать один из способов помочь машинам учиться. Другие исследователи изучают нейронные основы морали. ”Люди боятся «злобных» машин», — говорит Поджио. «Мы, вероятно, должны лучше понять, как возникает наше моральное поведение, если хотим построить хорошие машины, этические машины.” [Tomaso Poggio Pub.]
Яминс говорит, что трудно понять, как нейробиология в одиночку сможет раскрыть, как работает обучение без учителя. “Если у вас нет решения для ИИ, если у вас нет ничего, что работает искусственно, у вас не может быть модели мозга”, — говорит он. Вероятно, считает он, ученые, занимающиеся ИИ, придумают одно или несколько решений, которые затем нейробиологи смогут проверить.
Ответ на эти загадки поможет создать более интеллектуальные машины, которые будут способны учиться в своей среде, и которые смогут сочетать скорость и вычислительную мощность компьютеров со способностями человека. Обработка данных и возможность моделирования на компьютерах уже приносят результаты в науках о мозге, и это будет только прогрессировать. „ИИ будет иметь огромное влияние на нейробиологию, — говорит Суссилло, — и я хочу участвовать в этом процессе.”
Замечание переводчика. Учитывая специфику аудитории Хабра, не требующей разъяснения таких вопросов, что такое нейронная сеть или глубокое обучение, перевод осуществлен с некоторыми, несущественными для понимания статьи, сокращениями.
Нейробиология и искусственный интеллект: часть вторая – интеллект и представление информации в мозгу
Теперь, вооружившись новым знанем, можно порассуждать о том, каким образом транспорт ионов через мембраны приводит к интеллекту и сознанию. Правильного, полного и четкого ответа пока никто дать не может, так что будем рассматривать текущую ситуацию на примерах.
Хочу напомнить, что данная серия статей не претендует на детальное описание всех процессов, вовлеченных в когнитивную деятельность мозга, а является описательной, дабы дать интересующимся представление о принципах работы мозга, интеллекта и сознания.
И как же интеллект связан с деятельностью нейронов?
Рис. 1. Источник: UC Irvine, CA
Что же такое интеллект?
Вики: Интеллект (от лат. intellectus — понимание, познание) — это разум, рассудок, умственные способности: учиться из опыта, приспосабливаться, адаптироваться к новым ситуациям, применять знание, чтобы управлять окружающей средой или мыслить абстрактно (из Encyclopedia Britannica). Общая способность к познанию и решению проблем, которая объединяет все познавательные способности индивида: ощущение, восприятие, память, представление, мышление, воображение (из Словарь методических терминов).
Английская википедия дает сразу списком варианты определения интеллекта различными учеными и группами, среди которых наиболее интересными кажутся следующие:
философское:
— общая способность индивида к целенаправленному действию, рациональному мышлению и эффективному взаимодействию с окружением (David Wechsler).
— целенаправленное адаптивное поведение (Sternberg & Salter).
прикладное:
— результат процессов сбора, хранения, доступа, комбинирования, сравнения и использования в новых контекстах информации и умений (Lloyd Humphreys).
абстрактное:
— способность справляться с когнитивной сложностью (Linda Gottfredson).
антропоцентрическое:
— уникальная склонность человеческих существ изменять структуру их когнитивных функций для лучшей адаптации к меняющимся условиям жизненных ситуаций (Reuven Feuerstein).
Американская ассоциация психологов предлагает следующее определение (которое, по-моему, наиболее часто встречается в статьях):
“Индивиды отличаются один от другого в своей способности понимать сложные идеи, эффективно адаптироваться к окружающей среде, учиться из опыта, участвовать в различных формах размышлений, преодолении сложностей путем обдумывания” [1].
Получается, что точного определения нет, а чтобы что-то начать измерять, нужно это что-то детально себе представлять, и уж еще сложнее что-то сделать, у чего нет четкого ТЗ. Поэтому общую проблему интеллекта дробят на подзадачи и уже их пытаются решить, или найти области мозга, ответственные за них. Наиболее распространенный метод изучения функций какой бы то ни было области мозга – найти человека, у которого она не работает (инсульт был или повреждение) и посмотреть чего в его поведении не хватает. Потом результаты множества таких исследований собирают вместе и смотрят, что же получилось.
А получается, например, что общий интеллект (general intelligence – такая придуманная мера, основанная на результатах тестирования людей) не сосредоточен в какой-то одной области мозга, а вполне себе распределен по разным областям и соединениям между ними и “зависит от работы всего мозга” [2]. Это, в свою очередь, приводит нас к выводу, что способности мозга зависят от того, насколько мозг может интегрировать разрозненную информацию [2]. Что подтверждает выдвинутую ранее теорию [3] о связи интеллекта со способностью информации “путешествовать” по разным областям мозга (рис. 1). Таким образом, мало иметь возможность управлять вниманием, работать с памятью и языком, надо все это дело эффективно друг на друга завязать.
Однако, остается непонятно, а получится ли сильный ИИ (strong AI – концепция ИИ, аналогичного по способностям человеческому мозгу) если мы возьмем модули памяти, внимания, языка и т.д., и просто соединим их. И как их нужно соединять, чтобы начался тот самый процесс интеграции информации.
А что же есть информация с точки зрения мозга?
Рис. 2 Источник: cidpusa.org
Возьмем, например, глаз. В нем есть сетчатка, на которую проецируется текущее изображение. Сетчатка состоит из светочувствительных клеток (порядка 120 млн штук трубочек/палочек и колбочек), соединенных со зрительным нервом (через несколько слоев других нейронов) интересным способом (рис 2): заметьте, сначала свет должен пробиться через нервные волокна, а потом только зарегистрируется светочувствительными клетками. Из такой организации следует и природа слепого пятна.
А что же передается по зрительному нерву? А по нему уже передаются action potentials (АР), причем в виде серий импульсов. Причем, было замечено, что у большинства клеток есть свет с “любимой” длиной волны, который увеличивает частоту следования АР, в то время как свет другой длины волны – уменьшает частоту. Соответственно, есть клетки, которые любят более длинноволновое излучение, а есть – любящие коротковолновое [4]. Отсюда следует возможность видеть различные цвета (и, собственно, способ их кодировки). Тут стоит еще отметить, что в один нейрон оптического нерва вещают несколько светочувствительных трубочек и/или колбочек с определенной области (receptive field), причем сигналы из центра этой области и с ее периферии, как правило, антогоничны, т.е. если центр возбуждает нейрон, то периферия наоборот глушит. Получается, что в оптическом нерве как бы два информационных “канала”, один из которых отвечает усилением активности на сигналы светлее фона, а другой – на сигналы темнее фона. Такая организация позволяет реагировать не на общий уровень освещения (как в цифровых камерах), а на локальное изменение освещенности, тем самым повышая динамический диапазон (вот почему мы видим в HDR и откуда берут начало зрительные иллюзии, построенные на освещении).
На данном этапе только спектральные характеристики пришедшей картинки передаются, никакого анализа геометрии или распознавания образов.
Рис. 3 Зрительный тракт
По зрительному нерву все это богатство передается (рис. 3) через различные структуры мозга аж на самый затылок, где и находится зрительная кора (отсюда, кстати, удорился головой – посыпались звездочки). Что характерно, правая половина поля зрения с обоих глаз передается в левое полушарие, а левая половина поля зрения опять же обоих глаз – в правое, что позволяет в области перекрытия обрабатывать сигналы с обоих глаз в одном месте (рис. 4). Но и это еще не все. Часть нервов уходит в претектум (pretectum), который отвечает за рефлекторное сужение зрачков. Но не будем углубляться в схематику ортических сигналов, в конце концов нас же интересует что сам мозг со всем этим делает, что получается интеллект и продвинутая когнитивная деятельность?
Рис. 4 Зоны зрительного тракта
Так вот, до самого визуального кортекса (striate или visual cortex) информация так и идет, как она вышла из глаза, а вот уже в кортексе начинается что-то похожее на распознование взаимного расположения сигналов. Например, были найдены нейроны, активно отзывающиеся на угол наклона предъявляемого прямоугольника (рис. 5), на его длину, направление смещения и другие простейшие аттрибуты изображения. Причем, организация таких нейронов не случайна, а очень даже последовательна и логична (рис. 6) и составляет, как бы, карту из перемежающихся слоев. В результате получается, что визуальный кортекс состоит из повторяющихся модулей, которые могут оценивать определённую область поля зрения по целому набору свойств. И такая структура может быть найдена практически во всех областях кортекса (не только визуального, но и слухового и сенсорного). Кроме того, существует дополнительное разделение путей от lateral geniculate nucleus (LGN) до визуального кортекса, основанное на двух типах приходящих в LGN нейронов (M ganglion cells и P ganglion cells). Эти два вида нейронов имеют разный размер чувствительной области (у М клеток дендриты длиннее) и скорость передачи информации, в результате чего М клетки реагируют сильнее на быстрые стимулы, а Р клетки – на медленные, плюс к этому Р клетки могут передавать информацию о цвете, а М – нет. Значение этих двух путей таково: повреждение М клеток приводит к уменьшению способности реагировать на быстрое изменение ситуации не затрагивая при этом способность видеть в цвете, в то время как повреждения Р клеток существенно влияют на качество зрения, но не влияют на реакцию на быстрые раздражители. Есть еще третий путь – через К клетки, которые в основном передают информацию о коротковолновых стимулах, но про его роль известно меньше.
Рис. 5. Отклик нейронов в визуальном кортексе в зависимости от наклона изображения.
Рис. 6. Пространственная организация нейронов в визуальном кортексе, откликающихся на определнные стимулы.
Далее информация поступает в следующие области визуального кортекса (рис. 7), где происходит по-зонная частичная реорганизация и интеграция полученых сведений: например в зоне V4 нейроны откликаются на цвет независимо от движения или направления, а в зоне МТ (middle temporal area) – наоборт, нейроны откликаются исключительно на направление движение края объекта, независимо от его цвета.
Рис. 7. Зоны визуального кортекса.
Повреждения в таких областях приводят к специфическим ощущениям у пациентов. Например, повреждение в зоне МТ приводит к “двигательной слепоте” – невозможности видеть движение: пациент описывал текущий из чайника чай, как замороженый. То есть нейроны до МТ вполне себе обрабатывают полное изображение и человек, вообще говоря, видит все поле зрения, но интеграции двигательной информации в общую картину не происходит и она теряется из сознательного восприятия. Интересный момент в том, что бессознательно такая информация может таки обрабатываться. Известны случаи, когда из-за инсульта в высокоуровневых зонах визуального кортекса человек фактически слеп, но при этом двигаясь по комнате он довольно успешно обходил предметы. Это случалось потому, что хоть пути к сознательной обработке информации были повреждены, связи между моторной и визуальной областями затронуты не были и рефлекторно человек принимал правильные решения, хотя сам объяснить их не мог.
Вот таким замысловатым образом информация достигает мозга и обрабатывается им. И вопросов тут, конечно, больше чем ответов, но, надеюсь, мне удалось хоть немного пролить свет на работу мозга и принципы обработки и интеграции информации.
[1] Intelligence: Knowns and unknowns, Neisser et al., American Psychologist, 1996, 51(2), 77–101.
[2] Distributed neural system for general intelligence revealed by lesion mapping, Glascher et al., PNAS, 2010, 107:10, 4705-4709.
[3] The Parieto-Frontal Integration Theory (P-FIT) of intelligence: Converging neuroimaging evidence, Jung et al., Behavioral and Brain Sciences, 2007, 30, 135-187.
[4] Neural mechanisms of colour vision, De Valois et al., Comprehensive Physiology, 2011, 425-456.






