Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Физические основы нанотехнологий фотоники и оптоинформатики

..pdf
Скачиваний:
5
Добавлен:
19.11.2023
Размер:
41.54 Mб
Скачать

среди которых Microsoft и Google, используют глубокие нейронные сети для проектирования различных интеллектуальных систем. Вместе с глубокими нейронными сетями приобрел популярность термин «глубокое обучение».

В системах глубокого обучения автоматизируется сам процесс выбора и настройки признаков, т.е. сеть самостоятельно определяет и использует наиболее эффективные алгоритмы для иерархического извлечения признаков. Для метода глубокого обучения характерно обучение на больших выборках при помощи единого оптимизационного алгоритма. Типичные алгоритмы оптимизации настраивают параметры всех операций, одновременно и эффективно оценивают влияние каждого параметра нейросети на ошибку с помощью так называемого метода обратного распространения.

«Способность искусственных нейронных сетей обучаться является наиболее интригующим их свойством. Подобно биологическим системам, нейронные сети сами моделируют себя, стремясь достичь лучшей модели поведения», – отметил профессор Института кибернетических систем НИЯУ МИФИ Владимир Головко.

Прорыв в обучении нейросетей произошел в 2006 г., после научной публикации Джеффри Хинтона с описанием техники предварительной тренировки нейросети. В статье говорилось, что можно эффективно учить многослойную нейронную сеть, если обучать каждый слой отдельно при помощи ограниченной машины Больцмана, а затем дообучать методом обратного распространения ошибки. Эти сети получили название нейронных сетей глубокого доверия (DBN – Deep Belief Networks).

Владимир Головко проанализировал проблематику и основные парадигмы глубокого машинного обучения, предложив новый метод для обучения ограниченной машины Больцмана. Ученый показал, что классическое правило обучения этой нейросети является частным случаем предложенного им метода.

«Американские ученые Минский иПейперт всвое время выявили, что однослойный персептрон с пороговой функцией активации формирует линейную разделяющую поверхность с точки зрения классификации образов и поэтому не может решить задачу Исключающее ИЛИ. Это провоцировало пессимистические выводы насчет дальнейшего развития нейронных сетей. Однако последнее утверждение справедливо только для однослойного персептрона с пороговой или монотонной

241

непрерывной функцией активации – например, сигмоидной. При использовании сигнальной функции активации однослойный персептрон может решить задачу Исключающее ИЛИ, так как он разбивает входное пространство образов на классы при помощи двух прямых», – рассказал Владимир Головко.

В работе также были проанализированы перспективы применения глубоких нейронных сетей для сжатия, визуализации и распознавания данных. Кроме того, Головко предложил подход к реализации семантического кодирования (хеширования) с помощью глубоких автоассоциативных нейронных сетей. Этот метод глубокого обучения может быть очень полезен в поисковиках для нейросетей, которые, по утверждению автора, будут показывать высокую скорость поиска релевантных изображений.

Практическую ценность данных научных разработок сложно переоценить: они уже нашли применение в таких областях, как компьютерное зрение, распознавание речи и биоинформатика.

9.6 Когнитивные технологии2

Когнитивная наука представляет собой междисциплинарный синтез наук: философии, психологии, лингвистики, нейрофизиологии

иинформатики, связанных единой проблематикой (язык – познание – мозг) и общими методологическими принципами. Объектом когнитивной науки являются познавательные процессы и механизмы, выявленные на стыке наук, с помощью которых осуществляется адекватная адаптация человека к реальности.

Когнитивные науки традиционную дуальную картину реальности – объективный физический мир и субъективная психическая реальность – трансформируют, разворачивая в трехмерное измерение: 1) объективный мир, 2) субъективный образ объективного мира, 3) отношения между действительностью и ее репрезентацией, которые, собственно,

иопределяют результат адаптации человека к миру, определяют степень ее адекватности.

Когнитивные технологии – это способы и алгоритмы достижения целей субъектов, опирающиеся на данные о процессах познания, обучения, коммуникации, обработки информации человеком и животными, на представление нейронауки, на теорию самоорганизации, ком-

2 По материалам работ [9–11].

242

пьютерные информационные технологии, математическое моделирование элементов сознания.

Когнитивные технологии – прежде всего, это технологии интерфейсов между человеком и вычислительными системами. Примерами использования этих технологий могут, в частности, служить графические интерфейсы, технологии виртуальной реальности, применяемые при подготовке водителей, пилотов, диспетчеров с помощью специальных компьютерных тренажеров.

Конвергенция информационных и когнитивных технологий не ограничивается использованием компьютеров в изучении мозга, но используется для усиления человеческого интеллекта. Они во все большей степени дополняют естественные способности человека к работе

синформацией. Возможно, в будущем элементы искусственного интеллекта будут интегрироваться в разум человека с использованием прямых интерфейсов «мозг – компьютер», и управление компьютером

спомощью мысли станет таким же обычным, как сегодня клавиатура и «мышь». Согласно прогнозам, это может произойти до 2030 гг.

Когнитивные технологии, произошедшие из области искусственного интеллекта, включают в себя: компьютерное обучение, компьютерное зрение, распознавание речи, обработку естественного языка, робототехнику.

Основные тенденции в области когнитивных технологий. Это создание больших баз знаний на частном и государственном уровне. Вопервых, на уровне крупных компаний международного значения, имеющих сотни тысяч сотрудников, отделения в разных странах и сложное производство, упор делается на предсказательный анализ, который обеспечивают технологии Watson: управление идет не после свершения тех или иных событий, а с учетом всего опыта работы компании в режиме прогнозирования. Во-вторых, на уровне государства создаются системы накопления и обработки знаний в масштабах страны и информации из других стран. Это области, связанные с развитием науки, техники, здоровья нации, социального управления.

Когнитивные системы – современные аппаратно-программные средства, использующие когнитивные технологии. Когнитивные вычислительные машины (нейроморфные компьютеры, рассмотренные выше) могут самообучаться, адаптироваться и развивать полноценное восприятие мира. Для функционирования когнитивной системы любого рода необходим обмен информацией, обеспечиваемый телекоммуникацион-

243

ными сетями. В телекоммуникационных сетях могут использоваться когнитивные системы и технологии, позволяющие радикально улучшить показатели эффективности процессов обмена информацией.

Модель когнитивной инфокоммуникационной системы можно представить в виде многослойной конструкции. Она приведена на рис. 9.37. Для анализа этой модели достаточно определить ключевые функции для пяти подсистем, которые пронумерованы римскими цифрами.

БС – базовая станция, ИСЗ – искуственный спутник земли, КМ – когнитивная медицина, ПР– промышленный робот, ЧС – чрезвычайная ситуация

Рис. 9.37. Модель когнитивной инфокоммуникационной системы

На уровне I располагается подсистема сенсорных датчиков и исполнительных устройств – терминалов. В качестве примеров таких терминалов показаны вагон транспортного средства, светофор, набор датчиков, расположенных на территории дома, и автомобиль. Функции этих технических средств: должны формироваться сообщения, преобразовываться в сигналы, передаваться на верхние уровни модели с целью получения информациидля выполнениясодержащихсявней инструкций.

На уровне II находится телекоммуникационная подсистема. Ее задачи заключаются в сборе информации с уровня I. С этой целью могут использоваться разные технические средства. В качестве примеров показаны спутники и базовые станции сети мобильной связи. Для создания телекоммуникационной подсистемы применяются ресурсы эксплуатируемых сетей связи различного назначения.

244

Уровень III образован информационной подсистемой. Техническими средствами служат серверы, вычислительные центры и базы данных. В состав информационной подсистемы входят центры обработки вызовов, доступ к которым организуется через сети телефонной связи и Интернет.

На уровне IV выполняются вспомогательные функции для когнитивных систем – это подсистема поддержки когнитивных технологий. Типичные примеры: суперкомпьютер, дата центр (data center). Их основная задача – выполнение вычислительных операций по обработке информации с целью принятия решений.

Уровень V определяет подсистему когнитивных прикладных процессов. Когнитивные технологии реализуются именно на этом уровне. Реализуемые прикладные процессы представлены тремя актуальными приложениями: промышленный робот, когнитивная медицина, чрезвычайная ситуация.

Пятиуровневая модель решает основные задачи анализа и синтеза всех компонентов когнитивных систем. Предлагаемая модель допускает деление какой-либо подсистемы на компоненты, для решения специфической задачи подсистемы, напротив, могут объединяться.

Например, когнитивная система IBM Watson уже освоила профессии повара, врача, финансиста и переводчика. Система Watson в 2011 г. «прошла» немного модифицированный формальный тест Тюринга на право называться искусственным интеллектом. Использование когнитивных технологий в бизнесе направлено на решение целого ряда задач, связанных не с большими объемами быстро изменяющихся данных, а с необходимостью оперативно извлекать из этих данных нужную информацию и использовать ее для бизнеса с учетом отраслевого и собственного опыта компании.

IBM Watson относится к системам глубокой обработки естественного языка. Для того чтобы ответ был правильным, система стремится оценить как можно более широкой контекст. Это не только контекст, который содержится в самом вопросе, но и контекст из базы знаний (так называемого корпуса), доступной для поиска ответов.

Система работает в таком порядке:

1. Получив вопрос, Watson выполняет его синтаксический анализ, чтобы выделить основные особенности вопроса.

245

2.Система генерирует ряд гипотез, просматривая корпус в поисках фраз, которые с некоторой долей вероятности могут содержать необходимый ответ.

3.Система выполняет глубокое сравнение языка вопроса и языка каждого из возможных вариантов ответа, применяя различные алгоритмы логического вывода, выполняя разные сравнения: одни осуществляют поиск совпадающих терминов и синонимов, вторые рассматривают временные и пространственные особенности, третьи анализируют подходящие источники контекстуальной информации.

4.Каждый алгоритм логического вывода выставляет одну или несколько оценок, показывающих, в какой степени возможный ответ следует из вопроса, в той области, которая рассматривается данным алгоритмом.

5.Каждой полученной оценке затем присваивается весовой коэффициент по статистической модели, которая фиксирует, насколько успешно справился алгоритм с выявлением логических связей между двумя аналогичными фразами из этой области в «период обучения» Watson. Эта статистическая модель может быть использована впоследствии для определения общего уровня уверенности системы Watson в том, что возможный вариант ответа следует из вопроса.

6.Watson повторяет процесс для каждого возможного варианта ответа до тех пор, пока не найдет ответы, которые будут иметь больше шансов оказаться правильными, чем остальные.

На рис. 9.38 показано, каким образом Watson получает ответ на вопрос.

Рис. 9.38. Схема получения ответа системы Watson на вопрос

246

Особое значение для работы системы Watson имеет корпус знаний. Этот корпус включает в себя всевозможные виды неструктурированных знаний – учебники, методические рекомендации, практические руководства, часто задаваемые вопросы, социальные программы и новости. Watson обрабатывает корпус, преобразуя весь массив содержимого в более удобную для работы форму. В процессе обработки содержимое также подвергается проверке. То есть система обращает внимание на то, соответствующий ли контент содержится в корпусе, и отсеивает статьи или страницы, которые устарели, стали бесполезными или были получены из потенциально ненадежных источников.

Когнитивную систему можно представить в виде нескольких основных элементов. На рис. 9.39 в полях со средней интенивностью

окраски

представлены

текущие возможности

когнитивных

систем.

В полях,

выделенных

болле светлым тоном,

показаны

будущие

возможности когнитивных систем. Это предвидение, ведение диалога, сенсорное восприятие и др.

Рис. 9.39. Элементы когнитивной системы

Укогнитивных систем имеется свой способ сбора, запоминания

иизвлечения информации, аналогичный вопоминаниям человека. Дополнительно конитивные системы имеют основную способность

247

передавать информацию и действовать. Эти способности разделены на определенные поведенческие конструкты:

способность создавать и проверять гипотезы;

способность разбивать на составляющие и строить логические выводы о языке;

способность извлекать и оценивать полезную информацию (даты, местоположение и характеристики).

Когнитивные системы, как и человек, стремятся понять смысл, разделяя высказывания на составляющие элементы и связывая их с контекстом и вероятностью того, что определенные термины будут использованы определенным образом. Уверенность пропорциональна числу фактов, подтверждающих такую вероятность, и числу алгоритмов логического вывода, которые имеются у нас для проверки гипотезы.

Установив некоторый уровень понимания путем декомпозиции задачи в зависимости от её возможной цели, когнитивные системы

могут реконструировать элементы

разными

способами, каждый

из которых можно проверить,

чтобы представить себе новое целое.

На основе этих комбинаций

можно

получать

новые результаты

и ценные знания, позволяющие находить ответы на вопросы и определять, какие вопросы могли вызывать те или иные ответы.

По мере развития функций когнитивных систем они должны приобрести возможность сенсорного восприятия. Не только читать текст, но и слышать, видеть и ощущать, получая элементарное представление о своей среде. Системы смогут опознавать внешние формы и изменение условий, что будет дополнять их контекст новой информацией, расширяя их возможность строить логические выводы и делать заключения, а также учиться вести диалог, планировать различные стратегии решения задач, предвидеть ход событий и экстраполировать это предвидение на новые задачи.

Для развития когнитивных систем необходима генерализация, т.е обобщение, потому что правильность повышается в результате обобщения. Необходимо опознавать и делать логические выводы на основе большей лингвистической вариативности, в более широком ряду обстоятельств, по мере изменения наших знаний, вариативности контекста и изменений в современной лингвистике.

Варианты применения в здравоохранении представляют особый интерес, так как здесь часто требуется точность и правильность. Правильность нужна для того, чтобы соответствующим образом

248

интерпретировать текст в истории болезни и на его основании сделать логический вывод о состоянии больного.

Когды мы сталкиваемся с языковой аномалией (явлением в языке, которое не встречалось раньше), то принимаем решение о том, уникальная ли проблема для этой области или она типична для более широкого спектра языковых проблем. По возможности мы возвращаемся к базовым алгоритмам, можно ли распространить алгоритм на новую ситуацию. При использовании этого подхода мы связываем свое понимание с новым опытом и, таким образом, наращиваем контекстную базу системы.

В результате увеличиваем:

правильность лингвистического вывода (получение верного ответа, с вескими основаниями и своевременно);

область применения;

расширение масштаба – использование для обработки больших массивов данных во многих других областях.

Когнитивные системы усвоят многочисленные способы поведения, помогая людям решать задачи, которые сегодня лежат за гранью их понимания. Мы вступаем в новую эру, когда компьютеры начнут применять когнитивность, свойственную человеку. Это новая важная эра вычислений, которые ориентированы не столько на точность, сколько на правильность. Эра моделей человеческого поведения для решения масштабных вычислительных задач. Эра когнитивных систем.

Новая форма материи – «кристаллы времени»

Впервые их предсказал нобелевский лауреат, теоретик физики Фрэнк Вильчек в 2012 г. Кристаллы времени – это структуры, которые, кажется, находятся в движении даже в основном состоянии.

В 2010 г. нобелевский лауреат по физике Фрэнк Вильчек подготовил лекцию по классификации кристаллов для студентов Массачусетского технологического института. Периодическая структура кристаллов повторяется в пространстве трех измерений. Время является участником пространственно-временного континуума, который имеет четыре измерения: длина, ширина, высота и время. Следовательно, существуют объекты, повторяющиеся не только в пространстве, но и во времени. Они называются кристаллами времени.

249

Обычные кристаллы образуются, когда хаотично размещенные атомы начинают спонтанно собираться в организованную структуру. Образование кристаллической решетки требует энергии, поэтому сами кристаллы находятся на более низком энергетическом уровне, нежели первоначальная хаотичная среда. Места в решетке, которые могут занимать атомы, строго ограничены в своем количестве. Закон симметрии природы утверждает, что все места эквивалентны одно другому. Однако, поскольку атомы могут занимать только места в узлах кристаллической решетки, места между этими узлами теряют свою эквивалентность иным точкам пространства. Налицо изменение природных свойств пространства.

Изложенное выше касалось пространственных кристаллов. Вильчек задумался, а как будут себя вести кристаллы времени. К анализу уравнений был привлечен Альфред Шапер, физик-теоретик Университета Кентукки. Решение уравнений возможно только в случае, если кристаллы времени возвращаются в исходное состояние исключительно через дискретный промежуток времени.

Поскольку промежуток времени дискретен, имеется явное нарушение природы симметрии времени. Точно так обычные кристаллы нарушают природу симметрии пространства, кристаллы времени совершают свои хронарные (временные) колебания без затрат энергии. Анализ полученных уравнений показывает, что необходимым условием существования кристаллов времени является их нахождение на стабильном (минимальном энергетическом) уровне. Само движение кристаллов времени представляет собой хронарные колебания возле стабильного положения. По словамВильчека, кристаллывремени трясутся, словножеле.

За экспериментальную проверку взялся (со своими коллегами) профессор Чжан Сян из университета Калифорнии. Идея экспериментаторов заключалась в следующем: облако атомов бериллия загоняется в электромагнитную ловушку, представляющую собой круговое поле. Поскольку атомам бериллия деваться некуда, они обязаны равномерно распределиться по окружности. Силы электростатического отталкивания другого распределения попросту не позволят.

На рис. 9.40 показана экспериментальная реализация кристалла времени.

В электромагнитной ловушке атомы равномерно расположились по окружности, фактически они начали представлять некий газовый кристалл. Сохраняя расстояние между атомами, кольцо бериллия

250