Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

10545

.pdf
Скачиваний:
1
Добавлен:
25.11.2023
Размер:
6.75 Mб
Скачать

09.04.01-УММ-М.1.2.5-ПИС-ЛК09-Онтологические модели представления знаний о предметной области. Применение

онтологий в решении профессиональных задач

Учебник создан в соответствии с Федеральным государственным образовательным стандартом по направлению бакалавриата «Информационные системы и технологии». Рассмотрены современное состояние теоретических и прикладных вопросов

представления знаний в информационных системах, идеология построения

интеллектуальных систем, математический аппарат представления знаний, возможности и пути использования искусственного интеллекта при проектировании

информационных систем. Изложены новые аспекты представления знаний на основе

искусственных нейронных сетей, расчетно-логических систем, генетических

алгоритмов, мультиагентных систем. Приведены примеры практической реализации

представления знаний на базе декларативного языка Пролог. Для студентов

учреждений высшего профессионального образования. Может быть полезен разработчикам и пользователям информационных систем; преподавателям и научным

сотрудникам, сферой интересов которых является интеллектуализация различных

предметных областей; менеджерам и руководителям различного ранга, желающим

самостоятельно ознакомиться с современным состоянием информационных

технологий.

Подробнее: https://lavkababuin.com/predstavlenie-znaniy-v-informacionnyh-sistemah-2-e- izd-ster-650564/

[4] Остроух, А. В. Интеллектуальные информационные системы и технологии

[Электронный ресурс] : монография / А. В. Остроух, А. Б. Николаев. Санкт-Петербург:

Лань, 2019. - 308 с.

В монографии изложены концептуальные основы и методы представления знаний в интеллектуальных системах. Рассмотрены различные подходы, применяемые при

проектировании и разработке интеллектуальных систем и технологий в

транспортном комплексе, а также рассмотрены тенденции развития систем

искусственного интеллекта.

Монография может быть использована для формирования профессиональной

компетентности студентов высших учебных заведений, аспирантов и научных сотрудников обучающихся и ведущих научные исследования в области разработки и

практического применения систем искусственного интеллекта по укрупнённой

группе направлений подготовки "Информатика и вычислительная техника".

Подробнее: https://www.labirint.ru/books/692861/

Ссылки на открытые ресурсы (он-лайн-курсы, видеоуроки и т.д.)

[5]

iСписок рекомендуемой литературы может быть более широким по сравнению со списком литературы, указанным в рабочей программе

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

Прикладные интеллектуальные системы

Конспект лекции 10. Semantic Web (Семантическая паутина). Поиск знаний

в семантической паутине.

Аннотация: В лекции рассказывается о построении семантической паутины и её применении в практических задачах. Описан поиск знаний в семантической паутине.

План лекции:

1.Семантические технологии Web (Semantic Web). Определение и общее

назначение технологии. Преимущества семантических сетей для интернета.

2.Технологии Semantic Web. Архитектура Semantic Web. Описание стека технологий и как они приведут к реализации Semantic Web.

3.Технологии Semantic Web. XML. XMLSchema.

4.Технологии Semantic Web. RDF.

5.Веб-сервисы (Web-Services). Определение, назначение подходы к созданию.

6.Особенности поисковых систем. Структура организации и алгоритм работы.

7.Язык запросов поисковых систем.

8.Семантическая поисковая система.

9.Онтологии в семантической паутине. Общее определение. Классификация

онтологий.

10.Процесс разработки онтологий для семантической паутины.

11.Компоненты онтологического языка Web на основе OWL.

12.Применение онтологий. Значение онтологий для бизнеса.

13.Задания для самостоятельной работы.

Ключевые слова: Семантическая паутина, semantic web, онтологии, языки создания онтологий, автоматическое наполнение онтологий, XMLSchema, RDF, OWL

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

СОДЕРЖАНИЕ ЛЕКЦИИ:

1. Семантические технологии Web (Semantic Web). Определение и общее назначение

технологии. Преимущества семантических сетей для интернета.

Общее определение понятия семантика - это изучение значений. Семантические

технологии Web помогают выделять полезную информацию из данных, содержания

документов или кодов приложений, опираясь на открытые стандарты. Если компьютер понимает семантику документа, то это не означает, что он просто интерпретирует

набор символов, содержащихся в документе. Это значит, что компьютер понимает

смысл документа.

При создании интернета (веба) предполагалось, что не только люди будут

участвовать в обработке инф-ции, но и машины. Для машин трудно пригодна для обработки информация, представленная в вебе. У машинного робота на данный момент

нет никакого алгоритма выделения семантики из текста.

Семантический веб - расширение для уже существующей сети, такое, что информация в ней снабжена точно определенным значением. Это позволяет человеку и машине

более успешно взаимодействовать.

Каноническими примерами поисковых запросов в семантическом вебе явл.: «Где ближайшая библиотека?» С каждым человеком будет ассоциироваться свой

собственный поисковый агент, который, опираясь на смысловое содержание страниц будет выполнять замысловатые запросы.

Семантический веб будет использоваться для:

1)Семантический поиск – при таком поиске будут выдаваться не те страницы, где встретилось искомое ключевое слово, а лишь те, где есть искомое понятие.

2)Объединение знаний – если будут существовать возможности представления

знаний, то интернет превратиться в глобальную БЗ.

3)Всепроникающие вычисления.

Семантические технологии Web очерчивают общие рамки, позволяющие осуществлять обмен данными и их многократное использование в различных приложениях,

корпорациях и даже сообществах. Семантические технологии Web -это эффективный способ представления данных в интернете. Такую структуру также можно символически отождествить с базой данных, которая связана в глобальном масштабе с содержанием документов в интернете. Причем эта связь осуществляется способом,

понятным компьютерам. Семантические технологии представляют значения с помощью

онтологии и обеспечивают аргументацию, используя связи, правила, логику и условия, оговоренные в онтологии.

К семантическим технологиям Web относятся следующие:

1.Глобальная схема имен (URI);

2.Стандартный синтаксис описания данных (RDF);

3.Стандартные способы описания свойств данных (схема RDF);

Стандартные способы описания связей между объектами данных (онтология, определяемая с помощью онтологического языка Web (WebOntologyLanguage)).

Преимущества семантических сетей для интернета:

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

Интернет - это крупнейший из когда-либо существовавших информационных

репозиториев, причем его содержание все время растет и представлено на самых разнообразных языках и практически во всех областях знаний. Но в конечном счете

становится все труднее находить смысл во всем этом содержимом. Поисковые

системы способны находить информацию, содержащую определенные слова, но эта

информация не всегда оказывается именно той, что требуется. Какой-то элемент

всегда оказывается упущенным. Поиск основан на содержании страниц, но не на семантическом значении этого содержания или информации о странице.

Как только будет создан семантический интернет, он даст возможность разметки

всего содержания интернета, описания каждого элемента информации и обеспечения

семантического значения этих элементов. Таким образом, поисковые системы становятся более эффективными, чем сейчас, а пользователи могут находить именно

ту информацию, которая им необходима. Организации, оказывающие различные услуги,

способны индексировать их с особым значением. А пользователи будут в состоянии

оперативно находить эти услуги, используя программные средства на основе

интернета, и использовать их для своей пользы или в сочетании с другими услугами.

2.Технологии Semantic Web. Архитектура Semantic Web. Описание стека технологий

и как они приведут к реализации Semantic Web.

Основная идея создания семантического веба заключается в разработке

специального языка, способного выражать информацию в понятной для машин форме.

На таком языке можно описать как сами данные, так и отношения между этими данными

и правила рассуждения. Это описание экспортируется в веб и становится пригодным

для обработки машиной.

Любой другой язык имеет синтаксис и семантику.

Синтаксис определяет множество правил построения фраз языка, позволяющих

отделить корректные от некорректных.

Семантика – система правил истолкования языковых конструкций. Семантика

определяет смысл предложений языка.

Примером языка с синтаксисом, но без семантики явл. XML. Пример языка с

семантикой, но без синтаксиса – человеческая речь. Было предложено

разрабатывать синтаксис и семантику языка раздельно.

Синтаксис – язык RDF – язык, отвечающий за синтаксис документов семантического

веба. В нем широко используются ссылки на онтологии для определения смысла

понятий.

OWL – язык описания онтологий.

Онтологияэто предметная область, описание классов, объектов и их взаимосвязей

для какой-то предметной области или домена.

Стек технологий семантического веба:

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

URI описывает имя в виде ссылки куда-то. Множество URI – пр-во имен.

План реализации семантического веба:

1.Создать синтаксис для описания знаний, использующий ссылки на онтологии (уже разработан RDF);

2.Язык оприсания онтологий (OWL);

3.Язык для описания веб-сервисов (начато WSDL)$

4.Инструменты чтения и разработки документов семантического веба (jena –

веб-фреймворк, Protege – редактор для описания онтологий)

5.Язык запросов к знаниям, записанным на RDF (начат SPARQL – язык запросов

к веб-документам)

6.Логический вывод знаний.

7.Семантическая поисковая система

Агенты семантического веба.

3.Технологии Semantic Web. XML. XMLSchema.

XML (англ.eXtensibleMarkupLanguage — расширяемый язык разметки; произносится [

икс-эм-э́ль]) — рекомендованный Консорциумом Всемирной паутины язык разметки,

фактически представляющий собой свод общих синтаксических правил. XML —

текстовый формат, предназначенный для хранения структурированных данных

(взамен существующих файлов баз данных), для обмена информацией между

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

программами, а также для создания на его основе более специализированных языков разметки (например, XHTML). XML является упрощённым подмножеством языка SGML.

Теги в XML не заданы с самого начала, а определяются пользователем

самостоятельно.

Ex: <node>

<from>Деканат</from> <to>буриличев </to>

<data>Успеваемость </data> </node>

XML не является заменой HTML, они создавались с различными целями.

XMLфокусируется на том, чем являются данные, а HTML – как эти данные выглядят. XML создавался для того, чтобы ничего не делать. В XMLтеги придумываются самим программистом. XMLиспользуется для отделения данных от представления, обмена

данными, обмена фиксированной информацией, удобной организации совместной

обработки данных.XMLявляется основой для новых языков.

Одним из главных преимуществ XMLявляется расширяемость. Она заключ. В том, что

если мы добавим новый тег или атрибут, то код программы, работающий со старым

XMLдокументом останется рабочим.

Для описания предварительной структуры XMLдокумента используется технология

DTD. DTDпредназначена для задания разрешенных блоков XMLдокумента.

XML Schema — язык описания структуры XML-документа. Спецификация XML Schema является рекомендацией W3C.

Как большинство языков описания XML, XML Schema была задумана для определения

правил, которым должен подчиняться документ. Но, в отличие от других языков, XML Schema была разработана так, чтобы её можно было использовать в создании программного обеспечения для обработки документов XML.

После проверки документа на соответствие XML Schema, читающая программа может

создать модель данных документа, которая включает:

словарь (названия элементов и атрибутов);

модель содержания (отношения между элементами и атрибутами и их

структура);

типы данных.

Каждый элемент в этой модели ассоциируется с определённым типом данных,

позволяя строить в памяти объект, соответствующий структуре XML-документа.

Языкам объектно-ориентированного программирования гораздо легче иметь дело с

таким объектом, чем с текстовым файлом.

Другим удобством XML Schema является то, что один словарь может ссылаться на

другой, и, таким образом, разработчик может использовать уже существующие

словари и легче устанавливать и распространять стандарты XML структуры для

определённых задач (например, словарь протокола SOAP).

Файл, содержащий XML Schema, обычно имеет расширение «.xsd» (XML Schema d efinition).

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

Простой пример схемы на XML Schema, расположенной в файле "country.xsd" и

описывающий данные о населении страны:

<?xmlversion="1.0"encoding="utf-8"?> <xs:schema

xmlns:xs="http://www.w3.org/2001/XMLSchema">

<xs:elementname="страна"type="страна"/> <xs:complexTypename="страна">

<xs:sequence> <xs:elementname="название"type="xs:string"/> <xs:elementname="население"type="xs:decimal"/> </xs:sequence>

</xs:complexType>

</xs:schema>

Пример документа, соответствующего этой схеме:

<?xmlversion="1.0"encoding="utf-8"?>

<страна xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="country.xsd">

<название>Франция</название>

<население>59.7</население>

</страна>

4.Технологии Semantic Web. RDF.

К семантическим технологиям Web относятся следующие:

Глобальная схема имен (URI);

Стандартный синтаксис описания данных (RDF);

Стандартные способы описания свойств данных (схема RDF);

Стандартные способы описания связей между объектами данных (онтология, определяемая с помощью онтологического языка Web (WebOntologyLanguage)).

RDF- это спецификация, которая определяет модель представления мира и синтаксис

для сериализации и обмена этой модели. Консорциум всемирной сети

(WorldWideWebConsortium, сокр. W3C) разработал XML-сериализацию для RDF.

RDFXML - это стандартный формат обмена для RDF в семантической сети, хотя он не

является единственным. Например, Notation3 - это отличная тестовая

альтернативная сериализация.

RDF обеспечивает последовательный стандартный способ описания и работы практически с любыми интернет-ресурсами: от текстовых страниц и графиков до аудио-файлов и видео-клипов. Он предлагает синтаксические возможности для взаимодействия сетей и формирует базовый слой для создания семантической сети.

RDF определяет управляемые графы связей, представленные тройками объект-

атрибут-значение. Например, объект О имеет атрибут А со знач. V.

Листинг 1. ПримерRDF XML

<?xm1 version="1.0"?>

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:contact="http://www.w3.org/2000/05/contact#"> <contact:Companyrdf:about="http://www.w3.org/Organization/ contact#WebifySolutions">

<contact:name>Webify Solutions</contact:name> <contact:mailboxrdf:resource="mailto:info@webifysolutions.com"/><contact:phone>1- 800-4WEBIFY</contact:phone>

</contact:Company>

</rdf:RDF>

Эл-т RDF в листинге 1 несет информацию о ресурсе, в данном сл. это компания http:// www.w3.org/Organization/contact#WebifySolutions.

Компания может быть идентифицирована по URIhttp://www.w3.org/Organization/contact

#WebifySolutionsее название -WebifySolutions, ее e-mail - info@webifysolutions.com, а

номер телефона - 1-800-4WEBIFY.

На Рис. 1 показан управляемый граф связей, представляющий ту же информацию. Рис.1. Граф RDF, опис. контактную.инф. компании Webify Solutions

Стандартные способы описания свойств данных - схема RDF

Схема RDF- это семантическое расширение RDF. Она обеспечивает механизмы

описания связанных ресурсов, а также, собственно, этих связей.

Система классов и свойств схемы RDF похожа на систему типов языков объектноориентированного программирования, таких, например, как Java, но отличается от многих других систем. Так, описательный язык словаря RDF определяет свойства в терминах того класса ресурсов, к которому эти свойства относятся. Другие системы

же описывают класс в терминах свойств его элементов.

Определим свойство «автор» с доменом «Документ» и диапазоном «Человек».

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

RDF и схема RDF основаны на XML и схеме XML. Существование стандартов для описания данных (RDF) и их атрибутов (схема RDF) позволяет создавать пакеты легко доступных инструментов для чтения и использования данных из многочисленных источников. То, насколько глубоко различные приложения могут обмениваться данными и использовать их, иногда называется синтаксическим взаимодействием

сетей (syntacticinteroperability). Чем более стандартизированными и распространенными являются эти инструменты работы с данными, тем выше степень

синтаксического взаимодействия сетей и тем легче и привлекательнее становится

использование подхода на основесемантических сетей по сравнению с точечными

интеграционными решениями.

5.Веб-сервисы (Web-Services). Определение, назначение подходы к созданию.

Веб-сервис (веб-служба) – это способ коммуникации между двумя электронными

устройствами через сеть.

W3C: Веб-сервис – это программное обеспечение позволяющее производить общение

между двумя устройствами через сеть. Веб-сервис имеет интерфейс описанный на

машинно-понятном языке (обычно с помощью WebServicesDescriptionLanguage - WSDL).

Достоинства и недостатки:

Достоинства веб-служб:

Веб-службы обеспечивают взаимодействие программных систем независимо от

платформы

Веб-службы основаны на базе открытых стандартов и протоколов. Благодаря

использованию XML достигается простота разработки и отладки веб-служб

Использование интернет-протокола обеспечивает HTTP-взаимодействие

программных систем через межсетевой экран

Недостатки веб-служб:

Меньшая производительность и больший размер сетевого трафика по сравнению с

технологиями RMI, CORBA, DCOM за счёт использования текстовых XML-сообщений.

Используемые технологии:

1.HTTP (HyperTextTransferProtocol — «протокол передачи гипертекста»)

2.WSDL (WebServicesDescriptionLanguage — язык описания веб-сервисов,

основанный на языке XML)

3.XML (eXtensible Markup Language — расширяемыйязыкразметки)

4.JSON (JavaScript Object Notation — текстовыйформатобменаданными,

основанныйна JavaScript)

Виды веб-сервисов:

1. Remote procedure calls (RPC) - Вызовудалённыхпроцедур

09.04.01-УММ-М.1.2.5-ПИС-ЛК10- Semantic Web (Семантическая паутина). Поиск знаний в семантической паутине.

2.SimpleObjectAccessProtocol (SOAP) - Простой протокол доступа к объектам

3.Representational State Transfer (REST) - Передачасостоянияпредставления

Remoteprocedurecalls:

Класс технологий, позволяющих компьютерным программам вызывать функции или

процедуры в другом адресном пространстве (как правило, на удалённых

компьютерах)

Реализация RPC технологии включает в себя два компонента: сетевой протокол для

обмена в режиме клиент-сервер и язык сериализации объектов.

Различные реализации RPC имеют очень отличающуюся друг от друга архитектуру и

разнятся в своих возможностях: одни реализуют архитектуру SOA, другие CORBA или

DCOM. На транспортном уровне RPC используют в основном протоколы TCP и UDP, однако, некоторые построены на основе HTTP.

SOAP:

Протокол обмена структурированными сообщениями в распределённой

вычислительной среде.

SOAP может использоваться с любым протоколом прикладного уровня: SMTP, FTP, HTTP, HTTPS и др. Однако его взаимодействие с каждым из этих протоколов имеет свои особенности, которые должны быть определены отдельно. Чаще всего SOAP

используется поверх HTTP.

Сообщение SOAP выглядит так:

SOAP-конверт

SOAP-заголовок

Элемент заголовка 1 Элемент заголовка 2

Элемент заголовка N

Тело SOAP Элемент тела N

Элемент тела 2 Элемент тела 1

Недостатки:

Использование SOAP для передачи сообщений увеличивает их объём и снижает

скорость обработки. В системах, где скорость важна, чаще используется пересылка

XML-документов через HTTP напрямую, где параметры запроса передаются как

обычные HTTP-параметры.

Хотя SOAP является стандартом, некоторые программы часто генерируют сообщения

внесовместимом формате. Например, запрос, сгенерированный AXIS-клиентом, не

будет понят сервером WebLogic.

REST:

Подход к архитектуре сетевых протоколов, обеспечивающих доступ к

информационным ресурсам.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]