Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория и методы решения многовариантных неформализованных задач выбора(с примерами из области сварки)

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
8.87 Mб
Скачать

нием вычислительной техники, этап моделирования необхо­ дим и обязателен, поскольку машина может обрабатывать только символы, заменяющие понятия и отношения естест­ венного или предметно-ориентированного языков.

В работе С.А. Бешенкова и Е.А. Ракитиной [7] формали­ зация рассматривается как один из этапов моделирования и поэтому определяется как приведение существенных свойств и признаков объекта моделирования к выбранной форме. В этом определении видна связь между формой пред­ ставления информации и выбранным видом объекта модели­ рования (в нашем случае - задачи).

Для более детального обсуждения данного вопроса це­ лесообразно рассмотреть виды информации в печатных ис­ точниках и их готовность к обработке.

1.6.1. Виды информации в печатных источниках

Знания о предметных областях задач могут находиться в источниках информации в самых разных видах. Ознаком­ ление с литературой показало, что некоторые аспекты фор­ мализации данных рассмотрены в работах по искусственно­ му интеллекту и обработке знаний [13, 23, 64, 69, 71 и др.]. Многими авторами детально проанализированы процедуры, которые называют извлечением, структурированием, концеп­ туализацией и формализацией знаний. Однако в работах по экспертным системам понятия «извлечение» и «формализа­ ция» знаний трактуются весьма своеобразно. Под извлечени­ ем знаний понимается передача знаний специалиста пред­ метной области, участвующего в создании ЭС, - эксперта - инженеру по знаниям (когнитологу), а под формализацией знаний - описание концепций предметной области, то есть поля знаний, на выбранном языке представления знаний,

ми, так как упоминаемые в них объекты и понятия поиме­ нованы произвольными словами и структура знаний в яв­ ном виде не выражена. Такие тексты трудно формализо­ вать и структурировать.

Еще один вид неформализованной информации - это рисунки, под которыми на схеме рис. 3 понимаются фото­ графии, эскизы и другие графические изображения произ­ вольного вида, которые нельзя отнести к схемам (блоксхемам, диаграммам, гистограммам) или графикам.

Остальные, кроме упомянутых, виды информации мож­ но назвать частично формализованными. К ним можно отне­ сти структурированные тексты, тексты с параметрами и таб­ лицы, в которых имеются как текстовые, так и числовые зна­ чения.

Структурированными названы словесно выраженные знания, структура которых - то есть связи между выделен­ ными элементами (объектами) - указана в явном виде. К этой группе относятся, например, различные инструкции и выска­ зывания о необходимых действиях, высказывания о составе рассматриваемых объектов и др.

В технической литературе часто встречаются тексты, смысловое содержание которых сводится к указанию кон­ кретных значений объектов при определенных условиях (тексты с параметрами на схеме рис. 3). Структура таких тек­ стов проще, чем других видов текстовой информации.

С разными видами информации приходится работать поразному. Не вызывает проблем работа с математическими выражениями. Если решение задач заключается в расчетах по формулам, то используются методы математической оптими­ зации. Также не вызывает принципиальных затруднений об­ работка числовой информации, содержащейся в таблицах,

графиках и диаграммах. Поэтому при формировании ПОЗ необходимо из источников информации выбирать для ис­ пользования все формулы, таблицы с цифрами, графики, диа­ граммы, отдельные числовые характеристики понятий и свойств, отношения типа «больше», «меньше», «равно» ит.п. Гораздо более сложной и трудоемкой является работа с неформализованной или не полностью формализованной информацией, в первую очередь с текстами.

1.6.2. Обработка текстовой информации

Вопросы обработки знаний актуальны прежде всего в отношении текстовой информации. Такой вид информации преобладает не только в описании гуманитарных наук, но и в технической литературе. Применительно к сварочному производству ранее отмечалось, что даже в справочниках, не говоря уже о прочей литературе, сидения о сварке излагают­ ся в основном в словесной форме. Напомним мнение англий­ ских специалистов, согласно которому 80-85 % объема зна­ ний о процессе сварки не удается формализовать в математи­ ческой форме [106].

Проведенные нами подсчеты подтверждают тезис о пре­ обладании текстовой формы представления знаний о сварке. Так, в первом томе известного справочника «Сварка в маши­ ностроении» [79] на 492 страницы (без оглавления и преди­ словия) приходится 432 рисунка и 139 таблиц. На 93 страни­ цах нет ни одной таблицы или рисунка.

В монографии В.И. Терещенко и А.В. Ливанова [90] на 179 страницах помещено 56 рисунков, 36 таблиц и 66 фор мул, при этом площадь, занимаемая рисунками и таблицами составляет примерно 21 % общей площади страниц. Значит тексты занимают около 80 %.

Главными задачами обработки текстовой информации являются выборка из нее необходимых данных, их анализ и представление в удобной для дальнейшего использования форме. Рекомендации по выполнению названных процедур разработаны в теории искусственного интеллекта [13, 60, 64, 75 и др.]. Правда, они привязаны к процессу создания экс­ пертных систем, своеобразно трактуют термины извлечения и структурирования знаний и др. В частности, под извлече­ нием знаний понимается передача знаний от эксперта к когнитологу, занимающему построением базы знаний ЭС, а под структурированием знаний - их представление в форме, со­ ответствующей типу базы знаний разрабатываемой системы. Тем не менее имеющиеся наработки могут быть применены и в более узком назначении - для обработки текстовой ин­ формации.

При извлечении из текста (сборе) данных прежде всего надо знать, какие именно сведения необходимо извлекать. Этот вопрос определяется постановкой задачи, а также видом намеченной модели. Как будет показано ниже, в сложных задачах выбора в качестве универсальной модели постановки целесообразно использовать форму таблицы соответствий. Согласно этой форме модели и выражению (5) из текстов не­ обходимо извлекать данные об альтернативных решениях (выходных параметрах), влияющих на выбор факторах (входных параметров) и связях между ними (соответствий).

Обычно выделенные данные фиксируются в предельно сжатой форме, например, в виде записи отдельных слов и словосочетаний, реже - полных предложений абзацев (вы­ держек). Одновременно производится структурирование тек­ стов, которое заключается в определении входных и выход­ ных данных и их отдельных значений, уточнении смысла не­

которых объектов и понятий, выявлении связей между поня­ тиями, выявлении или формировании метапонятий (понятий более высокого уровня обобщения) и, наоборот, детализации (разукрупнении) некоторых понятий, определении стратегий принятия решений, то есть цепочек рассуждений, которые связывают все сформированные понятия в динамическую систему поля знаний.

Авторами работы [13] предложена методика извлечения и структурирования текстовых знаний в виде следующего перечня действий:

1. Составление «базового» списка литературы для озна­ комления с предметной областью и чтение по списку.

2.Выбор текста для извлечения знаний.

3.Первое знакомство с текстом (беглое прочтение).

4.Формирование первой гипотезы о макроструктуре

текста.

5.Внимательное прочтение текста с выписыванием ключевых слов и выражений, то есть выделение «смысловых вех» (компрессия текста).

6.Определение связей между ключевыми словами, раз­ работка макроструктуры текста в форме графа «сжатого тек­ ста» (реферата).

7.Формирование поля знаний на основании макрострук­ туры текста.

По существу авторы тезисно изложили действия, кото­ рые обычно выполняют исследователи, изучая интересую­ щие их вопросы по литературе.

Дальнейшее развитие методы обработки текстовой ин­ формации получили в так называемой гипертекстовой ин­ формационной технологии, базирующейся на достижениях

вобласти искусственного интеллекта и автоматизации рабо­

ты со знаниями. Основы гипертекстовой технологии систем­ но изложены в ряде отечественных работ [68, 98], а основные идеи сводятся к следующему.

Гипертекст - одна из фундаментальных моделей пред­ ставления знаний, выраженных в текстовом виде. Обычный (<одномерный) текст рассматривается как длинная строка, чи­ таемая в одном направлении. Многомерный текст включает

всебя точки ветвления, в которых чтение можно продолжать

внескольких направлениях в зависимости от информационных потребностей читателей. Если в обычном тексте расставить точки ветвления (ссылки), то текст превращается в гипертекст.

Таким образом, при создании гипертекстов обычный текст разделяется на фрагменты, представляющие его семан­ тические единицы (сеты). Между ними устанавливаются свя­ зи, которые наделяются именами. Гипертекст можно читать, двигаясь по разным траекториям, образованным связанными сетами. Переходы выбираются читателем (пользователем).

Вгипертекстовом документе может быть представлено несколько уровней детализации материала. Такие документы моделируются деревьями или сетями. В графовой модели гипертекста вершины соответствуют выделенным фрагмен­ там текста, а ребра - возможным переходам между ними. Каждый путь на графе представляет отдельную линию про­ чтения текста.

Гипертекстовый документ может быть как электронным,

так и бумажным, однако в полной мере функциональность гипертекстов реализуется лишь в электронных гипертексто­ вых документах.

Если не сосредоточивать внимание на новых для боль­ шинства рядовых читателей терминах, то нетрудно заметить, что принципы гипертекстовой технологии уже давно исполь­

выраженные формы - продукционные правила, фреймы и семантические сети [32, 60]. Именно представление зна­ ний в перечисленных формах, без использования матема­ тической символики, открыло дорогу к созданию эксперт­ ных систем, с помощью которых удается автоматизировать решение самого широкого круга задач. Ввиду практической важности данного вопроса его целесообразно рассмотреть отдельно.

1.6.3.Формализация и анализ исходной информации

спомощью графов

Известно, что наглядное представление облегчает ана­ лиз любой информации. Это послужило основой создания теории графов, согласно которой изучаемый объект или яв­ ление представляют в виде геометрического построения, со­ стоящего из узлов и соединяющих их линий - ребер или дуг. Узлам ставят в соответствие отдельные элементы или части объекта, соединительные линии показывают существующие смысловые и информационные связи между узлами.

Методы теории графов широко используются во многих науках, в том числе в системном анализе, теории искусствен­ ного интеллекта, теории автоматизированного проектирова­ ния и многих других для анализа информации, построения моделей и алгоритмов решения задач. Наш опыт проведения исследований показал большую полезность построения гра­ фов не только для анализа готовых моделей и поиска опти­ мальных решений, но и на более ранних этапах решения за­ дач для полного сбора необходимой информации и упроще­ ния решений за счет многоуровневой декомпозиции изучае­ мых объектов, чему в литературе не уделяется достаточного внимания.

Ранее была отмечена сложность формализации связей между понятиями предметной области задачи. Корреляцион­ ный анализ предлагает строить графы статистически значи­ мых связей между элементами изучаемого объекта. Элемен­ ты располагают равномерно по некоторой окружности, а свя­ зи между ними показывают с помощью ребер (ориентиро­ ванных дуг).

Применительно к основным задачам технологии сварки плавлением подобного вида граф показан на рис. 4. (По­ скольку все задачи можно начать со слова «выбор», это слово для краткости опущено.)

Рис. 4. Граф взаимосвязей между основными задачами технологии сварки

Граф строится специалистом, решающим задачу, на ос нове его профессиональных знаний, исходя из целей задачи (в данном случае - разработка технологии сварки плавлени­