Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

9290

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
2.48 Mб
Скачать

частные случаи этих понятий. В системе, основанной на фреймах, понятие в каждом узле определяется набором атрибутов-слотов (например, имя, цвет,

размер) и значениями этих атрибутов (например, "Запорожец", красный, ма-

ленький). Каждый слот может быть связан со специальными процедурами, ко-

торые выполняются, когда информация в слотах (значения атрибутов) меняет-

ся. С каждым слотом можно связать любое число процедур.

Описание некоторой предметной области в виде фреймов обладает высо-

ким уровнем абстрактности. Фреймовая система не только описывает знания,

но и позволяет человеку описывать метазнания, т.е. правила и процедуры обра-

ботки знаний, выбора стратегий, приобретения и формирования новых знаний.

2.4 Контрольные вопросы

Контрольные вопросы к разделу 1 «История систем поддержки при-

нятия решений. Их классификация».

1.Определите понятие «Система поддержки принятия решений».

2.Типы СППР. Архитектура СППР.

3.Основные компоненты СППР. Какие подсистемы входят в системы под-

держки принятия решений?

4.Как можно классифицировать систему поддержки принятия решений?

5.Функции систем поддержки принятия решений в оценке существующих и гипотетических ситуаций, в которых функционирует предприятие.

6.Какие системы поддержки принятия решений позволяют модифицировать решения системы, опирающиеся на большие объемы данных из разных источников?

7.Какие бывают архитектуры систем поддержки принятия решений?

8.Принципы загрузки, верификации и очистки данных.

9.Понятие качества данных. Основные причины низкого качества данных в

СППР.

10.Методы и средства повышения качества исходных данных.

21

11.Охарактеризуйте возможные условия, в которых менеджеру приходится принимать решения: определенность, риск, неопределенность.

12.В чем проявляется неопределенность при принятии экономических реше-

ний?

13.Почему автоматизация процесса разработки и принятия решения может повысить его эффективность?

14.Любой ли процесс принятия решения можно полностью автоматизиро-

вать?

15.Каковы преимущества и недостатки автоматизации процесса разработки,

принятия и реализации управленческого решения?

Контрольные вопросы к разделу 2 «Интеллектуальные информацион-

ные системы (ИИС)».

1.Дайте определения KDD и Data Mining.

2.Дайте определения задачам Data Mining (классификация, регрессия, кла-

стеризация, ассоциативные правила).

3.Какие существуют алгоритмы Data Mining.

4.Способы машинного обучения: обучение с учителем и без учителя. Мето-

ды формирования тестовой и обучающей выборки.

5.Что представляет искусственная нейронная сеть?

6.Дайте определение искусственного нейрона.

7.Какая операция выполняется в теле нейрона над сигналами, поступающи-

ми по входным связям?

8.Перечислите и поясните применяемые виды активационных функций.

9.В чем заключается процесс обучения нейронной сети?

10.Что называют многослойным персептроном?

11.В чем суть модели Дерево решений.

12.Каким свойством деревьев решений обусловлена их высокая объясняю-

щая способность.

22

13.Для каких моделей используются таблица сопряженности и диаграмма рассеяния и как с их помощью оценить точность модели?

14.Data Mining: задача кластеризации. Методы кластерного анализа. (метод k -средних).

15.Data Mining: описание модели Карта Кохонена.

Контрольные вопросы к разделу 3 «Адаптивные системы с генетиче-

скими алгоритмами».

1.Машинная эволюция. Генетические алгоритмы. В чем состоит идея гене-

тических алгоритмов?

2.Опишите в общих чертах работу генетического алгоритма. Приведите блок-схему генетического алгоритма.

3.Что такое функция приспособленности, нормализованная и средняя при-

способленность?

4.Опишите процесс селекции. Метод рулетки.

5.Перечислите операторы репродукции и приведете примеры их примене-

ния.

6.Проиллюстрируйте работу генетического алгоритма на примере поиска максимума квадратичной функции.

7.Проиллюстрируйте работу генетического алгоритма на примере обучения нейронной сети.

Контрольные вопросы к разделу 4 «Экспертные системы. Инженерия

знаний. Модели знаний».

1.Экспертные системы. Их отличия от других ИИС. Структура ЭС.

2.Классификации экспертных систем. Информационные технологии ЭС.

3.Информация, данные, знания. Свойства знаний. Классификация знаний.

4.Модели представления знаний. Классификация моделей представления знаний. Формальные логические модели.

5.Продукционная модель знаний. Механизмы логического вывода в про-

дукционной модели.

23

6.Представление знаний в виде семантической сети. Вывод на семантиче-

ских сетях.

7.Фреймовые модели знаний. Организация логического вывода во фреймо-

вой модели.

3. Методические указания по подготовке к практическим занятиям

3.1Общие рекомендации по подготовке к практическим занятиям

Входе подготовки к практическим занятиям необходимо изучать основ-

ную литературу, познакомиться с дополнительной литературой. При этом необходимо учесть рекомендации преподавателя и требования учебной про-

граммы.

В соответствии с этими рекомендациями и подготовкой полезно дорабаты-

вать свои конспекты лекции, делая в нем соответствующие записи из литерату-

ры, рекомендованной преподавателем и предусмотренной учебной программой.

Целесообразно также подготовить тезисы для возможных выступлений по всем учебным вопросам, выносимым на практическое занятие.

При подготовке к занятиям можно также подготовить краткие конспекты по вопросам темы. Очень эффективным приемом является составление схем и презентаций.

Готовясь к докладу или реферативному сообщению, желательно обращать-

ся за методической помощью к преподавателю. Составить план-конспект свое-

го выступления. Продумать примеры с целью обеспечения тесной связи изуча-

емой теории с реальной жизнью. Своевременное и качественное выполнение самостоятельной работы базируется на соблюдении настоящих рекомендаций и изучении рекомендованной литературы.

24

3.2 Примеры задач для практических занятий

Задание для раздела 1. (Базовые навыки работы в СППР Deductor Studio

Academic 5.3).

Теоретическая часть

Deductor Studio является аналитическим ядром платформы Deductor. Дан-

ное приложение содержит набор механизмов импорта, обработки, визуализации

иэкспорта данных для быстрого и эффективного анализа информации.

ВDeductor Studio включен полный цикл механизмов, позволяющих полу-

чать информацию из различных источников данных, производить весь цикл об-

работки (очистка, трансформация данных, построение моделей), отображать полученные результаты наиболее удобным способом (OLAP, таблицы, диа-

граммы, деревья решений и пр.) и экспортировать данные.

Работа по анализу данных базируется на выполнении следующих действий

(рис. 1):

 

 

 

импорт данных;

 

 

визуализация;

 

 

 

 

обработка данных;

 

 

экспорт данных.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис.1. Работа аналитического приложения Deductor Studio Academic 5.3.

Отправной точкой для анализа всегда является процедура импорта данных.

25

Полученный набор данных может быть обработан любым доступным спосо-

бом. Результатом обработки также является набор данных, который в свою очередь опять может быть обработан. Результаты обработки можно просмот-

реть множеством способов и экспортировать в наиболее популярные форматы.

Последовательность действий, необходимых для анализа данных, является

сценарием, который можно автоматически выполнять на любых данных.

Сценарий представляет собой иерархическую последовательность обра-

ботки и визуализации набора данных, представленную в виде дерева.

В дереве каждая операция образует узел, заголовок которого содержит имя источника данных, наименование применяемого алгоритма обработки, исполь-

зуемые при этом поля и т.д. Кроме этого, слева от наименования узла стоит значок, соответствующий типу операции или типу выборки данных, имеющих место в узле. Чтобы применить к узлу новый этап обработки или экспорта,

нужно выделить его и запустить соответствующий Мастер. При этом будет об-

разован подчиненный узел.

Если узел имеет подчиненные узлы, то слева от его названия будет распо-

ложен значок «+», щелчок по которому позволит развернуть узел, т.е. сделать видимыми все его подчиненные узлы, при этом значок «+» поменяется на «-».

Щелчок по значку «-» сворачивает все подчиненные узлы.

Главным узлом является узел «Сценарии», который отображается всегда.

Щелчок по значку «-» слева от него сворачивает все дерево сценариев (скрыва-

ет все узлы и подузлы).

Сценарий начинается с импорта данных из произвольного источника. По-

сле импорта может следовать произвольное число обработчиков любой глуби-

ны и сложности. Каждой операции обработки соответствует отдельный узел дерева (рис. 2).

26

Рис. 1. Пример сценария в Deductor

Обработка данных в аналитической платформе Deductor включает в себя различные манипуляции над набором данных.

Визуализация – это отображение импортированных и обработанных дан-

ных. Визуализировать можно любой объект в сценарии обработки. Программа самостоятельно анализирует, каким образом можно отобразить информацию, и

пользователь должен только выбрать нужный вариант (рис. 3, табл. 1).

Обработчики и визуализаторы Deductor

 

 

 

 

 

 

Очистка данных

Трансформация данных

Data Mining

(Добыча данных)

 

 

 

 

Редактирование ано-

Замена пустых значений

Нейронные сети

малий

 

 

 

 

Заполнение пропусков

Квантование значений

Линейная регрессия

Сглаживание

Табличная замена зна-

Автокорреляция

 

 

чений

 

 

Очистка от шумов

Скользящее окно

Прогнозирование

Обнаружение дубли-

Преобразование даты

Деревья решений

катов и противоречий

 

 

 

 

 

 

Группировка

Самоорганизующиеся

 

 

 

 

карты

 

 

Разгруппировка

Ассоциативные пра-

 

 

 

 

вила

 

 

Понижение размерности

Пользовательская

 

 

 

 

модель

 

 

Устранение незначащих

Скрипты

 

 

факторов

 

 

 

 

27

 

 

Рис.3. Классификация обработчиков и визуализаторов в Deductor

Таблица 1

Описание обработчиков и визуализаторов в Deductor

Пиктограмма

Наименование

Описание

 

 

Очистка данных

 

 

 

 

 

 

 

 

 

 

 

 

 

Парциальная обработка

Восстановление, сглаживание и ре-

 

 

 

 

 

дактирование аномальных данных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Факторный анализ

Понижение размерности

входных

 

 

 

 

 

факторов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Корреляционный анализ

Устранение незначащих факторов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дубликаты и противоре-

Выявление дубликатов и противо-

 

 

 

 

чия

речивых записей в исходном наборе

 

 

 

 

 

 

 

 

 

данных

 

 

 

 

 

 

 

 

 

 

 

 

Фильтрация

Фильтрация записей выборки по за-

 

 

 

 

 

данным условиям

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Трансформация данных

 

 

 

 

 

 

 

 

 

 

 

 

 

Настройка набора дан-

Настройку параметров полей

 

 

 

 

ных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Скользящее окно

Преобразование

данных

методом

 

 

 

 

 

скользящего окна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дата и время

Обработка данных в формате «дата»

 

 

 

 

 

и «время»

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Квантование

Квантование значений выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сортировка

Сортировка записей в исходной вы-

 

 

 

 

 

борке

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Слияние

Объединение данных из двух таб-

 

 

 

 

 

лиц

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Замена

Замена значений

по таблице под-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

28

 

 

 

Пиктограмма

Наименование

 

Описание

 

 

 

 

 

 

 

 

 

становки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Группировка

 

Группировка данных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Разгруппировка

 

Восстановление выборки, к которой

 

 

 

 

 

была применена операция группи-

 

 

 

 

 

 

 

 

 

 

ровки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Data Mining (Добыча данных)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Прогнозирование

 

Прогнозирование

динамического

 

 

 

 

 

ряда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Автокорреляция

 

Выполняет

автокорреляционный

 

 

 

 

 

анализ данных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Линейная регрессия

 

Построение модели данных в виде

 

 

 

 

 

набора коэффициентов

линейного

 

 

 

 

 

 

 

 

 

 

преобразования

 

 

 

 

 

 

 

 

 

 

 

 

Логистическая регрессия

Построение бинарной

логистиче-

 

 

 

 

 

ской регрессионной модели

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Нейросеть

 

Обработка данных с помощью мно-

 

 

 

 

 

гослойной нейронной сети

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дерево решений

 

Обработка данных с помощью де-

 

 

 

 

 

ревьев решений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Самоорганизующаяся

Кластеризация данных

 

 

 

 

 

карта

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ассоциативные правила

Обнаружение

зависимостей

между

 

 

 

 

 

связанными событиями

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пользовательская

мо-

Задание модели вручную по форму-

 

 

 

дель

 

лам

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кластеризация

 

Кластеризация

алгоритмом

k -

 

 

 

 

 

means и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

29

 

 

 

 

 

Пиктограмма

Наименование

Описание

 

 

 

 

g - means

 

 

 

 

 

 

 

 

Скрипт

Применение модели к новым дан-

 

 

 

 

ным

 

 

 

 

 

 

 

 

 

Очистка и трансформация данных являются предварительными обработ-

чиками для непосредственного анализа данных

Очистка данных необходима для устранения ошибок, погрешностей,

имеющихся в исходных данных. Очищенные данные содержат наиболее цен-

ную для анализа информацию, из которой исключены противоречивые и дуб-

лирующиеся данные, устранены аномальные выбросы и шумы. Во многих слу-

чаях достаточно провести только очистку данных и выводы будут очевидны.

Кроме того, очистка данных позволяет получить лучшие результаты при ис-

пользовании в дальнейшем любых методов построения моделей.

Парциальная обработка служит для восстановления пропущенных дан-

ных, редактирования аномальных значений и сглаживания данных.

Факторный анализ служит для выбора входных факторов путем указания необходимого порога значимости.

Корреляционный анализ применяется для оценки зависимости выходных полей данных от входных факторов и устранения незначащих факторов.

Дубликаты и противоречия Противоречивыми являются группы записей,

в которых содержатся строки с одинаковыми входными факторами, но разными выходными. В такой ситуации непонятно, какое результирующее значение вер-

но. Противоречивые данные исключаются.

Дубликаты – это записи с одинаковыми входными и выходными данными.

Такие данные приводят к избыточности, поэтому дублирующая информация исключается.

Трансформация данных

Разбиение данных служит для анализа всевозможных временных интер-

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]