Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

9290

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
2.48 Mб
Скачать

Рис.34. Граф нейросети 11х2х1.

На диаграмме рассеивания (рисунок 35) видно, что не все объекты были определены в пределах допустимой ошибки (0,05). Это говорит о том, что дан-

ная модель недостаточно хорошо обучилась, поэтому попытаемся использовать другие настройки модели (например, 8х4х2х1, 6х3х1).

51

Рис. 35. Диаграмма рассеяния 11х2х1.

Задача 3. «Аналитическая платформа Deductor Academic. Алгоритм k-

means. Карты Кохонена».

В качестве входных значений используются все данные полного внешнего соединения, кроме кода предприятия, названия и даты, которые не пригодятся при анализе.

52

Рис. 36. Настройка назначений столбцов.

При настройке отображений карты Кохонена в качестве входных столбцов выбираются форма собственности, район, год и потребление, а в качестве спе-

циальных – матрица расстояний и матрица плотности попадания.

Рис. 37. Настройка отображений карты Кохонена.

53

Рис. 38. Карта Кохонена.

Полученные карты Кохонена (рис. 38) необходимо проанализировать, что-

бы выявить имеющиеся в данных зависимости.

Алгоритм кластеризации k-means

Рассмотрим, как реализуется в программе Deductor Stduio Academic алго-

ритм кластеризации k-means. При этом исходные данные остались прежними.

54

Рис. 39. Настройка назначений столбцов.

При настройках параметров кластеризации выбирается либо фиксирован-

ное количество кластеров, либо автоматическое определение этого количества

алгоритмом k-means.

Рис. 40. Настройка параметров кластеризации

55

Рис. 41. Визуализатор «Профили кластеров».

Так же, как и при использовании карт Кохонена, полученные алгоритмом k-means кластеры необходимо проанализировать, чтобы выявить имеющиеся в данных зависимости и общие для примеров, попавших в тот или иной кластер,

характеристики.

Задача 4. «Аналитическая платформа Deductor Academic. Деревья ре-

шений»

Рассмотрим решение задачи классификации с применением метода Дере-

вья решений. Если выходной столбец имеет непрерывный тип, необходимо с помощью обработчика «Квантование» сделать его дискретным (рис. 20).

Следуя по шагам, настроим модель Деревья решений на нашу задачу

(рис. 42),

56

Рис. 42. Шаги настройки модели «Деревья решений».

Определим «Стоимость» как выходное поле, разделим выборку на обуча-

ющее и тестовое множества. В результате, получим дерево решений (рис. 43),

демонстрирующее зависимость выходного поле от входных.

57

Рис. 43. Дерево решений.

Рис. 44. Таблица сопряженности.

Визуализатор «Таблица сопряженности» (рис. 44) показывает соотношение правильно и неправильно классифицированных примеров.

Задачи для раздела 3.

Пример 1. Найти хромосому с максимальным количеством единиц.

Допустим, что хромосомы состоят из 12 генов, а популяция насчитывает 8

хромосом. Понятно, что наилучшей будет хромосома, состоящая из 12 единиц.

Выбор исходной популяции хромосом. Необходимо случайным образом сгенерировать 8 двоичных последовательностей длиной 12 битов. Это можно достигнуть, например, подбрасыванием монеты (96 раз, при выпадании «орла» приписывается значение 1, а в случае «решки» - 0). Таким образом, можно сформировать исходную популяцию: сh1 = [111001100101] сh5 =

[010001100100] сh2 = [001100111010] сh6 = [010011000101] сh3 = [011101110011] сh7 = [101011011011] сh4 = [001000101000] сh8 =

58

[000010111100].

Оценка приспособленности хромосом к популяции. Функция приспособ-

ленности определяет количество единиц в хромосоме. Ее значения для каждой хромосомы из исходной популяции: F(ch1) = 7, F(ch5) = 4, F(ch2) = 6, F(ch6) = 5, F(ch3) = 8, F(ch7) = 8, F(ch4) = 3, F(ch8) = 5. Хромосомы ch3 и ch7 характери-

зуются наибольшими значениями функции принадлежности. Они считаются наилучшими кандидатами на решение задачи. Если условие остановки алго-

ритма не выполняется, то на следующем шаге производится селекция хромосом из ткущей популяции.

Cелекция хромосом. Селекция производится по методу рулетки. Для каж-

дой из 8 хромосом текущей популяции получаем сектора рулетки, выраженные в процентах (рис. 45):

Рис. 45.

Принцип работы рулетки. V(ch1) = 15,22 V(ch5)= 8,7 V(ch2) = 13,04 V(ch6)= 10,87 V(ch3) = 17,39 V(ch7)= 17,39 V(ch4) = 6,52 V(ch5)= 10,87.

Розыгрыш с помощью колеса рулетки сводится к случайному выбору чис-

ла из интервала [0, 100], указывающего на соответствующий сектор на колесе,

т.е. на конкретную хромосому. Допустим, что разыграны следующие 8 чисел:

59

70, 44, 9, 74, 44, 86, 48, 23. Это означает выбор хромосом ch7 ch3 ch1 ch7 ch3 ch7 ch4 ch2. Как видно, хромосома ch7 была выбрана трижды, а хромосома ch3

– дважды. Именно эти хромосомы имеют наибольшее значение функции при-

способленности. Однако выбрана хромосома ch4 с наименьшим значением функции приспособленности. Все выбранные таким образом хромосомы вклю-

чаются в так называемый родительский пул.

Применение генетических операторов. Допустим, что ни одна из ото-

бранных в процессе селекции хромосом не подвергается мутации, и все они со-

ставляют популяцию хромосом, предназначенных для скрещивания. Это озна-

чает, что вероятность скрещивания рс =1, а вероятность мутации рм = 0. Допу-

стим, что из этих хромосом случайным образом сформированы пары родите-

лей: сh2 и ch7 ch1 и ch7 ch3 и ch4 ch3 и ch7 Для первой пары случайным обра-

зом выбрана точка скрещивания lk = 4, для второй lk = 3, для третьей lk = 11, для четвертой lk = 5. При этом процесс скрещивания протекает так, как показано на рис.46.

Рис.46. Работа генетического алгоритма.

В результате выполнения оператора скрещивания получается 4 пары по-

томков. Если бы при случайном подборе хромосом для скрещивания были объ-

единены, например, ch3 с ch3 и ch4 с ch7 вместо ch3 с ch4 и ch3 с ch7, а другие

60

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]