Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Материалы всероссийской научно-технической конференции Автоматизир

..pdf
Скачиваний:
6
Добавлен:
15.11.2022
Размер:
22.56 Mб
Скачать

ROC-АНАЛИЗ КЛАССИФИКАТОРОВ

Аспирант, ассистент Р.Р. Бакунов, студент гр. РИС-11-16 О.А. Кашин

Научный руководитель - д-р экон. наук, профессор Р.А. Файзрахманов

Пермский национальный исследовательский политехнический университет

Основная задача кластеризации данных состоит в разделении ис­ следуемых объектов на группы, называемые кластерами. Для осуще­ ствления кластеризации каждый объект должен характеризоваться вектором признаков (набором числовых характеристик) [1].

Классификатор - это реализованный алгоритмический метод, позволяющий по вектору признаков объекта сделать вывод о принад­ лежности данного объекта определенному набору кластеров. Часто требуется сравнить несколько классификаторов для формирования оптимального решения задачи классификации.

Постановка задачи. Исходными данными является некоторое количество измеренных биомедицинских сигналов, сгруппированных в кластеры, каждый из которых соответствует определенному со­ стоянию человека.

Данные сигналы формируют набор данных со следующими свойствами:

1.Каждый экземпляр данных выражается четкими числовыми значениями.

2.Класс для каждого конкретного экземпляра данных известен.

3.В результате классификации объект может быть отнесен к од­ ному из трех кластеров.

Требуется сравнить два классификатора с целью выбора опти­ мального из них на всех заданных классах исследуемых данных [2].

Теоретические основы. Качество классификации характеризу­ ется уровнями ошибок первого и второго рода. Ошибка первого рода - это ложный пропуск, когда интересующее событие ошибоч­ но не обнаруживается. Ошибка второго рода - ложное обнаруже­ ние, когда при отсутствии события ошибочно выносится решение

оего наличии.

Далее по тексту используются следующие обозначения.

ТР\ - количество верно классифицированных объектов первого кластера; FN2 - количество объектов первого кластера, ошибочно отнесенных ко второму; FN3- количество объектов первого кластера, ошибочно отнесенных к третьему; 77V2 - количество верно классифи­ цированных объектов второго кластера; FP2 - количество объектов второго кластера, ошибочно отнесенных к первому; 77V3 - количество верно классифицированных объектов третьего кластера; FP3 - коли­ чество объектов третьего кластера, ошибочно отнесенных к первому.

Доля истинно положительных случаев для первого класса будет вычисляться согласно формуле

T P R X

ТРХ

0 )

 

ТР{ + F N 2 + F N 3

Доли ложно положительных случаев будут вычисляться соглас­ но формулам:

F P R 2

РРг

(2)

T N 2 + F P 2

 

 

F P R 2

рръ

(3)

7W3

+ F P2

 

 

Сравнение классификаторов предлагается осуществлять с помо­ щью инструментария ROC-кривых.

ROC-кривая (кривая ошибок) - график, позволяющий оценить качество бинарной классификации. Анализ качества классификации с применением ROC-кривых называется ROC-анализом.

Количественную интерпретацию ROC-кривых дает показатель AUC - площадь, ограниченная ROC-кривой и осью доли ложных по­ ложительных классификаций. Чем выше показатель AUC, тем каче­ ственнее классификатор, при этом значение 0,5 демонстрирует не­ пригодность выбранного метода классификации. Объем под ROCповерхностью называется VUS и рассматривается как метрика каче­ ства классификаторов для небинарных задач классификации данных.

Сравнение классификаторов. Параметром, изменяемым во время работы классификатора, является уровень достоверности полу­ чаемых данных [1]. На каждое значение этого внутреннего параметра

можно получить свою тройку чисел [TRPU FPR2, FPR3], Далее проводится замена согласно правилу:

x = F P R 2; y = F PR 3; Z = TPRv

(4)

После завершения всех вычислений получается фигура, заданная ROC-поверхностью и ее проекциями на плоскости Оху, Oxz, Oyz. Тогда показатель VUS будет равен объему данной фигуры'

На рис. 1 показанаROC -поверхность, полученнаядляпервого классификатора.

The graphic of ROC

The coordinate of Oy

0 0

The coordinate of Ox

Рис. I. ROC-поверхность для первого классификаторе

Полученное значение VUS равно 0,4216, т.е. объем под поверх­ ностью на тестовом множестве занимает только 42 % от возможного. Таким образом, рассматриваемый классификатор не пригоден для использованиям (так как минимальный необходимый объем состав­ ляет 50 %).

На рис.2 приведенаROC -поверхность, полученнаядлявторого классификатора.

ic of ROC

The coordinate of Oy

0 0

The coordinate of Ox

Рис. 2. ROC-поверхность для первого классификатора

Значение VUS равно 0,5233, т.е. объем под поверхностью на тес­ товом множестве заполняет 52 % от возможного. Таким образом, второй классификатор пригоден для использования. Также его качественная оценка превышает аналогичную оценку первого клас­ сификатора.

Заключение. В данной статье был описан и применен специали­ зированный математический метод сравнения классификаторов.

С помощью данного метода была выполнена оценка двух клас­ сификаторов. Оказалось, что они обладают довольно скудными ха­ рактеристиками. Однако второй качественно преобладает над пер­ вым. Приведенные графики и оценки свидетельствуют о том, что го­ раздо выгоднее прорабатывать способы улучшения второго класси­ фикатора, чем первого.

Применение подобных методов сравнения классификаторов по­ зволит повысить эффективность функционирования информационно­ измерительных систем в задачах, требующих определения состояния исследуемого объекта на основе классификации сигналов его функ­ ционирования [2].

Библиографический список

1.Технология анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / A.A. Барсегян, M.C. Куприянов, В.В. Степаненко,

И.И.Холод. - 2-е изд., перераб. и доп. - СПб.: БХВ-Петербург, 2007. - 384 с.

2.Воробьев С.Н. Цифровая обработка сигналов: учебник для студ. учреждений высш. проф. образования. - М.: Ажадемия, 2013. - 320 с.

АНАЛИТИЧЕСКИЙ ОБЗОР МЕТОДОВ ОЦЕНКИ ЭРГОНОМИКИ

ГРАФИЧЕСКИХ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ

Аспирант Д.П. Сорока

Пермский национальный исследовательский политехнический университет

Успешность программного обеспечения на рынке складывается из многих факторов: функциональность, стоимость, техническая под­ держка, документация, маркетинг, и т.д. Одним из таких важных факторов является удобство пользовательского интерфейса.

При выборе программного обеспечения покупателю необходимо сравнить конкурирующие программы по соответствующим критери­ ям. В случае с оценкой по критериям функциональности, стоимости, технической поддержки все обстоит достаточно просто - достаточно обратиться к эксперту, который сравнит количество функционала, цены на продукт, объем и подробность документации, и прочее.

В случае с оценкой удобства пользовательских интерфейсов такой подход, как правило, не применим. Что для одного пользователя будет удобным, то для другого пользователя может быть неудобным. В таких ситуациях, как правило, используется методика оценки с помощью фокус-групп, подразумевающая тестирование продукта с помощью определенных групп лиц. Такой подход также не всегда применим и нерационален - привлечь к тестам фокус-группу и необходимых для тестирования специалистов, как правило, дороже и дольше.

Для того чтобы избежать подобных издержек, при оценке поль­ зовательских интерфейсов применяется оценка по определенным критериям, например, по времени выполнения пользователем опера­ ций с использованием пользовательских интерфейсов. Такая оценка может проводиться как с привлечением фокус-групп (что дорого и долго), так и с помощью различных моделей и методов.

Определим методы, которые позволяют произвести оценку пользо­ вательских интерфейсов по критерию времени выполнения операций:

-закон Фиттса [1, 2];

-закон Хика [3];

-KSL-GOMS [4, 5].

Закон Фиттса - закон, согласно которому время достижения це­ ли прямо пропорционально дистанции до нее и обратно пропорцио­ нально ее размеру. Исходя из этого закона, чем меньше расстояние до управляющего элемента и больше его размер, тем меньше времени

Секция II АВТОМАТИЗАЦИЯ ТЕХНОЛОГИЧЕСКИХ

ПРОЦЕССОВ И ПРОИЗВОДСТВ

АВТОМАТИЗИРОВАННЫЙ ИЗМЕРИТЕЛЬНЫЙ КОМПЛЕКС

ДЛЯ КОНТРОЛЯ КРУГЛОСТИ ДЕТАЛЕЙ

Студент гр. мКТОП-21 О.А. Яловой, аспирантка Е.П. Решетникова

Научный руководитель-д-ртехн. наук, профессор О.В. Захаров Саратовский государственный технический университет

им. Ю.А. Гагарина

Различные требования к точности, производительности и усло­ виям контроля привели к созданию множества методов и средств измерения, каждый из которых не может быть универсальным и име­ ет свою рациональную область применения [1]. На практике для кон­ троля круглости наибольшее применение получили кругломеры,

координатно-измерительные

машины (КИМ) и приборы с двух-

и трехточечным контактом.

Кругломеры и КИМ имеют высокую

стоимость, требуют высококвалифицированного обслуживания и специальной организации рабочего места. Поэтому они преимуще­ ственно применяются в центральных метрологических лабораториях предприятий. В цеховых условиях получили распространение прибо­ ры с двухточечным контактом (скобы, микрокаторы) или трехточеч­ ным контактом (комбинации призм и датчиков линейных перемеще­ ний). При разностном методе измеряют не абсолютные значения ин­ тересующей величины, а разности между ее последовательными зна­ чениями. Причем аналитическая зависимость между измеряемой и искомой величинами не известна. Для измерения круглости в цехо­ вых условиях в основном применяют приборы с трехточечным кон­ тактом (разнообразные комбинации призм и датчиков малых линей­ ных перемещений). Именно к данной разновидности измерения отно­ сится рассматриваемый бесцентровый метод.

Сущность бесцентрового метода измерения состоит в том, что деталь вращается и опирается на базирующие поверхности призмы непосредственно измеряемой поверхностью, а датчик малых линей­ ных перемещений фиксирует совокупное проявление круглости и отклонения от соосности. Это приводит к возникновению система­ тической погрешности измерений, достигающей до 100 % [2, 3].

Известные попытки минимизировать методическую погреш­ ность на основе конструктивных решений прибора и разработки спе­

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]