Материалы всероссийской научно-технической конференции Автоматизир
..pdfROC-АНАЛИЗ КЛАССИФИКАТОРОВ
Аспирант, ассистент Р.Р. Бакунов, студент гр. РИС-11-16 О.А. Кашин
Научный руководитель - д-р экон. наук, профессор Р.А. Файзрахманов
Пермский национальный исследовательский политехнический университет
Основная задача кластеризации данных состоит в разделении ис следуемых объектов на группы, называемые кластерами. Для осуще ствления кластеризации каждый объект должен характеризоваться вектором признаков (набором числовых характеристик) [1].
Классификатор - это реализованный алгоритмический метод, позволяющий по вектору признаков объекта сделать вывод о принад лежности данного объекта определенному набору кластеров. Часто требуется сравнить несколько классификаторов для формирования оптимального решения задачи классификации.
Постановка задачи. Исходными данными является некоторое количество измеренных биомедицинских сигналов, сгруппированных в кластеры, каждый из которых соответствует определенному со стоянию человека.
Данные сигналы формируют набор данных со следующими свойствами:
1.Каждый экземпляр данных выражается четкими числовыми значениями.
2.Класс для каждого конкретного экземпляра данных известен.
3.В результате классификации объект может быть отнесен к од ному из трех кластеров.
Требуется сравнить два классификатора с целью выбора опти мального из них на всех заданных классах исследуемых данных [2].
Теоретические основы. Качество классификации характеризу ется уровнями ошибок первого и второго рода. Ошибка первого рода - это ложный пропуск, когда интересующее событие ошибоч но не обнаруживается. Ошибка второго рода - ложное обнаруже ние, когда при отсутствии события ошибочно выносится решение
оего наличии.
Далее по тексту используются следующие обозначения.
ТР\ - количество верно классифицированных объектов первого кластера; FN2 - количество объектов первого кластера, ошибочно отнесенных ко второму; FN3- количество объектов первого кластера, ошибочно отнесенных к третьему; 77V2 - количество верно классифи цированных объектов второго кластера; FP2 - количество объектов второго кластера, ошибочно отнесенных к первому; 77V3 - количество верно классифицированных объектов третьего кластера; FP3 - коли чество объектов третьего кластера, ошибочно отнесенных к первому.
Доля истинно положительных случаев для первого класса будет вычисляться согласно формуле
T P R X |
ТРХ |
0 ) |
|
|
ТР{ + F N 2 + F N 3 |
Доли ложно положительных случаев будут вычисляться соглас но формулам:
F P R 2 |
РРг |
(2) |
||
T N 2 + F P 2 ’ |
||||
|
|
|||
F P R 2 |
рръ |
(3) |
||
7W3 |
+ F P2 |
|||
|
|
Сравнение классификаторов предлагается осуществлять с помо щью инструментария ROC-кривых.
ROC-кривая (кривая ошибок) - график, позволяющий оценить качество бинарной классификации. Анализ качества классификации с применением ROC-кривых называется ROC-анализом.
Количественную интерпретацию ROC-кривых дает показатель AUC - площадь, ограниченная ROC-кривой и осью доли ложных по ложительных классификаций. Чем выше показатель AUC, тем каче ственнее классификатор, при этом значение 0,5 демонстрирует не пригодность выбранного метода классификации. Объем под ROCповерхностью называется VUS и рассматривается как метрика каче ства классификаторов для небинарных задач классификации данных.
Сравнение классификаторов. Параметром, изменяемым во время работы классификатора, является уровень достоверности полу чаемых данных [1]. На каждое значение этого внутреннего параметра
можно получить свою тройку чисел [TRPU FPR2, FPR3], Далее проводится замена согласно правилу:
x = F P R 2; y = F PR 3; Z = TPRv |
(4) |
После завершения всех вычислений получается фигура, заданная ROC-поверхностью и ее проекциями на плоскости Оху, Oxz, Oyz. Тогда показатель VUS будет равен объему данной фигуры'
На рис. 1 показанаROC -поверхность, полученнаядляпервого классификатора.
The graphic of ROC
The coordinate of Oy |
0 0 |
The coordinate of Ox |
Рис. I. ROC-поверхность для первого классификаторе
Полученное значение VUS равно 0,4216, т.е. объем под поверх ностью на тестовом множестве занимает только 42 % от возможного. Таким образом, рассматриваемый классификатор не пригоден для использованиям (так как минимальный необходимый объем состав ляет 50 %).
На рис.2 приведенаROC -поверхность, полученнаядлявторого классификатора.
ic of ROC
The coordinate of Oy |
0 0 |
The coordinate of Ox |
Рис. 2. ROC-поверхность для первого классификатора
Значение VUS равно 0,5233, т.е. объем под поверхностью на тес товом множестве заполняет 52 % от возможного. Таким образом, второй классификатор пригоден для использования. Также его качественная оценка превышает аналогичную оценку первого клас сификатора.
Заключение. В данной статье был описан и применен специали зированный математический метод сравнения классификаторов.
С помощью данного метода была выполнена оценка двух клас сификаторов. Оказалось, что они обладают довольно скудными ха рактеристиками. Однако второй качественно преобладает над пер вым. Приведенные графики и оценки свидетельствуют о том, что го раздо выгоднее прорабатывать способы улучшения второго класси фикатора, чем первого.
Применение подобных методов сравнения классификаторов по зволит повысить эффективность функционирования информационно измерительных систем в задачах, требующих определения состояния исследуемого объекта на основе классификации сигналов его функ ционирования [2].
Библиографический список
1.Технология анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / A.A. Барсегян, M.C. Куприянов, В.В. Степаненко,
И.И.Холод. - 2-е изд., перераб. и доп. - СПб.: БХВ-Петербург, 2007. - 384 с.
2.Воробьев С.Н. Цифровая обработка сигналов: учебник для студ. учреждений высш. проф. образования. - М.: Ажадемия, 2013. - 320 с.
АНАЛИТИЧЕСКИЙ ОБЗОР МЕТОДОВ ОЦЕНКИ ЭРГОНОМИКИ
ГРАФИЧЕСКИХ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ
Аспирант Д.П. Сорока
Пермский национальный исследовательский политехнический университет
Успешность программного обеспечения на рынке складывается из многих факторов: функциональность, стоимость, техническая под держка, документация, маркетинг, и т.д. Одним из таких важных факторов является удобство пользовательского интерфейса.
При выборе программного обеспечения покупателю необходимо сравнить конкурирующие программы по соответствующим критери ям. В случае с оценкой по критериям функциональности, стоимости, технической поддержки все обстоит достаточно просто - достаточно обратиться к эксперту, который сравнит количество функционала, цены на продукт, объем и подробность документации, и прочее.
В случае с оценкой удобства пользовательских интерфейсов такой подход, как правило, не применим. Что для одного пользователя будет удобным, то для другого пользователя может быть неудобным. В таких ситуациях, как правило, используется методика оценки с помощью фокус-групп, подразумевающая тестирование продукта с помощью определенных групп лиц. Такой подход также не всегда применим и нерационален - привлечь к тестам фокус-группу и необходимых для тестирования специалистов, как правило, дороже и дольше.
Для того чтобы избежать подобных издержек, при оценке поль зовательских интерфейсов применяется оценка по определенным критериям, например, по времени выполнения пользователем опера ций с использованием пользовательских интерфейсов. Такая оценка может проводиться как с привлечением фокус-групп (что дорого и долго), так и с помощью различных моделей и методов.
Определим методы, которые позволяют произвести оценку пользо вательских интерфейсов по критерию времени выполнения операций:
-закон Фиттса [1, 2];
-закон Хика [3];
-KSL-GOMS [4, 5].
Закон Фиттса - закон, согласно которому время достижения це ли прямо пропорционально дистанции до нее и обратно пропорцио нально ее размеру. Исходя из этого закона, чем меньше расстояние до управляющего элемента и больше его размер, тем меньше времени
Секция II АВТОМАТИЗАЦИЯ ТЕХНОЛОГИЧЕСКИХ
ПРОЦЕССОВ И ПРОИЗВОДСТВ
АВТОМАТИЗИРОВАННЫЙ ИЗМЕРИТЕЛЬНЫЙ КОМПЛЕКС
ДЛЯ КОНТРОЛЯ КРУГЛОСТИ ДЕТАЛЕЙ
Студент гр. мКТОП-21 О.А. Яловой, аспирантка Е.П. Решетникова
Научный руководитель-д-ртехн. наук, профессор О.В. Захаров Саратовский государственный технический университет
им. Ю.А. Гагарина
Различные требования к точности, производительности и усло виям контроля привели к созданию множества методов и средств измерения, каждый из которых не может быть универсальным и име ет свою рациональную область применения [1]. На практике для кон троля круглости наибольшее применение получили кругломеры,
координатно-измерительные |
машины (КИМ) и приборы с двух- |
и трехточечным контактом. |
Кругломеры и КИМ имеют высокую |
стоимость, требуют высококвалифицированного обслуживания и специальной организации рабочего места. Поэтому они преимуще ственно применяются в центральных метрологических лабораториях предприятий. В цеховых условиях получили распространение прибо ры с двухточечным контактом (скобы, микрокаторы) или трехточеч ным контактом (комбинации призм и датчиков линейных перемеще ний). При разностном методе измеряют не абсолютные значения ин тересующей величины, а разности между ее последовательными зна чениями. Причем аналитическая зависимость между измеряемой и искомой величинами не известна. Для измерения круглости в цехо вых условиях в основном применяют приборы с трехточечным кон тактом (разнообразные комбинации призм и датчиков малых линей ных перемещений). Именно к данной разновидности измерения отно сится рассматриваемый бесцентровый метод.
Сущность бесцентрового метода измерения состоит в том, что деталь вращается и опирается на базирующие поверхности призмы непосредственно измеряемой поверхностью, а датчик малых линей ных перемещений фиксирует совокупное проявление круглости и отклонения от соосности. Это приводит к возникновению система тической погрешности измерений, достигающей до 100 % [2, 3].
Известные попытки минимизировать методическую погреш ность на основе конструктивных решений прибора и разработки спе