Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладной статистический анализ в горном деле (Одномерная математическая статистика и регрессионный анализ)

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
8.85 Mб
Скачать

рить, чтобы не прирезать большие объёмы пустой породы в кровле. Но у комбайна угол подъёма (наклона) не превышает 8–12 градусов, поэтому он не может повторить конфигурацию каждой складки. На некоторых крутых складках комбайн отходит назад и, «гоняясь» за пластом, выравнивается и подрубает почву (перезарубки комбайна). Перезарубки увеличивают площадь сечения выработки и влияют на объём камеры. Это видно на правом графике, на интервале 40–50 м от горловины выработки. Используемая в проекте функциональная зависимость объёма выработки от её протяжённости при фактических замерах объёма даёт отклонения, обусловленные горно-геологичес- кими условиями. Изменения возможны и при наличии погрешностей в замерах. Они небольшие, но отклонения преобразуют первоначально функциональную зависимость в статистическую.

а

б

Рис. 5.1. Зависимость объёма камеры от её длины: а – проектная на площадь сечения комбайна 15 м2, б – на фактическую площадь

Другой пример, по сильвинитовому пласту выполнен отбор проб на компоненты KСl и MgСl2. Если появится возможность установить зависимость одного компонента от другого, то стоимость химических анализов можно будет уменьшить. График рассеяния KСl и MgСl2 приведён на рис. 5.2. Видно, что границы облака рассеивания графика удалены от линии, проходящей по большой оси облака (эллипса рассеивания ab).

151

Рис. 5.2. График рассеивания компонентов KСl и MgСl2

На графиках рассеивания каждая проба в осях KСl / MgСl2 изображена точкой. Обозначим x = KСl; y = MgСl2. Точка со средними значениями компонентов лежит в центре облака. Вычислим среднее значение компонентов из выражения (2.9):

 

 

n

 

 

 

n

 

 

xi

 

 

 

yi

x

 

i 1

;

y

 

i 1

.

 

 

n

 

 

 

n

Рассчитаем дисперсию, как среднюю арифметическую квадратов отклонений значений от их средней арифметической, рассчитаем по формулам (2.14):

 

n

 

 

n

 

 

xi

 

2

 

 

yi

 

2

 

 

x

 

y

 

x2

i 1

;

y2

i 1

.

n

n

 

 

 

 

Тогда коэффициент парной корреляции Пирсона вычисляется по формулам:

 

 

 

 

 

 

 

 

(xi

 

)(yi

 

 

)

 

 

 

 

 

 

 

 

 

x

y

 

 

rxy

xy

x

y

 

,

(5.1)

x y

n x y

 

 

 

152

где xi и yi – значения аргумента и функции х и у соответственно для i-гo объекта, i = 1…n;

n – число объектов;

xy – средние арифметические значения произведений

признаков х на у;

x , y – стандартные отклонения признаков х и у;

x и y – средние арифметические значения признаков х и у

соответственно.

Коэффициент парной корреляции изменяется в пределах от – 1 до + 1. Равенство коэффициента нулю говорит об отсутствии линейной связи. А если коэффициенты равны – 1 или + 1, такое значение показывает наличие функциональной связи. Знак «+» указывает на связь прямо пропорциональную (увеличение или уменьшение одного признака сопровождается аналогичным изменением другого признака), знак «–» – на связь обратно пропорциональную (увеличение или уменьшение одного признака сопровождается противоположным по направлению изменением другого признака).

Сила связи характеризуется абсолютной величиной коэффициента корреляции. Для ориентировочного описания величины коэффициента корреляции используются границы его значений, приведённые в табл. 5.1. В специальной литературе можно встретить и другие границы категорий.

 

Таблица 5.1

Интерпретация значений коэффициента корреляции

 

 

Значениепомодулю

Интерпретация

0

Нетлинейнойсвязи

От0,0до0,2

Оченьслабаякорреляция

От0,21до0,5

Слабаякорреляция

От0,51до0,7

Средняякорреляция

От0,71до0,9

Высокаякорреляция

Свыше0,91

Оченьвысокаякорреляция

1

Связьфункциональная

153

5.2.2. Ранговые корреляции

Помимо выборочного коэффициента корреляции Пирсона, для определения степени взаимосвязи между величинами X и Y можно использовать так называемые ранговые корреляции, при расчете которых используются не сами значения xi , yi , а их

ранги – xi r и yir . Ранговые корреляции полезны по следующим причинам:

встречаются случаи, когда анализируемые величины не могут быть измерены количественно, но могут быть ранжированы, т.е. упорядочены по степени проявления контролируемого свойства. К этому типу можно отнести случаи, когда технологи на основе опыта ранжируют объекты в порядке предпочтения, когда эксперты «на глаз» оценивают износ рабочего органа комбайна, дефектность режущих зубков и другие свойства объектов;

ранговые коэффициенты корреляции в отличие от коэффициента корреляции Пирсона являются робастными оценками (т.е. мало чувствительны к отдельным, резко выделяющимся наблюдениям);

ранговые коэффициенты корреляции в отличие от коэффициента корреляции Пирсона являются непараметрическими оценками (т.е. основанные на ранговых корреляциях выводы не связаны с какими бы то ни было предположениями о функциональной зависимости, описывающей плотность совместного распределения проверяемых величин);

если контролируемые параметры изменяются в широком диапазоне (например, в пределах нескольких порядков), то переход к рангам иногда позволяет «спрямить» и наглядно представить сложные нелинейные зависимости.

Рассмотрим два различных наиболее употребительных на практике способа оценки ранговых корреляций, разработанных соответственно Спирмэном (Spearman) и Кендаллом (Kendall).

154

5.2.2.1. Коэффициент корреляции Спирмэна

Коэффициент корреляции был разработан и предложен в 1904 г. Чарльзом Эдвардом Спирмэном, английским учёным, профессором Лондонского и Честерфилдского университетов. Он используется для выявления и оценки тесноты связи между двумя рядами сопоставляемых количественных переменных. В том случае, если ранги значений, упорядоченных по степени возрастания или убывания, в большинстве случаев совпадают (большему значению одного показателя соответствует большее значение другого показателя, например, при сопоставлении длины камеры и её объёма), делается вывод о наличии прямой корреляционной связи. Если ранги показателей имеют противоположную направленность (большему значению одного показателя соответствует меньшее значение другого, например при сопоставлении длины камеры и остаточного её объёма), то говорят об обратной связи между показателями [25].

Коэффициент корреляции Спирмэна может быть легко посчитан в полной аналогии с коэффициентом корреляции Пирсона. Для этого нужно в формуле (5.1) для расчета выборочного коэффициента корреляции заменить х и у на их ранги и проделать все необходимые вычисления, соответственно, не с самими величинами, а с их рангами. Имеется и эквивалентная формула расчета:

 

n

 

 

 

 

6 di

2

 

 

r 1

i 1

 

; d 2

r r ,

n (n2 1)

 

i

xi yi

где rxi ;ryi – ранги анализируемых переменных.

Алгоритм применения ранговой корреляции Спирмэна для оценки степени связи признаков можно записать в такой последовательности:

1) Выполнить ранжирование значений первой исследуемой переменной rxi , начисляя ранг 1 наименьшему значению, и

155

записать ранги в первый столбец по порядку номеров испытуемых или по возрастанию ранга. При равных значениях переменных им присваивается одинаковый среднеарифметический ранг.

2) Аналогично (по тем же правилам) ранжировать значения второй переменной ryi и занести соответствующие ранги во

второй столбец.

Подсчитать разности di между рангами rxi и ryi по каж-

дой строке и занести их в третий столбец.

Квадраты di2 занести в четвертый столбец и подсчитать

их сумму.

При наличии одинаковых рангов рассчитать поправки:

Ta (a3 a)/12;

Tb (b3 b)/12,

где a,b – объем каждой группы одинаковых рангов в ранговых

рядах A и B.

Рассчитать коэффициент ранговой корреляции Спирмэна rB* по формуле:

a) при отсутствии одинаковых рангов:

r* 1

6 di2

;

n (n2 1)

 

 

 

B

 

б) при наличии одинаковых рангов ryi

:

 

 

 

r* 1 6

di2 Ta Tb

,

 

 

 

B

n (n2 1)

 

 

 

 

где n – количество наблюдений, участвовавших в ранжировании. Рассчитаем коэффициент ранговой корреляции Спирмэна в программе Statistica (рис. 5.3). Входим в меню «Анализ» –

«Непараметрическая статистика» – «Корреляции Спирмэна» – «Тау ( ) Кендалла» – «Гамма». Выбираем переменные «длина камеры» и «объём», рассчитываем корреляцию Спирмэна.

156

а

 

б

 

 

 

 

 

 

в

г

 

 

 

 

 

 

д

Рис. 5.3. Пошаговые действия для расчёта корреляции Спирмэна в программе Statistica: а – входные данные, б – выбор исследуемых переменных, в – результаты расчётов корреляции Спирмэна,

г – Кендалла, д – Пирсона

Расчёты показывают, что полученные значения корреляции Спирмэна совпадают со значениями корреляции Пирсона.

157

5.2.2.2. Коэффициент корреляции Кендалла

Альтернативой предыдущему методу определения корреляции является коэффициент ранговой корреляции -Кендалла (тау Кендалла). Он также позволяет определить взаимосвязи между двумя ранговыми переменными.

Коэффициент ранговой корреляции -Кендалла определяется как разность вероятностей совпадения и противоположностей в рангах.

Для одних и тех же значений переменных значения коэффициента корреляции Спирмэна будет всегда немного больше, чем значения коэффициента ранговой корреляции -Кендалла, тогда как уровень значимости будет одинаков или же у коэффициента корреляции -Кендалла будет немного больше.

Коэффициент корреляции Кендалла использует комбинаторный подсчет числа перестановок, необходимых для превращения одной последовательности чисел в другую. Соответствующую методику расчета лучше всего понять на конкретном примере отработки промышленного пласта на одном из рудников ВКМКС.

По пласту Кр-II камеры отработаны одним ходом комбайна и погашены семь выемочных единиц (ВЕ), одинаковых по геометрическим параметрам (длина ВЕ, ширина и мощность), но с изменяющейся гипсометрией пласта. Из актов на погашение ВЕ выписаны величина разубоживания rxi и сумма потерь в

каждой выемочной единице ryi , %. Требуется установить нали-

чие (или отсутствие) связи между величиной разубоживания и эксплуатационными потерями при добыче. Упорядочим (ранжируем) пары (хi, yi) в соответствии с ростом значений хi и, сопоставив значениям хi значения yi, получим табл. 5.2.

158

Таблица 5.2

Пример ранжирования данных по разубоживанию и эксплуатационным потерям при отработке сильвинитового пласта, %

Показатель

 

 

 

Ранги

 

 

 

1

2

3

4

5

6

7

 

rx

6,4

6,9

7,0

7,1

7,6

7,7

7,8

i

 

 

 

 

 

 

 

ryi

69

67

64

63

65

66

62

В таблице с ранжированной строкой rxi требуется упорядочить значения из строки ryi по возрастанию. При перемещении

каждого значения необходимо считать количество перестановок. При ранжировании выбираем минимальное значение строки ryi , это 62. Оно стоит на последнем месте, его перестав-

ляем влево на первое место, при этом вся строка сдвигается вправо на одну клетку. При перестановке на первое место этому числу требуется 6 перестановок. Получаем последовательность: 62 69 67 64 63 65 66. Следующее по возрастанию число 63, его переставляем влево на три позиции, получаем ряд: 62 63 69 67 64 65 66. Далее 64 переставляем влево через 2 позиции, 65 число перестановок 2, 66 число перестановок 2, и 66 потребует одну перестановку. Число 69 оказывается на последнем месте и не требует перестановок, у него число перестановок 0. Считаем общее количество перестановок: 6 + 3 + 2 + 2 + 2 + 1 + 0 = 16.

Коэффициент корреляции Кендалла определяем по выражению

1 n 4(nS 1),

где S – количество перестановок; n – количество наблюдений.

159

Рассчитаем коэффициент ранговой корреляции Кендалла в программе Statistica (табл. 5.3). Выбираем последовательность команд: «Анализ» – «Непараметрическая статистика» – «Корреляции Спирмэна» – «Тау Кендалла» – «Гамма». Выбираем переменные rx и ry , в которых введены величины разубоживания

и потерь, рассчитываем корреляцию «Тау Кендалла».

Таблица 5.3 Результаты расчёта корреляции Кендалла

Выведем правило, по которому можно было бы сопоставлять числу перестановок некоторый коэффициент корреляции. Минимальное число перестановок (нуль) соответствует ситуации, когда последовательности rx и ry изначально одинаковы,

т.е. строго согласованы между собой; такой ситуации естественно сопоставить коэффициент корреляции + 1. Максимальное число перестановок возникает в ситуации, когда последовательности rx и ry изначально антисогласованны, т.е. упорядоченной

по возрастанию последовательности rx (1, 2, … (n – 1), n) соответствует строго убывающая последовательность ry (n, (n – 1),

…3, 2, 1). Число перестановок S в этом случае есть сумма арифметической прогрессии: Smax = (n – 1) + (n – 2) + … + 2 + 1 = = n (n 1)/2. Описанной ситуации естественно сопоставить

коэффициент корреляции – 1.

Гипотеза о независимости признаков принимается, если полученный уровень значимости оказывается не ниже критиче-

160

Соседние файлы в папке книги