Множественная линейная регрессия
..pdfнято использовать более надежные критерии для оценки тесноты связи, основываясь на рассчитанных значениях коэффициента корреляции.
Здесь может помочь только эталон, с которым можно было бы сравнить вычисленную характеристику. Статистика как раз и занимается созданием таких эталонов, которые называются критическими или табличными значениями.
Процедуру установления корреляционной зависимости принято называть проверкой гипотезы. Ее принято проводить в следующей последовательности:
−вычисление линейного коэффициента корреляции между совокупностями случайных величин xi и yi;
−его статистическая оценка (проверка значимости).
Статистическую оценку коэффициента корреляции проводят путем сравнения его расчетной величины Rрасч (п. 1.2.1) с табличным (или критическим) показателем Rкрит, значения которого находят по специальной таблице.
Если окажется, что Rрасч ≥ Rкрит, то с заданной степенью вероятности (обычно 95 %) можно утверждать, что между рассматриваемыми числовыми совокупностями существует значимая линейная связь. Или по-другому − гипотеза о значимости линейной связи не отвергается.
В случае же обратного соотношения, т.е. при Rрасч < Rкрит, делается заключение об отсутствии значимой связи.
1.2.2. Метод наименьших квадратов
Для определения коэффициентов уравнения регрессии а применяют разные методы (графический, метод средних), однако наибольшее распространение получил метод наименьших квадратов (МНК).
Пусть обсуждается некоторая зависимость y = f(x), которая отражает какой-то процесс, имеющий плавное течение, и поэтому все параметры системы изменяются постепенно, без скачков. В этих случаях экспериментальные точки, нанесенные на графике, должны бы укладываться на некоторую плавную кривую (в частном случае, прямую). Однако на практике определенный разброс экспериментальных точек наблюдается всегда, что связано с изменчивостью (ошибками) регистрируемых измерений. Понятно, что такого разброса удалось бы избежать, если бы результаты измерений оказались совершенно свободными от ошибок, и тогда точки, отвечающие этим результатам, строго ложились бы на соответствующую плавную кривую, или прямую линию. Поэтому все процессы, которые имеют заведомо плавное течение, принято изображать также плавными кривыми, проводя их не через точки, а так, чтобы кривая проходила по возможности ближе ко всем точкам на графике.
Однако такое указание оставляет при построении кривых определенный произвол. Его частично можно устранить основным положением МНК: сумма квадратов отклоне-
ний εi экспериментальных точек от кривой по вертикальному направлению должна быть наименьшей, т.е. сумма квадратов величин εi, равна минимуму ( ∑εi2 = минимум).
Или иначе − сумма квадратов отклонений известных (экспериментальных) значений исследуемой функции и соответствующих значений функции (теоретическими показателями) должна быть наименьшей.
11
Для простоты и наглядности примера будем рассматривать зависимость показателя y от одного фактора x.
Довольно часто при описании аппроксимирующей функции ограничиваются простым видом полиноминальной зависимости, полагая ее линейной, т.е. в виде уравнения прямой y = а0 + а1x. Здесь свободный член а0 характеризует сдвиг и равен тому значению у, которое получается при х = 0, а коэффициент а1 определяет наклон линии.
Отыскание коэффициентов а0 и а1 осуществляется по МНК.
Пусть имеется n экспериментальных точек (n пар наблюдений): (x1, y1); (x2, y2); … (xn, yn). Введем следующие обозначения: уi – это измеренные (экспериментальные) значения изучаемого параметра, а yˆi – его теоретические (рассчитанные по уравнению) показатели.
Предположим, что экспериментальные точки на графике укладываются так, что по ним вполне возможно провести прямую линию. Значения функции yˆi в этом случае можно записать в виде линейного уравнения:
yˆi = а0 + а1xi .
Расстояние по ординате (вертикали) от точки yi до прямой составит:
а0 + а1xi − yi = εi,
где а0 + а1xi = yˆi − рассчитанное (теоретическое) значение функции; yi − ее измеренное (фактическое) значение и εi − разница (расстояние) между yˆi и yi.
В соответствии с МНК полагаем, что искомая прямая будет наилучшей, если сумма квадратов всех расстояний F(a0, a1) = ∑(а0 + а1xi − yi)2 = ∑εi2 окажется наименьшей.
Минимум этой суммы находится по правилам дифференциального исчисления:
∂F |
= 0; |
∂F |
= 0. |
∂a0 |
∂a1 |
∂F∂a0∂F∂a1
=2∑(а0 +а1хi − yi ) = 0,
=2∑(а0 +а1хi − yi ) xi = 0.
В результате для определения а0 и а1 используются следующие уравнения:
n a0 +∑ xi a1 = ∑ yi ,
∑ xi a0 +∑ xi2 a1 = ∑ yi xi ;
|
= |
∑(xi − x ) ( yi − y ) = ∑ yi |
, |
|
a1 |
∑(xi − x ) |
2 |
||
|
|
|
|
|
|
= y −a1 x. |
|
|
|
a0 |
|
|
12
1.2.3. Критерий Фишера
Для проверки значимости (пригодности) полученного уравнения регрессии применяют специальные приемы. Такую проверку называют проверкой адекватности модели.
Для количественной проверки гипотезы об адекватности можно использовать так называемый F-критерий (критерий Фишера):
S 2 / m
F = регр . расч Sост2 / (n −m −1)
Понятие и формулы расчета величин Sрегр2 , Sост2 смотрите в п. 1.2.1.
Здесь число степеней свободы f = n – m – 1, где n – число опытов в эксперименте (т.е. объем случайной выборки); m – число изучаемых факторов.
Чтобы определить, велика или мала ошибка в предсказании эмпирических результатов, ее нужно сопоставить с некоторой статистической величиной (эталоном), принимаемой в качестве критической. Вот почему используется расчетный F-критерий, который затем сравнивают с Fкрит (имеются таблицы как приложения к различным изданиям) при числе степеней свободы v1 = m, v2 = n −m −1 и заданном уровне значимости α (уровень
доверительной вероятности).
Если Fрасч < Fкрит, то модель признается адекватной, т.е. с заданной степенью достоверности (надежности) она верно предсказывает реальный результат. Если же Fрасч > Fкрит, то вывод обратный: данное уравнение не может с заданной надежностью прогнозировать эмпирические данные.
Проверка адекватности модели по критерию Фишера дает возможность ответить на вопрос, во сколько раз хуже по сравнению с опытом предсказывает результат модель.
1.2.4. Ошибки прогнозирования (определение качества регрессионного анализа)
Можно воспользоваться двумя приемами для оценки добротности выполненного нами регрессионного анализа. В статистике для этого используют:
1. Стандартную ошибку, которая дает представление о приблизительной величине ошибки прогнозирования.
Обозначим разность между фактическим значением результативного признака и его расчетным значением как ui:
ui = yi − yˆi ,
где yi – фактическое значение результативного признака y; yˆi – расчетное значение y; ui – разность между ними.
Поскольку (среднее значение остатков) равно нулю, то суммарная погрешность равна остаточной дисперсии.
Остаточная дисперсия находится по формуле:
|
ˆ |
2 |
|
2 |
|
Du = |
∑( yi − yi ) |
|
= |
∑иi |
. |
n −2 |
|
n −2 |
|||
|
|
|
|
13
Стандартная ошибка уравнения находится по формуле:
Sy = Du ,
где Du – остаточная дисперсия.
Относительная погрешность уравнения регрессии вычисляется как
ε = Syy 100 %,
где Sy – стандартная ошибка; у – среднее значение результативного признака.
Стандартная ошибка коэффициента аi вычисляется по формуле:
Sai = nDSy x .
Для вычисления стандартной ошибки коэффициента a0 используется формула:
Sа0 = Sy |
Dx + x2 . |
|
n Dx |
где Dx – величина дисперсии:
|
∑n |
(xi − x )2 |
|
Dx = |
i=1 |
|
. |
|
n −1 |
||
|
|
|
Чем меньше дисперсия, тем лучше уравнение описывает зависимость.
Стандартные ошибки коэффициентов используются для оценивания параметров уравнения регрессии.
Коэффициенты считаются значимыми, если
Sa |
< 0,5; |
Sa |
< 0,5. |
||||
|
i |
0 |
|
||||
|
a |
|
|
a |
|
||
|
|
|
|
||||
|
|
|
|
|
|
||
|
i |
|
|
|
0 |
|
|
2. Коэффициент детерминации (R2), указывающий, какой процент вариации функции у объясняется воздействием факторов хk.
2. ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
Для одного предприятия даны значения 11-ти показателей за пять лет с разбивкой по кварталам, т.е. имеется 20 наблюдений для 11 показателей. Требуется исследовать зависимость одного из показателей (производительность труда) y от всех остальных показателей (факторов) xi, i = 4, 5, … 13. Работа состоит из трех частей:
1.Выбрать три существенных фактора. Выбор можно сделать по двум критериям:
•рассчитать коэффициент корреляции между производительностью труда и каждым фактором (чем больше коэффициент, тем существеннее фактор);
•рассчитать коэффициент парной корреляции между факторами (если для какой-то пары факторов он больше 0,99, то при выборе факторов взять только один фактор из этой пары).
14
2. Построить многофакторную линейную модель (уравнение регрессии) по трем выбранным факторам
y = a0 + a1x1 + a2x2 + a3x3, |
(1) |
где у – производительность труда; х1, х2, х3 – выбранные факторы. Оценить качество уравнения регрессии по следующим критериям:
•коэффициент корреляции (R);
•F-статистика (критерий Фишера);
•стандартная ошибка (Sy).
Оценить степень влияния каждого фактора на исследуемый показатель.
3. Спрогнозировать производительность труда по модели (1) на все кварталы следующего года. Оценить точность прогноза в процентах. Для прогнозирования y значения факторов за соответствующий квартал следующего года из табл. 2 подставить в уравнение регрессии (1), полученные таким образом значения производительности труда сравнить с теми, что в табл. 2. Отклонение в процентах и будет характеризовать точность. Если точность прогноза (ошибки) меньше 7 %, то выбор факторов сделан правильно.
Замечание. Фактор обозначить через хi, где i – номер колонки, в которой находятся статистические данные по этому показателю. Такое обозначение сохранить при любых расчетах.
В табл. 2 представлена информация для каждого варианта. Номер варианта означает две последние цифры года, начиная с которого берутся статистические данные по всем показателям за пять лет.
Например, вариант 88. Для исследования берется информация за 5 лет с 1988 по 1992 год. Прогнозируется производительность труда на 1993 год по кварталам. Для этого значения факторов за соответствующий квартал 1993 года подставляются в модель (1).
15
|
|
|
|
|
|
Статистические данные |
|
|
|
|
Таблица 2 |
|||
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Произво- |
Инвести- |
Капитало- |
Стоимость |
Электрово- |
Уровень |
|
Средний |
Коэффи- |
Коэффи- |
Удельный |
Коэффици- |
|
|
Квар- |
дитель- |
ции на од- |
вооружен- |
машин и обо- |
оруженность |
механи- |
|
возраст |
циент |
циент за- |
вес про- |
ент произ- |
|
Год |
ность |
ного рабо- |
ность одного |
рудования на |
одного рабо- |
зации |
|
оборудо- |
сменности |
грузки |
грессивно- |
водитель- |
|
|
|
тал |
труда, |
тающего, |
работающего, |
одного рабо- |
тающего, |
труда, |
|
вания, |
оборудо- |
оборудо- |
го оборудо- |
ности обо- |
|
|
|
руб. |
руб. |
руб. |
тающего, руб. |
кВт·ч |
% |
|
лет |
вания |
вания |
вания, % |
рудования |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
9 |
10 |
11 |
12 |
13 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
880 |
400 |
1466 |
790 |
3773 |
0,385 |
|
12,94 |
1,443 |
0,744 |
17,12 |
1,354 |
|
1988 |
II |
884 |
453 |
1653 |
798 |
3813 |
0,39 |
|
13,02 |
1,475 |
0,743 |
12,23 |
1,346 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
III |
882 |
443 |
2008 |
813 |
3904 |
0,394 |
|
13,06 |
1,487 |
0,738 |
17,01 |
1,355 |
|
|
|
|
||||||||||||
|
|
IV |
883 |
460 |
2039 |
829 |
4076 |
0,398 |
|
12,99 |
1,475 |
0,746 |
18,13 |
1,35 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
907 |
463 |
2297 |
853 |
4087 |
0,397 |
|
12,93 |
1,468 |
0,748 |
18,97 |
1,355 |
16 |
1989 |
II |
910 |
460 |
2640 |
858 |
4098 |
0,399 |
|
12,85 |
1,482 |
0,746 |
18,67 |
1,36 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
III |
911 |
470 |
2931 |
897 |
4022 |
0,407 |
|
12,95 |
1,474 |
0,749 |
18,91 |
1,365 |
||
|
|
|||||||||||||
|
|
|
||||||||||||
|
|
IV |
913 |
480 |
3065 |
890 |
4045 |
0,409 |
|
12,87 |
1,472 |
0,748 |
18,86 |
1,368 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
923 |
411 |
3233 |
911 |
4061 |
0,413 |
|
12,75 |
1,465 |
0,754 |
18,94 |
1,361 |
|
1990 |
II |
929 |
471 |
3285 |
942 |
4082 |
0,419 |
|
12,81 |
1,481 |
0,751 |
19,01 |
1,369 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
III |
927 |
462 |
3392 |
923 |
3958 |
0,418 |
|
12,85 |
1,485 |
0,749 |
18,98 |
1,374 |
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
IV |
928 |
504 |
3521 |
945 |
3856 |
0,422 |
|
12,79 |
1,477 |
0,756 |
19,11 |
1,371 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
932 |
510 |
3713 |
984 |
3811 |
0,424 |
|
12,81 |
1,489 |
0,756 |
19,06 |
1,373 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1991 |
II |
940 |
520 |
3847 |
987 |
3802 |
0,428 |
|
12,73 |
1,503 |
0,758 |
19,13 |
1,376 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
III |
941 |
580 |
4014 |
987 |
3760 |
0,429 |
|
12,61 |
1,5 |
0,753 |
19,24 |
1,379 |
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
IV |
945 |
588 |
4262 |
993 |
3685 |
0,429 |
|
12,65 |
1,508 |
0,759 |
19,24 |
1,385 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
981 |
590 |
4385 |
1011 |
3811 |
0,428 |
|
12,64 |
1,528 |
0,761 |
19,44 |
1,391 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1992 |
II |
988 |
595 |
4512 |
1017 |
3995 |
0,429 |
|
12,68 |
1,544 |
0,762 |
19,44 |
1,398 |
|
III |
990 |
597 |
4665 |
1035 |
4171 |
0,429 |
|
12,52 |
1,548 |
0,761 |
19,56 |
1,399 |
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
IV |
989 |
600 |
4786 |
1039 |
4295 |
0,432 |
|
12,56 |
1,54 |
0,765 |
19,55 |
1,399 |
16
Продолжение табл. 2
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
|
|
|
I |
1025 |
610 |
4893 |
1087 |
4392 |
0,437 |
12,51 |
1,545 |
0,764 |
19,87 |
1,41 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1993 |
II |
1077 |
615 |
4952 |
1090 |
4487 |
0,441 |
12,52 |
1,577 |
0,775 |
19,85 |
1,415 |
|
|
III |
1079 |
620 |
5053 |
1095 |
4621 |
0,444 |
12,44 |
1,553 |
0,766 |
19,89 |
1,425 |
||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
IV |
1090 |
630 |
5003 |
1099 |
4648 |
0,445 |
12,53 |
1,555 |
0,774 |
19,93 |
1,429 |
|
|
|
I |
1100 |
640 |
5152 |
1117 |
4674 |
0,446 |
12,44 |
1,549 |
0,773 |
19,83 |
1,431 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1994 |
II |
1121 |
640 |
5223 |
1117 |
4726 |
0,45 |
12,44 |
1,556 |
0,781 |
20,13 |
1,438 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
III |
1122 |
645 |
5352 |
1129 |
4802 |
0,455 |
12,4 |
1,568 |
0,787 |
20,22 |
1,439 |
||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
IV |
1138 |
650 |
5355 |
1135 |
4895 |
0,458 |
12,32 |
1,567 |
0,779 |
20,46 |
1,454 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
1151 |
652 |
5501 |
1217 |
4982 |
0,459 |
12,32 |
1,547 |
0,776 |
20,97 |
1,463 |
|
|
1995 |
II |
1234 |
655 |
5541 |
1265 |
5067 |
0,461 |
12,34 |
1,555 |
0,783 |
20,96 |
1,464 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
III |
1269 |
658 |
5542 |
1283 |
5111 |
0,47 |
12,32 |
1,571 |
0,777 |
21,04 |
1,468 |
||
|
|
|||||||||||||
|
|
IV |
1320 |
660 |
5605 |
1285 |
5156 |
0,467 |
12,32 |
1,567 |
0,784 |
21,04 |
1,469 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
17 |
|
I |
1353 |
645 |
5662 |
1328 |
5194 |
0,471 |
12,22 |
1,558 |
0,781 |
21,16 |
1,475 |
|
1996 |
II |
1334 |
650 |
5722 |
1435 |
5202 |
0,474 |
12,23 |
1,568 |
0,788 |
21,34 |
1,475 |
||
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
III |
1383 |
660 |
5787 |
2227 |
5219 |
0,486 |
12,24 |
1,58 |
0,785 |
21,61 |
1,476 |
||
|
|
|||||||||||||
|
|
IV |
1399 |
665 |
5796 |
2595 |
5228 |
0,487 |
12,18 |
1,575 |
0,786 |
21,76 |
1,478 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
1444 |
660 |
6157 |
2947 |
5235 |
0,486 |
12,15 |
1,582 |
0,78 |
22,45 |
1,543 |
|
|
1997 |
II |
1485 |
680 |
6212 |
3135 |
5244 |
0,489 |
12,16 |
1,597 |
0,785 |
22,49 |
1,548 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
III |
1491 |
700 |
6259 |
3563 |
5247 |
0,49 |
12,04 |
1,616 |
0,79 |
22,58 |
1,549 |
||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
IV |
1505 |
750 |
6298 |
3883 |
5251 |
0,493 |
12,11 |
1,605 |
0,786 |
22,59 |
1,549 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
1510 |
760 |
6300 |
3880 |
5260 |
0,495 |
12,1 |
1,61 |
0,79 |
22,6 |
1,55 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1998 |
II |
1535 |
765 |
6310 |
3890 |
5265 |
0,5 |
12,11 |
1,615 |
0,792 |
22,65 |
1,552 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
III |
1530 |
780 |
6315 |
3892 |
5274 |
0,51 |
12,05 |
1,62 |
0,795 |
22,66 |
1,561 |
||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
IV |
1540 |
782 |
6320 |
3895 |
5280 |
0,513 |
12 |
1,625 |
0,794 |
22,71 |
1,562 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
1542 |
785 |
6340 |
3899 |
5290 |
0,524 |
11,94 |
1,63 |
0,8 |
22,75 |
1,566 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1999 |
II |
1550 |
787 |
6335 |
3901 |
5295 |
0,53 |
11,9 |
1,632 |
0,805 |
22,8 |
1,569 |
|
|
III |
1545 |
793 |
6350 |
3910 |
5363 |
0,532 |
11,91 |
1,635 |
0,815 |
22,85 |
1,572 |
||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
IV |
1563 |
795 |
6365 |
3915 |
5370 |
0,535 |
11,85 |
1,639 |
0,82 |
22,89 |
1,575 |
17
Окончание табл. 2
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
|
|
I |
1565 |
801 |
6372 |
3920 |
5374 |
0,538 |
11,8 |
1,645 |
0,825 |
22,9 |
1,578 |
|
2000 |
II |
1570 |
810 |
6370 |
3929 |
5380 |
0,541 |
11,82 |
1,65 |
0,815 |
22,95 |
1,58 |
|
III |
1572 |
815 |
6380 |
3925 |
5392 |
0,543 |
11,8 |
1,655 |
0,83 |
22,99 |
1,582 |
|
|
|
||||||||||||
|
|
IV |
1575 |
820 |
6375 |
3940 |
5390 |
0,548 |
11,73 |
1,66 |
0,832 |
23 |
1,583 |
|
|
I |
1576 |
823 |
6382 |
3942 |
5399 |
0,55 |
11,7 |
1,662 |
0,835 |
23,15 |
1,588 |
|
2001 |
II |
1580 |
825 |
6390 |
3945 |
5405 |
0,552 |
11,65 |
1,665 |
0,839 |
23,1 |
1,59 |
|
III |
1583 |
831 |
6392 |
3948 |
5415 |
0,554 |
11,6 |
1,67 |
0,841 |
23,25 |
1,592 |
|
|
|
||||||||||||
|
|
IV |
1590 |
840 |
6399 |
3952 |
5425 |
0,559 |
11,55 |
1,672 |
0,845 |
23,29 |
1,595 |
|
|
I |
1591 |
835 |
6400 |
3960 |
5429 |
0,561 |
11,54 |
1,678 |
0,847 |
23,3 |
1,6 |
|
2002 |
II |
1596 |
842 |
6410 |
3966 |
5437 |
0,562 |
11,53 |
1,68 |
0,849 |
23,35 |
1,612 |
|
III |
1594 |
845 |
6415 |
3970 |
5480 |
0,564 |
11,5 |
1,685 |
0,85 |
23,37 |
1,613 |
|
|
|
||||||||||||
|
|
IV |
1599 |
850 |
6420 |
3985 |
5495 |
0,567 |
11,45 |
1,689 |
0,851 |
23,39 |
1,62 |
|
|
I |
1605 |
853 |
6430 |
3987 |
5499 |
0,569 |
11,4 |
1,69 |
0,852 |
23,45 |
1,625 |
18 |
2003 |
II |
1620 |
857 |
6429 |
3990 |
5510 |
0,573 |
11,41 |
1,695 |
0,857 |
23,48 |
1,63 |
|
III |
1625 |
855 |
6432 |
3995 |
5530 |
0,574 |
11,38 |
1,7 |
0,855 |
23,49 |
1,634 |
|
|
|
||||||||||||
|
|
IV |
1628 |
860 |
6470 |
3999 |
5541 |
0,575 |
11,3 |
1,71 |
0,859 |
23,54 |
1,655 |
|
|
I |
1635 |
862 |
6465 |
4010 |
5549 |
0,577 |
11,2 |
1,72 |
0,86 |
23,6 |
1,659 |
|
2004 |
II |
1637 |
865 |
6472 |
4110 |
5560 |
0,58 |
11,15 |
1,73 |
0,861 |
23,65 |
1,66 |
|
III |
1640 |
871 |
6475 |
4120 |
5570 |
0,582 |
11,1 |
1,735 |
0,865 |
23,7 |
1,665 |
|
|
|
||||||||||||
|
|
IV |
1645 |
875 |
6480 |
4130 |
5580 |
0,585 |
11 |
1,74 |
0,87 |
23,72 |
1,67 |
|
|
I |
1646 |
874 |
6475 |
4030 |
5580 |
0,587 |
11 |
1,75 |
0,87 |
23,72 |
1,67 |
|
2005 |
II |
1648 |
876 |
6480 |
4035 |
5587 |
0,588 |
10,9 |
1,755 |
0,875 |
23,75 |
1,672 |
|
III |
1647 |
879 |
6484 |
4038 |
5589 |
0,591 |
10,75 |
1,758 |
0,878 |
23,8 |
1,675 |
|
|
|
||||||||||||
|
|
IV |
1650 |
880 |
6485 |
4042 |
5592 |
0,595 |
10,6 |
1,6 |
0,88 |
23,85 |
1,678 |
|
|
I |
1650 |
880 |
6485 |
4040 |
5595 |
0,595 |
10,6 |
1,76 |
0,885 |
23,87 |
1,679 |
|
2006 |
II |
1654 |
883 |
6487 |
4043 |
5597 |
0,6 |
10,55 |
1,765 |
0,888 |
23,89 |
1,682 |
|
III |
1655 |
885 |
6490 |
4045 |
5599 |
0,605 |
10,5 |
1,77 |
0,89 |
23,92 |
1,685 |
|
|
|
||||||||||||
|
|
IV |
1660 |
887 |
6492 |
4048 |
5610 |
0,61 |
10,45 |
1,778 |
0,895 |
23,95 |
1,69 |
|
2007 |
I |
1665 |
890 |
6495 |
4050 |
5612 |
0,612 |
10,44 |
1,78 |
0,897 |
23,95 |
1,692 |
18
3.МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ВЫПОЛНЕНИЮ РАБОТЫ
ВМICROSOFT EXCEL
Методические указания рассмотрим на конкретном примере варианта 88. Исследовать производительность труда (y) от всех показателей (факторов) хi, i = 4, 5,
…, 13.
Возьмем статистические данные за 5 лет с 1988 по 1992 год и занесем их в лист Exсel. Заготовим «шапку» таблицы в ячейках A1; B1; C1; …; М1. Затем разместим сами чи-
словые наборы соответственно в диапазонах ячеек А2:А21, B2:B21, C2:C21; …; М2:М21.
1. Выбрать три существенных фактора, влияющих на производительность труда.
1)Рассчитаем коэффициент парной корреляции между производительностью труда
икаждым фактором.
Корреляция рассматривается как признак, указывающий на взаимосвязь ряда числовых последовательностей. Иначе говоря, корреляция характеризует силу взаимосвязи в данных. Если это касается взаимосвязи двух числовых массивов xi и yi, то такую корреляцию называют парной.
При поиске корреляционной зависимости обычно выявляется вероятная связь одной измеренной величины x (для какого-то ограниченного диапазона ее изменения, например от x1 до xn) с другой измеренной величиной y (также изменяющейся в каком-то интервале y1 … yn). В таком случае мы будем иметь дело с двумя числовыми последовательностями, между которыми и надлежит установить наличие статистической (корреляционной) связи.
Для количественной оценки существования связи между изучаемыми совокупностями случайных величин используется специальный статистический показатель – коэффи-
циент корреляции r.
Коэффициент r − это безразмерная величина, она может меняться от 0 до ±1. Чем ближе значение коэффициента к единице (неважно, с каким знаком), тем с большей уве-
19
ренностью можно утверждать, что между двумя рассматриваемыми совокупностями переменных существует линейная связь. Иными словами, значение какой-то одной из этих случайных величин (y) существенным образом зависит от того, какое значение принимает другая (x).
Если окажется, что r = 1 (или −1), то имеет место классический случай чисто функциональной зависимости (т.е. реализуется идеальная взаимосвязь).
Познакомимся со способом оценки корреляционной связи посредством расчета коэффициента корреляции, рассмотрев конкретный пример.
Зная коэффициент корреляции, можно дать качественно-количественную оценку тесноты связи.
Определим коэффициенты корреляции с помощью Мастера функций. Действуем в следующей последовательности:
•активизируем ячейку D23, куда и будет помещено первое расчетное значение ко-
эффициента корреляции;
•запустим Мастер функций, в всплывающем диалоговом окне укажем требуемую категорию – Статистические, а затем выделим нужную функцию Коррел, после чего – ОК;
•в появившейся панели Коррел нужно заполнить текстовые поля для Массив 1 (диапазон ячеек С2:С21) и для Массив 2 (D2:D21);
•и наконец нажмем кнопку ОК.
20