- •Лабораторная работа №3-4.
- •Факторы урожайности зерновых культур
- •Матрица корреляционных коэффициентов
- •Модель, включающая х1 и х4:
- •Модель, включающая х2 и х4:
- •Модель, включающая х3 и х4:
- •Модель, включающая х4 и х5
- •Коэффициенты трехфакторной (х1,х3,х4) модели
- •Коэффициенты трехфакторной (х2,х3,х4) модели
- •Коэффициенты трехфакторной (х3,х4,х5) модели
- •Коэффициенты модели, полученной методом пошаговой регрессии
Выполнила: Иванова Е.В. 38 М
Лабораторная работа №3-4.
Модель множественной линейной регрессии.
Выявление мультиколлинеарности и коллинеарности.
Метод пошаговой регрессии.
Задача.
Исследовать зависимость урожайности зерновых культур от целого ряда переменных, характеризующих различные факторы сельскохозяйственного производства.
у – урожайность зерновых культур (тонны/гектары)
х1 – число тракторов приведенной мощности на 100 га
х2 – число зерноуборочных комбайнов на 100 га
х3 – число орудий поверхностной обработки почвы.
х4– количество удобрений, расходуемых на 1 га (т/га)
х5 – количество химических средств защиты растений, расходуемых на 1 га (центнер/га)
Факторы урожайности зерновых культур
Таблица №1
y |
x1 |
x2 |
x3 |
x4 |
x5 |
9,7 |
1,59 |
0,26 |
2,05 |
0,32 |
0,14 |
8,4 |
0,34 |
0,28 |
0,46 |
0,59 |
0,66 |
9 |
2,53 |
0,31 |
2,46 |
0,3 |
0,31 |
9,9 |
4,63 |
0,4 |
6,44 |
0,43 |
0,59 |
9,6 |
2,16 |
0,26 |
2,16 |
0,39 |
0,16 |
8,6 |
2,16 |
0,3 |
2,69 |
0,32 |
0,17 |
12,5 |
0,69 |
0,29 |
0,73 |
0,42 |
0,23 |
7,6 |
0,35 |
0,26 |
0,42 |
0,21 |
0,08 |
6,9 |
0,52 |
0,24 |
0,49 |
0,2 |
0,08 |
13,5 |
3,42 |
0,31 |
3,02 |
1,37 |
0,73 |
9,7 |
1,78 |
0,3 |
3,19 |
0,73 |
0,17 |
10,7 |
2,4 |
0,32 |
3,3 |
0,25 |
0,14 |
12,1 |
9,36 |
0,4 |
11,51 |
0,39 |
0,38 |
9,7 |
1,72 |
0,28 |
2,26 |
0,82 |
0,17 |
7 |
0,59 |
0,29 |
0,6 |
0,13 |
0,35 |
7,2 |
0,28 |
0,26 |
0,3 |
0,09 |
0,15 |
8,2 |
1,64 |
0,29 |
1,44 |
0,2 |
0,08 |
8,4 |
0,09 |
0,22 |
0,05 |
0,43 |
0,2 |
13,1 |
0,08 |
0,25 |
0,03 |
0,73 |
0,2 |
8,7 |
1,36 |
0,26 |
0,17 |
0,99 |
0,42 |
Анализ
Таблица №2
Исследуем пятифакторную модель
|
B |
Среднее квадратичное отклонение (σ) |
t(14) |
p-level
|
a |
3,514595 |
5,418531 |
0,648625 |
0,527078 |
X1 |
-0,00613 |
0,931671 |
-0,00658 |
0,994843 |
X2 |
15,54246 |
21,50311 |
0,7228 |
0,481704 |
X3 |
0,109899 |
0,832545 |
0,132004 |
0,896859 |
X4 |
4,474575 |
1,543454 |
2,899065 |
0,011664 |
X5 |
-2,93251 |
3,088329 |
-0,94955 |
0,358448 |
ŷ = 3, 50119 + 0, 00472x1 + 15, 59911x2 + 0, 10092x3 + 4, 47190x4 + 2, 94181x5
Коэффициент корелляции: r = 0, 71923823
Коэффициент детерминации: R2 = 0, 51730363
Скорректированный коэффициент детерминации: R2 = 0, 34491208
У данной модели достаточно низкий коэффициент детерминации (лишь 51% от доли общей дисперсии результативного показателя y объясняется уравнением пятифакторной модели). Также следует обратить внимание на то, что уровень р-level превышает допустимое значение 0.05:
Таблица №3
-
p-level
Константа
0,528497
X1
0,996028
X2
0,479969
X3
0,905163
X4
0,011708
X5
0,356851
Вывод: пятифакторная модель незначима и неадекватна, т.к. в ней присутствуют незначимые для анализа факторы.
Чтобы определить, какие факторы значимы, проанализируем корреляционную матрицу на выявление: а) самого информативного факторного признака; б) коллинеарных и мультиколлинеарных признаков.