Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 400172.doc
Скачиваний:
14
Добавлен:
30.04.2022
Размер:
2.04 Mб
Скачать

Задача 9. Вычисление параметров теоретического уравнения регрессии

С помощью метода наименьших квадратов (МНК) постройте уравнения регрессии Y(X), Z(Y), Z(X). Нанесите линии регрессии на корреляционное поле.

Методика решения

Параметры линейного уравнения парной регрессии находятся методом наименьших квадратов (МНК). Исходное условие МНК формулируется следующим образом:

т.е. должна быть обеспечена минимальность суммы квадратов отклонений фактических значений результативной переменной ( ) от ее теоретических значений ( ), получаемых на основе уравнения регрессии ( ).

Для отыскания значений параметров а и b, при которых f(a,b) принимает минимальное значение, приравниваем нулю первые частные производные функции:

Преобразуя полученные уравнения, получаем систему нормальных уравнений МНК для прямой:

Решая систему, получаем оценки неизвестных коэффициентов a и b:

Можно найти параметр а, разделив на n первое уравнение системы:

,

отсюда

.

Параметр b может быть выражен следующим образом:

Так как знаменатель этого выражения есть не что иное, как дисперсия переменной x, формула коэффициента регрессии b может быть записана следующим образом:

Найденные параметры а и b подставляем в исходное уравнение и получаем уравнение регрессии.

Задача 10. Нахождение средней и предельной ошибки выборки

Найдите среднюю и предельную ошибки выборки X, Y, Z. Постройте доверительные интервалы для генеральной средней с вероятностью р = 90 %; 95 %; 99,7 %.

Методика решения

Выборочное среднее значение , вычисляемое по выборке ограниченного объема n, будет отличаться от идеального «точного» значения , которое можно было бы получить для бесконечно большой выборки. Разница между выборочным средним и генеральным средним называется предельной ошибкой выборки:

.

Поскольку среднее значение генеральной совокупности ( ) обычно неизвестно, а задача заключается именно в его нахождении, существует следующая процедура для расчета предельной ошибки выборки.

Сначала определяется средняя ошибка выборки (μ):

где ‑ дисперсия признака в генеральной совокупности; п ‑ объем выборочной совокупности.

Такая формула применяется для повторной выборки. При повторном отборе попавшая в выборку единица подвергается обследованию, а затем возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Тем самым вероятность попадания каждой отдельной единицы в выборку остается постоянной на всем протяжении отбора.

При бесповторном отборе попавшая в выборку единица подвергается обследованию и в дальнейшей процедуре отбора не участвует. Поэтому вероятность попасть в выборку для оставшихся единиц увеличивается с каждым шагом отбора.

В случае расчета средней ошибки бесповторной выборки применяется скорректированная формула:

,

где N – численность генеральной совокупности. Величина ( ) всегда меньше единицы, поэтому сопоставление приведенных формул свидетельствует о том, что применение бесповторного отбора обеспечивает меньшую ошибку выборки.

Обычно, если объем выборки не превышает 5 % генеральной совокупности, к формуле для бесповторного отбора можно не переходить.

На практике величина дисперсии признака в генеральной совокупности ( ), как правило, неизвестна, поэтому ее заменяют выборочной дисперсией ( ). Это возможно, поскольку доказано, что соотношение и определяется равенством

При большой численности выборочной совокупности сомножитель ( ) стремится к единице и им можно пренебречь.

После нахождения средней ошибки выборки (μ) можно переходить к оценке предельной ошибки (Δ), используя следующую формулу:

,

где tкоэффициент доверия, показывающий, во сколько раз необходимо увеличить среднюю ошибку выборки, чтобы с заданным уровнем вероятности утверждать, что разница между выборочной и генеральной средними не превысит предельной ошибки выборки.

Коэффициент доверия t определяется по таблице значений интегральной функции Лапласа при заданной доверительной вероятности.

Приведем наиболее часто употребляемые уровни доверительной вероятности и соответствующие им значения t.

P(t)

0,683

0,9

0,950

0,954

0,990

0,997

t

1,00

1,64

1,96

2,00

2,58

3,00

Проявление ошибки большей, чем утроенная средняя ошибка выборки, имеет крайне малую вероятность (1 – 0,997 = 0,003 или 0,3 %) и считается практически невозможным событием. Такой уровень доверительной вероятности применяется для расчетов, требующих особенной точности. В большинстве случаев достаточными являются 90 % и 95 % вероятность.

Зная величину выборочной средней ( ) и предельную ошибку выборки ( ), можно определить доверительные интервалы, в которых с заданным уровнем вероятности находится значение генеральной средней:

.