Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Экономико-математические методы и модели. Ч. 1

.pdf
Скачиваний:
0
Добавлен:
20.11.2023
Размер:
21.79 Mб
Скачать

y a0 x1a1 x2a2 xmam .

В качестве факторов выбираются только самые необходимые ресурсы, так как если какой-то фактор xi = 0, то y = 0 (полностью взаимозаменяемые ресурсы).

Такая функция имеет много достоинств: ясный экономический смысл параметров, производственные высших порядков, в большинстве случаев удовлетворительно выравнивает эмпирические данные, удобна для оценки параметров. Функция является линейной относительно логарифмов:

lg y lg a0 a1 lg x1 a2 lg x2 am lg xm .

Параметр а0 интерпретируется как показатель общей эффективности ресурсов. a1 , a2 , , am – коэффициенты эластич-

ности выпуска продукции по соответствующему ресурсу. Это относительная величина показывает, на сколько процентов увеличится выпуск продукции при увеличении соответствующего ресурса на 1 %.

Эластичность исследуемого показателя y по фактору xi определяется по следующей формуле:

δi y xi ,

xi y

отсюда δi i .

Таким образом, параметры степенной функции являются относительными показателями. С их помощью можно оценить значимость каждого фактора. Чем больше параметр, тем больше влияние соответствующего фактора на функцию.

Широкую известность получила функция Кобба–Дугласа

Y a0 La1 Ca2 ,

где Y – национальный доход;

L – затраты труда;

C – затраты капитала.

11

Такие функции используются для анализа и прогнозирования развития экономики.

Для исследования экономики большое значение имеет сумма эластичностей:

A a1 a2 .

Возможны следующие случаи:

А = 1. Тогда при увеличении затрат всех ресурсов в k раз выпуск увеличится тоже в k раз. Стабильное производство.

А < 1. При увеличении затрат всех ресурсов в k раз выпуск увеличится менее чем в k раз. Спад производства.

A > 1. При увеличении затрат всех ресурсов в k раз выпуск увеличивается более чем в k раз. Развитие производства. Эти выводы легко доказываются.

1.2.2.Определение параметров уравнения регрессии

Для определения параметров уравнения регрессии а применяют разные методы (графический, средний, метод экспоненциального сглаживания и др.), однако наибольшее распространение получил метод наименьших квадратов (МНК), в силу его простоты.

Пусть исследуется зависимость y от нескольких факторов x1, x2 , , xm .

y f x1, x2 , , xm .

Суть метода наименьших квадратов заключается в том, чтобы построить такое уравнение регрессии, чтобы сумма квадратов отклонений фактических значений показателя y от вычисленных

по уравнению регрессии yˆ f x1, x2 , , xm была минимальной. Эти отклонения зависят от параметров ( a1 , a2 , , am )

F a0 , a1, , am y yˆ 2 min.

12

Для простоты и наглядности примера будем рассматривать зависимость показателя y от одного фактора x.

Довольно часто при описании аппроксимирующей функции ограничиваются простым видом полиномиальной зависимости, полагая ее линейной, т.е. в виде уравнения прямой y = а0 + + а1x. Здесь свободный член а0 характеризует сдвиг и равен тому значению у, которое получается при х = 0, а коэффициент а1 определяет наклон линии.

Отыскание коэффициентов а0 и а1 осуществляется по МНК. Пусть имеется n экспериментальных точек (n пар наблюдений): (x1, y1); (x2, y2);… ( xn, yn). Введем следующие обозначения: уi – это фактические значения исследуемого показателя, а ŷi – значение показателя, рассчитанное по уравнению регрессии.

Предположим, что экспериментальные точки на графике укладываются так, что по ним вполне возможно провести прямую линию. Значения функции ŷi в этом случае можно записать в виде линейного уравнения

ŷi = а0 + а1 xi,

где а0 + а1 xi = ŷi – значение показателя по уравнению регрессии; yi – значение показателя.

В соответствии с МНК полагаем, что искомая прямая будет

наилучшей, если сумма квадратов всех отклонений F(a0, a1) = = ∑(а0 + а1 xi yi)2 окажется наименьшей.

Минимум этой суммы ищется по правилам дифференциального исчисления, когда частные производные по неизвестным параметрам равны нулю:

 

 

 

 

F

0;

F

0.

 

 

 

 

 

a

 

 

 

 

a

 

 

 

 

 

0

 

1

 

F

2 а0

а1xi

yi 0,

 

 

 

a

 

0

 

 

 

 

 

 

 

 

F

 

 

 

 

 

 

 

 

2 а0

а1xi

yi xi 0;

 

a

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

13

В результате для определения а0 и а1 используются следующие уравнения:

 

xi a1 yi ,

na0

 

 

xi2a1 yi xi ;

xi a0

а xi x yi y ,

1 x x 2

i

a0 y a1x.

1.2.3. Оценка качества модели

Пусть исследуется зависимость y от нескольких факторов в виде уравнения множественной регрессии:

y a0 a1x1 a2 x2 am xm .

Оценка качества уравнения множественной регрессии измеряется различными показателями, из которых наибольшее практическое применение имеют:

коэффициент множественной корреляции R;

стандартная ошибка или среднеквадратическое отклоне-

ние Sy ;

критерий Фишера F.

Рассмотрим подробно определение и смысл этих оценок.

Коэффициент множественной корреляции. Существуют различные аналитические приемы определения коэффициента множественной корреляции R. Известны такие формулы:

R

(y

y)2 – (y

yˆ

)2

1

(y

yˆ

)2

,

i

 

i

i

 

i

i

 

 

(y

y)2

 

 

(y

y)2

 

 

 

 

 

 

 

 

i

 

 

 

 

i

 

 

 

где yi − фактическое значение исследуемого показателя y; y − средняя величина исследуемого показателя;

ŷi – расчетное значениепоказателя y поуравнению регрессии.

14

Введем обозначения:Остаточная вариация

Sост2 (yi yˆi )2 .

Она характеризует величину суммы квадратов отклонений фактического значения исследуемого показателя от его расчетного значения.

Регрессионная (объясненная) вариация

Sрегр2 (yˆi y)2 .

Она характеризует величину суммы квадратов отклонений рассчитанного значения исследуемого показателя от общей средней.

Общая (полная) вариация

n

Sполн2 yi y 2 . i 1

Она характеризует величину суммы квадратов отклонений фактическогозначенияисследуемогопоказателяотобщейсредней.

Между этими величинами существует соотношение

Sполн2 Sост2 Sрегр2 .

В рамках этих обозначений коэффициент корреляции

S2

R S2регр , полн

0≤ R ≤1.

Чем больше коэффициент корреляции, тем лучше уравнение множественной регрессии описывает существующая зависимость.

Зная коэффициент корреляции, можно дать качественноколичественную оценку тесноты связи. Используются, напри-

15

мер, специальные табличные соотношения, так называемая шкала Чеддока (табл. 1).

 

Таблица 1

Качественная оценка тесноты связи

 

 

Величина коэффициента

Характеристика силы связи

парной корреляции

 

До 0,3

Практически отсутствует

0,3–0,5

Слабая

0,5–0,7

Заметная

0,7–0,9

Сильная

0,9–0,99

Очень сильная

Такие оценки носят общий характер и не претендуют на статистическую строгость, поскольку не дают гарантий на вероятностную достоверность. Для большинства исследований практическое значение имеют множественные регрессии (модель), когда коэффициент корреляции R ≥ 0,75. Поэтому в статистике принято использовать более надежные критерии для оценки тесноты связи.

Здесь может помочь только эталон, с которым можно было бы сравнить вычисленную характеристику. Статистика как раз и занимается созданием таких эталонов, которые называются

критическими или табличными значениями.

Процедуру установления корреляционной зависимости принято называть проверкой гипотезы. Ее принято проводить

вследующей последовательности:

1)вычисление линейного коэффициента корреляции между совокупностями случайных величин xi и yi;

2)его статистическая оценка (проверка значимости). Статистическую оценку коэффициента корреляции прово-

дят путем сравнения его расчетной величины Rрасч, вычисленной по формуле, с табличным (или критическим) показателем Rкрит, значения которого отыскиваются из специальной таблицы.

Если окажется, что Rрасч Rкрит, то с заданной степенью вероятности (обычно 95 %) можно утверждать, что между рас-

16

PNRPU

сматриваемыми числовыми совокупностями существует значимая линейная связь. Или по-другому − гипотеза о значимости линейной связи не отвергается.

В случае же обратного соотношения, т.е. при Rрасч < Rкрит, делается заключение об отсутствии значимой связи.

Стандартная ошибка. Стандартная ошибка дает представление о приблизительной величине ошибки прогнозирования. Стандартнаяошибкауравнениярегрессии находится по формуле

S 2

Sy n mост 1,

где Sост2 – остаточная вариация, Sост2 yi yˆi 2 ;

n – число наблюдений; m – число факторов.

Относительная погрешность уравнения регрессии вы-

числяется как

Syy 100 %,

где Sy – стандартная ошибка;

y – среднее значение исследуемого показателя.

Стандартная ошибка коэффициента ai вычисляется по формуле

Sai nDSy x .

Для вычисления стандартной ошибки коэффициента a0

используется формула

Sa Sy

D x2

,

x

 

 

0

nDx

 

где Dx – величина дисперсии фактораx, определяется по формуле

17

n xi x 2

D

i 1

 

.

 

 

x

n 1

 

 

 

 

Чем меньше дисперсия, тем лучше уравнение описывает зависимость.

Стандартные ошибки коэффициентов используются для оценивания параметров уравнения регрессии.

Коэффициенты считаются значимыми, если

Sa

 

0,5;

Sa

 

0,5.

 

i

 

0

 

 

a

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

0

 

 

Если относительная погрешность уравнения регрессии не выше 5 % и параметры статистически значимы, то уровень доверия к модели достаточно высокий, ее можно использовать для прогнозирования.

Критерий Фишера. Для проверки значимости (пригодности) полученного уравнения регрессии применяют специальные приемы. Такую проверку называют проверкойадекватностимодели.

Для количественной проверки гипотезы об адекватности можно использовать так называемый F-критерий (критерий Фишера):

Fрасч

 

Sрегр2 / m

 

.

S2

/

n

m

 

 

ост

 

1

Понятиеиформулырасчета величин Sрегр2 , Sост2 см. вп. 1.2.1.

Здесь число степеней свободы f = n m – 1, где n − число опытов в эксперименте (т.е. объем случайной выборки); m − число изучаемых факторов.

Чтобы определить, велика или мала ошибка в предсказании эмпирических результатов, ее нужно сопоставить с некоторой статистической величиной (эталоном), принимаемой в качестве

18

критической. Вот почему используется расчетный F-критерий, который затем сравнивают с Fкрит (имеются таблицы как приложения к различным изданиям) при числе степеней свободы

v1 m , v2 n m 1 и заданном уровне значимости α (уровень

доверительной вероятности).

Если Fрасч < Fкрит, то модель признается адекватной, т.е. с заданной степенью достоверности (надежности) она верно

предсказывает реальный результат. Если же Fрасч > Fкрит, то вывод обратный: данное уравнение не может с заданной надежно-

стью прогнозировать эмпирические данные.

1.2.4. Прогнозирование по модели множественной регрессии

Если по статистическим оценкам модель адекватна действительности, надежна, статистически значима, то ее можно использовать для прогнозирования.

Допустим имеем уравнение регрессии, характеризующее зависимость выпуска продукции (y) от производственных факторов (ресурсов) ( x1, x2 , , xm ) в линейной форме:

y a1 a1x1 a2 x2 am xm .

Для прогнозирования выпуска продукции на следующий период времени необходимо знать значения факторов на этот период. Значения факторов можно определить:

1)на основе качественного анализа имеющихся ресурсов

ивозможности их роста;

2)статистическим путем, имея динамику затрат ресурса, построить тренд (изменение во времени) и спрогнозировать на следующий период затраты каждого из ресурсов.

Полученные каким-либо способом значения факторов на

прогнозируемый период x1* , x2* , , xm* подставляем в уравнение регрессии и будем иметь точечное значение прогноза выпуска продукции yˆ :

19

a0 a1x1* a2 x2* am xm .

В действительности трудно ожидать, что выпуск продукции будет равен этой величине. Для экономики важно не само значение, а интервал, в который попадет фактическое значение показателя с той или иной вероятностью. Этот интервал зависит от стандартной ошибки уравнения регрессии Sy, числа наблюдений, количества факторов и вероятности утверждения.

Интервал прогнозирования вычисляется по формуле

t Sy ,

где Sy – стандартная ошибка уравнения регрессии;

tα – табличное значение t-распределение Стьюдента. Табличное значение находится для α = 0,05 (это вероят-

ность 0,95) с (n–m–1) степенью свободы, где n – число наблюдений, m – число факторов.

Для числа наблюдений 30 и небольшого числа факторов (2,3) t равно примерно 2. Таким образом, интервал приближенно равен ± двойная ошибка. Тогда с вероятностью 0,95 фактическое значение будет неменее yˆ t Sy и не более yˆ t Sy .

Следует отметить, чем больше вероятность, тем больше t

ишире интервал; чем больше число наблюдений, тем меньше t

иуже интервал; чем больше факторов, тем больше t и шире

интервал.

Таким образом, результаты прогнозирования будут иметь наибольшее практическое значение в том случае, если интервал прогнозирования будет достаточно узким. Для этих целей рекомендуется использовать как можно большее число наблюдений (>30) и как можно меньшее количество факторов (2–5).

20