Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладной статистический анализ в горном деле (Одномерная математическая статистика и регрессионный анализ)

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
8.85 Mб
Скачать

7.4.6.2. Сплайн-функция

Сплайн-функция – это кусочная функция, в которой для каждого отрезка между экспериментальными точками подбирается свой вид полинома 3-й степени (или более высокой), хорошо описывающий прохождение кривой через многочисленные максимумы и минимумы. Такой вид подгонки функций используется при моделировании различных поверхностей, пикетные точки которых расположены с высокой плотностью, в том числе при картографировании топографических поверхностей земной поверхности (горизонтали на картах и планах, изолинии содержаний, мощности и др.). Поскольку такая функция не имеет никакого физического смысла, для других целей применение этой функции ограничено, «а последующая (после аппроксимации экспериментальных данных сплайн-функцией) физическая интерпретация такого рода аппроксимации невозможна» [51]. Не всегда можно подобрать к экспериментальным данным некоторую простую по форме зависимость, например, при совместном влиянии на экосистему горного предприятия процесса проведения горных работ и внешних факторов. В таких случаях появляется необходимость использования сложных полиномиальных функций с множеством параметров. Вместе с тем возникает вопрос оценки важности для целей адекватного моделирования всех коэффициентов в подобных случаях. С большой долей вероятности можно предположить, что не все параметры имеют физический смысл и значимо влияют на результат моделирования.

7.5.Нелинейная множественная регрессия

Впредыдущих разделах уже были освещены многие вопросы оценивания уравнений множественной регрессии, значимости уравнения и адекватности. В настоящем разделе в большей степени пойдёт уклон на пояснение методов преобразования не-

231

линейных переменных (а иногда и функции) для использования уже знакомой технологии регрессионного анализа.

7.5.1. Некоторые процедуры преобразования аргументов в уравнениях, нелинейных относительно независимых переменных

7.5.1.1. Полиномиальная регрессия

Примером уравнений, нелинейных по независимым переменным, могут служить уже ранее рассмотренные полиномы разных степеней. Например, полином третьей степени:

y= b0 + b1x + b2x2 + b3x3.

Вэтих уравнениях аргументы преобразуются путём замены x2 на z2, а x3 на z3, тогда полином можно переписать в следующем виде:

y = b0 + b1x + b2 z2 + b3 z3.

А это уже линейное уравнение с известными методами оценивания параметров и проверки выдвигаемых при регрессионном анализе гипотез.

При исследованиях чаще всего используются полиномы низших порядков (второго, реже третьего) [1]. Особенно, если анализируются геопространственные переменные. На это имеется несколько причин:

во-первых, чем выше степень полинома (одномерного), тем больше изгибов имеет кривая, тогда тем менее однородны исходные данные;

во-вторых, если в степень возводятся величины большого порядка (например, координаты 8–10 значащих цифр), высокие степени приводят к потере точности вычислений;

в-третьих, увеличение степени полинома означает включение в модель дополнительной переменной, образованной воз-

232

ведением в степень уже имеющейся переменной. Такое дополнение повлечёт сложности при статистической оценке модели, связанные с эффектом мультиколлинеарности, который мы рассмотрели в предыдущих разделах.

Графиком полинома второй степени y = 2 + 1,5x + 2x2 является парабола (рис. 7.11, а).

а

б

 

Рис. 7.11. Графики параболы:

а) y = 2 +

1,5x + 2x2; b2 > 0; б) y = – 2 + 1,5x – 2x2; b2 < 0

В исследованиях геопространственных данных полиномы низких степеней используют для описания тренда (дрейфа) в случайных функциях, в геостатистике. При этом делается предположение, что все закономерности изменчивости случайных функций можно представить в виде совокупности двух составляющих – детерминистической функции, которая и называется трендом, и остаточной стохастической компоненты. Базовое допущение такой концепции состоит в том, что выборочные наблюдения интерпретируются как результаты стохастического процесса. Следует помнить, что разложение случайной переменной на компонент дрейфа и стохастический компонент – просто механизм, позволяющий нам описывать реальное явление математическими терминами. В этом случае оценкам зна-

233

чимости и адекватности полинома большого значения не придают, поскольку после удаления (учёта) тренда на следующем этапе анализируется и аппроксимируется остаток.

7.5.1.2.Гипербола

Кнелинейным по независимым переменным функциям

можно отнести и равностороннюю гиперболу y = a0 + (b / x), графики которой показаны на рис. 7.12. Оценка такой регрессии, нелинейной относительно независимых переменных, достаточно проста. Путем замены переменных (u = 1 / x) они легко сводятся

клинейным функциям и оцениваются с помощью метода наименьших квадратов. Вообще, графиком функции y = k / x (при этом k ≠ 0) является гипербола, ветви которой расположены в первой и третьей четверти, если k > 0, и во второй и четвёртой четверти, если k < 0. Точка с координатами (0; 0) является центром симметрии гиперболы. Функция непрерывна на промежутках (− ∞; 0) и (0; + ∞) и претерпевает разрыв при x = 0. Уравнение гиперболы может иметь свободный член, как, например, на рис. 7.12, б). В этом случае график (и центр симметрии) смещается по оси y на величину свободного члена.

а

б

Рис. 7.12. График гиперболы: а – без свободного члена: y = 2 / x; б – свободный член равен 3: y = 3 + 2 / x

234

На рис. 7.13 показан график зависимости статического коэффициента Пуассона от объёмного содержания глин для некоторых месторождений Средней Азии.

Рис. 7.13. Зависимость между статическим коэффициентом Пуассона

иобъёмным содержанием глин месторождений Средней Азии [30]

7.5.2.Некоторые процедуры преобразования аргументов в уравнениях, нелинейных относительно параметров

7.5.2.1.Общие сведения

Вп. 7.3 рассматривались уравнения, нелинейные относительно независимых переменных. Отмечалось, что они остаются линейными по оцениваемым параметрам. В такие линейные

уравнения аргументы могут входить нелинейно, например

вквадрате или кубе, как в полиноме.

Кдругому классу регрессий относятся уравнения, в которых результирующая переменная y нелинейно связана с параметрами. Нелинейность относительно параметров представляет

235

собой более сложный случай [1; 51]. К ним относятся степенные, показательные и экспоненциальные функции. Эти модели, в свою очередь, могут быть разделены на две группы – внутренне линейные и внутренне нелинейные модели.

К примеру, степенная функция вида y = axbe нелинейна относительно оцениваемых параметров, так как включает параметры уравнения a и b неаддитивно. Однако ее можно считать внутренне линейной, ибо логарифмирование данного уравнения по основанию e приводит его к линейному виду:

lnyi = lna + b·lnxi + lni·ei

Заменив переменные, получим линейное уравнение регрессии.

Стандартным и широко используемым подходом к преобразованиям моделей подобного вида в геологии и горном деле, в экономике является логарифмирование.

7.5.2.2. Логарифмические преобразования для степенных, показательных и экспоненциальных функций

Прологарифмируем обе части степенной функции y = axbе:

lny = lna + blnx + lnе.

Эти преобразования дают двойную логарифмическую модель (и зависимая, и объясняющая переменные заданы в логарифмическом виде). Степенные функции обладают большими возможностями. Они достаточно успешно моделируют как линейные, так и криволинейные, как возрастающие, так и убывающие зависимости. В практике исследований используются и полулогарифмические модели, когда логарифмируется только левая или только правая часть уравнения.

Если нелинейная мультипликативная модель внутренне линейна, то при помощи определенных процедур она может быть сведена к линейному виду и оценена при помощи метода

236

наименьших квадратов. Напротив, если модель внутренне нелинейна, то к линейной функции ее свести нельзя [51]. Однако намного чаще в практике встречаются внутренне линейные модели. Приведем некоторые из них с примерами замен.

Таблица 7.1

Логарифмические преобразования

Показательная функция:

lny = lna + xlnb + lne; выполним преобразования:

y = abxе,

Y = lny; A = lna; B = lnb; E = lne;

рис. 7.14

получаем линейную функцию: Y = A + Bx + E

Степенная функция:

lny = lna + blnx + lne; выполним преобразования:

y = axbе,

Y = lny; A = lna; X = lnx; E = lne;

рис. 7.15

получаем линейную функцию: Y = A + bX + E

Экспоненциальная

lny = a + bx выполним преобразования: Y = lny;

функция: y = ea + bx,

рис. 7.16

получаем линейную функцию: Y = A + bX

 

Показательная функция определена для основания b. Графики функции существенно зависят от значения этого парамет-

ра (рис. 7.14) [33].

В классе внутренне линейных функций отдельное место занимает степенная функция [33]. В этом выражении параметр b интерпретируется как коэффициент эластичности.

а

б

Рис. 7.14. Графики показательных функций вида y = abxe:

а) y = 2x, b > 1; б) y = 0,5x, 0 < b < 1

237

а

 

б

 

 

 

 

 

 

в

г

Рис. 7.15. Графики степенных функций:

а) y = 2x2,5; б) y = 2x0,5; в) y = – 2 + 2x3; г) y = 2x4

Он показывает, на сколько процентов изменится результат при изменении аргумента на 1 %. Степенная функция часто используется при анализе экономических моделей.

Экспоненциальной называют показательную функцию для основания e – иррационального числа, примерно равного 2,718281828459. Основные формулы такие же, как и для показательной функции с основанием степени е. Экспонента y = e x определена для всех x. Ее область определения – вся числовая

238

ось (– ∞ < x < + ∞). Экспонента является монотонно возрастающей функцией, поэтому экстремумов не имеет (рис. 7.16, а). Обратной функцией для экспоненты является натуральный логарифм ln e x = x.

Пример экспоненциальной функции индекса компрессии от пористости образцов для некоторых месторождений Западной Сибири приведен на рис. 7. 16, б).

а

б

Рис. 7.16. Графики экспоненциальных функций: а – график экспоненты y = e0,35 + 1,25x; б – график экспоненциальной зависимости индекса компрессии от пористости для месторождения Западной Сибири [30]

239

7.5.2.3. Некоторые дополнительные процедуры преобразования переменных

Можно предположить, что существует возможность большого выбора аналитических представлений нелинейной формы связи, использование которых ограничивает лишь сложность процедур оценки параметров. С математической реализацией относительно несложно такая задача решается для функций, преобразуемых к линейному виду [51]. В табл.7.2 приведены дополнительные виды преобразования переменных, приводящие уравнения к линейному виду. Вместе с тем интерпретация коэффициента регрессии так, как она выполнялась в линейном уравнении, для нелинейнойзависимостинеподходит.

Поэтому для оценки степени влияния изменения аргумента на изменение значения функции используют частную производную, взятую по соответствующему фактору X. Производная по аргументу является мерой чувствительностиодной переменной к изменению другой, она именуется коэффициентом эластичности. Эластичность показывает, на сколько процентов изменится значение функции при изменении значения аргумента на 1%. В общем случаекоэффициентэластичностирассчитываетсяпоформуле

Э YX YX dXdY YX dXdY : YX ,

где YX – первая производная функции у по аргументу x.

Например, в случае парной линейной регрессии коэффициент эластичности будет равен

Э b1 X

 

 

b1 X

.

b

 

Y

 

b X

 

 

0

1

 

Коэффициенты эластичности могут быть рассчитаны как средние и точечные коэффициенты. Для каждого вида нелинейных функций средние коэффициенты эластичности рассчитываются по индивидуальным формулам.

240

Соседние файлы в папке книги