Макарова Н.В. Статистика в Excel-1
.pdfв табл. 4.17 интервалом, содержащим нижний квартиль, явля ется интервал 4—6 лет, а первый квартиль имеет значение 5,58 года.
Содержимое ячеек в табл. 4.17 и 4.6 (см. описание функции МЕДИАНА) аналогично, за исключением следующих ячеек:
1Ш
|Й.::
|
|
Таблица 4.17 |
|
В |
С |
D |
|
Научный стаж |
Число |
Накопленная |
|
сотрудников НИЦ, |
|||
сотрудников, у;- |
частота, 5/ |
||
лет |
|
|
|
До 4 |
14 |
14 |
|
4-6 |
33 |
47 |
|
6-8 |
30 |
77 |
|
8-10 |
45 |
122 |
|
10-12 |
21 |
143 |
|
Свыше 12 |
17 |
160 |
|
Итого |
160 |
|
|
25 % числа сотруд |
40 |
|
|
ников |
|
||
Смещение на max |
|
|
|
<N/4 |
14 |
|
|
Значение max<N/4 |
|
||
Смещение на пер |
|
|
|
вый .квартильный |
|
|
|
интервал |
|
|
|
Накопленная час |
|
|
|
тота первого квар- |
47 |
|
|
тильного интервала |
|
||
Первый квартиль |
4-6 |
|
|
ный интервал |
|
||
Нижняя граница |
|
|
|
первого квартиль- |
|
|
|
ного интервала |
|
|
|
Значение накоп |
|
|
|
ленной частоты |
|
|
|
предшествующего |
14 |
|
|
интервала |
|
||
Первый квартиль |
5,58 |
|
90
•ячейка СЮ содержит формулу =С9/4 — рассчитывается чет вертая часть численности совокупности (25 % числа сотрудников);
•ячейка С18 содержит формулу =С16+2*((С9/4-С17)/С14) - вычисляется значение первого квартиля.
Второй квартиль совпадает с медианой (см, описание функ ции МЕДИАНА) и равен 8,13. Верхний (третий) квартиль содер жится в интервале 8-10 лет и равен 9,91.
Функция ПЕРСЕНТИЛЬ
См. также МЕДИАНА, КВАРТИЛЬ.
Синтаксис:
ПЕРСЕНТИЛЬ (массив; к)
Результат:
Рассчитывает к-ю перцентиль для множества данных.
Аргументы:
•массив: массив ячеек с числовыми значениями, для которых определяются значения перцентилей;
•к: значение перцентили в интервале от О до 1 включительно.
Замечания:
•если массив пуст или содержит более 8191 точки данных, то функция ПЕРСЕНТИЛЬ помещает в ячейку значение ошибки #ЧИСЛО!;
•если к не является числом, то функция ПЕРСЕНТИЛЬ по мещает в ячейку значение ошибки #ЗНАЧ!;
•если к<0 или к> 1, то функция ПЕРСЕНТИЛЬ помещает в ячейку значение ошибки #ЧИСЛО!;
•если к не кратно 1/(п - 1), то функция ПЕРСЕНТИЛЬ произ водит интерполяцию для определения значения к-й перцентили.
МатематикО'Статистинеская интерпретация:
Кроме квартилей в вариационных рядах распределения могут определяться децили и перцентили. Последние также иногда на зывают персентилями или процентилями. Децили делят ранжи рованную совокупность на десять равновеликих частей, а пер центили - на сто. Соотношения медианы, квартилей, децилей и перцентилей представлены на рис, 4.5.
Перцентили применяются лишь при необходимости подроб ного изучения структуры вариационного ряда.
91
ШШЖ |
s |
Ж |
I |
|
I |
I- |
TTJ |
7-й |
М |
||||
1-й |
2-й З-й 4-й 5-й |
б-й |
|
|
8-й 9-й 10-й |
|
дециль |
|
|
|
|
|
дециль |
Рис. 4.5
25-я перцентиль является 1-м (нижним) квартилем, 50-я - 2-м квартилем (медианой), 75-я — 3-м (верхним) квартилем.
Приведем некоторые результаты, рассчитанные функцией ПЕРСЕНТИЛЬ на основании исходных данных из табл. 4.7 (см, описание функции МОДА). Функция ПЕРСЕНТИЛЬ не требует предварительной ранжировки данных, она проводит ее автома тически.
Формула |
Результат |
=ПЕРСЕНТИЛЬ(С4:С8; 0) |
48,00 |
=ПЕРСЕНТИЛЬ(С4:С8;0,25) |
57,00 |
=ПЕРСЕНТИЛЬ(С4:С8;0,50) |
60,00 |
=ПЕРСЕНТИЛЬ(С4:С8;0,75) |
77,00 |
=ПЕРСЕНТИЛЬ(С4:С8;1) |
95,00 |
В отличие от дискретных вариационных рядов вычисление перцентилей по интервальным рядам требует проведения опреде ленных расчетов. Вычисляются они по той же схеме, что и медиа на, и квартили:
^1-^;,+/
Pl = Хр^ +/ |
'— и Ъ д., * |
где Хр - нижняя граница интервала, содержащего /-ю перцентиль;
/- величина интервала;
^ - частота интервала, содержащего /-ю перцентиль;
92
Sp - накопленная частота интервала, предшествующего интер валу, содержащему /-ю перцентиль»
Для данных табл. 4.17 {см, описание функции КВАРТИЛЬ) 25-я перцентиль равна 5,58, 40-я перцентиль - 7,13, 50-я перцентиль - 8,13, 60-я перцентиль - 8,84, 75-я перцентиль - 9,91.
4.4.3.
Функции, родственные функциям ДИСП и СТАНДОТКЛОН
Функция ДИСПА
См, также ДИСП, ДИСПРА, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОНА.
Синтаксис:
ДИСПА (значение!; значение2;...)
Результат:
Оценивает генеральную дисперсию по выборке, заданной ар гументами, которые могут включать текстовые и логические зна чения.
Аргументы:
значение!, значение!,...: от 1 до 30 аргументов, соответствую щих выборке из генеральной совокупности.
В расчете помимо численных значений учитываются также текстовые и логические значения, такие, как ИСТИНА или ЛОЖЬ.
Замечания:
•функция ДИСПА предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, нужно вычислять дисперсию, используя функцию ДИСПРА;
•аргументы, содержащие значение ИСТИНА, интерпретиру ются как 1; аргументы, содержащие текст или значение ЛОЖЬ, интерпретируются как 0. Если текстовые и логические значения должны игнорироваться, следует использовать функцию ДИСП.
Математика-статистическая интерпретация:
См, описание функции ДИСП.
93
Фушощя ДИСПР
См, также ДИСП, ДИСПРА, КВАДРОТКЛ, СРОТКЛ, СТАН-
ДОТКЛОНП.
Синтаксис:
ДИСПР (число1; число2;...)
Результат:
Вычисляет дисперсию по генеральной совокупности.
Аргументы:
число], число2,...; от 1 до 30 аргументов, соответствующих ге неральной совокупности.
Замечания:
•логические значения, например ИСТИНА и ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, следу ет использовать функцию ДИСПРА;
•функция ДИСПР предполагает, что аргументы представляют всю генеральную совокупность. Если данные представляют толь ко выборку из генеральной совокупности, то дисперсию следует вычислять, используя функцию ДИСП.
Математика-статистическая интерпретация:
Дисперсия (от лат. dispersio — рассеяние) — числовая характери стика случайной величины, характеризующая рассеяние ее воз можных значений около математического ожидания. В теории ве роятностей дисперсия вычисляется через центральный момент 2-го порядка:
а\Х\ - D[X\ = Ц2[^ - М[(Х- т,)\
Аналогично этому статистическая дисперсия определяется че рез статистический (эмпирический) центральный момент 2-го порядка, представляет собой средний квадрат отклонений инди видуальных значений признака от их средней величины и вычис ляется в зависимости от исходных данных по формулам невзвешенной (простой) и взвешенной дисперсий:
^2 ^ LC^f "'^) (простая дисперсия);
г 2 = 2ii5—ILA. (взвешенная дисперсия).
1 Л
94
Лишайте/функция ДИСПР рассчитывает дисперсию при ус ловии, что исходные данные образуют генеральную совокуп ность. В случае если совокупность является выборочной, необхо димо воспользоваться функцией ДИСП.
Используем исходные данные из табл. 4.10 (см, описание функции СТАНДОТКЛОН), предполагая, что они образуют гене ральную совокупность. Тогда невзвешенная дисперсия будет оп ределяться формулой =ДИСПР(С4:С9) и равняться 7466,67 (срав ните со значением 8960, рассчитываемым функцией ДИСП).
Взвешенная дисперсия находится по аналогии с расчетом взвешенной средней арифметической {см. описание функции СРЗНАЧ).
Функция ДИСПРА
См, также ДИСПР, ДИСПА, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОНПА.
Синтаксис:
ДИСПРА (значение!; значение2;...)
Результат:
Вычисляет дисперсию по генеральной совокупности, задан ной аргументами, которые могут включать текстовые и логичес кие значения.
Аргументы:
значение!, значение2,...; от 1 до 30 аргументов, соответствую щих генеральной совокупности.
В расчете помимо численных значений учитываются также текстовые и логические значения, такие, как ИСТИНА или ЛОЖЬ.
Замечания:
•функция ДИСПРА предполагает, что аргументы представля ют всю генеральную совокупность. Если данные представляют только выборку из генеральной совокупности, то дисперсию сле дует вычислять, используя функцию ДИСПА;
•аргументы, содержащие значение ИСТИНА, интерпретиру ются как 1, аргументы, содержащие текст или значение ЛОЖЬ, интерпретируются как 0. Если текстовые и логические значения должны игнорироваться, следует использовать функцию ДИСПР.
Математико-статистическая интерпретация:
См, описание функции ДИСПР
95
функция СТАНДОТКЛОНА
Gw. также ДИСПА, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОН, СТАНДОТКЛОНПА.
Синтаксис:
СТАНДОТКЛОНА (значение!; значение2;...)
Результат:
Оценивает генеральное стандартное отклонение по выборке, заданной аргументами, которые могут включать текстовые и ло гические значения.
Аргументы:
значение!, значение2, ....* от 1 до 30 аргументов, соответствую щих выборке из генеральной совокупности.
В расчете помимо численных значений учитываются также тек стовые и логические значения, такие, как ИСТИНА или ЛОЖЬ.
Замечания:
•функция СТАНДОТКЛОНА предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, то стан дартное отклонение следует вычислять с помощью функции СТАНДОТКЛОНПА;
•аргументы, содержащие значение ИСТИНА, интерпретиру ются как 1. Аргументы, содержащие значение ЛОЖЬ, интерпрети руются как 0. Если текстовые и логические значения должны иг норироваться, следует использовать функцию СТАНДОТКЛОН.
Математико-статистинеская интерпретация:
См. описание функций ДИСП, СТАНДОТКЛОН и СТАНДОТКЛОНП.
Функция СГАНДОТКЛОНП
См, также ДИСПР, КВАДРОТКЛ, СРОТКЛ, СТАНДОТ КЛОН, СТАНДОТКЛОНПА.
Синтаксис:
СТАВДОТКЛОНП (число!; число2;...)
Результат:
Вычисляет стандартное отклонение по генеральной совокуп ности.
^^гументы:
число!, число2, ...: от 1 до 30 аргументов, соответствующих генеральной совокупности.
96
Замечания:
•функция СТАНДОТКЛОНП предполагает, что аргументы образуют всю генеральную совокупность. Если данные являются только выборкой из генеральной совокупности, то стандартное отклонение следует вычислять с использованием функции СТАНДОТКЛОН;
•для больших выборок функции СТАНДОТКЛОН и СТАН ДОТКЛОНП рассчитывают примерно равные значения;
•логические значения, такие, как ИСТИНА или ЛОЖЬ, а так же текст игнорируются. Если текстовые и логические значения игнорироваться не должны, следует использовать функцию рабо чего листа СТАНДОТКЛОНПА.
Математико-статистинеская интерпретация:
См. описание функции ДИСПР.
Дисперсия имеет размерность квадрата вариант. Для нагляд ной характеристики меры вариации удобнее пользоваться вели чиной, размерность которой совпадает с размерностью вариант. Для этого из дисперсии извлекают квадратный корень. Получен ная величина называется стандартным отклонением а (иначе,
среднеквадратичным отклонением). Оно выражается в тех же еди ницах измерения, что и признак (тоннах, рублях, метрах, процен тах и т. д.).
Формулы для стандартного отклонения имеют следующий вид:
Уь\^1 |
^) |
(простое стандартное отклонение); |
|
а = V |
п |
|
|
<j = lX(^f |
^) |
fi |
(взвешенное стандартное отклонение). |
"11 I/,
Внимание! Функция СТАНДОТКЛОНП рассчитывает стан дартное отклонение при условии, что исходные данные образуют генеральную совокупность. В случае если совокупность является выборочной, необходимо использовать функцию СТАНДОТ КЛОН.
Используем исходные данные из табл. 4.10 {см. описание функции СТАНДОТКЛОН), предполагая, что они образуют гене-
97
ральную совокупность. Тогда стандартное отклонение будет опре деляться формулой =СТАНДОТКЛОНП(С4:С9) и равняться 86,41 (сравните со значением 94,66, рассчитываемым функцией СТАНДОТКЛОН).
Функция СГАВДОТКЛОНПА
См. также ДИСПРА, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОНА, СТАНДОТКЛОНП.
Результат:
Вычисляет стандартное отклонение по генеральной совокуп ности, заданной аргументами, которые могут включать текстовые и логические значения.
Синтаксис:
СТАНДОТКЛОНПА (значение!; значение!;...)
^гументы:
значение!, значение!, ...: от 1 до 30 аргументов, соответствую щих генеральной совокупности.
В расчете помимо численных значений учитываются также тек стовые и логические значения, такие, как ИСТИНА или ЛОЖЬ.
Замечания:
•функция СТАНДОТКЛОНПА предполагает, что аргументы образуют всю генеральную совокупность. Если данные являются только выборкой из генеральной совокупности, то стандартное отклонение следует вычислять с использованием функции СТАНДОТКЛОНА;
•аргументы, содержащие значение ИСТИНА, интерпретиру ются как 1, аргументы, содержащие значение ЛОЖЬ, интерпрети руются как 0. Если текстовые и логические значения должны иг норироваться, следует использовать функцию СТАНДОТ КЛОНП;
•для больших выборок функции СТАНДОТКЛОНА и СТАН ДОТКЛОНПА рассчитывают примерно равные значения.
Математико-статистическая интерпретация:
См, описание функции СТАНДОТКЛОНП.
Функция КВАДРОТКЛ
См. также ДИСПР, СТАНДОТКЛОН.
Синтаксис:
КВАДРОТКЛ (число!; число2;...)
Результат:
Рассчитывает сумму квадратов отклонений точек данных от их средней арифметической.
^гументы:
число 1, число2,...; от 1 до 30 аргументов, для которых вычисля ется сумма квадратов отклонений.
Замечания:
•аргументы должны быть числами или именами, массивами или ссылками, содержащими числа;
•если аргумент, который является массивом или ссылкой, со держит текстовые, логические значения или пустые ячейки, то та кие значения игнорируются; однако ячейки с нулевыми значени ями учитываются.
МатематикО'Статистическая интерпретация:
Формула для квадратичного отклонения имеет следующий вид:
Как самостоятельная мера вариации квадратичное отклоне ние в экономической статистике используется редко. Оно входит составной частью в выражения дисперсии и стандартно го отклонения {см. описание функций ДИСПР, СТАНДОТКЛОНП). В качестве самостоятельной меры вариации квадра тичное отклонение применяется в некоторых разделах статисти ческой физики, в частности при оценке флуктуации хаотическо го теплового движения частиц.
Используя данные, приведенные в табл. 4.10 {см. описание функции СТАНДОТКЛОН), по формуле =КВАДРОТКЛ(С4:С9) получим квадратичное отклонение 44800.
Внимание! Ht путать квадратичное отклонение со среднеквад ратичным (стандартным) отклонением, вычисляемым функцией СТАНДОТКЛОН.
Функция СРОТКЛ
См. также ДИСП, КВАДРОТКЛ, СТАНДОТКЛОН.
Синтаксис:
СРОТКЛ (число!; число2;...)
Результат:
Вычисляет среднее линейное отклонение в множестве дан ных.
99