Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Макарова Н.В. Статистика в Excel-1

.pdf
Скачиваний:
1
Добавлен:
11.04.2024
Размер:
11.91 Mб
Скачать

в табл. 4.17 интервалом, содержащим нижний квартиль, явля­ ется интервал 4—6 лет, а первый квартиль имеет значение 5,58 года.

Содержимое ячеек в табл. 4.17 и 4.6 (см. описание функции МЕДИАНА) аналогично, за исключением следующих ячеек:

|Й.::

 

 

Таблица 4.17

В

С

D

Научный стаж

Число

Накопленная

сотрудников НИЦ,

сотрудников, у;-

частота, 5/

лет

 

 

До 4

14

14

4-6

33

47

6-8

30

77

8-10

45

122

10-12

21

143

Свыше 12

17

160

Итого

160

 

25 % числа сотруд­

40

 

ников

 

Смещение на max

 

 

<N/4

14

 

Значение max<N/4

 

Смещение на пер­

 

 

вый .квартильный

 

 

интервал

 

 

Накопленная час­

 

 

тота первого квар-

47

 

тильного интервала

 

Первый квартиль­

4-6

 

ный интервал

 

Нижняя граница

 

 

первого квартиль-

 

 

ного интервала

 

 

Значение накоп­

 

 

ленной частоты

 

 

предшествующего

14

 

интервала

 

Первый квартиль

5,58

 

90

ячейка СЮ содержит формулу =С9/4 — рассчитывается чет­ вертая часть численности совокупности (25 % числа сотрудников);

ячейка С18 содержит формулу =С16+2*((С9/4-С17)/С14) - вычисляется значение первого квартиля.

Второй квартиль совпадает с медианой (см, описание функ­ ции МЕДИАНА) и равен 8,13. Верхний (третий) квартиль содер­ жится в интервале 8-10 лет и равен 9,91.

Функция ПЕРСЕНТИЛЬ

См. также МЕДИАНА, КВАРТИЛЬ.

Синтаксис:

ПЕРСЕНТИЛЬ (массив; к)

Результат:

Рассчитывает к-ю перцентиль для множества данных.

Аргументы:

массив: массив ячеек с числовыми значениями, для которых определяются значения перцентилей;

к: значение перцентили в интервале от О до 1 включительно.

Замечания:

если массив пуст или содержит более 8191 точки данных, то функция ПЕРСЕНТИЛЬ помещает в ячейку значение ошибки #ЧИСЛО!;

если к не является числом, то функция ПЕРСЕНТИЛЬ по­ мещает в ячейку значение ошибки #ЗНАЧ!;

если к<0 или к> 1, то функция ПЕРСЕНТИЛЬ помещает в ячейку значение ошибки #ЧИСЛО!;

если к не кратно 1/(п - 1), то функция ПЕРСЕНТИЛЬ произ­ водит интерполяцию для определения значения к-й перцентили.

МатематикО'Статистинеская интерпретация:

Кроме квартилей в вариационных рядах распределения могут определяться децили и перцентили. Последние также иногда на­ зывают персентилями или процентилями. Децили делят ранжи­ рованную совокупность на десять равновеликих частей, а пер­ центили - на сто. Соотношения медианы, квартилей, децилей и перцентилей представлены на рис, 4.5.

Перцентили применяются лишь при необходимости подроб­ ного изучения структуры вариационного ряда.

91

ШШЖ

s

Ж

I

 

I

I-

TTJ

7-й

М

1-й

2-й З-й 4-й 5-й

б-й

 

 

8-й 9-й 10-й

дециль

 

 

 

 

 

дециль

Рис. 4.5

25-я перцентиль является 1-м (нижним) квартилем, 50-я - 2-м квартилем (медианой), 75-я — 3-м (верхним) квартилем.

Приведем некоторые результаты, рассчитанные функцией ПЕРСЕНТИЛЬ на основании исходных данных из табл. 4.7 (см, описание функции МОДА). Функция ПЕРСЕНТИЛЬ не требует предварительной ранжировки данных, она проводит ее автома­ тически.

Формула

Результат

=ПЕРСЕНТИЛЬ(С4:С8; 0)

48,00

=ПЕРСЕНТИЛЬ(С4:С8;0,25)

57,00

=ПЕРСЕНТИЛЬ(С4:С8;0,50)

60,00

=ПЕРСЕНТИЛЬ(С4:С8;0,75)

77,00

=ПЕРСЕНТИЛЬ(С4:С8;1)

95,00

В отличие от дискретных вариационных рядов вычисление перцентилей по интервальным рядам требует проведения опреде­ ленных расчетов. Вычисляются они по той же схеме, что и медиа­ на, и квартили:

^1-^;,+/

Pl = Хр^ +/

'— и Ъ д., *

где Хр - нижняя граница интервала, содержащего /-ю перцентиль;

/- величина интервала;

^ - частота интервала, содержащего /-ю перцентиль;

92

Sp - накопленная частота интервала, предшествующего интер­ валу, содержащему /-ю перцентиль»

Для данных табл. 4.17 {см, описание функции КВАРТИЛЬ) 25-я перцентиль равна 5,58, 40-я перцентиль - 7,13, 50-я перцентиль - 8,13, 60-я перцентиль - 8,84, 75-я перцентиль - 9,91.

4.4.3.

Функции, родственные функциям ДИСП и СТАНДОТКЛОН

Функция ДИСПА

См, также ДИСП, ДИСПРА, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОНА.

Синтаксис:

ДИСПА (значение!; значение2;...)

Результат:

Оценивает генеральную дисперсию по выборке, заданной ар­ гументами, которые могут включать текстовые и логические зна­ чения.

Аргументы:

значение!, значение!,...: от 1 до 30 аргументов, соответствую­ щих выборке из генеральной совокупности.

В расчете помимо численных значений учитываются также текстовые и логические значения, такие, как ИСТИНА или ЛОЖЬ.

Замечания:

функция ДИСПА предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, нужно вычислять дисперсию, используя функцию ДИСПРА;

аргументы, содержащие значение ИСТИНА, интерпретиру­ ются как 1; аргументы, содержащие текст или значение ЛОЖЬ, интерпретируются как 0. Если текстовые и логические значения должны игнорироваться, следует использовать функцию ДИСП.

Математика-статистическая интерпретация:

См, описание функции ДИСП.

93

Фушощя ДИСПР

См, также ДИСП, ДИСПРА, КВАДРОТКЛ, СРОТКЛ, СТАН-

ДОТКЛОНП.

Синтаксис:

ДИСПР (число1; число2;...)

Результат:

Вычисляет дисперсию по генеральной совокупности.

Аргументы:

число], число2,...; от 1 до 30 аргументов, соответствующих ге­ неральной совокупности.

Замечания:

логические значения, например ИСТИНА и ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, следу­ ет использовать функцию ДИСПРА;

функция ДИСПР предполагает, что аргументы представляют всю генеральную совокупность. Если данные представляют толь­ ко выборку из генеральной совокупности, то дисперсию следует вычислять, используя функцию ДИСП.

Математика-статистическая интерпретация:

Дисперсия (от лат. dispersio — рассеяние) числовая характери­ стика случайной величины, характеризующая рассеяние ее воз­ можных значений около математического ожидания. В теории ве­ роятностей дисперсия вычисляется через центральный момент 2-го порядка:

а\Х\ - D[X\ = Ц2[^ - М[(Х- т,)\

Аналогично этому статистическая дисперсия определяется че­ рез статистический (эмпирический) центральный момент 2-го порядка, представляет собой средний квадрат отклонений инди­ видуальных значений признака от их средней величины и вычис­ ляется в зависимости от исходных данных по формулам невзвешенной (простой) и взвешенной дисперсий:

^2 ^ LC^f "'^) (простая дисперсия);

г 2 = 2ii5—ILA. (взвешенная дисперсия).

1 Л

94

Лишайте/функция ДИСПР рассчитывает дисперсию при ус­ ловии, что исходные данные образуют генеральную совокуп­ ность. В случае если совокупность является выборочной, необхо­ димо воспользоваться функцией ДИСП.

Используем исходные данные из табл. 4.10 (см, описание функции СТАНДОТКЛОН), предполагая, что они образуют гене­ ральную совокупность. Тогда невзвешенная дисперсия будет оп­ ределяться формулой =ДИСПР(С4:С9) и равняться 7466,67 (срав­ ните со значением 8960, рассчитываемым функцией ДИСП).

Взвешенная дисперсия находится по аналогии с расчетом взвешенной средней арифметической {см. описание функции СРЗНАЧ).

Функция ДИСПРА

См, также ДИСПР, ДИСПА, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОНПА.

Синтаксис:

ДИСПРА (значение!; значение2;...)

Результат:

Вычисляет дисперсию по генеральной совокупности, задан­ ной аргументами, которые могут включать текстовые и логичес­ кие значения.

Аргументы:

значение!, значение2,...; от 1 до 30 аргументов, соответствую­ щих генеральной совокупности.

В расчете помимо численных значений учитываются также текстовые и логические значения, такие, как ИСТИНА или ЛОЖЬ.

Замечания:

функция ДИСПРА предполагает, что аргументы представля­ ют всю генеральную совокупность. Если данные представляют только выборку из генеральной совокупности, то дисперсию сле­ дует вычислять, используя функцию ДИСПА;

аргументы, содержащие значение ИСТИНА, интерпретиру­ ются как 1, аргументы, содержащие текст или значение ЛОЖЬ, интерпретируются как 0. Если текстовые и логические значения должны игнорироваться, следует использовать функцию ДИСПР.

Математико-статистическая интерпретация:

См, описание функции ДИСПР

95

функция СТАНДОТКЛОНА

Gw. также ДИСПА, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОН, СТАНДОТКЛОНПА.

Синтаксис:

СТАНДОТКЛОНА (значение!; значение2;...)

Результат:

Оценивает генеральное стандартное отклонение по выборке, заданной аргументами, которые могут включать текстовые и ло­ гические значения.

Аргументы:

значение!, значение2, ....* от 1 до 30 аргументов, соответствую­ щих выборке из генеральной совокупности.

В расчете помимо численных значений учитываются также тек­ стовые и логические значения, такие, как ИСТИНА или ЛОЖЬ.

Замечания:

функция СТАНДОТКЛОНА предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, то стан­ дартное отклонение следует вычислять с помощью функции СТАНДОТКЛОНПА;

аргументы, содержащие значение ИСТИНА, интерпретиру­ ются как 1. Аргументы, содержащие значение ЛОЖЬ, интерпрети­ руются как 0. Если текстовые и логические значения должны иг­ норироваться, следует использовать функцию СТАНДОТКЛОН.

Математико-статистинеская интерпретация:

См. описание функций ДИСП, СТАНДОТКЛОН и СТАНДОТКЛОНП.

Функция СГАНДОТКЛОНП

См, также ДИСПР, КВАДРОТКЛ, СРОТКЛ, СТАНДОТ­ КЛОН, СТАНДОТКЛОНПА.

Синтаксис:

СТАВДОТКЛОНП (число!; число2;...)

Результат:

Вычисляет стандартное отклонение по генеральной совокуп­ ности.

^^гументы:

число!, число2, ...: от 1 до 30 аргументов, соответствующих генеральной совокупности.

96

Замечания:

функция СТАНДОТКЛОНП предполагает, что аргументы образуют всю генеральную совокупность. Если данные являются только выборкой из генеральной совокупности, то стандартное отклонение следует вычислять с использованием функции СТАНДОТКЛОН;

для больших выборок функции СТАНДОТКЛОН и СТАН­ ДОТКЛОНП рассчитывают примерно равные значения;

логические значения, такие, как ИСТИНА или ЛОЖЬ, а так­ же текст игнорируются. Если текстовые и логические значения игнорироваться не должны, следует использовать функцию рабо­ чего листа СТАНДОТКЛОНПА.

Математико-статистинеская интерпретация:

См. описание функции ДИСПР.

Дисперсия имеет размерность квадрата вариант. Для нагляд­ ной характеристики меры вариации удобнее пользоваться вели­ чиной, размерность которой совпадает с размерностью вариант. Для этого из дисперсии извлекают квадратный корень. Получен­ ная величина называется стандартным отклонением а (иначе,

среднеквадратичным отклонением). Оно выражается в тех же еди­ ницах измерения, что и признак (тоннах, рублях, метрах, процен­ тах и т. д.).

Формулы для стандартного отклонения имеют следующий вид:

Уь\^1

^)

(простое стандартное отклонение);

а = V

п

 

 

<j = lX(^f

^)

fi

(взвешенное стандартное отклонение).

"11 I/,

Внимание! Функция СТАНДОТКЛОНП рассчитывает стан­ дартное отклонение при условии, что исходные данные образуют генеральную совокупность. В случае если совокупность является выборочной, необходимо использовать функцию СТАНДОТ­ КЛОН.

Используем исходные данные из табл. 4.10 {см. описание функции СТАНДОТКЛОН), предполагая, что они образуют гене-

97

ральную совокупность. Тогда стандартное отклонение будет опре­ деляться формулой =СТАНДОТКЛОНП(С4:С9) и равняться 86,41 (сравните со значением 94,66, рассчитываемым функцией СТАНДОТКЛОН).

Функция СГАВДОТКЛОНПА

См. также ДИСПРА, КВАДРОТКЛ, СРОТКЛ, СТАНДОТКЛОНА, СТАНДОТКЛОНП.

Результат:

Вычисляет стандартное отклонение по генеральной совокуп­ ности, заданной аргументами, которые могут включать текстовые и логические значения.

Синтаксис:

СТАНДОТКЛОНПА (значение!; значение!;...)

^гументы:

значение!, значение!, ...: от 1 до 30 аргументов, соответствую­ щих генеральной совокупности.

В расчете помимо численных значений учитываются также тек­ стовые и логические значения, такие, как ИСТИНА или ЛОЖЬ.

Замечания:

функция СТАНДОТКЛОНПА предполагает, что аргументы образуют всю генеральную совокупность. Если данные являются только выборкой из генеральной совокупности, то стандартное отклонение следует вычислять с использованием функции СТАНДОТКЛОНА;

аргументы, содержащие значение ИСТИНА, интерпретиру­ ются как 1, аргументы, содержащие значение ЛОЖЬ, интерпрети­ руются как 0. Если текстовые и логические значения должны иг­ норироваться, следует использовать функцию СТАНДОТ­ КЛОНП;

для больших выборок функции СТАНДОТКЛОНА и СТАН­ ДОТКЛОНПА рассчитывают примерно равные значения.

Математико-статистическая интерпретация:

См, описание функции СТАНДОТКЛОНП.

Функция КВАДРОТКЛ

См. также ДИСПР, СТАНДОТКЛОН.

Синтаксис:

КВАДРОТКЛ (число!; число2;...)

Результат:

Рассчитывает сумму квадратов отклонений точек данных от их средней арифметической.

^гументы:

число 1, число2,...; от 1 до 30 аргументов, для которых вычисля­ ется сумма квадратов отклонений.

Замечания:

аргументы должны быть числами или именами, массивами или ссылками, содержащими числа;

если аргумент, который является массивом или ссылкой, со­ держит текстовые, логические значения или пустые ячейки, то та­ кие значения игнорируются; однако ячейки с нулевыми значени­ ями учитываются.

МатематикО'Статистическая интерпретация:

Формула для квадратичного отклонения имеет следующий вид:

Как самостоятельная мера вариации квадратичное отклоне­ ние в экономической статистике используется редко. Оно входит составной частью в выражения дисперсии и стандартно­ го отклонения {см. описание функций ДИСПР, СТАНДОТКЛОНП). В качестве самостоятельной меры вариации квадра­ тичное отклонение применяется в некоторых разделах статисти­ ческой физики, в частности при оценке флуктуации хаотическо­ го теплового движения частиц.

Используя данные, приведенные в табл. 4.10 {см. описание функции СТАНДОТКЛОН), по формуле =КВАДРОТКЛ(С4:С9) получим квадратичное отклонение 44800.

Внимание! Ht путать квадратичное отклонение со среднеквад­ ратичным (стандартным) отклонением, вычисляемым функцией СТАНДОТКЛОН.

Функция СРОТКЛ

См. также ДИСП, КВАДРОТКЛ, СТАНДОТКЛОН.

Синтаксис:

СРОТКЛ (число!; число2;...)

Результат:

Вычисляет среднее линейное отклонение в множестве дан­ ных.

99