5389
.pdfТема 3. ПОКАЗАТЕЛИ ВАРИАЦИИ
3.1. Методические указания
Понятие вариации
Вариацией какого-либо признака в совокупности называется различие его значений у разных единиц совокупности в один и тот же период времени. Вариация является следствием того, что индивидуальные значения формируются в результате совместного действия множества факторов (условий), которые поразному сочетаются в каждом конкретном случае.
Средняя величина даёт обобщающую характеристику признака в изучаемой совокупности, но не показывает, как расположены варианты, сосредоточены ли они вблизи средней или значительно отклоняются от неё. Средняя величина двух совокупностей может быть одинаковой, но в одном случае все индивидуальные значения отличаются от неё мало, а в другом — эти отличия велики, т.е. во втором случае вариация признака значительна, и это необходимо учитывать при оценке надёжности средней величины.
В статистике торговли показатели вариации широко используются для оценки различий цен на отдельные товары у разных продавцов, реализующих данный товар, а также на разных территориях.
Показатели размера и интенсивности вариации
1. Размах вариации R (диапазон колебаний признака) — представляет собой разность между максимальным и минимальным значениями признака:
.
2. Среднее линейное отклонение d – средняя арифметическая абсолютных значений отклонений отдельных вариантов от их средней арифметической без учёта знака:
Для несгруппированных данных:
где n – число единиц совокупности; Для вариационного ряда:
Где f – сумма частот вариационного ряда.
21
3. Дисперсия признака 2 представляет собой средний квадрат отклонений вариантов от их средней величины. В зависимости от исходных данных используют формулы:
–простая дисперсия для несгруппированных данных
–взвешенная дисперсия для вариационного ряда:
2 |
x x 2 |
f |
. |
|
|
||
|
f |
|
|
|
|
|
Рассчитать дисперсию можно также по преобразованной формуле
x 2 − квадрат среднего значения признака в совокупности; xi2 − средний квадрат значений признака в совокупности:
При расчёте дисперсии по этой формуле исключается дополнительная процедура по учёту отклонений индивидуальных значений признака от его средней величины; за счёт этого уменьшается ошибка, связанная с округлением значений промежуточных вычислений.
4. Среднее квадратическое отклонение ( ) – корень квадратный из дисперсии.
Это обобщающая |
2 |
характеристика размеров вариации признака в |
|
совокупности. Среднее квадратическое отклонение так же, как и среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты от их среднего значения.
Среднее квадратическое отклонение по своей величине всегда больше среднего линейного отклонения и является лучшей характеристикой меры колеблемости изучаемого признака.
Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются именованными величинами, т.е. имеют ту же единицу измерения, что и изучаемый признак. Дисперсия единицы измерения не имеет.
Для оценки интенсивности вариации, а также для сравнения её величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных
22
показателей вариации к средней величине признака (или медиане) и выражаются в процентах:
коэффициент осцилляции K R |
|
R |
100% ; |
|
|
|
|
|||
|
|
|
|
|
|
|||||
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
относительное линейное отклонение K |
|
|
d |
100% ; |
||||||
d |
|
|||||||||
|
|
|
|
|
x |
|||||
|
|
|
|
|
|
|
||||
коэффициент вариации V |
d |
100%. |
|
|
|
|
|
|
||
x |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
По величине коэффициента вариации принято судить не только об интенсивности вариации признака, но и об однородности состава изучаемой совокупности. Чем больше значение коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Общепринятым является следующее: совокупность считается однородной, если коэффициент вариации не превышает 33%.
Виды дисперсий. Правило сложения дисперсий
Вариация результативного признака обусловлена действием различных факторов, оценить влияние некоторых из них можно, разбив статистическую совокупность на группы по факторному признаку. Тогда вместе с изучением общей вариации признака в совокупности становится возможным изучить вариацию признака в каждой из составляющих её групп, а также между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации осуществляется с использованием трёх видов дисперсий.
1. Общая дисперсия 2 характеризует вариацию результативного признака в совокупности в результате действия всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака от общей средней и может быть вычислена по формулам:
простая дисперсия для несгруппированных данных
взвешенная дисперсия для вариационного ряда
2. Межгрупповая дисперсия 2 характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора,
23
положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних xi от общей средней x :
где f – численность единиц в группе.
3. Внутригрупповая дисперсия i2 отражает случайную вариацию, т.е. часть общей вариации, обусловленную влиянием неучтённых факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы xi (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная по соответствующим формулам:
простая дисперсия для несгруппированных данных |
2 |
x |
xi |
2 |
|
; |
|
||||||||
i |
n |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
взвешенная дисперсия для вариационного ряда – |
2 |
|
|
|
x xi |
2 |
f |
. |
|
||||||
i |
|
|
f |
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
На основании внутригрупповой дисперсии по |
каждой |
группе |
|
|
2 |
, можно |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
определить среднюю из внутригрупповых дисперсий |
|
|
2 |
: |
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
f |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
f |
|
Между всеми указанными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий, — общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии:
Другими словами, общая вариация признака в совокупности складывается из вариации признака внутри отдельных групп, вызванной действием всех неучтённых факторов, и вариации между группами, являющейся результатом действия только одного группировочного признака.
Для количественной оценки силы влияния признака, положенного в основание группировки, на образование общей вариации результативного признака в статистике используется эмпирический коэффициент детерминации:
24
Очевидно, что чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние признака, положенного в основание группировки, на изменчивость (вариацию) результативного (изучаемого) признака. При отсутствии связи между признаками эмпирический коэффициент детерминации равен нулю, при функциональной зависимости равен 1.
Эмпирическое корреляционное отношение – это корень квадратный из эмпирического коэффициента детерминации:
.
Этот показатель используется для оценки тесноты связи между группировочным и результативным признаками. Принимает значение от 0 до 1. Если связь отсутствует, то эмпирическое корреляционное значение равно 0, т.е. все групповые средние равны между собой и межгрупповая вариация отсутствует. Значит, факторный признак, положенный в основание группировки, никак не влияет на образование общей вариации.
Если связь функциональная, то корреляционное отношение равно 1. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповая дисперсия отсутствует. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем ближе значение корреляционного отношения к единице, тем теснее и ближе к функциональной связь между признаками.
Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэддока:
Ŋ |
0,1–0,3 |
0,3 –0,5 |
0,5–0,7 |
0,7–0,9 |
0,9–0,99 |
|
|
|
|
|
|
Сила связи |
слабая |
умеренная |
заметная |
тесная |
весьма тесная |
|
|
|
|
|
|
Вариация альтернативного признака
В случае качественных альтернативных признаков, имеющих только два взаимоисключающих варианта значений (да и нет; качественные изделия и бракованные и т.д.), дисперсия рассчитывается по формуле
2 |
q |
, |
|
где p – удельный вес единиц, обладающих некоторым значением признака; q – удельный вес единиц, не обладающих некоторым значением признака. Очевидно, что р + q = 1.
Предельное значение вариации доли альтернативного признака равно 0,25
(р∙q = 0,5∙0,5 = 0,25).
25
3.2. Решение типовых задач Пример 3.1. Цены на товар А в районах области составили:
Район |
Цена |
Числен- |
|
|
|
|
|
|
Расчётные графы |
|
|
|
|||||||
|
за ед., |
ность |
x f |
P P |
|
|
P P |
f |
P |
P |
2 |
P |
P |
2 f |
P P / |
||||
|
руб. |
населения |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р |
в |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
процентах |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
к итогу f |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
24 |
25 |
600 |
-14 |
|
350 |
|
196 |
4 900 |
0,98 |
|||||||||
2 |
35 |
32 |
1 120 |
-3 |
|
96 |
|
9 |
288 |
0,21 |
|||||||||
3 |
50 |
16 |
800 |
12 |
|
|
192 |
|
144 |
2 304 |
0,84 |
||||||||
4 |
28 |
11 |
308 |
-10 |
|
110 |
|
100 |
1 100 |
0,70 |
|||||||||
5 |
64 |
7 |
448 |
26 |
|
|
182 |
|
676 |
4 732 |
1,82 |
||||||||
6 |
72 |
6 |
432 |
34 |
|
|
204 |
|
1 156 |
6 936 |
2,38 |
||||||||
7 |
30 |
3 |
90 |
-8 |
|
24 |
|
64 |
192 |
0,56 |
|||||||||
Итого |
|
100 |
3 798 |
|
|
|
1 158 |
|
|
|
|
20 452 |
|
|
|
Дадим оценку колеблемости цен на данный товар в районах области.
Решение
Для оценки колеблемости |
цен |
|
в |
|
области на товар А рассчитаем |
||||||||||||||||||
(вспомогательные расчёты приведём в таблице): |
|
|
|
||||||||||||||||||||
1. |
Размах вариации цен |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
R Rmax |
|
|
Rmin |
72 24 48 руб.; |
|||||||||||||||||
2. |
Среднюю цену товара |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
P |
f |
3 798 |
|
|
|
|
|
||||||
|
|
|
|
P |
|
38 руб.; |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
f |
|
|
|
|
100 |
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
3. |
Среднее линейное отклонение |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
P |
|
f |
1 158 |
|
|
|
|
||||||
|
d |
|
|
|
1,58 руб.; |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
f |
|
|
|
|
100 |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
4. |
Среднее квадратическое отклонение |
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
P |
|
f |
20 452 |
|
14,3 руб.; |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f |
|
|
|
|
100 |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5. Коэффициент вариации
V P 100 14,338 100 37,6 %.
Так как V>33 %, то колеблемость цен на товар А в области следует признать весьма заметной, а совокупность районов по уровню цен неоднородной.
6. t – критерий
26
ti (Pi P ) .
Так как для всех районов ti<3, то цены на товар А в каждом районе можно считать типичными.
Пример 3.2. Заработная плата 12 продавцов магазина характеризуется следующими данными:
Группа продавцов |
Число |
Месячная заработная плата каждого |
|
по стажу работы, |
продавцов |
продавца за сентябрь, руб. |
|
|
лет |
|
|
|
|
|
|
1. |
До 5 |
7 |
5 234; 7 895; 6 370; 9 870; 10 270; 8 400; 8 590 |
|
|
|
|
2. |
Свыше 5 |
5 |
12 530; 8 940; 9 430; 6 400; 7 350 |
|
|
|
|
Используя правило сложения дисперсий, оценим влияние стажа работы на различия в уровне заработной платы продавцов.
Решение
В этой задаче необходимо разложить общую вариацию заработной платы (общую дисперсию) на систематическую, связанную с профессией (межгрупповую дисперсию), и случайную, обусловленную всеми прочими факторами, кроме профессии (внутригрупповую дисперсию).
1. Средний уровень заработной платы в каждой группе и по магазину в целом:
|
5234 |
|
7895 |
|
6370 |
|
9870 |
|
10270 |
8400 |
8590 |
|
|||||
|
|
|
|
|
|
||||||||||||
x1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
8 090 руб. |
|||
|
|
|
|
|
|
|
7 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 530 |
8940 |
9430 |
6400 |
7350 |
|
|
|
|||||||||
x |
8 930 руб. |
|
|||||||||||||||
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
5 |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5234 |
7895 |
6370 |
9870 - |
|
10270 |
8400 |
8590 |
|
||||||||
x |
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12530 |
8940 |
9430 |
6400 |
7350 |
8 440 руб. |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
12 |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. Внутригрупповые и средняя из внутригрупповых дисперсий:
|
|
|
2 |
|
2 |
xi |
x |
; |
|
i |
n |
|
|
|
|
|
|
||
|
|
|
|
27
2 |
(5234 - 8090)2 |
(7895 - 8090)2 |
(6370 - 8090)2 (9870 - 8090)2 |
||||||
1 |
|
|
|
|
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(10 270 - 8090)2 |
(8400 - 8090)2 |
(8590 - 8090) |
2 |
2 774 294; |
|||||
|
|
|
|
7 |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
2 |
(12530 - 8930)2 |
(8940 - 8930)2 (9430 - 8930)2 |
|
||||||
2 |
|
|
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(6400 - 8930)2 |
(7350 - 8930)2 |
|
4 421 480; |
|
|
|
|||
|
|
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
i2 f |
i |
|
|
2 |
|
|||||
i |
|
|
|
i |
|
f i |
|
|
|
||
|
|
|
|
|
2771294 |
7 |
4421480 |
5 |
3 460 622 . |
|
|
|
|
|
|
12 |
|
|
|
|
|
|
|
Средняя из внутригрупповых дисперсия характеризует вариацию заработной платы в результате действия случайных, неучтённых факторов.
3. Межгрупповая дисперсия:
|
|
|
i |
|
2 f i |
|
|
|
|
|
2 |
|
x |
x |
2 |
(8090 - 8440) |
2 7 (8930 - 8440) |
2 5 |
171 558. |
f i 12
Межгрупповая дисперсия характеризует систематическую вариацию заработной платы в результате действия признака-фактора, положенного в основание группировки – стажа работы
4. Общая дисперсия:
2 |
xi x 2 |
43586161 |
3 632 180. |
|
|
|
|
|
|
|
n |
12 |
||
|
|
Общая дисперсия характеризует общую вариацию заработной платы, сложившуюся в результате действия как систематического фактора (стажа работы), так и всех прочих неучтённых факторов (образование, квалификация и т.д.).
5. Правило сложения дисперсий:
2 |
2 |
|
|
2 |
3632180 |
3460622 |
171558 |
3 632 180. |
|
|
|
||||||||
|
|
i |
|||||||
|
|
|
|
||||||
6. Среднее квадратическое отклонение: |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
3632180 |
1 906 руб. |
|
|||
|
|
|
|
|
|
Коэффициент вариации:
V 100% ; x
V 19068440 100% 22,6%.
28
Совокупность продавцов достаточно однородна по уровню заработной платы, так как значение коэффициента вариации меньше 33%.
8. Эмпирический коэффициент детерминации:
|
2 |
|
171558 |
|
|
2 |
2 |
0,047 |
, или 4,7%. Это означает, что только на 4,7% |
||
|
2 |
|
3632180 |
||
|
|
|
|
||
|
|
|
|
|
вариация заработной платы продавцов за сентябрь обусловлена различиями в их стаже работы и на 95,3% — влиянием прочих факторов.
9. Эмпирическое корреляционное отношение :
2 ;
0,047 0,217.
В соответствии с соотношениями Чэдока можно сказать, что связь между стажем работы и уровнем заработной платы продавцов слабая.
Пример 3.3. В трёх партиях мясных консервов, представленных на контроль качества, бракованными оказались 1,5% в первой партии, состоящей из 1000 банок; 2,5% — во второй партии (1200 банок); 3,5% — в третьей партии (1500 банок). Определим средний процент бракованной и годной продукции, дисперсию, среднее квадратическое отклонение, коэффициент вариации всей партии по качеству.
Решение
Средний процент бракованной продукции:
1000 0,015 1200 0,02 - 5 1500 0,035 |
15 30 53 |
0,0265 |
, или 2, 65 %. |
||||
|
|
|
|
|
|||
1000 |
1200 |
1500 |
3700 |
||||
|
|
Средний процент годной продукции:
q 1 1 0.0265 0,9735 , или 97,35%.
Дисперсия удельного веса бракованной продукции:
2 |
q |
2 |
0,0265 0,9735 0,0258. |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
Среднее квадратическое отклонение: |
2 |
|
|
|
||||
0,258 0,161. |
||||||||
|
Коэффициент вариации удельного веса годной продукции:
V q 100% V 0,97350,161 100% 16,54%.
Так как значение коэффициента вариации меньше 33%, можно утверждать, что совокупность партии мясных консервов является однородной по качеству.
29
3.3. Задачи для самостоятельного решения
3.1. Определите все показатели вариации, если известны следующие данные:
Торговая площадь магазина, м2 |
Число магазинов |
1 500 – 2 000 |
4 |
2 000 – 2 500 |
7 |
2 500 – 3 000 |
13 |
3 000 – 3 500 |
11 |
3 500 – 4 000 |
8 |
4 000 – 4 500 |
2 |
Итого |
45 |
3.2. Торговая фирма заключила договор на первое полугодие с двумя фабриками о поставке швейных изделий. Поставка за каждый месяц первого полугодия составила (тыс. руб.):
Фабрика |
Январь |
Февраль |
Март |
Апрель |
Май |
Июнь |
№ 1 |
460 |
450 |
500 |
520 |
510 |
560 |
№ 2 |
500 |
480 |
510 |
500 |
580 |
430 |
Определите, какая фабрика характеризуется меньшей вариацией объёма поставки.
3.3. Население города по среднедушевому совокупному месячному доходу распределяется следующим образом:
Средний совокупный доход, руб. |
Численность населения, в % к итогу |
До 5 000 |
28,8 |
5 000 – 10 000 |
31,1 |
10 000 – 15 000 |
19,1 |
15 000 – 20 000 |
16,7 |
Свыше 20 000 |
4,3 |
Итого |
100 |
Определите дисперсию и среднее квадратическое отклонение среднедушевого совокупного месячного дохода всеми известными способами.
3.4. Имеются следующие данные о реализации картофеля на рынках города:
Рынок |
Январь |
|
Февраль |
|
||
|
цена за кг, руб. |
|
продано, ц |
цена за кг, руб. |
|
продано, ц |
1 |
16 |
|
24,5 |
19 |
|
21,9 |
2 |
10 |
|
18,7 |
15 |
|
18,8 |
3 |
18 |
|
32,0 |
20 |
|
37,4 |
30