Макарова Н.В. Статистика в Excel-1
.pdfСоздать.... Кроме того, команда Создать... используется для до бавления имени, отсутствующего в списке.
2. Имеется ошибка в написании имени.
Меры по устранению ошибки - исправьте написание имени. Чтобы вставить правильное имя в формулу, выделите имя в стро ке формул, выберите команду Имя в меню Вставка, а затем — ко манду Вставить. На экране появится диалоговое окно Вставка имени. Вьщелите нужное имя и щелкните по кнопке ОК.
3. Имеется ошибка в написании имени функции.
Меры по устранению ошибки — исправьте написание имени функции вручную или вставьте функцию с помощью мастера функций.
4. В формулу введен текст, не заключенный в двойные кавыч ки. Microsoft Excel пытается распознать такой текст как имя, хо тя это не предполагается.
Меры по устранению ошибки — заключите текст формулы в двойные кавычки. Например, если в ячейке А1 содержится зна чение 200, а в ячейке В1 — формула =«Итого:»&А1, то в ячейке В1 будет выведен результат Итого:200.
5. В ссылке на диапазон ячеек пропущен знак двоеточия (:). Меры по устранению ошибки — исправьте формулу так, чтобы
во всех ссылках на диапазон ячеек использовался знак двоето чия (:), например =СУММ(А1:С10).
Ошибка #Н/Д
Значение ошибки #Н/Д (Неопределенные данные) помога ет предотвратить использование ссылки на пустую ячейку. Вве дите в ячейки листа значение #Н/Д, если они должны содер жать данные, но в настоящий момент эти данные отсутствуют. Формулы, ссылающиеся на эти ячейки, тоже будут иметь значе ние #Н/Д.
Причины возникновения ошибки
1. Для функций ГОР, ПРОСМОТР, ПОИСКПОЗ или ВПР (функции ссылки и автоподстановки) задан недопустимый аргу мент искомое значение.
Меры по устранению ошибки - задайте правильный аргумент искомое значение, например значение или ссылку, но не диапа зон ссылок.
20
2. Функции ВПР или ГПР используются цдя обработкинеот сортированной таблицы.
Меры по устранению ошибки — по умолчанию для функций просмотра таблиц сведения должны располагаться в возрастаю щем порядке (аргумент интервальный просмотр опущен или имеет значение ИСТИНА). Чтобы найти искомое значение в не отсортированной таблице, установите для аргумента интерваль ный просмотр значение ЛОЖЬ.
3. В формуле массива используется аргумент, не соответству ющий размеру диапазона, определяющегося числом строк и столбцов.
Меры по устранению ошибки — если формула массива введена
внесколько ячеек, проверьте диапазон ссылок формулы на соот ветствие числу строк и столбцов или введите формулу массива в недостающие ячейки. Например, если формула массива введена
впервые 15 ячеек столбца С (С1:С15), а сама формула ссылается на первые 10 ячеек столбца А (А1:А10), то в ячейках CI 1:С15 бу дет отображаться ошибка #Н/Д. Чтобы исправить эту ошибку, уменьшите диапазон в формуле (например, С1:С10) или увеличь те диапазон, на который ссылается формула (например, А1:А15).
4.Не заданы один или несколько аргументов стандартной или пользовательской функции листа.
Меры по устранению ошибки — задайте все необходимые аргу менты функции.
5. Используется пользовательская функция, обращение к ко торой приводит к ошибке.
Меры по устранению ошибки — проверьте, что книга, исполь зующая функцию листа, открыта, и убедитесь в правильности ра боты функции (проведите отладку в редакторе VBA).
Ошибка #ССЫЛКА!
Причина возникновения ошибки
Ячейки, на которые ссылаются формулы, были удалены или в эти ячейки было помещено содержимое других скопированных ячеек.
Меры по устранению ошибки - измените формулы или сразу же после удаления или вставки скопированного восстановите прежнее содержимое ячеек с помощью кнопки Отменить,
21
Ошибка #ЧИСЛО!
Причины возникновения ошибки
1.В функции с числовым аргументом используется неприем лемый аргумент.
Меры по устранению ошибки — проверьте правильность ис пользования в функции аргументов.
2.Задана функция (например, статистическая функция СТЬЮДРАСПОБР), при вычислении которой используется ите рационный процесс. При этом итерационный процесс не сходит ся и результат не может быть получен.
Меры по устранению ошибки — используйте другое начальное приближение для этой функции.
3. Введена формула, рассчитывающая числовое значение, ко торое слишком велико или слишком мало, чтобы его можно было представить в Microsoft Excel.
Меры по устранению ошибки — измените формулу так, чтобы в результате ее вычисления получалось число, попадающее в диапа зон от - 1 ' 10"^^^ до 1 • 10"^^^. Например, число 200 является слиш ком большим, чтобы быть использованным в качестве аргумента функции ФАКТР (функция вычисления факториала числа), по этому формула =ФАКТР(200) помещает в ячейку значение ошиб ки #ЧИСЛО!.
Ошибка #ПУСТО!
Причина возникновения ошибки
Использован оператор, задающий пересечение диапазонов, не имеющих общих ячеек.
Меры по устранению ошибки — задайте правильно размерность пересекающихся диапазонов или не используйте оператор пере сечения, если диапазоны не являются таковыми.
В Microsoft Excel оператором пересечения диапазонов являет ся пробел (). Например, диапазоны А1:А5 и В1:В5 содержат масси вы единиц. В этом случае формула =СУММ(А1:А5; В1:В5) будет выдавать значение ошибки #ПУСТО!, а формула =СУММ(А1:А5; А1:ВЗ) рассчитает значение 3. Для суммирования непересекающих ся диапазонов А1:А5 и В1:В5 необходимо воспользоваться стандарт ной синтаксической конструкцией функции СУММ, т. е. =СУММ(А1А5;В1:В5), которая рассчитает значение 10.
22
ГЛАВА 2 Гистограмма
2.1.
Краткие сведения из теории статистики
Результаты сводки и фуппировки материалов статистическо го наблюдения оформляются в виде таблиц и статистических ря дов распределения.
Статистический рядраспределения представляет собой упоря доченное распределение единиц изучаемой совокупности по оп ределенному варьирующему признаку. Он характеризует состоя ние (структуру) исследуемого явления, позволяет судить об одно родности совокупности, фаницах ее изменения, закономернос тях развития наблюдаемого объекта. Построение рядов распреде ления является составной частью сводной обработки статистиче ской информации.
В зависимости от признака, положенного в основу образова ния ряда распределения, различают атрибутивные и вариационные ряды распределения [8, 12]. Последние, в свою очередь, в зависи мости от характера вариации признака делятся на дискретные
(прерывные) и интервальные (непрерывные) ряды распределени
Удобнее всего ряды распределения анализировать с помощью их фафического изображения, позволяющего судить о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистофамма.
Полигон используется для изображения дискретных вариаци онных рядов. При построении полигона в прямоугольной систе ме координат по оси абсцисс в одинаковом масштабе откладыва ются ранжированные значения варьирующего признака, а по оси ординат наносится шкала частот, т. е. число случаев, в которых встретилось то или иное значение признака*. Полученные на пе-
* На оси ординат могут наноситься не только значения частот, но и час тостей вариационного ряда. Частостями называют частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%. В математической статистике наряду с термином «час тость» также широко употребляется термин «статистическая вероятность».
23
ресечении абсцисс и ординат точки соединяют прямыми линия ми, в результате чего получают ломаную линию, называемую по лигоном частот.
Например, в табл. 2.1 представлено распределение жилого фонда городского района по типу квартир [ 12]. Построим полигон для данного распределения.
iii • - • • . |
|
|
Таблица |
|
2.1 |
• • • € : ; • , • |
• : / • : , •/,.•;:,;•••• •Ь'1-''У"г''У |
• • • • • • V . . : > .. Д , |
,:. |
• . • ; . ^ | |
|
|
|
Распределение жилого фонда |
|
|
|
|
|
городского района по типу квартир |
|
|
|
|
№ п/п |
Группы квартир |
Число квартир, |
||
|
по числу комнат |
тыс. ед. |
|
|
|
|
|
|
|
||
|
1 |
1 |
10 |
|
|
i |
2 |
2 |
35 |
|
|
|
3 |
3 |
30 |
|
|
|
4 |
4 |
15 |
|
|
|
5 |
5 |
5 |
|
|
^^^^Ё 1 |
|
ВСЕГО |
95 |
|
|
2 3 4 Число комнат
Рис. 2.1
М
Для построения полигона воспользуемся мастером диаграмм Microsoft Excel (режим «График») и получим полигон (рис. 2.1).
Для изображения интервальных вариационных рядов распреде лений применяются гистограммы. При этом на оси абсцисс откла дываются значения интервалов, а частоты изображаются прямо угольниками, построенными на соответствующих интервалах. В результате получается гистограмма — график, на котором ряд рас пределения представлен в виде смежных друг с другом областей.
На рис. 2.2 показана построенная с помощью мастера диа грамм гистограмма интервального ряда распределения, приве денного в табл. 2.2 [12].
3-5 |
5-7 |
7-9 |
9-11 |
11-13 |
Жилая площадь, кв. м
Рис. 2.2
При необходимости гистофамма интервального ряда распре деления может быть преобразована в полигон. Для этого нужно середины верхних сторон прямоугольников соединить прямыми линиями (ломаная линия на рис. 2.2).
25
в рассмотренном распределении {см, табл. 2.2) интервалы имеют одинаковую величину, поэтому высота столбиков гисто граммы пропорциональна частотам ряда распределения. При не равных интервалах это условие не соблюдается, что не позволяет правильно оценить характер распределения по данному призна ку. В подобных случаях для обеспечения необходимой сравнимо
сти исчисляют плотность статистического распределения, т
определяют, сколько единиц в каждой группе приходится на еди ницу величины интервала.
|
|
|
|
|
Таблица 2,2 |
|
[::Sft.:::":-:-.' ^••^;-:.;B:J: :т-1:-<^^ШШ--^^^^^^^ ;-i--:^:,:--,,:::D:.-^-^^ |
|
|||||
|
|
|
Распределение семей по размеру жилой |
площади, |
||
• |
^ ^ |
|
приходящейся на одного человека |
|||
|
|
№ |
Размер жилой пло |
Число семей с |
Число семей |
|
1 |
;13 |
щади, приходящейся |
данным размером |
нарастающим |
||
п/п |
||||||
на одного |
жилой площади |
итогом |
||||
|
|
|||||
|
|
|
человека, м^ |
|
|
|
\^г^": |
1 |
3-5 |
10 |
10 |
||
|S:'15- • |
2 |
5-7 |
20 |
30(10 + 20) |
||
:ii6;v;: |
3 |
7-9 |
40 |
70 (30 + 40) |
||
i'Ml:^ 4 |
9-11 |
30 |
100 (70 + 30) |
|||
| |
; ^ J S •:;•••: |
5 |
11-13 |
15 |
115(100+15) |
|
к.:Ш: |
|
ВСЕГО |
115 |
|
Например, в табл. 2.3 представлено распределение магазинов по размеру товарооборота [8].
Сравнение частот отдельных групп показывает, что чаще все го встречаются магазины с товарооборотом 250-450 тыс. руб., что не является совсем верным. Для точной характеристики ма газинов по товарообороту рассчитаем плотность распределения путем деления значений частот на величину интервала ({==D11:D15/E11:E15}). Оказывается, что чаще всего встречают ся магазины с товарооборотом 50-120 тыс. руб.
26
|
|
|
|
|
Таблица |
2.3 |
^^_..._..^ в |
с |
D |
...... -щ.-^--.^;Г':Р^Ш;!--; |
|||
:•!).; |
|
Распределение магазинов по размеру товарооборота |
|
|||
|
№ |
Группы магазинов |
Число |
Величина |
Плотность |
|
10 |
п/п |
по размеру |
интервала, |
распределения |
||
товарооборота, |
магазинов |
тыс. руб. |
(D/E) |
I |
||
|
|
тыс. руб. |
|
|
|
|
[:.Д1.:. |
1 |
До 50 |
25 |
50 |
0,5 |
1 |
|-:;12:^ |
2 |
50-120 |
45 |
70 |
0,64 |
1 |
мз" |
3 |
120-250 |
65 |
130 |
0,5 |
1 |
ki^ |
4 |
250-450 |
80 |
200 |
0,4 |
! |
•<15,- 5 |
450-980 |
20 |
530 |
0,04 |
\ |
|
|„,16,V |
|
ИТОГО |
235 |
|
|
|
При построении гистограммы вариационного ряда с нерав ными интервалами высоту прямоугольников определяют про порционально не частотам, а показателям плотности распреде ления значений изучаемого признака в соответствующих интер валах.
В практике экономической работы нередко возникает по-' требность в преобразовании рядов распределения в кумулятив ные ряды, строящиеся по накопленным частотам. С их помощью можно определять структурные средние (см. главу 3) и наблю дать за процессом концентрации изучаемого явления (кривые Лоренца), На рис. 2.3 изображена кумулята для интервального ряда распределения, приведенного в табл. 2.2.
Полигон и кумулята дают начальное представление о функ ции и плотности распределения случайной величины. При этом по лигон можно рассматривать в качестве статистического аналога плотности распределения, а кумуляту - в качестве статистичес кого аналога функции распределения. Более подробно о функ ции и плотности распределения случайной величины, а также о задаваемых с их помощью теоретических распределениях см, в главе 6.
27
3-5 |
S-1 |
7^9 |
9-11 |
11-13 |
Жилая площадь, кв. м
Рис. 2.3
2.2.
Справочная информация по технологии работы
Режим «Гистограмма» служит для вычисления частот попада ния данных в указанные границы интервалов, а также для пост роения гистограммы интервального вариационного ряда распре деления,
В диалоговом окне данного режима (рис. 2.4) задаются следу ющие параметры:
1.Входной интервал - см, подразд. 1.1.2.
2.Интервал карманов (необязательный параметр) ~ вводится ссылка на ячейки, содержащие набор граничных значений, опре деляющих интервалы (карманы). Эти значения должны быть вве дены в возрастающем порядке. В Microsoft Excel вычисляется число попаданий данных в сформированные интервалы, причем границы интервалов являются строгими нижними границами и нестрогими верхними: а<х<Ь,
28
Гистограмма |
Б[о |
|
рВходные данные — |
||
(Ж |
||
В)$р^ичой интервал: |
||
|
||
ИtLтe^дл карнаноб^ |
Оттнь |
|
|
||
|
О^шка |
|
гПараиетры вывода' |
|
|
1 Г* Вы^озднойннте{жал: |
|
|
^ Вэвый рабочий лист: |
|
|
.^Г* Новая рабочая tlHvrа |
|
|
Парето (отсортйрсжанн^ гжтогража] |
|
|
Г" Иитефалы^й процент |
|
|
Р Вывод грэ4»1ка |
|
Рис. 2.4
Если диапазон карманов не был введен, то набор интервалов, равномерно распределенных между минимальным и максималь ным значениями данных, будет создан автоматически.
3.Метки - см, подразд. 1.L2.
4.Выходной интервал/Новый рабочий лист/Новая рабочая кни га — см. подразд. 1.1.2.
5.Парето {отсортированная гистограмма) — устанавливается
вактивное состояние, чтобы представить данные в порядке убы вания частоты. Если флажок снят, то данные в выходном диапа зоне будут приведены в порядке следования интервалов.
6.Интегральный процент - устанавливается в активное состо яние для расчета выраженных в процентах накопленных частот (накопленных частостей) и включения в гистофамму графика кумуляты.
7.Вывод графика - устанавливается в активное состояние для автоматического создания встроенной диаграммы на листе, со держащем выходной диапазон.
29