10535
.pdfО. Л. Любимцева
ПРОГРАММНЫЕ СТАТИСТИЧЕСКИЕ КОМПЛЕКСЫ
Часть 1. Обработка статистических данных с помощью MS Excel
Учебное пособие
Нижний Новгород
2019
Министерство науки и высшего образования Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего образования
«Нижегородский государственный архитектурно-строительный университет»
О. Л. Любимцева
Программные статистические комплексы
Часть 1. Обработка статистических данных с помощью MS Excel
Утверждено редакционно-издательским советом университета в качестве учебного пособия
Нижний Новгород ННГАСУ
2019
1
ББК 30.10
Л 93
УДК 519.226 (075.8)
Печатается в авторской редакции
Рецензенты:
А. В. Семенов – канд. физ.-мат. наук, доцент кафедры математического моделирования экономических процессов (ФГАОУ ВО «Национальный исследовательский Нижегородский государственный ун-т им. Н. И. Лобачевского»)
А. В. Баландин – канд. физ.-мат. наук, доцент кафедры алгебры, геометрии и дискретной математики (ФГАОУ ВО «Национальный исследовательский Нижегородский государственный ун-т им. Н. И. Лобачевского»)
Любимцева О. Л. Программные статистические комплексы. Часть 1. Обработка статистических данных с помощью MS Excel. [Текст]: учеб. пособие. /О. Л. Любимцева; Нижегор. гос. архитектур. - строит. ун - т – Н. Новгород: ННГАСУ, 2019. – 88 с.
ISBN 978-5-528-00340-5
Учебное пособие содержит теоретический материал, необходимый для овладения навыками обработки статистических данных с помощью MS Excel. Состоит из шести тематических разделов. Первые разделы посвящены построению статистических рядов и проверке статистических гипотез с помощью инструмента Анализ данных. Далее представлены методы обработки дисперсионных, регрессионных моделей. Особое место отведено работе с контрольными картами качества и временным рядам.
Предназначено студентам направления подготовки 27.03.01 Стандартизация и метрология, профиль Стандартизация и сертификация, по дисциплине «Программные статистические комплексы», а также всем интересующимся статистическими методами обработки данных.
ISBN 978-5-528-00340-5 |
© О. Л. Любимцева, 2019 |
|
© ННГАСУ, 2019 |
2
Содержание |
|
ВВЕДЕНИЕ................................................................................................................. |
4 |
ТЕМА 1: ФОРМУЛЫ И ДИАГРАММЫ MS EXCEL. ПОСТРОЕНИЕ |
|
ИНТЕРВАЛЬНОГО СТАТИСТИЧЕСКОГО РЯДА. ГРАФИЧЕСКОЕ |
|
ПРЕДСТАВЛЕНИЕ ДАННЫХ ................................................................................ |
6 |
ТЕМА 2: ОПИСАТЕЛЬНАЯ СТАТИСТИКА. ФУНКЦИИ |
|
РАСПРЕДЕЛЕНИЯ. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ .............. |
14 |
Показатели Описательной статистики ........................................................... |
14 |
Функции распределения .......................................................................................... |
20 |
Проверка статистических гипотез..................................................................... |
26 |
ТЕМА 3: ДИСПЕРСИОННЫЙ АНАЛИЗ ............................................................ |
32 |
ТЕМА 4: КОНТРОЛЬНЫЕ КАРТЫ. ПОСТРОЕНИЕ И АНАЛИЗ.................. |
40 |
Построение контрольных карт............................................................................ |
42 |
Анализ контрольных карт ..................................................................................... |
44 |
ТЕМА 5: ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ .................................................. |
49 |
Реализация типовых задач в MS Excel................................................................. |
56 |
ТЕМА 6: ВРЕМЕННЫЕ РЯДЫ. ПРОГНОЗИРОВАНИЕ................................. |
59 |
Прогнозирование с помощью функций EXCEL................................................... |
61 |
Прогнозирование с помощью построения тренда............................................. |
67 |
ЗАКЛЮЧЕНИЕ ........................................................................................................ |
86 |
ПРИЛОЖЕНИЕ 1..................................................................................................... |
87 |
ПРИЛОЖЕНИЕ 2..................................................................................................... |
87 |
СПИСОК ЛИТЕРАТУРЫ ....................................................................................... |
88 |
3
Введение
Статистические методы играют важную роль в объективной оценке коли-
чественных и качественных характеристик процесса и являются одним из важ-
нейших элементов системы обеспечения качества продукции и всего процесса управления качеством.
Для получения качественной продукции необходимо знать реальную точ-
ность имеющегося оборудования, определять соответствие точности выбранно-
го технологического процесса заданной точности изделия, оценивать стабиль-
ность технологического процесса. Решение задач указанного типа производится в основном путем математической обработки эмпирических данных, получен-
ных многократными измерениями либо действительных размеров изделий, ли-
бо погрешностей обработки или погрешностей измерения.
Компьютерные технологии заметно расширили возможности специали-
стов в статистической обработке данных различных исследований.
К основным предпосылкам применения современных информационных техно-
логий в области статистической обработки данных можно отнести следующие:
−большое количество объектов статистического наблюдения, многомерность данных;
−необходимость отслеживания динамики массива показателей во времени,
формирование на их основе различных сводок;
−низкую оперативность обработки данных;
−высокие материальные и трудовые затраты на сбор и обработку статистиче-
ской информации;
−территориальную разобщенность исходных данных, необходимость их инте-
грации и одновременной обработки;
−сложность математических методов анализа данных.
Программные |
продукты, |
разработанные |
для |
современ- |
ной вычислительной техники, позволяют успешно решать эти задачи. Стати-
4
стические методы обработки данных включены в состав большинства элек-
тронных таблиц таких, как MS Excel, специализированных пакетов
STATISTICA и SPSS.
Предлагаемый курс охватывает как классические, так и современные ме-
тоды анализа данных, а также инструменты, позволяющие студенту, новичку в области аналитики, проводить мониторинг данных, строить прогнозы, созда-
вать шаблоны анализов и готовить аналитические отчеты презентационного ка-
чества, используя средства автоматизации и широкий спектр графических воз-
можностей.
5
Тема 1: Формулы и диаграммы MS Excel. Построение интервального статистического ряда. Графическое представление данных
Программа Microsoft Excel самая удобная и самая мощная электронная таблица, разработанная для использования в среде Windows.
Интересна эта программа многочисленными средствами автоматизации работы, оформления документов и вычислительной мощью. Загадочность же ее состоит в том, что большинство пользователей применяет в своей работе лишь малую толику того, что может дать им Excel. Это тем более удивительно, что спектр возможностей Excel почти безграничен: от создания хорошо оформлен-
ных бланков до программирования сложных вычислений и моделирования раз-
личных процессов с визуализацией параметров в виде диаграмм и графиков.
Документ Excel имеет расширение *.xlsx и называется рабочей книгой.
Рабочая книга состоит из листов. Переключаться между листами можно, ис-
пользуя закладки в нижней части окна «Лист 1» и т.д. Каждый лист представля-
ет собой таблицу. Таблица состоит из столбцов и строк. Количество столбцов в листе – 256, строк – 65536. Столбцы обозначаются буквами латинского алфави-
та (в обычном режиме) от A до Z, затем идет AA-AZ, BB-BZ и т.д. Строки обо-
значаются обычными арабскими числами. На пересечении столбца и строки на-
ходится ячейка. Каждая ячейка имеет свой уникальный (в пределах данного листа) адрес, который составляется из буквы столбца (в обычном режиме) и
номера строки. Адрес ячейки используется для работы с данными (ячейками) и
формулами.
Статистические расчеты выполняются тремя способами:
а) с помощью формул;
б) с помощью статистических, математических, логических функций;
в) с помощью Надстройки («Анализ данных» и «Поиск решений»).
Рассмотрим каждый метод более подробно а) Для ввода формулы с клавиатуры необходимо:
6
выделить ячейку;
поставить знак равенства (=);
записать выражение.
Например,
=A1 * $B$2
=СУММ(B2:B151)/150.
б) Статистические, математические и логические функции можно выбрать на вкладке ФОРМУЛЫ :
[Форму-
лы→
Библио-
тека
Функ-
ций → Другие функции → Статистические].
в
) При вы-
пол-
не-
нии работы может быть использована Надстройка Microsoft Excel. Чтобы акти-
вировать Надстройку, необходимо выбрать [Файл →Параметры → Над-
стройки → (Перейти…) → Анализ данных]
7
Для наглядного изображения статистических данных применяют графики и диаграммы. Познавательная ценность диаграмм объясняется их способностью отображать реальную действительность в простом, ясном и наглядном виде.
Графическое отображение статисти-
ческих данных позволяет зрительно оценить характер изучаемого явления,
присущие ему закономерности, тен-
денции развития, взаимосвязи с гими показателями. Графики и диа-
граммы стали средством научного обобщения статистической информа-
ции.
Для построения графиков и диаграмм необходимо:
[Вставка Диаграммы Графики]
Рассмотрим на примере применение всех элементов, представленных в теоретической части.
Пример Построение интервального статистического ряда и гистограммы Исходные данные представляют собой выборку {x1, x2, …, xn}. Интервальный статистический ряд можно построить с помощью функции «Гистограмма»:
[Данные →Анализ → Анализ данных →Гистограмма]
8
Диалоговое окно функции «Гистограмма»:
1.Входной интервал – диапазон ячеек, содержащих анализируемые данные.
2.Интервал карманов диапазон ячеек, содержащих значения границ интерва-
лов (параметр является необязательным, в этом случае набор интервалов созда-
ется автоматически).
3.Параметры вывода – указывается ячейка электронной таблицы, начиная с которой будет выведена таблица частот с соответствующими интервалами.
4.Для вывода гистограммы следует установить «флажок» опции Вывод графи-
= −
ка. Флажки опций Парето (отсортиро-
ванная гистограмма) и Интегральный процент (накопленные) частоты следует оставить сброшенными.
Для построения карманов воспользуем-
ся формулой
, где = 1 + log2 .
h – шаг разбиения (длина интервала); m – количество интервалов;
n – число элементов в выборке.
Результат работы функции «Гистограмма»
9