- •Основы статистического анализа
- •1 Основные задачи статистического анализа
- •1.1 Выборочный метод
- •1.2 Основные задачи статистического анализа
- •Задача 1
- •Пример 1
- •2 Первичная статистическая обработка результатов наблюдений
- •2.1 Графическое представление данных
- •2.2 Числовые характеристики вариационного ряда
- •2.3 Интервальные оценки (доверительные интервалы)
- •2.4 Определение достаточного объема выборки
- •3 Сравнение двух выборок.
- •4. Статистическая оценка расхождения между выборочными частотами.
- •5. Сравнение долей
- •6. Исследование зависимостей
- •6.1. Постановка задачи
- •6.2. Линейная зависимость
- •6.4. Множественная линейная зависимость
Основы статистического анализа
1 Основные задачи статистического анализа
1.1 Выборочный метод
Основой статистического анализа является выборочный метод. Часто нет необходимости, а иногда и возможности обследования всех объектов изучаемой совокупности или всех исходов рассматриваемого явления. Даже в тех случаях, когда проводится обследование всех объектов совокупности, его можно рассматривать как выборку (например, перепись населения).
Главной задачей статистического анализа является описание общих закономерностей и характеристик всей совокупности (генеральной совокупности) на основе ограниченного числа наблюдений (выборки). Поэтому выборка должна достаточно полно и правильно отражать генеральную совокупность, то есть быть репрезентативной. Рассматривают два основных способа получения такой случайной выборки:
а) простой случайный отбор,
б) сложный случайный отбор.
В первом случае элементы выборки можно получить “разыгрывая” n элементов генеральной совокупности, например, с помощью датчика псевдослучайных чисел. Во втором случае вся генеральная совокупность разбивается на полсовокупности и из каждой осуществляется простой случайный отбор. Например, “Тихий Дон” М. Шолохова разбивается на 4 тома (4 полсовокупности). Такое построение выборки обеспечивает объективность данных. Часто выборка получается естественным образом как результат проведения соответствующего эксперимента (естественная выборка). При применении методов статистического анализа в языковых исследованиях рассматриваются как случайные выборки, так и естественные (реже).
1.2 Основные задачи статистического анализа
Основная задача статистического анализа в общем, виде может быть сформулирована следующим образом:
как на основе ограниченного числа наблюдений (выборки) описать основные закономерности, присущие генеральной совокупности.
У добно рассматривать всю генеральную совокупность (ГС) как множество всех значений изучаемого признака:
или : выборка.
Тогда задачи статистического анализа можно формализовать, рассматривая их как задачи относительно признака . Признак , как правило, может рассматриваться как случайная величина (с.в.), значение которой до опыта предсказать нельзя.
Задача 1
Установление теоретического распределения признака .
Если бы мы имели возможность посмотреть всю ГС, то знали бы все об изучаемом признаке (и о ГС). С.в. характеризуется, прежде всего, своим законом изменения (распределением вероятностей). Поэтому одна из основных задач состоит в установлении теоретического распределения с.в. на основе ограниченного объема наблюдений (т.е. по выборке).
Рассматривают два основных типа признаков (с.в.):
а) дискретные
б) непрерывные
Дискретные с.в. В этом случае признак принимает конечное или бесконечное (счетное) число значений: . Если мы каждому значению признака поставим в соответствии вероятность наблюдать это значение, то получим закон изменения признака (с.в.) :
-
….
….
где