Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

pdf.php@id=6180

.pdf
Скачиваний:
26
Добавлен:
14.05.2023
Размер:
7.56 Mб
Скачать

Окончание табл. 2.5

t

Ф(t)

t

Ф(t)

t

Ф(t)

t

Ф(t)

t

Ф(t)

t

Ф(t)

0,40

0,31084

0,90

0,63188

1,40

0,83849

1,90

0,94257

2,80

0,99489

 

 

0,41

0,31819

0,91

0,63718

1,41

0,84146

1,91

0,94387

2,82

0,99520

 

 

0,42

0,32552

0,92

0,64243

1,42

0,84439

1,92

0,94514

2,84

0,99549

 

 

0,43

0,33280

0,93

0,64763

1,43

0,84728

1,93

0,94639

2,86

0,99576

 

 

0,44

0,34006

0,94

0,65278

1,44

0,85013

1,94

0,94762

2,88

0,99602

 

 

0,45

0,34729

0,95

0,65789

1,45

0,85294

1,95

0,94882

2,90

0,99627

 

 

0,46

0,35448

0,96

0,66294

1,46

0,85571

1,96

0,95000

2,92

0,99650

 

 

0,47

0,36164

0,97

0,66795

1,47

0,85844

1,97

0,95116

2,94

0,99672

 

 

0,48

0,36877

0,98

0,67291

1,48

0,86113

1,98

0,95230

2,96

0,99692

 

 

0,49

0,37587

0,99

0,67783

1,49

0,86378

1,99

0,95341

2,98

0,99712

 

 

41

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №3 Ошибки выборки

3.1. Ошибки регистрации и ошибки репрезентативности

Врезультате статистической обработки данных могут возникнуть ошибки наблюдения, получаемые вследствие расхождения между величиной какого-либо показателя, найденного при статистическом наблюдении данных, и действительными его размерами. Их еще называют выбросами. Это данные среди исходных результатов измерений (или данные, занесенные в таблицу и полученные из результатов измерений), которые настолько отклоняются от сопоставимых данных, внесенных в ту же самую таблицу, что признаются несовместимыми.

Взависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают в результате неправильного установления фактов или ошибочной записи в процессе наблюдения. Они бывают случайными и систематическими. Случайные ошибки регистрации могут быть допущены как опрашиваемыми в их ответах, так и регистраторами. Систематические ошибки могут быть и преднамеренными, и непреднамеренными. Преднамеренные ошибки – сознательные, тенденциозные искажения действительного положения дел. Непреднамеренные ошибки могут быть вызваны различными случайными причинами (небрежность, невнимательность).

Ошибки репрезентативности (представительности) возни-

кают в результате неполного обследования и в случае, если обследуемая совокупность недостаточно полно воспроизводит генеральную совокупность. Они могут быть случайными и систематическими.

Ошибки репрезентативности присущи выборочному наблюдению и возникают в связи с тем, что выборочная совокупность не полностью воспроизводит генеральную.

42

Выборка является репрезентативной (или представитель-

ной), если она достаточно полно представляет изучаемые признаки генеральной совокупности. Условием обеспечения репрезентативности выборки является, согласно закону больших чисел, соблюдение случайности отбора, т.е. все объекты генеральной совокупности должны иметь равные вероятности попасть в выборку.

Анализ репрезентативности выборки особенно важен на начальном этапе исследований, когда численность генеральной совокупности неизвестна, но известны некоторые параметры опыта, позволяющие оценить репрезентативность.

Ошибки выборки – разность между характеристиками выборочной и генеральной совокупностей. Для среднего значения опре-

деляют предельную ошибку выборки по формуле

x =

 

x x

 

,

(3.1)

 

 

где

x = xi / N,

(3.2)

N – объем выборки.

Грубые ошибки и промахи обнаруживают и исключают из расчетов следующим образом:

находят среднее арифметическое x результата n-кратного измерения величины хi;

определяют среднее квадратическое отклонение S. Если базовый элемент ij содержит лишь два результата измерений, то внутриэлементное расхождение (аналог стандартного отклонения)

sij =

 

/

 

 

(3.3)

yij1 yij 2

2.

Таким образом, если во всех базовых элементах содержится по два результата измерений, для простоты вместо стандартных отклонений могут быть использованы абсолютные расхождения;

• вычисляют вспомогательную величину t(S) (табл. 3.1).

43

Таблица 3.1

Значения вспомогательной величины t(S) в зависимости от числа n повторных измерений (степень достоверности 0,95)

n

2

3

4

 

5

 

6

7

8

9

 

10

t(S)

15,56

4,97

3,56

 

3,04

 

2,78

2,62

2,51

2,43

 

2,37

 

При |хi

x |>t(S)

результат

измерения

хi является

грубой

ошибкой, поэтому его исключают из расчетов и среднее значение x вычисляют заново для оставшихся достоверных результатов измерения.

Ошибки (промахи) могут быть исключены из генеральной совокупности с помощью следующего правила:

• если некоторое измерение xi внушает сомнение в его принадлежности к генеральной совокупности, то в этом случае определяется значение х и S генеральной совокупности без сомнительных измерений;

• используя правило Томпсона (критерий Рошера), вычисля-

ют коэффициент k = (xi

х )/S.

 

 

 

 

 

 

 

 

Если k больше допустимого значения, то делается вывод о

том, что xi не принадлежит к генеральной совокупности.

 

 

 

Значения допустимых k дано в табл. 3.2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3.2

Значения допустимых k в зависимости от числа измерений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число измерений

4

6

 

8

10

12

14

16

18

20

 

25

Значение k

1,49

1,94

 

2,22

2,41

2,55

2,66

2,75

2,82

2,88

 

3,01

В литературе известны также критерии 3s, Граббса (Смирнова) [ГОСТ Р ИСО 5725-2-2002. Точность (правильность и прецизионность) методов и результатов измерений. Часть 2. Основной метод определения повторяемости и воспроизводимости стандартного метода измерений], Шарлье, Шовенэ, Диксона и других, которые позволяют исключить грубые промахи.

44

3.2. Критерий Романовского

Используя критерий Романовского, можно определить грубую погрешность в зависимости от числа измерений и уровня значимости α. Для этого необходимо вычислить расчетное значение Vрасч сомнительного результата по формулам

V

=V =

 

xнб x

 

 

;

V

=V =

 

xнб x

 

 

(3.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

расч

нб

 

 

 

 

 

расч

нм

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Vнб, Vнм – соответственно расчетные значения, соответствующие наибольшему (хнб) и наименьшему (хнм) значениям сомнительного результата.

Для принятых значений числа измерений n и уровня значимости α определяется максимально допустимое значение Vдоп по

табл. 3.3, которое сравнивается с расчетным. Если Vдоп < Vрасч, то сомнительные значения (хнб, хнм) являются грубыми погрешностя-

ми и должны быть исключены из дальнейших рассмотрений.

Если Vдоп > Vрасч, то хнб и хнм необходимо оставить в данном ряду измерений и учитывать при обработке результатов измерений.

Таблица 3.3

Значение критерия Романовского Vдоп в зависимости от числа измерений и уровня значимости

Число

 

Уровень значимости

 

измерений n

0,1

0,05

0,025

0,01

3

1,41

1,41

1,41

1,41

4

1,65

1,69

1,71

1,72

5

1,79

1,87

1,92

1,96

6

1,89

2,00

2,07

2,13

7

1,97

2,09

2,18

2,27

8

2,04

2,17

2,27

2,37

9

2,10

2,24

2,35

2,46

10

2,15

2,29

2,41

2,54

11

2,19

2,34

2,47

2,61

12

2,23

2,39

2,52

2,66

13

2,26

2,43

2,56

2,71

45

Окончание табл. 3.3

Число

 

Уровень значимости

 

измерений n

0,1

0,05

0,025

0,01

14

2,30

2,46

2,60

2,76

15

2,33

2,49

2,64

2,8

16

2,35

2,52

2,67

2,84

17

2,38

2,55

2,70

2,87

18

2,40

2,58

2,73

2,90

19

2,43

2,60

2,75

2,93

20

2,45

2,62

2,78

2,96

21

2,47

2,64

2,8.’

2,98

22

2,49

2,66

2,82

3,01

23

2,50

2,68

2,84

3,03

24

2,52

2,7

2,86

3,05

25

2,54

2,72

2,88

3,07

Пример 3.1. Проверить результат хнб = 17,15 на соответствие грубой погрешности при = 0,05. Выполнено измерений п = 12; разброс значений составил = 0,03, x =17,00.

Решение. Рассчитаем критерий Романовского по формуле (3.4):

Vрасч = (17,15 – 17,00)/0,03 = 5.

Для заданных = 0,05 и п = 12 найти по табл. 3.3 допустимое значение критерия Романовского Vдоп = 2,39. Сравнивая табличное значение с расчетным, получаем 2,39 < 5, т.е. Vдоп < Vрасч, следовательно, хнб является грубой погрешностью и должно быть исключено из дальнейших рассмотрений.

3.3.Статистическая обработка экспериментальных данных. Собственно-случайная выборка (простая случайная)

Выборочное наблюдение относится к разновидности несплошного наблюдения, цель которого – по отобранной части единиц дать характеристику всей совокупности единиц. Необходимо, чтобы отобранная часть была репрезентативна (т.е. представляла всю совокупность единиц).

46

Используя теорему П.Л. Чебышева, можно вычислить величину μx , выражающую среднее квадратическое отклонение выбо-

рочной средней от математического ожидания,

μx

=

S

,

(3.5)

 

 

 

 

 

 

 

 

 

N

 

которую называют средней ошибкой выборки.

С учетом выбранного уровня вероятности и соответствующего ему значения t (выбирается по табл. 2.1) предельная ошибка выборки

x = t (N 1) x ,

(3.6)

где tα(N–1) – квантиль распределения Стьюдента для вероятности α и числа степеней свободы f = (N – 1).

С учётом (3.5) и (3.6) можно утверждать, что при заданной вероятности генеральная средняя x будет находиться в следующих границах:

x x x x + x .

(3.7)

Пример 3.2. Предположим, в результате выборочного обследования жилищных условий жителей города, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения (табл. 3.4).

Таблица 3.4

Результаты выборочного обследования жилищных условий жителей города

Общая

 

 

10,0…15,0

15,0…20,0

20,0…25,0

25,0…30,0

 

площадь

До 5,0

5,0…10,0

30,0 и более

жилищ,

приходящая-

ся на

1 чел., м2

 

 

 

 

 

 

 

Число

8

95

204

207

210

130

83

жителей

 

 

 

 

 

 

 

47

Рассмотрим определение границ генеральной средней, в данном случае – средней площади жилищ в расчёте на 1 чел. в целом по городу, опираясь только на результаты выборочного обследования. Для определения средней ошибки выборки нам необходимо прежде всего рассчитать выборочную среднюю величину и дисперсию изучаемого признака (табл. 3.5).

В случае когда данные сгруппированы по интервалам, т.е. представлены в виде интервальных рядов распределения, при расчёте средней арифметической в качестве значения признака принимают середину интервала, исходя из предположения о равномерном распределении единиц совокупности на данном интервале.

Таблица 3.5

Расчёт средней (полезной) площади жилищ, приходящейся на 1 чел., и дисперсии

Общая (полезная)

Число

 

Середи-

 

 

 

площадь жилищ,

 

 

на

 

 

 

x2 m

жителей

 

 

 

 

xi·mi

приходящаяся

 

 

интерва-

 

 

i i

 

 

 

 

 

 

 

 

на 1 чел., м2

mi

 

ла xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

До 5,0

8

 

2,5

 

 

20,0

50,0

5,0 … 10,0

95

 

7,5

 

 

712,5

5343,75

10,0 … 15,0

204

 

12,5

 

 

2550,0

31 875,0

15,0 … 20,0

270

 

17,5

 

 

4725,0

82 687,5

20,0 … 25,0

210

 

22,5

 

 

4725,0

106 312,5

25,0 … 30,0

130

 

27,5

 

 

3575,0

98 312,5

30,0 и более

83

 

32,5

 

 

2697,5

87 668,75

Итого:

1000

 

 

 

 

19 005,0

412 250,0

Расчёт ведется по формулам

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

xi

mi

,

(3.8)

 

 

x =

i=1

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mi

 

 

i=1

где xi – середина интервала.

48

В нашем примере

x = 19005,01000 =19,0м2.

Дисперсию определим по формуле

 

n

 

 

S 2 =

xi mi

x 2 .

(3.9)

i=1

N

 

 

 

Тогда

S 2 = 4122501000 19,02 = 51,25.

Откуда получаем значение выборочного среднего квадратичного отклонения

S = 7,16 м2.

Средняя ошибка выборки

x = 7,161000 = 0,23 м2 .

Определим предельную ошибку выборки с вероятностью

0,954 (t = 2):

x = 2 0,23 = 0,46м2.

Установим границы генеральной средней:

19,0 0,46 x 19,0 0,46

или 18,54 x 19,46.

Таким образом, на основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средний размер общей площади, приходящейся на 1 чел., в целом по городу лежит в пределах от 18,5 до 19,5 м2.

При расчёте средней ошибки собственно-случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора:

49

 

 

 

S 2

 

N

 

(3.10)

x

=

 

 

1

 

 

,

 

 

 

 

 

N

 

Nx

 

 

где Nx – генеральная совокупность. Если предположить, что представленные в табл. 3.5 данные являются результатом 5 %-го бесповторного отбора, следовательно, генеральная совокупность включает 20 000 ед., т.е. средняя ошибка выборки согласно (3.10) будет несколько меньше:

 

 

15,25

 

1000

2

.

x

=

1000

1

20000

 

= 0,22м

 

 

 

 

 

 

Соответственно уменьшится и предельная ошибка выборки, что вызовет сужение границ генеральной средней. Особенно ощутимо влияние поправки на бесповторность отбора при относительно большом проценте выборки.

50