ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

ГОСТР ИСО 3534-1— 2019

Статистические методы

СЛОВАРЬ И УСЛОВНЫЕ ОБОЗНАЧЕНИЯ

Часть 1

Общие статистические термины и термины, используемые в теории вероятностей

(ISO 3534-1:2006, Statistics — Vocabulary and symbols — Part 1: General statistical terms and terms used in probability, IDT)

Издание официальное

Москва

Стандартинформ

2019

Предисловие
1    ПОДГОТОВЛЕН Закрытым акционерным обществом «Научно-исследовательский центр контроля и диагностики технических систем» (ЗАО «НИЦ КД») на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4

2    ВНЕСЕН Техническим комитетом по стандартизации ТК 125 «Применение статистических методов»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 5 сентября 2019 г. № 636-ст

4    Настоящий стандарт идентичен международному стандарту ИСО 3534-1:2006 «Статистика. Словарь и условные обозначения. Часть 1. Общие статистические термины и термины, используемые в теории вероятностей» (ISO 3534-1:2006 «Statistics — Vocabulary and symbols — Part 1: General statistical terms and terms used in probability», IDT).

Международный стандарт разработан Техническим комитетом ISO/TC 69.

Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5)

5    ВЗАМЕН ГОСТ Р 50779.10-2000 (ИСО 3534-1—93)

Правипа применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. № 162-ФЗ «О стандартизации в Российской Федерации». Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандаргпы». а официальный текст изменений и поправок — в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

© ISO. 2006 — Все права сохраняются ©Стандартинформ. оформление. 2019

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

II

Примечание 2 — Асимметрия характеризует симметричность распределения Близкие к нулю значения данной статистики указывают на то, что рассматриваемое распределение очень близко к симметричному, тогда как ненулевые значения соответствуют тому, что, вероятно, существуют случайные всплески значений по одну сторону от центра распределения Асимметричность данных также отражает различие в значениях выборочного среднего (115) и выборочной медианы (1 13) Положительная асимметрия (правосторонняя асимметрия) данных указывает на возможное наличие нескольких экстремально больших значений Подобным образом отрицательная асимметрия указывает на возможное наличие нескольких экстремально малых значений Примечание 3 — Выборочный коэффициент асимметрии является третьим выборочным моментом стандартизованной выборочной случайной величины (1.19)

1.21 выборочный коэффициент эксцесса; выборочный эксцесс: Среднее en sample арифметическое стандартизованных выборочных случайных величин (1.19)    coefficient of

случайной выборки (1.6).    kurtosis

Пример — Для примера, приведенного в 1.9, получен выборочный коэффициент ^r coefficient эксцесса 2,67419. Для выборки такого же объема, как и в данном примере, выбо-    ^ aplatisse-

рочный коэффициент эксцесса (п = 10) имеет высокую изменчивость, поэтому    ment d’6chan-

стической обработки позволяют варьировать настройки при вычислении выборочного коэффициента эксцесса (см. примечание 3 к 2.40). При использовании альтернативной формулы, приведенной в примечании 1, вычисленное значение составляет 0,43605. Два полученных значения, 2,67419 и 0,43605, непосредственно не сопоставимы. Для их сравнения рассматривают разность 2,67419 – 3 (3 вычитают для сопоставления с эксцессом нормального распределения), которая равна -С,32581, эту величину можно сравнивать с 0,43605.

при использовании требуется осторожность. Программные пакеты стати-    tillon

Примечание 1 — Определению соответствует следующая формула

В некоторых программных пакетах статистической обработки данных с целью корректировки смещения (1 33) и определения отклонения от эксцесса нормального распределения выборочный коэффициент эксцесса вычисляют по следующей формуле

”(л + 1)    “.    3(л-1)²

(л-1)(л-2)(n-3)₍f, ‘    (п-2)(п    –    3)    ’

Второй член формулы при достаточно больших п приближается к значению 3. Иногда эксцессом считают выражение, приведенное в 2 40. минус 3 для сопоставления с эксцессом нормального распределения Специалист, работающий с программами статистической обработки данных, может регулировать соответствующие настройки Примечание 2 — Эксцесс характеризует тяжесть хвостов унимодального распределения Для нормального распределения (2 50) с учетом вариабельности выборки выборочный коэффициент эксцесса приблизительно равен 3 На практике эксцесс нормального распределения представляет собой эталонное или базовое значение Распределения (2.11), у которых значение эксцесса менее 3, имеют более легкие хвосты, чем хвосты нормального распределения: распределения (2.11), у которых значение эксцесса более 3, имеют более тяжелые хвосты, чем у нормального распределения Примечание 3 — Для наблюдаемых значений эксцесса, значительно превосходящих 3, существует вероятность того, что хвосты рассматриваемого распределения значимо тяжелее, чем хвосты нормального распределения Выборка может содержать наблюдения из другого источника или ошибочные записи

sample

covariance

covariance

d’6chantillon

Примечание 4 — Выборочный коэффициент эксцесса является 4-м выборочным моментом стандартизованных выборочных случайных величин

1.22 выборочная ковариация; S_xy: Сумма произведений отклонений пар слу- ел чайных величин (2.10) случайной выборки (1.6) от их выборочных средних (1.15), деленная на число слагаемых минус единица.    fr

Примор 1 — Наблюдаемые значения представляют собой десять групп упорядоченных чисел, по три числа в каждой группе. Для настоящего примера использованы только первые два числа группы (х, у).

Таблица 1 — Результаты наблюдений для примера 1

/

1

2

3

4

5

6

7

8

9

10

X

38

41

24

60

41

51

58

50

65

33

У

73

74

43

107

65

73

99

72

100

48

Z

34

31

40

28

35

28

32

27

27

31

Выборочное среднее для X составляет 46,1, а для Y составляет 75,4. Соответствующая выборочная ковариация равна:

[(38 – 46,1) ■ (73 – 75,4) (41 – 46,1) ■ (74 – 75,4) …(33- 46,1) ■ (48 – 75,4)]/9 = 257,178. Пример 2 — В таблице, представленной в первом примере, рассматривают значения у и г. Выборочное среднее для Z составляет 31,3. Соответствующая выборочная ковариация равна:

((73 – 75,4) ■ (34 – 31,3) (74 – 75,4) (74 – 31,3) … *(48 – 75,4) ■ (31 – 31,3))У9 = -54,356.

Примечание 1 — Рассматриваемая как статистика (1.8) выборочная ковариация представляет собой функцию пар случайных величин [(X_v У,), (Х₂, У₂)…., (Х^ У„)) случайной выборки объема л в смысле примечания Зк 1 6 Данную статистику (1 12) следует отличать от численного значения выборочной ковариации, вычисленной по наблкаденным

парам значений выборочных единиц (1 2) ((х,. у^), (х₂, у₂) у„)] случайной выборки

Числовое значение, как правило, называют эмпирической выборочной ковариацией или наблюдаемой выборочной ковариацией

Примечание 2 — В соответствии с определением выборочная ковариация имеет вид

— 1<Х,-ХХУ,-У).
” ‘ i-1

Примечание 3 —Деление на л – 1 позволяет получить несмещенную оценку (1 34) ковариации (2 43) генеральной совокупности

sample

correlation

coefficient

coefficient de

correlation

d6chantillon

Примечание 4 — В примере, данные для которого представлены в таблице 1. приведены три переменные несмотря на то, что в определении говорится о парах переменных. На практике стандартными являются ситуации, в которых присутствует несколько переменных

1.23 выборочный коэффициент корреляции: r_xу: Выборочная коварна- еп ция (1.22), деленная на произведение соответствующих выборочных стандартных отклонений (1.17).

Пример 1 — В примере 1, приведенном в 1.22, стандартное отклонение состав- ^ ляет 12,948 для X и 21,329 для У. Поэтому полученный выборочный коэффициент корреляции (для X и Y) равен:

257,178/(12,948 ■ 21,329) – 0,9312.

Пример 2 — В примере 2, приведенном в 1.22, стандартное отклонение составляет 21,329 для У и 4,165 для Z. Поэтому выборочный коэффициент корреляции (для У и Z) равен:

-54,356/(21,329 4,165) = -0,612.

Примечание 1 — В соответствии с определением выборочный коэффициент корреляции имеет следующий вид

Х^-хм-У)

/=1

]£(X,-X)²£.(Y,-Yf

\ г-1 г-1

Данное выражение представляет собой отношение выборочной ковариации к квадратному корню из произведения стандартных отклонений Иногда символ используют для

обозначения выборочного коэффициента корреляции Наблюдаемый выборочный коэффициент корреляции основан на реализациях (х_1# у,), (х₂, /₂)…..(*„. у_п) соответствующих

случайных величин

standard error erreur type

Примечание 2 — Наблюдаемый выборочный коэффициент корреляции может принимать значения в промежутке (-1.1), при этом значения, близкие к 1, указывают на сильную положительную корреляцию, а значения, близкие к – 1, — на сильную отрицательную корреляцию Выборочный коэффициент корреляции показывает степень близости к линейной зависимости между переменными со значениями -1 или 1 в случае линейной зависимости, значения, близкие к 0. указывают на слабую линейную зависимость.

1.24 стандартная ошибка; о$: Стандартное отклонение (2.37) оценки (1.12) 0. ^еп

Пример — Если выборочное среднее (1.15) является оценкой математического ожидания (2.35) генеральной совокупности и о — стандартное отклонение одной случайной величины (2.10), то стандартная ошибка выборочного среднего равна O’/п. где п — объем выборки. Оценкой стандартной ошибки является SAh, где S — выборочное стандартное отклонение (1.17).

Примечание 1— Практически стандартная ошибка является естественной оценкой стандартного отклонения оценки

nterval estimator

estimateur par intervalle

Примечание 2 — Не существует (целесообразного) понятия «нестандартная ошибка» Стандартную ошибку можно рассматривать как сокращение выражения «стандартное отклонение оценки*. На практике под стандартной ошибкой неявно подразумевают стандартное отклонение выборочного среднего Для стандартной ошибки выборочного среднего применяют обозначение о_х

1.25 интервальная оценка: Интервал, ограниченный верхней и нижней грани- ел цами статистики (1.8).

Примечание 1 — Одной из граничных точек интервала могут быть +«*, —» или есте- *^гственная граница значений параметра Например, ноль — естественная нижняя граница интервальной оценки дисперсии (2 36) генеральной совокупности 8 подобных случаях интервал часто называют односторонним интервалом

Примечание 2 — Интервальная оценка может быть представлена при определении оценки (1 36) параметра (2 9). Предполагается, что интервальная оценка накрывает значение параметра в установленной доле случаев в условиях многократного повторения отбора выборки или в ином вероятностном смысле

statistical

tolerance

interval

intervalle

statistique de

dispersion

statistical tolerance limit limite

statistique de dispersion

Примечание 3 — Три часто используемых вида интервальных оценок включают доверительные интервалы (1 28) для параметра, предикционные интервалы (1 30) для будущих наблюдений и статистические толерантные интервалы (1 26) на долю распределения (2 11).

1.26 толерантный интервал: Интервал, определяемый по случайной выбор- еп ке (1.6) таким образом, что с заданным уровнем доверия он накрывает, по меньшей мере, установленную долю генеральной совокупности (1.1).

Примечание — Уровнем доверия в данном случае является доля интервалов, по-строенных таким образом, что включают, по крайней мере, заданную долю выборки при многократном повторении процедуры

1.27 толерантная граница: Статистика (1.8), представляющая собой конечную еп точку толерантного интервала (1.26).

Примечание — Толерантные интервалы могут быть ^

– односторонними (когда одна из границ является фиксированной естественной границей случайной величины); в этом случае интервал имеет либо верхнюю, либо нижнюю статистическую толерантную границу;

– двусторонними, когда интервал имеет обе границы

confidence interval intervene de confiance

Естественная граница случайной величины может представлять собой предельное значение односторонней границы

1.28 доверительный интервал: Интервальная оценка (1.25) (Г₀, TJ пара- еп метра (2.9) 0 со статистиками (1.8) Т₀ и 7₁ в качестве границ интервала, для которых

Р[Т₀<0< Г,)* ¹ -a. ^fr

Примечание 1— Уровень доверия отражает долю случаев, когда доверительный интервал накрывает истинное значение параметра для длинной серии повторяемых случайных выборок (1 6) при одинаковых условиях. Доверительный интервал не отражает

вероятность (2 5) того, что полученный по наблюдениям доверительный интервал содержит истинное значение параметра (интервал может как накрывать, так и не накрывать истинное значение)

one-sided

confidence

interval

intervalle de

confiance

unilateral

Примечание 2 — По отношению к доверительному интервалу используют показатель 100(1 – а) %. где и — малое положительное число Этот показатель называют коэффициентом или уровнем доверия, часто его задают равным 95 % или 99 % Неравенство F{T_q< 0 <7,) г 1 – а верно для всех неизвестных значений параметра генеральной совокупности 0

1.29 односторонний доверительный интервал: Доверительный интер- еп вал (1.28), одна из конечных точек которого равна +» или -« либо является естественной границей значений случайной величины.

prediction interval intervalle de prediction

Примечание 1 — Определение 1.28 применимо и в том случае, когда значение 7q ⁼ —и в том случае, когда значение Г, = ♦«. Односторонние доверительные интервалы используют в тех ситуациях, когда объектом исследования являются только нижние или только верхние значения параметра Например, при проверке громкости звука в целях обеспечения безопасности сотовых телефонов верхнюю доверительную границу рассматривают для назначений верхней границы громкости звука в предполагаемых условиях безопасности В случае механических испытаний может представлять интерес нижняя доверительная граница усилия, при котором устройство отказывает Примечание 2 — Односторонние доверительные интервалы встречаются в ситуациях. когда исследуемый параметр имеет натуральную естественную границу значений, например равную нулю Для распределения Пуассона (2 47). используемого при моделировании поступления жалоб потребителей, ноль является нижней границей Другой пример — доверительный интервал для вероятности безотказной работы электронного компонента в виде (0,98,1), где единица — естественная верхняя граница значений вероятности.

1.30 предикционный интервал: Диапазон значений переменной случайной вы- еп борки (1.6). отобранной из непрерывной генеральной совокупности, для которого с установленным уровнем доверия можно утверждать, что не менее задан- fr ного числа значений будущей случайной выборки из той же самой генеральной совокупности (1.1) попадет в данный диапазон.

estimate

estimation

(r6suttat)

Примечание 2 — Как правило, исследуют единственное будущее наблюдение, получаемое в тех же условиях, что и наблюдения, используемые для построения предик-ционного интервала На практике предикционные интервалы применяют также в регрессионном анализе, в котором предикционный интервал строят для спектра независимых значений.

1.31 значение оценки: Наблюдаемое значение (1.4) оценки (1.12). еп

error of estimation erreurd’esti-mation

Примечание — Значение оценки представляет собой численное значение, полученное на основе наблюдаемых значений. По отношению к определению оценки (1 36) параметра (2 9) гипотетического распределения вероятностей (2.11) оценка связана со статистикой (1 8), предназначенной для определения оценки параметра, при этом значение оценки получают на основании наблюдаемых значений Иногда после слова «значение» употребляют прилагательное «точечной», чтобы подчеркнуть, что получено только одно значение (значение точечной оценки), а не интервал значений Подобным образом прилагательное «интервальной» употребляют перед словом «оценки» в том случае, когда определяют интервал значений

1.32 ошибка оценивания: Разность значения оценки (1.31) и оцениваемого па- еп раметра (2.9). характеризующего свойство генеральной совокупности.

Примечание 1 — Свойство генеральной совокупности может быть функци- ^ ей параметра или параметров или другой величины, связанной с распределением вероятностей (2.11).

bias

biais

Примечание 2 — Ошибка может включать составляющие, связанные с отбором выборки, неопределенностью результатов измерений, округлением результатов вычислений и др По сути ошибка оценивания характеризует достоверность результатов Определение основных составляющих ошибки оценивания является важным для повышения качества обработки данных

1.33 смещение: Математическое ожидание (2.12) ошибки оценивания (1.32). еп

Примечание 1— Данное определение отличается от приведенного в (2) (3 3 2) и (4) (5 25, 5.28). Смещение рассмотрено в общем смысле, как указано в примечании 1 к 1.34.

unbiased estimator estimateur sans biais

Примечание 2 — На практике наличие смещения может привести к нежелательным последствиям Например, заниженная оценка прочности материала, вызванная смещением. может стать причиной неожиданных отказов устройства

1.34 несмещенная оценка: Оценка (1.12). смещение (1.33) которой равно нулю, ел

Пример 1 —Для случайной выборки (1.36) п независимых случайных величин (2.10), .

подчиненных одному и тому же нормальному распределению (2.50) с матема- ¹

ти ческим ожиданием (2.35) ц и стандартным отклонением (2.37) о, выборочное среднее (1.15) X и выборочная дисперсия (1.16) S² являются несмещенными оценками математического ожидания р и дисперсии (2.36) о² соответственно. Пример 2 — Как упомянуто в примечании 1 к 1.37, оценка максимального правдоподобия (1.35) дисперсии о² включает знаменатель п вместо п – 1, что дает смещенную оценку. В приложениях выборочное стандартное отклонение (1.17) имеет значительное применение, однако важно иметь в виду, что квадратный корень из выборочной дисперсии, использующей знаменатель п – 1, является смещенной оценкой стандартного отклонения (2.37) генеральной совокупности. Пример 3 — Для случайной выборки из п независимых пар случайных величин, где каждая пара имеет одно и то же двумерное нормальное распределение (2.65) с ковариацией (2.43), равной рОуу, выборочная ковариация (1.22) представляет собой несмещенную оценку ковариации генеральной совокупности. Оценка максимального правдоподобия, где в знаменателе использовано п вместо п – 1, даот смещенную оценку.

Примечание — Несмещенные оценки предпочтительны, т. к. в среднем их значения корректны. Данные оценки являются начальной точкой поиска «оптимальных* оценок параметров генеральной совокупности Приведенное определение имеет статистический характер

maximum likelihood estimator estimateur du maximum de vraisemblance

В повседневной практике исследователи стараются избегать внесения смещения в исследование. например путем обеспечения репрезентативности случайной выборки по отношению к рассматриваемой генеральной совокупности

1.35 оценка максимального правдоподобия: Оценка <1.12). приписывающая еп параметру (2.9) значение, при котором функция правдоподобия (1.38) достигает максимального значения или является его приближением.

Примечание 1 — Оценка максимального правдоподобия — общепринятый подход ^ определения значений оценок параметров распределения в том случае, когда установлен вид распределения (2 11), например нормальное распределение (2 50), гамма-распределение (2 56). распределение Вейбулла (2 63) ит.д Эти оценки имеют желаемые статистические свойства (например, инвариантность при монотонном преобразовании) и во многих ситуациях обеспечивают метод определения оценки Когда оценка максимального правдоподобия является смещенной, иногда возможна простая коррекция смещения (1 33) Как упомянуто в примере 2 к 1 34. оценка максимального правдоподобия для дисперсии (2 36) является смещенной, однако она может быть скорректирована путем использования знаменателя п – 1 вместо п В этом случае смещение убывает с увеличением объема выборки.

estimation

(operation)

Примечание 2 — Английскую аббревиатуру MLE. как правило, используют как для обозначения оценки максимального правдоподобия (англ «maximum likelihood estimator»), так и для способа получения оценки максимального правдоподобия (англ «maximum likelihood estimation»), при этом выбор соответствующего варианта зависит от контекста

1.36 определение оценки: Процедура, с помощью которой получают статисти- еп ческое представление генеральной совокупности (1.1) на основе случайной вы- fr борки (1.6), полученной изданной генеральной совокупности.

Примечание 1—В частности, процедура определения значения оценки (1 31) на основе выражения для оценки (112) относится к определению оценки Примечание 2 — Определение оценки следует понимать в широком смысле, включая определение точечных оценок, интервальных оценок или оценок свойств генеральной совокупности

Примечание 3 — Часто статистическое представление генеральных совокупностей связано с определением оценки параметра (2 9) или параметров или функции параметров

предполагаемой модели В более общем виде представление генеральной совокупности может быть менее конкретным, например в случае статистик, относящихся к воздействию природных катастроф (несчастные случаи, травмы, гибель лкадей, сельскохозяйственные потери и т, п.).

maximum likelihood estimation estimation du maximum de vraisemblance

Примечание 4 — Рассмотрение описательных статистик (1 5) может показать, что предполагаемая модель дает неадекватное представление данных, что может быть выявлено путем применения критериев согласия используемой модели полученным данным В таких случаях могут быть рассмотрены другие модели, и процесс определения оценки может быть продолжен

1.37 определение оценки максимального правдоподобия Определение еп оценки (1.36), в результате которого получают оценку максимального правдоподобия (1.35).

Примечание 1 —Для нормальногораспределения(2.50)выборочноесреднее(1.15) ^ является оценкой максимального правдоподобия (1 35) параметра (2.9) ц, тогда как выборочная дисперсия (1 16), вычисляемая по формуле, в которой знаменатель равен п, а не п – 1, дает оценку максимального правдоподобия о² Однако обычно используют знаменатель п – 1, так как он дает несмещенную оценку (1.34)

Примечание 2 — Оценку максимального правдоподобия иногда используют для описания отклонения оценки (1 12) от функции правдоподобия

Примечание 3 — В некоторых случаях определение оценки максимального правдоподобия математически может представлять собой решение одного уравнения, однако имеют место ситуации, в которых получение оценки максимального правдоподобия требует итеративного решения нескольких уравнений

likelihood function fonction de vraisemblance

Примечание 4 — Английскую аббревиатуру MLE, как правило, используют как для обозначения оценки максимального правдоподобия (англ «maximum likelihood estimator»), так и для обозначения определения оценки максимального правдоподобия (англ «maximum likelihood estimation»), при этом выбор соответствующего варианта зависит от контекста

1.38 функция правдоподобия: Функция плотности распределения (2.26), вы- еп

числяемая на основе наблюдаемых значений (1.4) и рассматриваемая как функция параметров (2.9) семейства распределений (2.8). fr

Пример 1 — Из генеральной совокупности (1.1) очень большого размера случайным образом отобрана выборка объема 10 единиц; установлено, что три выборочные единицы имеют некоторую определенную характеристику. Из рассмотрения данной выборки следует, что интуитивное значение оценки (1.31) доли генеральной совокупности, обладающей данной характеристикой, составляет 0,3 (три из десяти). В предположении о том, что генеральной совокупности соответствует биномиальная функция распределения (2.46), функция правдоподобия (функция вероятности, рассматриваемая как функция р, где в качестве п взято 10, а в качестве х — три) достигает своего максимума при р = 0,3, что согласуется с интуитивным предположением.

[Ниже, полученные по отношению к р результаты проверены с помощью построения графика функции вероятности биномиального распределения (2.46)

120р³(1 – р)⁷].

profile

likelihood

function

fonction de

vraisemblance

partielle

hypothesis

hypoth6se

Пример 2 — Для нормального распределения (2.50) с известным стандартным отклонением (2.37) в общем случав показано, что функция правдоподобия принимает максимальное значение при ц, равном выборочному среднему.

1.39 функция правдоподобия профиля: Функция правдоподобия (1.38), рас- ^еп

сматриваемая как функция одного неизвестного параметра (2.9), если всем остальным параметрам присвоены значения, максимизирующие функцию правдоподобия. ^fr

1.40 гипотеза Н: Утверждение о свойствах генеральной совокупности (1.1). еп

Примечание — Как правило, утверждение относительно генеральной совокупности fr связано с одним или несколькими параметрами (2 9) семейства распределений (2 8) или с семейством распределений

1.41 нулевая гипотеза Н₀: Гипотеза (1.40). проверяемая с помощью статисти- еп

null hypothesis

hypothese

nulle

ческого критерия (1.48). fr

Пример 1 —Для случайной выборки (1.6) независимых случайных величин (2.10) из одного и того жо нормального распределения (2.50) при неизвестных математическом ожидании (2.35) и стандартном отклонении (2.37) нулевая гипотеза может состоять в том, что математическое ожидание ц не превосходит заданного значения что записывают следующим образом: Н# р < ц^.

Пример 2 — Нулевая гипотеза может иметь следующий вид: статистической моделью генеральной совокупности (1.1) является нормальное распределение.

Для данного типа нулевой гипотезы математическое ожидание и стандартное отклонение не определены.

Пример 3 — Нулевая гипотеза может иметь следующий вид: статистической моделью генеральной совокупности является симметричное распределение.

Для данного типа нулевой гипотезы форма распределения не определена.

Примечание 1 — Очевидно, что нулевая гипотеза может вклкхать подмножество множества возможных распределений вероятности

Примечание 2 — Данное определение не может быть рассмотрено изолированно от определений альтернативной гипотезы (1.42) и статистического критерия (1 48). т. к. корректное применение процедур поверки гипотез требует наличия всех составляющих Примечание 3 — На практике нулевую гипотезу никогда не доказывают, скорее, полученная в рассматриваемой ситуации оценка может не давать оснований для отклонения нулевой гипотезы

Примечание 4 — То обстоятельство, что нулевая гипотеза не отклонена, не является доказательством ее справедливости, а лишь указывает на то. что достаточные основания оспаривать ее отсутствуют. В данном случае либо нулевая гипотеза (или близкое ее приближение) является истинной, либо объем выборки недостаточен для обнаружения отклонений от нее

Примечание 5 — В некоторых ситуациях первоначально интерес направлен на нулевую гипотезу, однако затем предметом интереса могут стать отклонения от нулевой гипотезы Надлежащее внимание к объему выборки и мощности обнаружения характерного отклонения или альтернативы может привести к построению процедуры критерия для соответствующей оценки нулевой гипотезы

Примечание 6 — Принятие альтернативной гипотезы в противоположность принятию нулевой гипотезы является положительным результатом в том смысле, что оно поддерживает рассматриваемую гипотезу Отклонение нулевой гипотезы в пользу альтернативной представляет собой более однозначный результат, чем невозможность отклонить нулевую гипотезу в данном случае

Примечание 7 — Нулевая гипотеза служит основанием для построения соответствующей статистики критерия (1 52), используемой при проверке нулевой гипотезы Примечание 8 — Нулевую гипотезу часто обозначают H_Q (Н имеет нижний индекс, равный нулю).

alternative

hypothesis

hypothese

alternative

Примечание 9 — Набор параметров, задающих нулевую гипотезу, по возможности выбирают таким образом, чтобы они были несовместимыми с исследуемой гипотезой (см примечание 2 к 1 48 и пример, приведенный в 1 49).

1.42 альтернативная гипотеза Н_А, Ну Утверждение относитепьно множества еп

или подмножества возможных допустимых распределений (2.11), которое не относится к нулевой гипотезе (1.41). fr

Пример 1 — Альтернативная гипотеза для нулевой гипотезы, представленной в примере 1 к 1.41, состоит в том, что математическое ожидание (2.35) превосходит заданное значение, что записывают в следующем виде: ц >

Пример 2 — Альтернативная гипотеза для нулевой гипотезы, представленной в примере 2 к 1.41, состоит в том, что статистической моделью генеральной совокупности не является нормальное распределение (2.50).

Пример 3 — Альтернативная гипотеза для нулевой гипотезы, представленной в примере 3 к 1.41, состоит в том, что статистической моделью генеральной совокупности является асимметричное распределение. Для данной альтернативной гипотезы не важен конкретный вид асимметричного распределения.

Примечание 1 — Альтернативная гипотеза является дополнением к нулевой гипотезе

Примечание 2 — Альтернативная гипотеза может быть обозначена W, или Н_А без явного предпочтения одного из обозначений по аналогии с обозначением нулевой гипотезы

Примечание 3 — Альтернативная гипотеза является утверждением, которое опровергает нулевую гипотезу Для выбора между нулевой и альтернативной гипотезами используют соответствующую статистику критерия (1 52).

Примечание 4 — Альтернативная гипотеза не может быть рассмотрена отдельно как от нулевой гипотезы, так и от статистического критерия (1 48)

simple

hypothesis

hypoth£se

simple

Примечание 5 — Принятие альтернативной гипотезы в противовес невозможности принятия нулевой гипотезы является положительным результатом, состоящим в том. что в данном случае исследуемая гипотеза подтверждена.

1.43 простая гипотеза: Гипотеза (1.40). устанавливающая единственное еп распределение в семействе распределений (2.8).

Примечание 1— Простой гипотезой является либо нулевая гипотеза (1 41), либо ^frальтернативная гипотеза (1.42), для которых выбранное подмножество возможных подходящих распределений составляет только одно распределение (2.11).

Примечание 2 — Для случайной выборки (1 6) независимых случайных величин (2 10) с одним и тем же нормальным распределением (2 50) при неизвестных математическом ожидании (2.35) и стандартном отклонении (2 37) о простая гипотеза может состоять в том, что математическое ожидание ц равно заданному значению что записывают следующим образом Н₀: ц = Но-

composite

hypothesis

hypoth6se

composite

Примечание 3 — Простая гипотеза полностью определяет распределение (2.11).

1.44 сложная гипотеза: Гипотеза, задающая более одного распределения (2.11) еп из семейства распределений (2.8).

Пример 1 — Нулевая гипотеза (1.41) и альтернативная гипотеза (1.42), представленные в примерах 1.41 и 1.42, являются примерами сложных гипотез. Пример 2 — В примере 3 к 1.48 (случай 3) нулевая гипотеза является простой гипотезой. В примере 4 к 1.48 нулевая гипотеза также является простой гипотезой. Остальные гипотезы, представленные в 1.48, являются сложными.

significance

level

niveau de signification

Type I error erreur de premiere espece

Примечание— Сложной гипотезой являются нулевая гипотеза (1.41) и/или альтернативная гипотеза (1.42), для которых выбранное подмножество распределений составляет более одного распределения (2 11).

1.45 уровень значимости; а: Для статистического критерия максимальная еп вероятность (2.5) отклонения нулевой гипотезы (1.41) в том случае, когда она верна.

Примечание — Если нулевая гипотеза является простой гипотезой (1 43), то ее- ^ роятность ошибочного отклонения нулевой гипотезы представляет собой единственное значение.

1.46 ошибка первого рода: Отклонение нулевой гипотезы (1.41) в том случае, еп

когда она верна. fr

Примечание 1 — Фактически ошибка первого рода является принятием неверного решения Поэтому предпочтительно, чтобы вероятность (2 5) такой ошибки была настолько мала, насколько это возможно При нулевой вероятности ошибки первого рода нулевая гипотеза никогда не будет отвергнута, т е она будет принята безотносительно к каким-либо основаниям.

Type II error erreur de seconde espece

Примечание 2 — Возможно, что в некоторых ситуациях (например, исследование биномиального параметра р) установленный уровень значимости, такой как 0.05. не может быть достигнут вследствие дискретности результатов

1.47 ошибка второго рода: Принятие нулевой гипотезы (1.41) в том случае, еп

когда она не верна. fr

statistical test test statistique

Примечание — Фактически ошибка второго рода является принятием неверного решения Поэтому желательно, чтобы вероятность (2 5) такой ошибки была настолько мала, насколько это возможно Ошибка второго рода, как правило, имеет место в тех ситуациях, когда обьем выборки недостаточен для выявления отклонений от нулевой гипотезы

148 статистический критерий, критерий значимости: Процедура, еп

предназначенная для принятия решения о том, может ли быть отклонена fr нулевая гипотеза (1.41) в пользу альтернативной гипотезы (1.42).

Пример 1 — Например, если непрерывная случайная величина (2.29) принимает значения от до ♦» и существует предположение, что истинное распределение не является нормальным распределением (2.50), то могут быть сформулированы следующие гипотезы:

■ рассмотрению подложат все непрерывные распределения (2.23), у которых соответствующая случайная величина принимает значения от до +»;

– существует предположение о том, что истинное рапределение не является нормальным;

– нулевая гипотеза: распределение наблюдаемой случайной величины является нормальным распределением;

– альтернативная гипотеза: распределение наблюдаемой случайной величины не является нормальным распределением.

Пример 2 — Если случайная величина подчиняется нормальному распределению с известным стандартным отклонением (2.37) и существует предположение, что значение математического ожидания ц отличается от заданного значения то гипотезы могут быть сформулированы в соответствии со случаем 3, приведенным в примере 3.

Пример 3 — В примере рассмотрены три случая, которые могут возникнуть при применении статистического критерия.

Случай 1 — Существует предположение, что математическое ожидание процесса больше заданного целевого значения Hq. Данное предположение ведет к следующим гипотезам.

Нулевая гипотеза:

Альтернативная гипотеза: ц >

Случай 2 — Существует предположение, что математическое ожидание процесса меньше заданного целевого значения ц^. Данное предположение ведет к следующим гипотезам.

Нулевая гипотеза: Н& ц 2 ц^.

Альтернативная гипотеза: Н₁: ц < ц^.

Случай 3 — Существует предположение, что математическое ожидание процесса не совпадает с заданным целевым значением но при атом не известно, какое из значений больше (или меньше). Данное предположение ведет к следующим гипотезам.

Нулевая гипотеза: Н^ ц =

Альтернативная гипотеза: Нр ц * ц^.

Во всех трех случаях гипотезы сформулированы на основе предположений относительно альтернативной гипотезы и ее отклонения от базового условия. Пример 4 — В данном примере рассмотрены все доли дефектных изделий р₁ и р₂, от нуля до единицы, в партиях 1 и 2. Если предположить, что две партии отличаются между собой, то скорюе всего доли дефектов в этих двух партиях различны. Данное предположение приводит к следующим гипотезам.

Нулевая гипотеза: Н^ р₁ = р_гАльтернативная гипотеза: Н₀: р₁ * р^

Примечание 1 — Статистический критерий — это процедура, выполнение которой с заданными условиями на основе выборочных данных позволяет принимать решения о том, какая из гипотез относительно распределения наблкадаемой случайной величины (нулевая или альтернативная) является истинной.

Примечание 2 — Перед применением статистического критерия на основе доступной информации определяют набор возможных функций распределений Затем определяют распределения, которые на основе выдвинутого предположения могут быть истинными распределениями и составляют альтернативную гипотезу Затем формулируют нулевую гипотезу как дополнение к альтернативной гипотезе Во многих случаях возможная совокупность функций распределения, а следовательно, нулевая и альтернативная гипотезы могут быть определены на основе набора значений соответствующих параметров

Примечание 3 — Так как решение принимают на основе наблюдений из случайной выборки, то может иметь место ошибка первого рода (1 46). т. е отклонение нулевой гипотезы. когда она верна, или ошибка второго рода (1 47), т е принятие нулевой гипотезы, когда альтернативная гипотеза верна

Примечание 4 — Случаи 1 и 2, рассмотренные в примере 3. представляют собой примеры односторонних критериев Случай 3—при мер двустороннего критерия Во всех трех случаях выбор применения одностороннего или двустороннего статистического критерия основан на рассмотрении области изменения значения параметра ц. соответствующего

альтернативной гипотезе В более общем случае односторонние и двусторонние критерии могут быть обусловлены областью нулевой гипотезы, соответствующей выбранному статистическому критерию Для статистики критерия существует критическая область показания значений, которая соответствует отклонению нулевой гипотезы в пользу альтернативной гипотезы, но это может быть не связано напрямую с простым описанием области изменения параметров, как в случаях 1. 2 и 3

p-value valeur р

Примечание 5 — Выдвигаемые предположения тщательно продумывают, иначе применение статистического критерия может быть некорректным. Статистические критерии. позволяющие получить решения, на которые не влияет наличие неточностей в выдвигаемых предположениях, относятся к робастным Считают, что f-критерий для математического ожидания по единственной выборке обладает хорошей робастностью при ненормальном распределении данных Критерий однородности дисперсий Бартлетта — пример неробастного статистического критерия, который может привести к слишком частому ошибочному отклонению предположения о равенстве дисперсий

1.49 />значение: Вероятность (2.5) того, что наблюдаемое значение статистики еп критерия (1.52) или наблюдаемое значение некоторого соответствующего пара- fr метра не благоприятствует принятию нулевой гипотезы (1.41).

Пример — Рассмотрим пример, приведенный в 1.9. Для наглядности наблюдаемые значения — значения параметра процесса, для которого номинальное значение математического ожидания составляет 12,5, и в соответствии с предположением специалиста, обслуживающего процесс, наблюдаемые значения процесса стабильно ниже номинального значения. Проведено исследование процесса, отобрана случайная выборка обьема 10 единиц (соответствующие значения взяты из примера в 1.9). Выдвинуты следующие гипотезы.

Нулевая гипотеза: HqL ц 2 12,5.

Альтернативная гипотеза: W_f: р < 12,5.

Выборочное среднее составляет 9,7, что согласуется с предположением, но достаточно далеко от значения 12,5. Для данного примера статистика критерия (1.52) составляет -1,9764, что соответствует р-значению 0,040. Это означает, что менее чем в четырех случаях из 100 наблюдений значение статистики критерия составит -1,9764 и ниже, если в действительности истинное среднее процесса составляет 12,5. Если исходный заданный уровень значимости составляет 0,05, то нулевую гипотезу отвергают в пользу альтернативной.

В качестве еще одного примера задача может быть рассмотрена иначе. Высказано предположение о том, что процесс отклоняется от своего целевого значения, составляющего 12,5, но направление отклонения не известно. Данное предположонио приводит к следующим гипотозам.

Нулевая гипотеза: Hp у. = 12,5.

Альтернативная гипотеза: W_f: р 4 12,5.

В качестве рассматриваемых данных взята ранее приведенная выборка, значение статистического критерия также составляет -1,9764. При выдвинутой альтернативной гипотезе важен ответ на вопрос: «какова вероятность появления такого или еще более отклоняющегося значения?• В данном случае существуют две соответствующие области значений: значения, меньшие или равные -1,9764, и значения, большие или равные-1,9764. Вероятность того, что статистика t критерия попадет в одну из этих областей, составляет 0,080 (дважды одностороннее значение). В восьми случаях из 100 значение статистики критерия равно или превосходит данное значение. Таким образом, при уровне значимости 0,05 нулевую гипотезу не отклоняют.

Примечание 1 — Если, например, p-значение оказывается равным 0,029. то менее трех шансов из 100, что такое или еще более экстремальное значение может возникнуть при нулевой гипотезе На основе этой информации, так как p-значение довольно мало, может быть принято решение об отклонении нулевой гипотезы

power of a test puissance d un test

Примечание 2 — Термин p-значение иногда рассматривают как вероятность значимости, которую не стоит путать с уровнем значимости (1 45). являющимся заданным значением в прикладных статистических исследованиях

1.50 мощность критерия: Единица минус вероятность (2.5) ошибки второго еп

рода (1.47). fr

Примечание 1 — Мощность критерия для заданного значения неизвестного параметра (2 9) в семействе распределений (2 8) равна вероятности отклонения нулевой гипотезы (1 41) при данном значении параметра

Содержание

Область применения………………………………………………………………………………………………………………………1

1 Общие статистические термины…………………………………………………………………………………………………..1

2 Термины, используемые в теории вероятностей………………………………………………………………………….18

Приложение А (справочное) Обозначения……………………………………………………………………………………..41

Приложение В (справочное) Схемы для статистических терминов………………………………………………….43

Приложение С (справочное) Схемы для терминов, связанных с теорией вероятностей…………………..49

Приложение D (справочное) Методология разработки словаря……………………………………………………….53

Алфавитный указатель терминов на русском языке……………………………………………………………………….56

Алфавитный указатель эквивалентов терминов на английском языке……………………………………………..59

Алфавитный указатель эквивалентов терминов на французском языке…………………………………………..62

Библиография………………………………………………………………………………………………………………………………65

Примечание 2 — На практике в большинстве случаев увеличение объема выборки приводит к увеличению мощности критерия Другими словами, вероятность отклонения нулевой гипотезы, когда верна альтернативная гипотеза (1.42), возрастает вместе с увеличением выборки, тем самым снижая вероятность ошибки второго рода Примечание 3 — Предпочтительно, чтобы объем выборки был достаточно большим, это важно для обнаружения даже небольших отклонений от нулевой гипотезы и, как следствие, для отклонения нулевой гипотезы Другими словами, мощность критерия должна приближаться к единице для каждой альтернативы нулевой гипотезы вместе с неограниченным увеличением объема выборки Такие критерии называют состоятельными При сравнении двух критериев по мощности критерий с более высокой мощностью считают более эффективным при условии, что уровни значимости идентичны, а также совпадают нулевые и альтернативные гипотезы Более формальное математическое описание состоятельности и эффективности критерия выходит за рамки настоящего стандарта. Для получения подобной информации могут быть использованы книги и справочники по статистике и математической статистике

ел power curve

fr courbe de

puissance

en test statistic

fr statistique de

test

1.51 кривая мощности: Набор значений мощности критерия (1.50) как функция параметра (2.9) генеральной совокупности из семейства распределений (2.8).

Примечание —См также термин «кривая оперативной характеристики» (ИСО 3534-2 2006.4 5.1).

1.52 статистика критерия: Статистика (1.8). используемая вместе со статистическим критерием (1.48).

Примечание — Статистику критерия используют для определения того, какой гипотезе— нулевой (1 41) или альтернативной (1 42) —соответствует распределение (2.11).

en	graphical descriptive statistics
fr	statistique descriptive graphique
en	numerical descriptive statistics
fr	statistique descriptive num6rique
en	classes
fr	classes
en	class
fr	classe
en	class
fr	classe
en	class
fr	classe
en	class limits, class boundaries
fr	bornes de classe. fron-ti6res de classe
en	mid-point of class
fr	centre de dasse 17

1.53 графическая описательная статистика: Описательная статистика (1.5), представленная в графической форме.

Примечание — Как правило, описательную статистику используют для редуцирования большого количества значений до небольшого управляемого числа или для представления в наглядной форме Примерами графических представлений данных являются «ящики с усами», график вероятности, график «квантиль-квантиль», график нормального квантиля, точечная диаграмма, диаграмма рассеяния и гистограмма (1.61).

1.54 числовая описательная статистика: Описательная статистика (1.5), представленная в числовой форме.

Примечание — Числовыми описательными статистиками являются выборочное среднее (1 15). выборочный размах (1 10). выборочное стандартное отклонение (1 17), интерквантильный размах и т. п

1.55 классы

Примечание — Предполагают, что классы полны и не пересекаются Действительная прямая представляет собой все действительные числа между —> и -к».

1.55.1 класс (качественная характеристика): Подмножество элементов выборки (1.3).

1.55.2 класс (порядковая характеристика): Множество, состоящее из одной или нескольких смежных категорий на порядковой шкале.

1.55.3 класс (количественная характеристика): Отрезок действительной прямой.

1.56 границы класса; пределы класса (количественная характеристика): Значения. определяющие верхнюю и нижнюю границы класса (1.55).

Примечание — Данное определение относится к классам с количественной характеристикой

1.57 середина класса (количественная характеристика): Среднее арифметическое верхней и нижней границ класса (1.56).

Введение
В настоящем стандарте использован минимальный уровень математической абстракции, при котором возможно введение последовательных, корректных и лаконичных определений. Термины, представленные в настоящем стандарте, являются основополагающими в теории вероятностей и статистике. вследствие чего они имеют несколько усложненное математическое представление. Работа с другими стандартами по прикладной статистике предполагает обращение к настоящему стандарту для уточнения определений соответствующих терминов, по этой причине некоторые определения представлены менее формально и сопровождены примечаниями и примерами. Данное неформальное представление не заменяет собой формальных определений, но позволяет работать с приведенными терминами и определениями пользователям с различными уровнями подготовки в области теории вероятностей и математической статистики. Примечания и примеры позволяют настоящему стандарту быть более доступным для пользователей.

Корректное и полное определение терминов, используемых в теории вероятностей и математической статистике, важно для разработки и эффективного применения стандартов, содержащих статистические методы. Определения, представленные в настоящем стандарте, являются достаточно точными и имеют необходимый уровень математического представления, что дает возможность разработчикам стандартов на статистические методы избежать неопределенности в представлении информации. Более детальное представление содержания излагаемых концепций и сферы их применения приведено в литературе по теории вероятностей и математической статистике.

В приложениях представлены схемы для каждой группы терминов: 1) общие статистические термины (приложение В) и 2) термины, используемые в теории вероятностей (приложение С). Приведены шесть диаграмм для общих статистических терминов и четыре диаграммы для терминов, связанных с теорией вероятностей. Некоторые термины включены в несколько диаграмм, что обеспечивает связь между представленными концепциями. Приложение D содержит краткое введение в методологию концептуальных диаграмм и их интерпретацию.

Использованные схемы позволяют выявлять взаимосвязи терминов. Они также полезны при переводе терминов на другие языки.

Большая часть терминов и определений, представленных в настоящем стандарте, если не указано иное, дана для одномерного случая без упоминания этого предположения. Это позволяет избежать многократных указаний на размерность в большинстве определений.

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Статистические методы СЛОВАРЬ И УСЛОВНЫЕ ОБОЗНАЧЕНИЯ Часть 1

Общие статистические термины и термины, используемые в теории вероятностей

Statistical methods Vocabulary and symbols Part 1. General statistical terms and terms used in probability

Дата введения — 2020—01—01

Область применения¹^

Настоящий стандарт устанавливает общие статистические термины и термины, используемые в теории вероятностей, которые могут быть использованы при разработке других стандартов. Приведенные в настоящем стандарте термины подразделены:

a) на общие статистические термины (раздел 1);

b) термины, используемые в теории вероятностей (раздел 2).

Приложение А содержит перечень обозначений и сокращений, используемых в настоящем стандарте. Термины и определения, представленные в настоящем стандарте, упорядочены в соответствии со схемами, приведенными в приложениях В и С.

1 Общие статистические термины

population

еп

1.1 (генеральная) совокупность: Множество всех рассматриваемых единиц. .

Примечание 1— Совокупность может состоять из реальных объектов и быть конеч- ¹ной. может состоять из реальных объектов и быть бесконечной или может быть полностью гипотетической Иногда используют термин «конечная совокупность», особенно в ситуациях. связанных с получением конечных выборок Подобным образом термин «бесконечная совокупность» используют в случае выборки из континуума В главе 2 совокупность рассматривается в вероятностном контексте как пространство элементарных событий (21).

Примечание 2 — Гипотетическая совокупность позволяет делать различные предположения о природе ожидаемых данных Таким образом, гипотетическая совокупность полезна на стадии статистических исследований, особенно при выборе подходящего объема выборки Гипотетическая совокупность может состоять из конечного или бесконечного числа элементов Ее использование особенно полезно при работе с аналитическими статистиками в статистических исследованиях

sampling unit unit6

dtechantillon-

nage

Примечание 3 — Область применения исследований определяет свойства совокупности Например, если для демографического или медицинского исследования выбраны три населенных пункта, то генеральная совокупность состоит из жителей данных конкретных населенных пунктов Однако если эти три населенных пункта выбраны случайным образом среди всех населенных пунктов заданного региона, то совокупность состоит из всех жителей данного региона

еп

1.2 выборочная единица: Одна из конкретных единиц, из которых состоит генеральная совокупность (1.1).

Примечание —В зависимости от обстоятельств единицей может быть человек, семья, учебное заведение, административное подразделение и т д

Разделу не присвоен номер для сохранения идентичности настоящего стандарта

Издание официальное

1.3 выборка: Подмножество генеральной совокупности (1.1). состоящее из од- еп

sample

6chantillon

ной выборочной единицы (1.2) или более. fr

Примечание 1 — В зависимости от рассматриваемой генеральной совокупности выборочными единицами могут быть предметы, числовые значения или даже абстрактные объекты

observed value vale u г observ6e

Примечание 2 — Определение выборки, приведенное в ИСО 3534-2. включает пример схемы отбора выборки, которая необходима при отборе случайной выборки из конечной совокупности

1.4 наблюдаемое значение: Значение исследуемой характеристики, получен- еп

ное в результате единичного наблюдения. fr

Примечание 1 — Часто используемые синонимы данного понятия — это «реализация* и «данная величина» Множественное число от понятия «данная величина» —данные

descriptive statistics statistique descriptive

Примечание 2 — Определение не указывает на происхождение или способ получения данного значения Значение может представлять только одну реализацию случайной величины (2.10), но это не является общей ситуацией Последующему статистическому анализу может быть подвергнута одна из нескольких реализаций случайной величины Несмотря на то что соответствующие выводы требуют некоторого статистического обоснования. ничто не препятствует вычислительной обработке или графическому представлению наблюдаемых значений Только при появлении таких вопросов, как определение вероятности появления конкретного набора реализаций случайной величины, применение статистических методов обработки данных становится уместным и важным Предварительный этап изучения наблюдаемых значений, как правило, относят к анализу данных

1.5 описательная статистика: Краткое представление наблюдаемых значе- еп ний (1.4) в графическом, численном или ином виде.

Пример 1 — Численные сводки включают выборочное среднее (1.15), выбороч- ^ ный размах (1.10), выборочное стандартное отклонение (1.17) и т. д.

Пример 2 — Примеры графических представлений включают «ящики с усами», диаграммы, графики «квантиль-квантиль», графики нормального квантиля, диаграммы рассеяния, множественные диаграммы рассеяния и гистограммы.

random sample

6chantillon

al6atoire

1.6 случайная выборка: Выборка (1.3), отобранная методом случайного отбора¹), еп

Примечание 1 — Данное определение имеет меньше ограничений, чем приведенное в ИСО 3534-2, которое допускает наличие бесконечной генеральной совокупности Примечание 2 — Когда выборка из л выборочных единиц отобрана из конечного пространства элементарных событий (2.1), каждая из возможных комбинаций л выборочных единиц имеет свою вероятность (2 5) быть отобранной Для выборочных планов данных опроса конкретная вероятность каждой возможной комбинации может быть вычислена заранее Примечание 3 — Для выборочных планов данных опроса, составляемых для конечного пространства элементарных событий, случайная выборка может быть отобрана с помощью различных планов отбора выборки, таких как планы отбора стратифицированной случайной выборки, систематической случайной выборки, групповой выборки, выборки с вероятностью отбора пропорционально величине вспомогательной переменной, а также с помощью различных других планов

Примечание 4 — Как правило, определение относят к фактическим наблюдаемым значениям (14) Эти наблюдаемые значения считают реализациями случайных величин (2 10), и каждое наблюдаемое значение соответствует одной случайной величине Если оценки (1 12). статистические критерии для проверки статистических гипотез (1 48) и доверительные интервалы (1 28) получены на основе случайной выборки, определение дополняют ссылкой на случайные величины, возникающие в большей степени на основе абстрактных объектов выборки, чем на основе фактически наблюдаемых значений этих случайных величин

Примечание 5 — Случайные выборки из бесконечной генеральной совокупности часто генерируют путем многократного отбора из пространства элементарных событий таким образом, что выборка состоит из независимых одинаково распределенных случайных величин в соответствии с интерпретацией данного определения, приведенной в примечании 4

’) Случайный отбор — метод образования выборки из генеральной совокупности, при котором для каждого элемента генеральной совокупности существует предполагаемая вероятность попасть в выборку

1.7 простая случайная выборка: Случайная выборка (1.6) из конечной гене- еп

simple random sample

6cfiantillon simple aleatoire

statistic

statistique

ральной совокупности, такая, что всем подмножествам заданного объема соответствует одна и та же вероятность быть отобранными. fr

Примечание —Данное определение гармонизировано с определением, приведенным в ИСО 3534-2, хотя и имеет немного отличную формулировку

1.8 статистика: Полностью определенная функция случайных величин (2.10). еп

Примечание 1— Для случайной выборки (16), понимаемой в смысле примеча- ^ ния 4 к 1.6, статистика представляет собой функцию случайных величин Примечание 2 — В соответствии с примечанием 1. если {X_1t Х₂…..Х„) — слу

чайная выборка из нормального распределения (2 50) с неизвестным математическим ожиданием (2 35) ц и неизвестным стандартным отклонением (2 37) о. то выражение (X, ♦ X, ♦ … ♦ Х_п)1п представляет собой статистику, называемую выборочным средним (1 15). тогда как выражение ((X, + Х₂ ♦ + Х_п)1п] – ц не является статистикой, так как

включает неизвестное значение параметра (2.9) р.

order statistic

statistique

d’ordre

Примечание 3 — Приведенное определение является формальным и соответствует трактовке, используемой в математической статистике В приложениях многочисленные статистические данные, в частности статистики, могут иметь отношение к различным областям технических знаний, включающим анализ действий, представленный в международных стандартах ISOH’C 69

1.9 порядковая статистика: Статистика (1.8), определяемая порядковым но- ел мером случайной величины (2.10) в ряду случайных величин, расположенных в fr неубывающем порядке.

Пример — Пусть выборка состоит из наблюдаемых значений (1.4): 9, 13, 7, б, 13,

7, 19, 6, 10 и 7. Наблюдаемые значения в порядке неубывания: 6, 6, 7, 7, 7, 9, 10, 13,

13, 19. Эти значения являются реализациями порядковых статистик X_fI…. Х₁₀.

Примечание 1 — Пусть наблюдаемые значения (14), составляющие случайную выборку (1 6). образующие множество {*,. х₂…..х„). при сортировке в неубывающем порядке обозначены следующим образом х₍₁₎ £… £ х_(А) £ .. £ х_(п) Тогда (х₍₁₎…..x_(fc……х_(п»)

представляют собой наблюдаемые значения порядковой статистики (Х₍₁₎….. *<*>…..*«>•

а х_(к) — наблюдаемое значение к-и порядковой статистики

Примечание 2 — На практике определение порядковых статистик для набора данных сводится к сортировке данных, как формально описано в примечании 1 Отсортированные данные применяют для определения полезных сводных статистик, как представлено в нескольких следующих определениях

Примечание 3 — Порядковая статистика представляет собой выборочное значение, соответствующее его позиции в последовательности данных после их ранжирования в неубывающем порядке Как показано в примере, легче понять сортировку выборочных значений (реализаций случайных величин), чем сортировку ненаблюдаемых случайных величин Тем не менее можно представлять случайные величины из случайной выборки (1 6), упорядоченной в неубывающем порядке Например, максимальное значение набора из л случайных величин может быть изучено заранее на основе его реализованного значения Примечание 4 — Отдельная порядковая статистика представляет собой полностью заданную функцию случайной величины. Эта функция является идентификатором положения или ранга случайной величины в отсортированном наборе случайных величин Примечание 5 — Потенциальную проблему представляет ранжирование совпадающих значений, особенно для дискретных случайных величин и для значений, полученных с низкой точностью Формулировка «неубывающий порядок» точнее, чем «возрастающий порядок», при учете всех тонкостей процесса ранжирования данных Необходимо акцентировать внимание на том. что совпадающие значения сохраняют при обработке данных, а не заменяют одним значением В примере, представленном выше, две реализации. «6» и «6», представляют собой совпадающие значения

Примечание 6 — Упорядочивание выполняют на основе фактических значений, а не на основе абсолютных значений случайных величин

Примечание 7 — Полный набор порядковых статистик составляет случайную величину размерности п, где л — число наблюдений в выборке.

Примечание 8 — Компоненты порядковой статистики также рассматривают как порядковые статистики, но снабженные спецификатором, указывающим их номер в упорядоченной последовательности значений в выборке

Примечание 9 — Минимальное и максимальное значения, а также при нечетном объеме выборки выборочная медиана (1.13) представляют собой частные случаи порядковых статистик Например, для выборки объема 11 единиц. Х₍₁₎— минимум, Х₍₁₀₎— максимум и Х₍₆₎ — выборочная медиана

1.10 выборочный размах: Разность между значениями наибольшей и наи- еп

sample range

fetendue

d’6chantillon

меньшей порядковых статистик (1.9). fr

Пример — Для примерз, рассмотренного о 1.9, выборочный размах, полученный на основе наблюдений, равон 19-6 = 13.

mid-range milieu de letendue

Примечание — В статистическом управлении процессами выборочный размах часто используют для отслеживания дисперсии процесса, особенно при относительно небольших объемах выборки.

1.11 середина размаха: Среднее арифметическое (1.15) наименьшей и наи- еп

большей порядковых статистик (1.9). fr

Пример — В примере, рассмотренном в 1.9, середина размаха на основе наблюдений равна (6 + 19)12 = 12,5.

Примечание — Середина размаха дает быструю и простую оценку середины небольших наборов данных

estimator

estimateur

1.12 оценка: б статистика (1.8). используемая для оценивания (1.36) лараме- ел

тра 0. fr

Примечание 1 —Оценкой может быть выборочное среднее (1.15) при определении оценки математического ожидания (2 35) генеральной совокупности, которое может быть обозначено р. Для такого распределения (2.11), как нормальное распределение (2.50), естественной оценкой математического ожидания генеральной совокупности р является выборочное среднее

Примечание 2 — При определении оценок характеристик генеральной совокупности [например, моды (2 27) для одномерного распределения (2 16)] подходящей оценкой может быть функция оценки(ок) параметра распределения или сложная функция случайной выборки (1 6).

sample median

m^diane

dechantillon

Примечание 3 — Термин «оценка* использован в широком смысле Он включает в себя как точечную, так и интервальную оценки параметра, которые могут быть использованы для прогнозирования (иногда их рассматривают как прогностические факторы) Оценка также может включать в себя такие функции, как ядерные оценки и другие специальные статистики Дополнительная информация приведена в примечаниях к 1.36

1.13 выборочная медиана: Значение [(л + 1)/2]-й порядковой статистики (1.9) при ел нечетном объеме выборки п (см. ИСО 3534-2:2006,1.2.26); значение суммы (л/2)-й и fr [(л/2) + 1 )-й порядковых статистик, деленной на два, при четном объеме выборки п.

Пример — В примере, приведенном в 1.9, значение 8 представляет собой реализацию выборочной медианы. В этом случае (четный объем выборки равен 10) 5-е и 6-е значения составили 7 и 9, их среднее равно 8. На практике это заносят в отчет в виде «выборочная медиана равна 8», хотя, строго говоря, выборочная медиана является случайной величиной.

Примечание 1—Для случайной выборки (1 6)объема п случайные величины (2 10). которые расположены в неубывающем порядке от 1 до п, выборочная медиана — это (л ♦ 1у2-я случайная величина в случае нечетного объема выборки При четном объеме выборки п выборочная медиана равна среднему арифметическому (л/2)-й и [(л/2) ♦ 1]-й случайных величин

Примечание 2 — Упорядочивание случайных величин, для которых наблюдения отсутствуют, может казаться невозможным Тем не менее в рамках работы с порядковыми статистиками данный анализ может быть произведен На практике получают наблюдаемые значения и, сортируя эти значения, реализации порядковых статистик Данные реализа^и могут быть проинтерпретированы исходя из структуры порядковых статистик случайной выборки Примечание 3 — Выборочная медиана является оценкой середины распределения, с каждой стороны от которой лежит половина выборки.

Примечание 4 — На практике выборочная медиана полезна как оценка, не чувствительная к наличию в выборке сильно удаленных крайних значений Например, в обзорах в качестве «среднего дохода» и «средней цены на жилье» часто указывает медиану

sample moment of order k moment dechantillon d ordre k

1.14 выборочный момент порядка А; Е(Х*): Сумма А-х степеней случайных ел

величин (2.10) случайной выборки (1.6), деленная на число наблюдений в выборке (1.3). fr

Примечание 1— Для случайной выборки объема л, т е для (X,, Х₂…..XJ, выбо

рочный момент порядка А, £(Х*) — это

Примечание 2 — Кроме того, данное понятие можно характеризовать как начальный выборочный момент порядка к

Примечание 3 — Выборочный момент порядка 1, представленный в следующем определении, является выборочным средним (1 15).

Примечание 4 — Хотя определение дано для произвольного к, на практике, как правило, рассматривают следующие значения к. к -1 (выборочное среднее (1 15)), к = 2 (связано с выборочной дисперсией (1 16) и выборочным стандартным отклонением (1.17)], к = 3 (связано с выборочным коэффициентом асимметрии (1.20)] и к = 4 (связано с выборочным коэффициентом эксцесса (1 21)]

ел sample mean (average, arithmetic mean) fr moyenne d’6chantillon (moyenne. moyenne arith-m6tique)

Примечание 5 — Использование буквы «£» в записи £(Х*) связано с тем. что с этой буквы начинается аклийская запись понятий «ожидаемое значение» («expected value») и «ожидание» («expectation»).

1.15 выборочное среднее: среднее арифметическое: Сумма случайных величин (2.10) случайной выборки (1.6). деленная на число слагаемых в этой сумме.

Пример — В примере, приведенном в 1.9, значение выборочного среднего составляет 9,7, т. к. сумма наблюдаемых значений равна 97, а объем выборки равен 10.

Примечание 1 — Рассматриваемое как статистика выборочное среднее представляет собой функцию случайных величин из случайной выборки в смысле, указанном в примечании 3 к 1 8 Необходимо отличать функцию от численного значения выборочного среднего, вычисленного на основе наблюдаемых значений (1 4) случайной выборки Примечание 2 — Рассматриваемое как статистика выборочное среднее часто используют как оценку математического ожидания (2 35) генеральной совокупности Часто используемым синонимом является арифметическое среднее.

Примечание 3 — Для случайной выборки объема л. т е для {X,. Х₂…..Х^}, выбо

рочное среднее — это

Примечание 4 — Выборочное среднее является моментом первого порядка Примечание 5 — Для выборки объема, равного двум, выборочное среднее, выборочная медиана (1.13) и середина размаха (1 11) совпадают.

en sample variance fr variance

d’6chantillon

1.16 выборочная дисперсия: S²: Сумма квадратов отклонений случайных величин (2.10) случайной выборки (1.6) от их выборочного среднего (1.15). деленная на число слагаемых в этой сумме минус один.

Пример—Для примера, приведенного в 1.9, значение выборочной дисперсии составляет 17,57. Сумма квадратов отклонений от выборочного среднего равна 158,10; данная сумма поделена на число 9, что составляет объем выборки 10 минус один.

Примечание 1 — Рассматриваемая как статистика (1 8) выборочная дисперсия S²является функцией случайных величин случайной выборки Данную статистику (1.12) следует отличать от численного значения выборочной дисперсии, вычисленной на основе наблюдаемых значений (1 4) случайной выборки. Это численное значение называют эмпирической выборочной дисперсией или наблюдаемой выборочной дисперсией и обычно обозначают $²

Примечание 2_— Для случайной выборки объема л. т е для {X,. Х₂, .. Х^. с выборочным среднимХ, выборочная дисперсия — это

Примечание 3 — Выборочная дисперсия — это статистика, которая «почти» совпадает со средним арифметическим квадратных отклонений случайных величин (2.10) от их выборочного среднего (так как сумму делят не на л. а на л – 1). Использование л – 1 дает несмещенную оценку (1 34) дисперсии генеральной совокупности (2.36). Примечание 4 — Величину л – 1 называют числом степеней свободы (2 54) Примечание 5 — Выборочная дисперсия является вторым выборочным моментом случайных величин нормализованной выборки (1.19).

1.17 выборочное стандартное отклонение; S: Неотрицательное значение ква- ел дратного корня из выборочной дисперсии (1.16).

sample standard deviation 6cart-type d’6chantillon

Пример — Для примера, приведенного о 1.9, значение выборочного стандарт- *^гного отклонения составляет 4,192, т. к. полученная выборочная дисперсия составляет 17,57.

Примечание 1 — На практике выборочное стандартное отклонение используют для определения оценки стандартного отклонения (2 37) S также является случайной величиной (210). а не значением, полученным по реализации случайной выборки (16) Примечание 2 — Выборочное стандартное отклонение является мерой разброса распределения (2.11).

sample coefficient of variation coefficient de variation d’6chantilk>n

standardized sample random variable variable aleatoire centr6e r6duite d’6chantillon

1.18 выборочный коэффициент вариации: Выборочное стандартное откло- ел нение (1.17). деленное на выборочное среднее (1.15).

Примечание — Как и в случае коэффициента вариации (2.38), полезность этой статистики ограничена генеральными совокупностями, содержащими положительные fr значения Величину выборочного коэффициента вариации обычно представляют в процентах На практике выборочный коэффициент вариации, как правило, применяют, когда вариация возрастает пропорционально среднему

1.19 стандартизованная выборочная случайная величина: Разность случай- ел ной величины (2.10) и ее выборочного среднего (1.15), деленная на выборочное стандартное отклонение (1.17).

Пример — Для примера, приведенного в 1.9, полученное выборочное среднее со- ^ ставляет 9,7, а полученное выборочное стандартное отклонение — 4,192; таким образом, полученные значения стандартизованной выборки составляют: -0,17; 0,79; -0,64; -0,88; 0,79; -0,64; 2,22; -0,88; 0,07; -0,64.

Примечание 1 — Стандартизованную выборочную случайную величину следует отличать от ее теоретического аналога — стандартизованной случайной величины (2.33) Целью стандартизации случайной величины является ее преобразование в случайную величину с нулевым математическим ожиданием и стандартным отклонением, равным единице, данное преобразование проводят для простоты интерпретации и сравнения данных

sample

coefficient of

skewness

coefficient

d’asymetrie

d‘6chantillon

Примечание 2 — Стандартизованные наблюдаемые значения имеют нулевое наблюдаемое среднее и наблюдаемое стандартное отклонение, равное единице

1.20 выборочный коэффициент асимметрии: Среднее арифметическое стан- ел дартизованных выборочных случайных величин (1.19) случайной выборки (1.6) в третьей степени.

Пример — Для примера, приведенного в 1.9, получен выборочный коэффициент ^ асимметрии 0,97188. Для такого объема выборки (п * 10) выборочный коэффициент асимметрии имеет высокую изменчивость, поэтому требует осторожности при использовании. Применение альтернативной формулы, представленной в примечании 1, дает значение 1,34983.

Примечание 1— Определению соответствует следующая формула:

щую формулу

Некоторые программы статистической обработки данных с целью корректировки смещения (1.33) используют для вычисления выборочного коэффициента асимметрии следую-

_ п

_1_fz³

(л-1)(л-2)£ ‘■

, Х,-Х где Zj = —“

При больших обьемах выборок разность значений этих двух оценок пренебрежимо мала Отношение несмещенной оценки к смещенной для п = 10 составляет 1,389. для п = 100 – 1.031 и для п = 1000