Значение НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ в Большой советской энциклопедии, БСЭ

Что такое НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ

методы в математической статистике, методы непосредственной оценки теоретического распределения вероятностей и тех или иных его общих свойств (симметрии и т.п.) по результатам наблюдений. Название Н. м. подчёркивает их отличие от классических (параметрических) методов, в которых предполагается, что неизвестное теоретическое распределение принадлежит какому-либо семейству, зависящему от конечного числа параметров (например, семейству нормальных распределений ) , и которые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять те или иные гипотезы относительно их значений. Разработка Н. м. является в значительной степени заслугой советских учёных.

В качестве примера Н. м. можно привести найденный А. Н. Колмогоровым способ проверки согласованности теоретических и эмпирических распределений (так называемый критерий Колмогорова). Пусть результаты n независимых наблюдений некоторой величины имеют функцию распределения F ( x ) и пусть Fn ( x ) обозначает эмпирическую функцию распределения (см. Вариационный ряд ) , построенную по этим n наблюдениям, a Dn - наибольшее по абсолютной величине значение разности Fn ( x ) - F ( x ) . Случайная величина

имеет в случае непрерывности F ( x ) функцию распределения Kn (l) , не зависящую от F ( x ) и стремящуюся при безграничном возрастании n к пределу

Отсюда при достаточно больших n, для вероятности pn, l . Неравенства

получается приближённое выражение

pn, l ' 1 - К (l).(*)

Функция К (l) табулирована. Её значения для некоторых А приведены в табл.

Таблица функции К (l)

0,57

0,71

0,83

1,02

1,36

1,63

К (l)

0,10

0,30

0,50

0,75

0,95

0,99

Равенство (*) следующим образом используется для проверки гипотезы о том, что наблюдаемая случайная величина имеет функцию распределения F ( x ) : сначала по результатам наблюдений находят значение величины Dn, а затем по формуле (*) вычисляют вероятность получения отклонения Fn от F, большего или равного наблюдённому. Если указанная вероятность достаточно мала, то в соответствии с общими принципами проверки статистических гипотез (см. Статистическая проверка гипотез ) проверяемую гипотезу отвергают. В противном случае считают, что результаты опыта не противоречат проверяемой гипотезе. Аналогично проверяется гипотеза о том, получены ли две независимые выборки, объёма n1 и n2 соответственно, из одной и той же генеральной совокупности с непрерывным законом распределения. При этом вместо формулы (*) пользуются тем, что вероятность неравенства

как это было установлено Н. В. Смирновым , имеет пределом К (l) , здесь Dn1, n2 есть наибольшее по абсолютной величине значение разности Fn1 ( х ) - Fn2 ( х ) .

Другим примером Н. м. могут служить методы проверки гипотезы о том, что теоретическое распределение принадлежит к семейству нормальных распределений. Отметим здесь лишь один из этих методов - так называемый метод выпрямленной диаграммы. Этот метод основывается на следующем замечании. Если случайная величина Х имеет нормальное распределение с параметрами a и s, то

где Ф-1 - функция, обратная нормальной:

Т. о., график функции у Ф-1 [ F ( x )]будет в этом случае прямой линией, а график функции у Ф-1 [ Fn (x)] - ломаной линией, близкой к этой прямой (см. рис. ). Степень близости и служит критерием для проверки гипотезы нормальности распределения F ( x ) .

Лит.: Смирнов Н. В., Дунин-Барковский И. В., Курс теории вероятностей и математической статистики для технических приложений, 3 изд., М., 1969; Большее Л. Н., Смирнов Н. В., Таблицы математической статистики, М., 1968.

Ю. В. Прохоров.

Большая советская энциклопедия, БСЭ. 2012