Выборочные значения и ранги
Автор: Zhanar Muldabekova • Март 27, 2022 • Лекция • 1,118 Слов (5 Страниц) • 235 Просмотры
3.3. Выборочные значения и ранги
Обратим теперь внимание на «ранги» - числа, входящие в качестве индексов в обозначения элементов упорядоченной выборки. Совокупность этих элементов обладает особыми вероятностными свойствами и, кроме того, может быть с пользой применена в практических целях. Ранг, как уже было отмечено, означает место элемента (или соответствующего ему значения) в ранжированной выборке. Наименьший элемент получает ранг 1 r , а наибольший n r . Очевидно, что ранги – целые положительные числа. Пусть образуется выборка объема n и из исходной совокупности извлекается очередной элемент, которому предстоит занять свое место в ранжированном ряду. Каков же будет его ранг? Очевидно, если значение i x , присущее элементу, еще не известно или с другими элементами он еще не сравнивался, объективная возможность для него, занять любое из мест в выборке, одинакова. Это значит, что совокупность рангов - случайная nмерная величина R- дискретна и распределена равномерно, так, что для всех m- n rp m / 1) ( ) ( !. Часто совокупность рангов nrrrR ...,,, 21 называют ранговым вектором. Он также случаен, его реализации являются перестановками чисел n ...,, 2, 1 , и число возможных реализаций равно ! n . Ранжируя выборку, мы вместо исходной ix получаем пару вероятностных объектов: ранжированную выборку )( ix и вектор рангов R, состоящих с исходной выборкой в однозначном соответствии. Естественно, что по )( ix и R можно восстановить исходную выборку. Это значит, что упорядоченная выборка и вектор рангов содержат ту же информацию, что и исходная выборка. Как упорядоченная выборка, так и вектор рангов описывают один и тот же объект - исходную случайную выборку ix , причем ix и R статистически независимы. Совместное n- мерное распределение непрерывной величины )( ix и дискретной величины R представляет собой произведение значений распределений этих величин. Можно оценить зависимость между ix и R с помощью распространенной меры статистической связи - коэффициента корреляции. По определению коэффициент корреляции между исследуемыми объектами равен:
RX RX RX D D Er ExE n ) )(( )(,
. (1.18)
Преобразование этого выражения, с учетом того, что распределение R равномерно, приводит к:
)(ρ
1 1
)( ρ , x F n n nRX . (1.19)
Произошедшая в (1.18) факторизация показывает, что один сомножитель зависит только от объема выборки и стремится к 1 при n . Второй сомножитель определяется лишь видом исходного распределения. А это значит, что коэффициент корреляции между значением и рангом не зависит от параметров расположения и рассеяния этих случайных величин. Действительно, если «сдвинуть ранги, т.е. пронумеровать элементы выборки при 10 n не от 1 до 10, а, например, от 11 до 20, то вероятностная связь между значениями и рангами от этого не нарушится, как и для любых других значений «сдвига». Вычислим далее количество информации, которое несут друг о друге распределения параметров и рангов. Преобразование общего по определению выражения:
dx
rpxf rxf
rxfRXJ
n
r X
1 ) ()( ), ( ln), ()
,(
, (1.20)
где n r ..., ,2, 1 ; ) (rp
- вероятности рангов, приводит при n к асимптотической формуле:
2
ln
2 1
ln
2 1
),(
e
nRXJ
...