Корреляция выборок данных. Расчет значимости данных.

Корреляция-цен-на-нефть

Цель коорреляционного анализа заключается в установлении факта наличия или отсутствия связи между рядом случайных величин.

Переменные x и y представляют собой числовые переменные, если в результате каждого эксперимента получается конкретное число, которое можно наносить на график.

Ординальные переменные – переменные, в соответствии которым могут быть поставлены каким-то условным образом определенные числа, характеризующие степень проявления изучаемого свойства.

Номинальные переменные – переменные, позволяющие разбивать исследуемые объекты на некоторые классы.

Статические характеристики, устанавливающие связь между числовыми переменными (при линейной связи x и y).

Статическая связь между случайными величинами x и y характеризуется с помощью:

a11=M[X Y] – корреляционного момента и

m11=M[(X-mx)(Y-my)] – ковариационного момента.

При статическом анализе обычно пользуются нормированной характеристикой, называемой коэффициентом корреляции r:

r=(M[(X-m_{x})(Y-m_{y})])/\sqrt{(M[(X-m_{x})^2(Y-m_{y})^2])}

Если статическая связь полная, то r=±1.

Если статическая связь отсутствует, то r=0.

Строго говоря, коэффициент корреляции r позволяет судить о степени статической связи только при линейной связи X и Y. Поэтому при r=0 говорят об отсутствии корреляции между X и Y (а не об отсутствии статической связи).Для оценки коэффициента корреляции используют следующее соотношение:

\tilde{r}=(\sum_{i=1}^{n}{(X_{i}-\bar{X})(Y_{i}-\bar{Y})})/\sqrt{\sum_{i=1}^{n}{(X_{i}-\bar{X})^2}\sum_{i=1}^{n}{(Y_{i}-\bar{Y})^2)}} ?

где  \bar{X}=(\sum_{i=1}^{n}{X_{i}})/n\bar{Y}=(\sum_{i=1}^{n}{Y_{i}})/n .

Анализ статической связи между ординальными (порядковыми) переменными.

К ординальным переменным относятся переменные позволяющие упорядочивать (ранжировать) рассматриваемые объекты по степени проявления изучаемого свойства (установить порядок, ранг объекта).

Если обозначить Xi(k) ранг i объекта по признаку k, то можно определить ранговый коэффициент корреляции Спирмэна по формуле:

\tau_{kj}^{(S)}={1-(6/n^3-n)\sum_{i=1}^{n}{(X_{i}^{k}-X_{i}^{j})^2}}

где n – число сравниваемых рангов.

При совпадающих ранжировках Xi(k) и Xi(j) tkj(s)=1. Если ранжировка будет противоположной – наименьший ранг Xi(k) соответствует наибольшему Xi(j), то tkj(s)=-1. Если tkj(s)=0, статическая связь между ординальными переменными отсутствует.

Кроме рангового коэффициента корреляции Спирмена используется также и ранговый коэффициент корреляции Кендалла:

\tau_{ij}^{(k)}=1-(4v(X^{i}, X^{j}))/n(n-1)  - минимальное число обменов соседних элементов последовательности X(i), необходимое для приведения ее к упорядочению X(j).

\tau_{ij}^{(k)}=1 , при одинаковой ранжировке;

\tau_{ij}^{(k)}1 , при противоположной ранжировке;

\tau_{ij}^{(k)}=0 , при отсутствии статической связи.


Оставить комментарий

  • Список наук

  • Образовательные статьи