Analiza korelacji Spearmana online. Zastosowanie korelacji Spearmana i Pearsona

​ Współczynnik korelacji rang Spearmana jest metodą nieparametryczną stosowaną do statystycznego badania zależności między zjawiskami. W tym przypadku określa się rzeczywisty stopień równoległości pomiędzy obydwoma szeregami ilościowymi badanych cech, a ocenę bliskości powstałego połączenia podaje się za pomocą wyrażonego ilościowo współczynnika.

1. Historia rozwoju współczynnika korelacji rang

Kryterium to zostało opracowane i zaproponowane do analizy korelacji w 1904 roku Charlesa Edwarda Spearmana, angielski psycholog, profesor na uniwersytetach w Londynie i Chesterfield.

2. Do czego służy współczynnik Spearmana?

Współczynnik korelacji rang Spearmana służy do identyfikacji i oceny bliskości związku między dwiema porównywanymi seriami wskaźniki ilościowe. W przypadku, gdy szeregi wskaźników uporządkowane według stopnia wzrostu lub spadku, w większości przypadków pokrywają się ( wyższa wartość jednemu wskaźnikowi odpowiada wyższa wartość innego wskaźnika – np. porównując wzrost i masę ciała pacjenta), stwierdza się, że tak prosty połączenie korelacyjne. Jeżeli szeregi wskaźników mają odwrotny kierunek (wyższa wartość jednego wskaźnika odpowiada niższej wartości drugiego – np. porównując wiek i tętno), potem o tym rozmawiają odwracać połączenia między wskaźnikami.

    Współczynnik korelacji Spearmana ma następujące właściwości:
  1. Współczynnik korelacji może przyjmować wartości od minus jeden do jednego, przy czym przy rs=1 mamy do czynienia z zależnością ściśle bezpośrednią, a przy rs= -1 mamy do czynienia ze ściśle sprzężoną zależnością.
  2. Jeśli współczynnik korelacji jest ujemny, istnieje zależność sprzężenia zwrotnego, jeśli jest dodatni, istnieje zależność bezpośrednia.
  3. Jeśli współczynnik korelacji wynosi zero, wówczas praktycznie nie ma związku między wielkościami.
  4. Im moduł współczynnika korelacji jest bliższy jedności, tym silniejszy jest związek pomiędzy mierzonymi wielkościami.

3. W jakich przypadkach można zastosować współczynnik Spearmana?

Z uwagi na to, że współczynnik jest metodą analiza nieparametryczna, nie jest wymagany test rozkładu normalnego.

Porównywalne wskaźniki można mierzyć zarówno w skala ciągła(na przykład liczba czerwonych krwinek w 1 μl krwi) i w porządkowy(na przykład punkty oceny eksperckiej od 1 do 5).

Skuteczność i jakość oceny Spearmana zmniejsza się, jeśli różnica pomiędzy nimi maleje różne znaczenia którakolwiek z mierzonych wielkości jest wystarczająco duża. Nie zaleca się stosowania współczynnika Spearmana w przypadku nierównomiernego rozkładu wartości mierzonej wielkości.

4. Jak obliczyć współczynnik Spearmana?

Obliczenie współczynnika korelacji rang Spearmana obejmuje następujące kroki:

5. Jak interpretować wartość współczynnika Spearmana?

Stosując współczynnik korelacji rang, warunkowo ocenia się bliskość związku między cechami, biorąc pod uwagę wartości współczynników równe 0,3 lub mniejsze jako wskaźniki słabego połączenia; wartości większe niż 0,4, ale mniejsze niż 0,7 są wskaźnikami umiarkowanej bliskości połączenia, a wartości 0,7 i większe są wskaźnikami dużej bliskości połączenia.

Istotność statystyczną otrzymanego współczynnika ocenia się za pomocą testu t-Studenta. Jeżeli obliczona wartość testu t jest mniejsza niż wartość z tabeli dla danej liczby stopni swobody, znaczenie statystyczne Nie obserwuje się żadnej zależności. Jeżeli jest większa, wówczas korelację uznaje się za istotną statystycznie.

Jeżeli rankingowi podlegają dwie serie wartości, racjonalne jest obliczenie korelacji rang Spearmana.

Takie serie można przedstawić:

  • para cech określonych w tej samej grupie badanych obiektów;
  • parę indywidualnych cech podrzędnych, wyznaczonych w 2 badanych obiektach według tego samego zestawu cech;
  • para grupowych cech podrzędnych;
  • indywidualne i grupowe podporządkowanie cech.

Metoda polega na szeregowaniu wskaźników oddzielnie dla każdej z cech.

Najmniejsza wartość ma najmniejszą rangę.

Metoda ta odnosi się do nieparametrycznej metody statystycznej, mającej na celu ustalenie istnienia związku pomiędzy badanymi zjawiskami:

  • określenie rzeczywistego stopnia równoległości pomiędzy dwoma seriami danych ilościowych;
  • ocena bliskości zidentyfikowanego powiązania wyrażona ilościowo.

Analiza korelacji

Metoda statystyczna mająca na celu identyfikację istnienia związku między 2 lub większą liczbą wartości losowych (zmiennych), a także jego siłę, nazywa się analizą korelacji.

Swoją nazwę zawdzięcza correlatio (łac.) - stosunek.

Podczas jego używania możliwe są następujące scenariusze:

  • obecność korelacji (dodatniej lub ujemnej);
  • brak korelacji (zero).

Jeżeli między zmiennymi zostanie stwierdzona zależność, mówimy o ich korelacji. Innymi słowy, możemy powiedzieć, że gdy zmieni się wartość X, koniecznie zostanie zaobserwowana proporcjonalna zmiana wartości Y.

Jako narzędzia wykorzystywane są różne miary komunikacji (współczynniki).

Na ich wybór wpływają:

  • metoda pomiaru liczb losowych;
  • charakter powiązania między liczbami losowymi.

Istnienie zależności korelacyjnej można przedstawić graficznie (wykresy) oraz za pomocą współczynnika (wyświetlacz numeryczny).

Zależność korelacyjną charakteryzuje się następującymi cechami:

  • siła połączenia (przy współczynniku korelacji od ±0,7 do ±1 – mocne; od ±0,3 do ±0,699 – średnie; od 0 do ±0,299 – słabe);
  • kierunek komunikacji (bezpośredni lub odwrotny).

Cele analizy korelacji

Analiza korelacji nie pozwala na ustalenie związku przyczynowego pomiędzy badanymi zmiennymi.

Wykonuje się go w celu:

  • ustalanie zależności pomiędzy zmiennymi;
  • uzyskanie pewnych informacji o zmiennej na podstawie innej zmiennej;
  • określenie bliskości (powiązania) tej zależności;
  • określenie kierunku nawiązywanego połączenia.

Metody analizy korelacji


Ta analiza można to zrobić za pomocą:

  • metoda kwadratów lub Pearsona;
  • metoda rangi lub Spearman.

Metoda Pearsona ma zastosowanie do obliczeń wymagających precyzyjna definicja siła istniejąca pomiędzy zmiennymi. Charakterystyki badane za jego pomocą należy wyrażać wyłącznie ilościowo.

Aby zastosować metodę Spearmana lub korelację rang, nie ma ścisłych wymagań dotyczących wyrażania cech - może to być zarówno ilościowe, jak i atrybutywne. Dzięki tej metodzie uzyskuje się informację nie o dokładnym określeniu wytrzymałości połączenia, ale ma ona charakter przybliżony.

Zmienne wiersze mogą zawierać otwarte warianty. Na przykład, gdy doświadczenie zawodowe wyrażone jest w wartościach takich jak do 1 roku, powyżej 5 lat itp.

Współczynnik korelacji

Wielkość statystyczna charakteryzująca charakter zmian dwóch zmiennych nazywana jest współczynnikiem korelacji lub współczynnikiem korelacji par. W ujęciu ilościowym waha się od -1 do +1.

Najczęstsze kursy to:

  • osoba– dotyczy zmiennych należących do skali przedziałowej;
  • Włócznik– dla zmiennych skali porządkowej.

Ograniczenia stosowania współczynnika korelacji

Uzyskanie nierzetelnych danych przy obliczaniu współczynnika korelacji jest możliwe w przypadkach, gdy:

  • dostępna jest wystarczająca liczba wartości zmiennych (25-100 par obserwacji);
  • między badanymi zmiennymi ustala się na przykład zależność kwadratową, a nie liniową;
  • w każdym przypadku dane zawierają więcej niż jedną obserwację;
  • obecność nieprawidłowych wartości (odstających) zmiennych;
  • badane dane składają się z wyraźnie wyodrębnionych podgrup obserwacji;
  • obecność korelacji nie pozwala stwierdzić, która ze zmiennych może być uznana za przyczynę, a która w konsekwencji.

Sprawdzenie istotności korelacji

Do oceny wielkości statystycznych wykorzystuje się pojęcie ich istotności lub wiarygodności, które charakteryzuje prawdopodobieństwo losowego wystąpienia wielkości lub jej wartości ekstremalnych.

Najpopularniejszą metodą określania istotności korelacji jest test t-Studenta.

Jego wartość porównuje się z wartością z tabeli, liczbę stopni swobody przyjmuje się jako 2. Gdy otrzymana obliczona wartość kryterium jest większa od wartości z tabeli, świadczy to o istotności współczynnika korelacji.

Przy przeprowadzaniu obliczeń ekonomicznych za wystarczający uważa się poziom ufności 0,05 (95%) lub 0,01 (99%).

szeregi Spearmana

Współczynnik korelacji rang Spearmana pozwala statystycznie ustalić obecność związku między zjawiskami. Jego obliczenie polega na ustaleniu numeru seryjnego – rangi – dla każdego atrybutu. Ranga może być rosnąca lub malejąca.

Liczba cech podlegających rankingowi może być dowolna. Jest to dość pracochłonny proces, który ogranicza ich liczbę. Trudności zaczynają się po osiągnięciu 20 znaków.

Aby obliczyć współczynnik Spearmana, użyj wzoru:

w której:

n – wyświetla liczbę uszeregowanych obiektów;

d to nic innego jak różnica między rzędami dwóch zmiennych;

oraz ∑(d2) jest sumą kwadratów różnic rang.

Zastosowanie analizy korelacji w psychologii

Wsparcie statystyczne badania psychologiczne pozwala uczynić je bardziej obiektywnymi i wysoce reprezentatywnymi. Statystyczne przetwarzanie danych uzyskanych podczas eksperymentów psychologicznych pomaga wydobyć maksymalnie przydatne informacje.

Najpowszechniej stosowaną metodą przetwarzania ich wyników jest analiza korelacji.

Właściwe jest przeprowadzenie analizy korelacji wyników uzyskanych w trakcie badań:

  • lęk (wg badań R. Temml, M. Dorca, V. Amen);
  • relacje rodzinne („Analiza relacji rodzinnych” (AFV) kwestionariusz E.G. Eidemillera, V.V. Yustitskisa);
  • poziom wewnętrzności-zewnętrzności (kwestionariusz E.F. Bazhina, E.A. Golynkiny i A.M. Etkinda);
  • poziom wypalenie emocjonalne wśród nauczycieli (kwestionariusz V.V. Bojki);
  • powiązania pomiędzy elementami inteligencji werbalnej uczniów podczas kształcenia multidyscyplinarnego (metodologia K.M. Gurewicza i in.);
  • powiązania poziomu empatii (metoda V.V. Bojki) z satysfakcją małżeńską (kwestionariusz V.V. Stolina, T.L. Romanowej, G.P. Butenko);
  • powiązania statusu socjometrycznego młodzieży (test Jacoba L. Moreno) z charakterystyką stylu wychowania w rodzinie (kwestionariusz E.G. Eidemillera, V.V. Yustitskisa);
  • struktury celów życiowych młodzieży wychowywanej w rodzinach pełnych i niepełnych (kwestionariusz Edward L. Deci, Richard M. Ryan Ryan).

Krótka instrukcja przeprowadzenia analizy korelacji z wykorzystaniem kryterium Spearmana

Przeprowadzono analizę korelacji metodą Spearmana zgodnie z następującym algorytmem:

  • sparowane porównywalne cechy są ułożone w 2 rzędach, z których jeden jest oznaczony X, a drugi Y;
  • wartości serii X są ułożone w kolejności rosnącej lub malejącej;
  • kolejność ułożenia wartości serii Y jest określona przez ich zgodność z wartościami serii X;
  • dla każdej wartości w serii X określ rangę - przypisz numer seryjny od wartości minimalnej do maksymalnej;
  • dla każdej wartości w szeregu Y określ także rangę (od minimum do maksimum);
  • obliczyć różnicę (D) pomiędzy rzędami X i Y, korzystając ze wzoru D=X-Y;
  • powstałe wartości różnic są kwadratowane;
  • wykonać sumowanie kwadratów różnic rang;
  • wykonaj obliczenia korzystając ze wzoru:

Przykład korelacji Spearmana

Konieczne jest ustalenie istnienia korelacji pomiędzy stażem pracy a wskaźnikiem wypadków, jeśli dostępne są następujące dane:

Najbardziej odpowiednią metodą analizy jest metoda rang, ponieważ jedna z cech jest prezentowana w formie otwartych opcji: doświadczenie zawodowe do 1 roku i doświadczenie zawodowe wynoszące 7 lub więcej lat.

Rozwiązanie problemu rozpoczyna się od uszeregowania danych, które są zestawiane w tabelę roboczą i można to zrobić ręcznie, ponieważ ich objętość nie jest duża:

Doświadczenie zawodowe Liczba obrażeń Numer seryjny (szeregi) Różnica rang Kwadratowa różnica rang
d(x-y)
do 1 roku 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 lub więcej 6 5 1 +4 16
Σ d2 = 38,5

Pojawienie się rang ułamkowych w kolumnie wynika z faktu, że jeśli pojawią się warianty o jednakowej wielkości, zostanie znaleziona średnia arytmetyczna rangi. W w tym przykładzie wskaźnik urazu 12 występuje dwukrotnie i przypisuje mu się rangi 2 i 3, znajdź średnią arytmetyczną tych rang (2+3)/2= 2,5 i umieść tę wartość w arkuszu dla 2 wskaźników.
Po podstawieniu otrzymanych wartości do działająca formuła i po wykonaniu prostych obliczeń otrzymujemy współczynnik Spearmana równy -0,92

Ujemna wartość współczynnika wskazuje na obecność informacja zwrotna pomiędzy cechami i pozwala stwierdzić, że towarzyszy temu krótkie doświadczenie zawodowe duża liczba urazy Co więcej, siła powiązania między tymi wskaźnikami jest dość duża.
Kolejnym etapem obliczeń jest określenie wiarygodności otrzymanego współczynnika:
obliczany jest jego błąd i test Studenta

jest ilościową oceną statystycznego badania zależności między zjawiskami, stosowaną w metodach nieparametrycznych.

Wskaźnik pokazuje, jak różni się suma kwadratów różnic między rangami uzyskana podczas obserwacji od przypadku braku połączenia.

Cel usługi. Za pomocą tego kalkulatora online możesz:

  • obliczenie współczynnika korelacji rang Spearmana;
  • obliczenie przedziału ufności dla współczynnika i ocena jego istotności;

Współczynnik korelacji rang Spearmana odnosi się do wskaźników oceny bliskości komunikacji. Cechy jakościowe Dokładność związku między współczynnikiem korelacji rang, a także innymi współczynnikami korelacji można ocenić za pomocą: Skala Chaddocka.

Obliczanie współczynnika składa się z następujących kroków:

Własności współczynnika korelacji rang Spearmana

Obszar zastosowań. Współczynnik korelacji rang służy do oceny jakości komunikacji między dwiema populacjami. Ponadto jego istotność statystyczna jest wykorzystywana podczas analizy danych nt heteroskedastyczność.

Przykład. Na podstawie próbki zaobserwowanych zmiennych X i Y:

  1. utwórz tabelę rankingową;
  2. znajdź współczynnik korelacji rang Spearmana i sprawdź jego istotność na poziomie 2a
  3. ocenić charakter zależności
Rozwiązanie. Przypiszmy rangi cechie Y i czynnikowi X.
XYranga X, dxranga Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Macierz rang.
ranga X, dxranga Y, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Sprawdzenie poprawności macierzy na podstawie obliczenia sumy kontrolnej:

Suma kolumn macierzy jest równa sobie i sumie kontrolnej, co oznacza, że ​​macierz jest złożona poprawnie.
Korzystając ze wzoru obliczamy współczynnik korelacji rang Spearmana.


Związek między cechą Y a czynnikiem X jest silny i bezpośredni
Znaczenie współczynnika korelacji rang Spearmana
W celu sprawdzenia hipotezy zerowej na poziomie istotności α, przy hipotezie konkurencyjnej Hi, ogólny współczynnik korelacji rang Spearmana jest równy zero. p ≠ 0, musimy obliczyć punkt krytyczny:

gdzie n jest wielkością próby; ρ - współczynnik korelacji rang Spearmana próbki: t(α, k) - punkt krytyczny dwustronnego obszaru krytycznego, który znajduje się w tabeli punkt krytyczny Rozkład Studenta ze względu na poziom istotności α i liczbę stopni swobody k = n-2.
Jeśli |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp – hipoteza zerowa zostaje odrzucona. Istnieje istotna korelacja rangowa pomiędzy cechami jakościowymi.
Korzystając z tabeli Studenta znajdujemy t(α/2, k) = (0,1/2;12) = 1,782

Ponieważ T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Analiza korelacji jest metodą pozwalającą na wykrycie zależności pomiędzy pewną liczbą zmiennych losowych. Celem analizy korelacji jest dokonanie oceny siły powiązań pomiędzy takimi zmiennymi losowymi lub cechami charakteryzującymi określone procesy rzeczywiste.

Dzisiaj proponujemy rozważyć, w jaki sposób analiza korelacji Spearmana jest wykorzystywana do wizualnego przedstawienia form komunikacji w praktycznym handlu.

Korelacja Spearmana lub podstawa analizy korelacji

Aby zrozumieć, czym jest analiza korelacji, należy najpierw zrozumieć pojęcie korelacji.

Jednocześnie, jeśli cena zacznie poruszać się w pożądanym przez Ciebie kierunku, musisz na czas odblokować swoje pozycje.


W przypadku tej strategii, która opiera się na analizie korelacji, Najlepszym sposobem Odpowiednie są instrumenty handlowe o wysokim stopniu korelacji (EUR/USD i GBP/USD, EUR/AUD i EUR/NZD, AUD/USD i NZD/USD, kontrakty CFD i tym podobne).

Wideo: Zastosowanie korelacji Spearmana na rynku Forex