Cum se calculează coeficientul de corelație a spiriului

Coeficientul de corelație al rangului Spireman vă permite să determinați dacă dependența exprimată de o funcție monotonă (adică a doua și viceversa), există între două variabile și invers). Pașii simpli din articol vă vor permite să efectuați calcule manual, precum și să calculați coeficientul de corelare utilizând programele Excel și R.

Pași

Metoda 1 din 3:
Calculul manual
Imagine intitulată table_338
unu. Faceți o masă de date. Astfel, comandați informațiile necesare pentru a calcula coeficientul de corelație al rangului lui Spearman. În același timp, aveți nevoie de:
  • 6 coloane îndreptate după cum se arată mai sus în figură.
  • Numărul de rânduri corespunzătoare numărului de perechi variabile.
  • Imagine intitulată Table2_983
    2. Umpleți primele două coloane în perechi de variabile.
  • Imagine intitulată Table3_206
    3. În coloana a treia, scrieți numere (ranguri) de variabile de la 1 la N (numărul total de perechi). Numărul 1 pereche cu cea mai mică valoare din prima coloană, 2 - următoarea valoare din spatele acestuia și astfel ascendența valorilor variabilei din prima coloană.
  • Imagine intitulată Table4_228
    4. În cea de-a patra coloană, faceți același lucru ca în al treilea, dar de data aceasta corectă perechile de variabile prin cea de-a doua coloană a tabelului.
  • Imagine intitulată medie_742
    Dacă două (sau mai multe) valorile variabilei într-o singură coloană sunt aceleași, plasați-le unul câte unul și găsiți valoarea medie a numerelor lor, apoi amorți-le cu această valoare medie.
    În cele de mai sus, cele două valori ale variabilei coincid și sunt egale cu 5- În cazul numerotării normale, aceste date ar primi rândurile 2 și 3. Deoarece valorile sunt aceleași, găsim valoarea medie a rândurilor lor. Media 2 și 3 este de 2,5, astfel încât ambele valori sunt atribuite rang de 2,5.
  • Imagine intitulată Table5_263
    cinci. Într-o coloană "D" Calculați diferența dintre două rânduri din cele două coloane anterioare. De exemplu, dacă rangul din coloana a treia este 1, iar în al patrulea - 3, diferența dintre ele va fi 2. Semnul nu contează, deoarece în următorul pas aceste numere vor fi ridicate la pătrat.
  • Imagine intitulată Table6_205
    6. Fiecare valoare din coloană "D" Pătrat și scrieți valorile valorilor din coloană "D".
  • 7. Măsurați toate valorile din coloană "D". Definiți suma Σd.
    Imagine intitulată step7_812
  • opt. Profitați de una dintre următoarele formule:
  • Dacă pașii anteriori nu au îndeplinit aceleași valori, înlocuiți pur și simplu suma obținută în formula simplificată pentru calcularea coeficientului corelației rangului Spearmanului:
    Imagine intitulată step8_271

    Și în schimb "N" Înlocuiți numărul de perechi de date introduse mai devreme în tabel.
    Imagine intitulată step9_402
  • Dacă aceleași valori au venit peste pașii anteriori, utilizați formula standard pentru a calcula coeficientul de corelație al rangului Spearman:
    Imagine intitulată Spearman.jpg
  • nouă. Analizați rezultatul. Valoarea obținută este între -1 și 1.
  • Dacă este aproape de -1, corelația este negativă.
  • Dacă este aproape de 0, corelația lipsește.
  • Dacă este aproape de 1, se observă o corelație pozitivă.
  • Nu uitați să împărțiți cantitatea de variabile și să luați rădăcina. După aceea, împărțiți-vă pe Σd.
    Imagine intitulată step7_812
  • Metoda 2 din 3:
    Calculul în Excel
    unu. Creați coloane noi cu rang, coloane de date corespunzătoare. De exemplu, dacă datele sunt introduse în coloana A2: A11, utilizați funcția "= Rang (A2, un $ 2: un $ 11)" și aduce rezultate pentru toate liniile la o coloană nouă.
  • 2. Găsiți rândurile pentru aceleași valori, așa cum este descris în pașii 3 și 4 din metoda 1 1.
  • 3. În noua celulă, determinați corelația dintre două coloane de ranguri folosind funcția "= Correl (C2: C11, D2: D11)". În acest caz, C și D sunt coloane care conțin rânduri. Astfel, în această celulă veți primi un coeficient de corelare a spiriului.
  • Metoda 3 din 3:
    Calculul în R
    unu. Dacă nu aveți niciun program r pentru a procesa datele statistice, cumpărați-l (consultați. http: // R-Project.Org).
  • 2. Salvați datele în format CSV, plasându-le în două coloane, corelația dintre care veți explora. Salvați fișierul în acest format este ușor prin opțiune "Salvează ca".
  • 3. Deschidere R. Editor. Dacă nu ați intrat încă în r, faceți-o. Pentru a face acest lucru, faceți clic pe r pe desktop.
  • 4. Apelați comenzi:
  • D <- read.csv("NAME_OF_YOUR_CSV.csv") и нажмите клавишу ввода
  • Cor (rang (d [, 1]), rang (D [, 2]))
  • sfaturi

    • De regulă, setul de date trebuie să fie alcătuit din cel puțin 5 perechi pentru a stabili în mod semnificativ orice corelație (3 perechi au fost utilizate în exemplul de mai sus pentru simplitate).

    Avertizări

    • Coeficientul de corelație de rating al spirmei vă permite să instalați numai dacă ambele variabile sunt în creștere sau în scădere simultan. Dacă variația datelor este prea mare, acest coeficient nu va da o valoare exactă de corelație.
    • Funcția va da rezultatul corect în absența acelorași valori în matricea de date. Dacă există astfel de valori, ca și în exemplul pe care l-am luat în considerare, este necesar să se utilizeze următoarea definiție: coeficientul de corelare bazat pe ranguri.
    Publicații similare