Contacte

Corelațiile de rang Spearman și Kendall. Kendall și Spearman clasează coeficienții de corelație. Vedeți ce este „coeficientul de corelare a rangului Kendall” în alte dicționare

Coeficientul de corelație al lui Kendall este utilizat atunci când variabilele sunt reprezentate pe două scale ordinale, cu condiția să nu existe ranguri asociate. Calculul coeficientului Kendall presupune numărarea numărului de potriviri și inversări. Să luăm în considerare această procedură folosind exemplul problemei anterioare.

Algoritmul de rezolvare a problemei este următorul:

    Rearanjam datele în tabel. 8.5 astfel încât unul dintre rânduri (în acest caz rândul X i) s-a dovedit a fi clasat. Cu alte cuvinte, rearanjam perechile XȘi y în ordinea corectă și Introducem datele în coloanele 1 și 2 din tabel. 8.6.

Tabelul 8.6

X i

y i

2. Determinați „gradul de clasare” al celui de-al doilea rând ( y i). Această procedură se efectuează în următoarea secvență:

a) luați prima valoare a seriei neclasificate „3”. Numărarea numărului de ranguri de mai jos număr dat, care Mai mult valoare comparată. Există 9 astfel de valori (numerele 6, 7, 4, 9, 5, 11, 8, 12 și 10). Introduceți numărul 9 în coloana „potriviri”. Apoi numărăm numărul de valori care Mai puțin Trei. Există 2 astfel de valori (locul 1 și 2); Introducem numărul 2 în coloana „inversie”.

b) aruncați numărul 3 (am lucrat deja cu el) și repetați procedura pentru următoarea valoare „6”: numărul de potriviri este 6 (locurile 7, 9, 11, 8, 12 și 10), numărul de inversiuni este 4 (rangurile 1, 2, 4 și 5). Introducem numărul 6 în coloana „coincidență”, iar numărul 4 în coloana „inversie”.

c) procedura se repetă în mod similar până la sfârșitul rândului; trebuie amintit că fiecare valoare „elaborată” este exclusă de la o analiză ulterioară (se calculează doar rangurile care se află sub acest număr).

Notă

Pentru a nu greși în calcule, trebuie avut în vedere că la fiecare „pas” suma coincidențelor și inversiilor scade cu una; Acest lucru este de înțeles având în vedere că de fiecare dată o valoare este exclusă din considerare.

3. Se calculează suma potrivirilor (R)și suma inversiilor (Q); datele sunt introduse în una și trei formule interschimbabile pentru coeficientul Kendall (8.10). Se efectuează calculele corespunzătoare.

t (8.10)

În cazul nostru:

În tabel XIV Anexa conține valorile critice ale coeficientului pentru acest eșantion: τ cr. = 0,45; 0,59. Se compară valoarea obținută empiric cu cea tabelată.

Concluzie

τ = 0,55 > τ cr. = 0,45. Corelația este semnificativă statistic la nivelul 1.

Notă:

Dacă este necesar (de exemplu, dacă nu există un tabel cu valori critice), semnificația statistică t Kendall poate fi determinat prin următoarea formulă:

(8.11)

Unde S* = P – Q+ 1 dacă P< Q , Și S* = P – Q – 1 dacă P>Q.

Valori z pentru nivelul de semnificație corespunzător corespund cu măsura Pearson și se regăsesc în tabelele corespunzătoare (nu sunt incluse în anexă. Pentru nivelurile de semnificație standard z kr = 1,96 (pentru β 1 = 0,95) și 2,58 (pentru β 2 = 0,99). Coeficientul de corelație al lui Kendall este semnificativ statistic dacă z > z cr

În cazul nostru S* = P – Q– 1 = 35 și z= 2,40, adică se confirmă concluzia inițială: corelația dintre caracteristici este semnificativă statistic pentru primul nivel de semnificație.

Este folosit pentru a identifica relația dintre indicatorii cantitativi sau calitativi, dacă aceștia pot fi clasați. Valorile indicatorului X sunt afișate în ordine crescătoare și rangurile atribuite. Valorile indicatorului Y sunt clasate și se calculează coeficientul de corelație Kendall:

Unde S = PQ.

P mare valoarea rangurilor Y.

Q- numărul total de observații în urma observațiilor curente cu mai mic valoarea rangurilor Y. (Rangurile egale nu sunt luate în considerare!)

Dacă datele studiate sunt repetate (au aceleași ranguri), atunci în calcule se utilizează coeficientul de corelație Kendall ajustat:

t- numărul de ranguri înrudite din seria X, respectiv Y.

19.De la ce ar trebui să pornim atunci când stabilim tema, obiectul, subiectul, scopul, obiectivele și ipoteza studiului?

Programul de cercetare, de regulă, are două secțiuni: metodologică și procedurală. Prima include justificarea relevanței temei, formularea problemei, definirea obiectului și subiectului, scopurile și obiectivele studiului, formularea conceptelor de bază (aparatul categorial), analiza sistemică preliminară a obiectului de studiu și formularea a unei ipoteze de lucru. A doua secțiune dezvăluie designul strategic al studiului, precum și designul și procedurile de bază pentru colectarea și analiza datelor primare.

În primul rând, atunci când alegeți o temă de cercetare, trebuie să pornim de la relevanță. Justificarea relevanței include o indicație a necesității și oportunității studierii și soluționării problemei pentru dezvoltarea ulterioară a teoriei și practicii predării și educației. Cercetările actuale oferă răspunsuri la cele mai presante întrebări din acest moment, reflectă ordinea socială a societății pentru știința pedagogică și dezvăluie cele mai importante contradicții care apar în practică. Criteriul de relevanță este dinamic, flexibil, depinde de timp, ținând cont de circumstanțe specifice și specifice. În forma sa cea mai generală, relevanța caracterizează gradul de discrepanță între cererea de idei științifice și recomandări practice (pentru a satisface o anumită nevoie) și propunerile pe care știința și practica le pot oferi în prezent.

Cea mai convingătoare bază care definește tema cercetării este ordinea socială, reflectând problemele cele mai presante, semnificative din punct de vedere social, care necesită soluții urgente. Ordinea socială necesită justificare pentru un anumit subiect. De obicei, aceasta este o analiză a gradului în care o întrebare a fost dezvoltată în știință.

Dacă ordinea socială decurge din analiza practicii pedagogice, atunci cel problema stiintifica este într-un alt plan. Ea exprimă principala contradicție care trebuie rezolvată prin intermediul științei. Soluția problemei este de obicei scopul studiului. Scopul este o problemă reformulată.

Formularea problemei presupune selecția obiectelor cercetare. Poate fi un proces pedagogic, o zonă a realității pedagogice sau o relație pedagogică care conține o contradicție. Cu alte cuvinte, obiectul poate fi orice care conține în mod explicit sau implicit o contradicție și dă naștere unei situații problematice. Un obiect este ceea ce vizează procesul de cunoaștere. Subiect de studiu - parte, parte a unui obiect. Acestea sunt cele mai semnificative proprietăți, aspecte și trăsături ale unui obiect din punct de vedere practic sau teoretic, care fac obiectul unui studiu direct.

În conformitate cu scopul, obiectul și subiectul studiului, cercetarea este determinată sarcini, care au drept scop de obicei verificarea ipoteze. Acesta din urmă este un set de ipoteze bazate teoretic, al căror adevăr este supus verificării.

Criteriu noutate științifică aplicabile pentru a evalua calitatea studiilor finalizate. Caracterizează noi concluzii teoretice și practice, modele de educație, structura și mecanismele sale, conținutul, principiile și tehnologiile, care la acest moment nu erau cunoscute și neînregistrate în literatura pedagogică. Noutatea cercetării poate avea semnificație atât teoretică, cât și practică. Semnificația teoretică a cercetării constă în crearea unui concept, obținerea unei ipoteze, model, metodă, model pentru identificarea unei probleme, tendință, direcție. Semnificația practică a cercetării constă în pregătirea propunerilor, recomandărilor etc. Criteriile de noutate, semnificația teoretică și practică variază în funcție de tipul cercetării; ele depind și de momentul obținerii de noi cunoștințe.

Un factor care limitează utilizarea testelor bazate pe ipoteza normalității este dimensiunea eșantionului. Atâta timp cât eșantionul este suficient de mare (de exemplu, 100 sau mai multe observații), puteți presupune că distribuția de eșantionare este normală, chiar dacă nu sunteți sigur că distribuția variabilei în populație este normală. Cu toate acestea, dacă eșantionul este mic, aceste teste ar trebui utilizate numai dacă sunteți sigur că variabila are de fapt o distribuție normală. Cu toate acestea, nu există nicio modalitate de a testa această ipoteză într-un eșantion mic.

Utilizarea criteriilor bazate pe ipoteza normalității este limitată și de scara de măsurare (vezi capitolul Concepte elementare ale analizei datelor). Metodele statistice precum testul t, regresia etc. presupun că datele originale sunt continue. Cu toate acestea, există situații în care datele sunt pur și simplu clasate (măsurate pe o scară ordinală) mai degrabă decât măsurate cu acuratețe.

Un exemplu tipic este dat de evaluările site-urilor de pe Internet: prima poziție este ocupată de site-ul cu numărul maxim de vizitatori, a doua poziție este ocupată de site-ul cu numărul maxim de vizitatori dintre site-urile rămase (dintre site-uri de pe care a fost șters primul site), etc. Cunoscând ratingurile, putem spune că numărul de vizitatori pe un site este mai mare decât numărul de vizitatori pe altul, dar cât de mult nu se poate spune. Imaginați-vă că aveți 5 site-uri: A, B, C, D, E, care sunt clasate pe primele 5 locuri. Să presupunem că în luna curentă am avut următorul aranjament: A, B, C, D, E, iar în luna precedentă: D, E, A, B, C. Întrebarea este dacă au avut loc schimbări semnificative în clasament de site-uri sau nu? În această situație, evident, nu putem folosi testul t pentru a compara aceste două grupuri de date și trecem în domeniul calculelor probabilistice specifice (și orice test statistic conține calcule probabilistice!). Raționăm aproximativ după cum urmează: cât de probabil este ca diferența dintre cele două aranjamente ale site-ului să se datoreze unor motive pur aleatorii sau dacă această diferență este prea mare și nu poate fi explicată prin pură întâmplare. În aceste discuții, folosim doar ranguri sau permutări ale site-urilor și nu folosim în niciun fel un anumit tip de distribuție a numărului de vizitatori ai acestora.

Metodele neparametrice sunt utilizate pentru a analiza eșantioane mici și pentru date măsurate pe scale slabe.

O scurtă prezentare a procedurilor neparametrice

În esență, pentru fiecare criteriu parametric există cel puțin o alternativă neparametrică.

În general, aceste proceduri se încadrează în una dintre următoarele categorii:

  • teste de diferență pentru probe independente;
  • teste de diferență pentru eșantioane dependente;
  • evaluarea gradului de dependenţă între variabile.

În general, abordarea criteriilor statistice în analiza datelor ar trebui să fie pragmatică și să nu fie împovărată cu raționamente teoretice inutile. Cu un computer care rulează STATISTICA, puteți aplica cu ușurință mai multe criterii datelor dvs. Cunoscând unele dintre capcanele metodelor, veți alege soluția potrivită prin experimentare. Dezvoltarea intrării este destul de naturală: dacă doriți să comparați valorile a două variabile, atunci utilizați un test t. Cu toate acestea, trebuie amintit că se bazează pe ipoteza normalității și egalității varianțelor în fiecare grup. Eliminarea acestor ipoteze duce la teste neparametrice, care sunt utile în special pentru eșantioanele mici.

Dezvoltarea testului t conduce la analiza varianței, care este utilizată atunci când numărul de grupuri comparate este mai mare de două. Dezvoltarea corespunzătoare a procedurilor neparametrice duce la analiza neparametrică a varianței, deși este semnificativ mai slabă decât analiza clasică a varianței.

Pentru a evalua dependența, sau, ca să spunem oarecum pompos, gradul de apropiere a conexiunii, se calculează coeficientul de corelație Pearson. Strict vorbind, utilizarea sa are limitări asociate, de exemplu, cu tipul de scară în care se măsoară datele și cu neliniaritatea relației, deci neparametrice, sau așa-numitul rang, coeficienți de corelație, utilizați, de exemplu , pentru datele clasate, sunt de asemenea folosite ca alternativă. Dacă datele sunt măsurate la o scară nominală, atunci este firesc să le prezentăm în tabele de contingență, care utilizează testul chi-pătrat Pearson cu diverse variații și ajustări pentru precizie.

Deci, în esență, există doar câteva tipuri de criterii și proceduri pe care trebuie să le cunoașteți și să le puteți utiliza, în funcție de specificul datelor. Trebuie să determinați ce criteriu ar trebui aplicat într-o anumită situație.

Metodele neparametrice sunt cele mai potrivite atunci când dimensiunile eșantionului sunt mici. Dacă există o mulțime de date (de exemplu, n >100), adesea nu are sens să folosiți statistici neparametrice.

Dacă dimensiunea eșantionului este foarte mică (de exemplu, n = 10 sau mai puțin), atunci nivelurile de semnificație pentru acele teste neparametrice care utilizează aproximarea normală pot fi considerate doar estimări brute.

Diferențele dintre grupurile independente. Dacă aveți două eșantioane (de exemplu, bărbați și femei) pe care doriți să le comparați în ceea ce privește o valoare medie, cum ar fi tensiunea arterială medie sau numărul de globule albe, atunci puteți utiliza testul t pentru mostre independente.

Alternativele neparametrice la acest test sunt testul Wald-Wolfowitz, Mann-Whitney)/n, unde x i este valoarea i-a, n este numărul de observații. Dacă o variabilă conține valori negative sau zero (0), media geometrică nu poate fi calculată.

Mijloace armonică

Media armonică este uneori folosită pentru a medie frecvențele. Media armonică se calculează prin formula: GS = n/S(1/x i) unde GS este media armonică, n este numărul de observații, x i este valoarea numărului de observație i. Dacă o variabilă conține zero (0), media armonică nu poate fi calculată.

Varianta si abaterea standard

Varianța eșantionului și abaterea standard sunt cele mai utilizate măsuri de variabilitate (variație) în date. Dispersia se calculează ca suma abaterilor pătrate ale valorilor variabilelor de la media eșantionului, împărțită la n-1 (dar nu la n). Abaterea standard este calculată ca rădăcină pătrată a estimării varianței.

Domeniul de aplicare

Intervalul unei variabile este un indicator al variabilității, calculat ca maxim minus minim.

Gama de quartile

Intervalul trimestrial, prin definiție, este quartila superioară minus quartila inferioară (75% percentila minus 25% percentila). Deoarece percentila de 75% (cuartila superioară) este valoarea din stânga căreia se află 75% din observații, iar percentila de 25% (quartilă inferioară) este valoarea din stânga căreia se află 25% din observații, quartila intervalul este intervalul din jurul mediei.care conține 50% din observații (valori variabile).

Asimetrie

Deformarea este o caracteristică a formei unei distribuții. Distribuția este oblică spre stânga dacă valoarea asimetriei este negativă. Distribuția este înclinată spre dreapta dacă asimetria este pozitivă. Asimetria distribuției normale standard este 0. Asimetria este asociată cu al treilea moment și este definită ca: asimetrie = n × M 3 /[(n-1) × (n-2) × s 3 ], unde M 3 este egal cu: (x i -xaverage x) 3, s 3 - abaterea standard ridicată la a treia putere, n - numărul de observații.

Exces

Kurtoza este o caracteristică a formei unei distribuții, și anume o măsură a clarității vârfului său (față de o distribuție normală, a cărei curtoză este 0). De obicei, distribuțiile cu un vârf mai ascuțit decât cel normal au curtoză pozitivă; distribuțiile al căror vârf este mai puțin ascuțit decât vârful unei distribuții normale au curtoză negativă. Kurtoza este asociată cu al patrulea moment și este determinată de formula:

curtoză = /[(n-1) × (n-2) × (n-3) × s 4 ], unde M j este egal cu: (x-media x, s 4 - abaterea standard la a patra putere, n - numărul de observaţii .

COEFICIENTUL DE CORELARE A RANGULUI KENDALL

Una dintre măsurile eșantionului de dependență a două variabile aleatoare (trăsături) Xi Y, bazat pe clasarea elementelor eșantionului (X 1, Y x), .. ., (X n, Y n). K. k. r. se referă astfel la clasarea statisticienilor si este determinata de formula

Unde r i- U, aparținând acelui cuplu ( X Y), pentru tăierea Xequal i, S = 2N-(n-1)/2, N este numărul de elemente eșantion, pentru care atât j>i, cât și r j >r i. Mereu Ca măsură selectivă a dependenței lui K. k.r. K. a fost folosit pe scară largă de M. Kendall (M. Kendall, vezi).

K. k. r. k. este folosit pentru testarea ipotezei de independenţă a variabilelor aleatoare. Dacă ipoteza independenței este adevărată, atunci E t =0 și D t =2(2n+5)/9n(n-1). Cu o dimensiune mică a eșantionului, verificarea statisticilor ipotezele de independenţă se fac folosind tabele speciale (vezi). Pentru n>10, utilizați aproximarea normală pentru distribuția m: dacă

atunci se respinge ipoteza independenței, în caz contrar se acceptă. Aici a . - nivelul de semnificație, u a /2 este punctul procentual al distribuției normale. K. k. r. k., ca oricare, poate fi folosit pentru a detecta dependența a două caracteristici calitative, dacă doar elementele eșantionului pot fi ordonate în raport cu aceste caracteristici. Dacă X Y au o normală comună cu coeficientul de corelație p, atunci relația dintre K. k.r. k. și are forma:

Vezi si Corelarea rangului Spearman, testul de rang.

Lit.: Kendal M., Rank corelations, trad. din engleză, M., 1975; Van der Waerden B. L., Matematică, trad. din germană, M., 1960; Bolşev L. N., Smirnov N. V., Tabele de statistică matematică, M., 1965.

A. V. Prohorov.


Enciclopedie matematică. - M.: Enciclopedia Sovietică. I. M. Vinogradov. 1977-1985.

Vedeți ce este „COEFICIENTUL DE CORELARE A RANGULUI KENDALL” în alte dicționare:

    Engleză cu corelație eficientă, de rang Kendall; limba germana Kendalls Rangkorrelationskoeffizient. Un coeficient de corelație care determină gradul de acord între ordonarea tuturor perechilor de obiecte în funcție de două variabile. antinazi. Enciclopedia de Sociologie, 2009... Enciclopedia Sociologiei

    COEFICIENTUL DE CORELARE A RANGULUI KENDALL- Engleză coeficient, corelație de rang Kendall; limba germana Kendalls Rangkorrelationskoeffizient. Coeficientul de corelație, care determină gradul de corespondență al ordonării tuturor perechilor de obiecte în funcție de două variabile... Dicționar explicativ de sociologie

    O măsură a dependenței a două variabile aleatoare (trăsături) X și Y, bazată pe clasarea rezultatelor observației independente (X1, Y1), . . ., (Xn,Yn). Dacă rangurile valorilor X sunt în ordinea naturală i=1, . . ., n,a Ri rang Y, corespunzător... ... Enciclopedie matematică

    Coeficient de corelație- (Coeficientul de corelație) Coeficientul de corelație este un indicator statistic al dependenței a două variabile aleatoare.Definiția coeficientului de corelație, tipuri de coeficienți de corelație, proprietăți ale coeficientului de corelație, calcul și aplicare... ... Enciclopedia investitorilor

    O dependență între variabile aleatoare care, în general, nu are un caracter strict funcțional. Spre deosebire de dependența funcțională, K., de regulă, este considerată atunci când una dintre cantități depinde nu numai de cealaltă, ci și... ... Enciclopedie matematică

    Corelația (dependența de corelație) este o relație statistică între două sau mai multe variabile aleatoare (sau variabile care pot fi considerate ca atare cu un grad acceptabil de acuratețe). În acest caz, modificări ale valorilor unuia sau ...... Wikipedia

    Corelație- (Corelația) Corelația este o relație statistică între două sau mai multe variabile aleatoare.Conceptul de corelație, tipuri de corelație, coeficient de corelație, analiză de corelație, corelație de preț, corelarea perechilor valutare pe Conținutul Forex... ... Enciclopedia investitorilor

    Este general acceptat că începutul S. m.v. sau, așa cum este adesea numită, statistica „n mic”, a fost fondată în primul deceniu al secolului al XX-lea odată cu publicarea lucrării lui W. Gosset, în care a plasat distribuția t, postulată de cea care a primit putin mai tarziu in toata lumea..... Enciclopedie psihologică

    Maurice Kendall Sir Maurice George Kendall Data nașterii: 6 septembrie 1907 (1907 09 06) Locul nașterii: Kettering, Marea Britanie Data morții... Wikipedia

    Prognoza- (Prognoza) Definirea prognozei, sarcinile si principiile prognozei Definirea prognozei, sarcinile si principiile prognozei, metodele de prognoza Cuprins Cuprins Definitie Concepte de baza ale prognozei Sarcini si principii de prognoza... ... Enciclopedia investitorilor



Ți-a plăcut articolul? Împărtășește-l