Testul Mann-Whitney U Se aplică pentru compararea a două eșantioane independente atunci când au puține date sau nu urmează o distribuție normală. În acest fel, este considerat a fi un test non-parametric, Spre deosebire de omologul său Testul studentului, care se folosește atunci când eșantionul este suficient de mare și urmează distribuția normală.
Frank Wilcoxon a propus-o pentru prima dată în 1945, pentru eșantioane de dimensiuni identice, dar doi ani mai târziu a fost extinsă pentru cazul eșantioanelor de dimensiuni diferite de Henry Mann și D. R. Whitney.
Testul este adesea aplicat pentru a verifica dacă există o relație între o variabilă calitativă și una cantitativă.
Un exemplu ilustrativ este acela de a lua un set de oameni hipertensivi și de a extrage două grupuri, de la care datele zilnice ale tensiunii arteriale sunt înregistrate timp de o lună.
Tratamentul A se aplică unui grup și tratamentul B se aplică altui. Aici tensiunea arterială este variabila cantitativă, iar tipul de tratament este calitativ..
Vrem să știm dacă mediana și nu media valorilor măsurate este statistic aceeași sau diferită, pentru a stabili dacă există o diferență între cele două tratamente. Pentru a obține răspunsul, se aplică statistica Wilcoxon sau testul Mann-Whitney U..
Indice articol
Un alt exemplu în care testul poate fi aplicat este următorul:
Să presupunem că doriți să știți dacă consumul de băuturi răcoritoare diferă semnificativ în două regiuni ale țării.
Una dintre ele se numește regiunea A și cealaltă regiune B. Se ține evidența litrilor consumați săptămânal în două eșantioane: una din 10 persoane pentru regiunea A și alta de 5 persoane pentru regiunea B.
Datele sunt după cum urmează:
-Regiunea A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Regiunea B: 12,14, 11, 30, 10
Urmează următoarea întrebare:
Consumul de băuturi răcoritoare (Y) depinde de regiune (X)?
-Variabila calitativă X: Regiune
-Variabila cantitativă Y: Consumul de sifon
Dacă cantitatea de litri consumată este aceeași în ambele regiuni, concluzia va fi că nu există nicio dependență între cele două variabile. Modalitatea de a afla este de a compara tendința medie sau medie pentru cele două regiuni.
Dacă datele urmează o distribuție normală, se ridică două ipoteze: H0 nul și H1 alternativ prin comparația dintre medii:
-H0: nu există nicio diferență între media celor două regiuni.
-H1: mijloacele ambelor regiuni sunt diferite.
Dimpotrivă, dacă datele nu urmează o distribuție normală sau eșantionul este pur și simplu prea mic pentru a le cunoaște, în loc să compare media, acestea ar fi comparate mediana dintre cele două regiuni.
-H0: nu există nicio diferență între mediana celor două regiuni.
-H1: medianele ambelor regiuni sunt diferite.
Dacă medianele coincid, atunci se îndeplinește ipoteza nulă: nu există nicio relație între consumul de băuturi răcoritoare și regiune.
Și dacă se întâmplă opusul, ipoteza alternativă este adevărată: există o relație între consum și regiune.
Pentru aceste cazuri este indicat testul U Mann-Whitney..
Următoarea întrebare importantă pentru a decide dacă se aplică testul Mann Whitney U este dacă numărul de date din ambele probe este identic, ceea ce înseamnă că acestea sunt la egalitate..
Dacă cele două eșantioane sunt împerecheate, s-ar aplica versiunea originală Wilcoxon. Dar dacă nu, așa cum se întâmplă în exemplu, atunci se aplică testul Wilcoxon modificat, care este exact testul U al lui Mann Whitney..
Testul Mann - Whitney U este un test non-parametric, aplicabil eșantioanelor care nu respectă distribuția normală sau cu puține date. Are următoarele caracteristici:
1.- Comparați medianele
2.- Funcționează pe intervale ordonate
3.- Este mai puțin puternic, fiind înțeleasă prin putere probabilitatea de a respinge ipoteza nulă atunci când este de fapt falsă.
Luând în considerare aceste caracteristici, testul Mann-Whitney U se aplică atunci când:
-Datele sunt independente
-Nu respectă distribuția normală
-Ipoteza nulă H0 este acceptată dacă medianele celor două probe coincid: Ma = Mb
-Ipoteza alternativă H1 este acceptată dacă medianele celor două eșantioane diferă: Ma ≠ Mb
Variabila U este statistica de contrast utilizată în testul Mann-Whitney și este definită după cum urmează:
U = min (Ua, Ub)
Aceasta înseamnă că U este cea mai mică dintre valorile dintre Ua și Ub, aplicată fiecărui grup. În exemplul nostru ar fi pentru fiecare regiune: A sau B.
Variabilele Ua și Ub sunt definite și calculate conform următoarei formule:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Aici valorile Na și Nb sunt dimensiunile eșantioanelor corespunzătoare regiunilor A și respectiv B și, la rândul lor, Ra și Rb sunt sume de rang pe care le vom defini mai jos.
1.- Comandă valorile celor două probe.
2.- Alocați un rang de ordine fiecărei valori.
3.- Corectați ligaturile existente în date (valori repetate).
4.- Calculați Ra = Suma intervalelor probei A.
5.- Găsiți Rb = Suma rangurilor eșantionului B.
6.- Determinați valoarea Ua și Ub, conform formulelor date în secțiunea anterioară.
7.- Comparați Ua și Ub, iar cel mai mic dintre cele două este atribuit statisticii U experimentale (adică a datelor) care este comparată cu statistica U teoretică sau normală.
Acum aplicăm cele menționate mai sus la problema băuturilor răcoritoare ridicate anterior:
Regiunea A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Regiunea B: 12,14, 11, 30, 10
În funcție de faptul dacă mijloacele ambelor probe sunt statistic aceleași sau diferite, ipoteza nulă este acceptată sau respinsă: nu există nicio relație între variabilele Y și X, adică consumul de băuturi răcoritoare nu depinde de regiune:
H0: Ma = Mb
H1: Ma ≠ Mb
Continuăm să comandăm datele în comun pentru cele două eșantioane, ordonând valorile de la cea mai mică la cea mai mare:
Observați că valoarea 11 apare de 2 ori (o dată în fiecare eșantion). Inițial are poziții sau intervale 3 și 4, dar pentru a nu supraestima sau subestima una sau alta, valoarea medie este aleasă ca interval, adică 3,5.
În mod similar, continuăm cu valoarea 12, care se repetă de trei ori cu intervalele 5, 6 și 7.
Ei bine, valorii 12 i se atribuie intervalul mediu de 6 = (5 + 6 + 7) / 3. Și același lucru pentru valoarea 14, care are ligatură (apare în ambele probe) în pozițiile 8 și 9, i se atribuie intervalul mediu 8,5 = (8 + 9) / 2.
Apoi, datele pentru Regiunea A și B sunt separate din nou, dar acum intervalele lor corespunzătoare le sunt atribuite într-un alt rând:
Intervalele Ra și Rb sunt obținute din sumele elementelor celui de-al doilea rând pentru fiecare caz sau regiune.
Valorile Ua și Ub respective sunt calculate:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2-34 = 31
Valoare experimentală U = min (19, 31) = 19
Se presupune că U teoretic urmează o distribuție normală N cu parametri dați exclusiv de mărimea eșantioanelor:
N ((na⋅nb) / 2, √ [na nb (na + nb +1) / 12])
Pentru a compara variabila U obținută experimental, cu U teoretic este necesară schimbarea variabilei. Trecem de la variabila experimentală U la valoarea ei tipificat, care se va numi Z, pentru a putea face comparația cu cea a unei distribuții normale standardizate.
Schimbarea variabilei este după cum urmează:
Z = (U - na.nb / 2) / √ [na. nb (na + nb + 1) / 12]
Trebuie remarcat faptul că pentru schimbarea variabilei s-au folosit parametrii distribuției teoretice pentru U. Apoi noua variabilă Z, care este un hibrid între U teoretic și U experimental, este contrastată cu o distribuție normală normalizată N (0 , 1).
Dacă Z ≤ Zα ⇒ se acceptă ipoteza nulă H0
Dacă Z> Zα ⇒ ipoteza nulă H0 este respinsă
Valorile critice standardizate ale Zα depind de nivelul necesar de încredere, de exemplu, pentru un nivel de încredere α = 0,95 = 95%, care este cel mai obișnuit, valoarea critică Zα = 1,96.
Pentru datele prezentate aici:
Z = (U - na nb / 2) / √ [na nb (na + nb + 1) / 12] = -0,73
Care este sub valoarea critică 1.96.
Deci, concluzia finală este că ipoteza nulă H0 este acceptată:
Nu există nicio diferență în consumul de băuturi răcoritoare între regiunile A și B.
Există programe specifice pentru calcule statistice, inclusiv SPSS și MINITAB, dar aceste programe sunt plătite și utilizarea lor nu este întotdeauna ușoară. Acest lucru se datorează faptului că oferă atât de multe opțiuni, încât practic utilizarea lor este rezervată experților în statistici..
Din fericire, există mai multe programe online foarte precise, gratuite și ușor de utilizat, care vă permit să rulați testul Mann-Whitney U, printre altele..
Aceste programe sunt:
-Social Science Statistics (socscistatistics.com), care are atât testul Mann-Whitney U, cât și testul Wilcoxon pentru cazul eșantioanelor echilibrate sau asociate.
-AI Therapy Statistics (ai-therapy.com), care are mai multe dintre testele obișnuite ale statisticilor descriptive.
-Statistic de utilizat (physics.csbsju.edu/stats), una dintre cele mai vechi, astfel încât interfața sa poate părea datată, deși este totuși un program gratuit foarte eficient.
Nimeni nu a comentat acest articol încă.