grade de libertate în statistici sunt numărul de componente independente ale unui vector aleatoriu. Dacă vectorul are n componente și există p ecuații liniare care își raportează componentele, apoi grad de libertate este n-p.
Conceptul de grade de libertate Apare și în mecanica teoretică, unde aproximativ acestea sunt echivalente cu dimensiunea spațiului în care particula se mișcă, minus numărul de legături..
Acest articol va discuta conceptul de grade de libertate aplicat statisticilor, dar un exemplu mecanic este mai ușor de vizualizat sub formă geometrică.
Indice articol
În funcție de contextul în care este aplicat, modul de calcul al numărului de grade de libertate poate varia, dar ideea de bază este întotdeauna aceeași: dimensiunile totale minus numărul de restricții.
Să luăm în considerare o particulă oscilantă legată de un șir (un pendul) care se deplasează în plan vertical x-y (2 dimensiuni). Cu toate acestea, particula este forțată să se deplaseze pe circumferința razei egale cu lungimea coardei.
Deoarece particula se poate deplasa numai pe acea curbă, numărul de grade de libertate este 1. Acest lucru poate fi văzut în figura 1.
Modul de a calcula numărul de grade de libertate este luând diferența dintre numărul de dimensiuni minus numărul de constrângeri:
grade de libertate: = 2 (dimensiuni) - 1 (ligatură) = 1
O altă explicație care ne permite să ajungem la rezultat este următoarea:
-Știm că poziția în două dimensiuni este reprezentată de un punct de coordonate (x, y).
-Dar întrucât punctul trebuie să satisfacă ecuația circumferinței (xDouă + DaDouă = LDouă) pentru o valoare dată a variabilei x, variabila y este determinată de respectiva ecuație sau restricție.
Astfel, doar una dintre variabile este independentă și sistemul are un (1) grad de libertate.
Pentru a ilustra ce înseamnă conceptul, să presupunem vectorul
X = (x1, XDouă,..., Xn)
Ce reprezintă eșantionul n valori aleatorii distribuite în mod normal. În acest caz vectorul aleator X avea n componente independente și de aceea se spune că X avea n grade de libertate.
Acum să construim vectorul r de deșeuri
r = (x1 -
Unde
Deci suma
(X1 -
Este o ecuație care reprezintă o constrângere (sau legare) asupra elementelor vectorului r din reziduuri, deoarece dacă sunt cunoscute n-1 componente ale vectorului r, ecuația de constrângere determină componenta necunoscută.
Prin urmare vectorul r de dimensiunea n cu restricția:
∑ (xeu -
Avea (n - 1) grade de libertate.
Se aplică din nou că calculul numărului de grade de libertate este:
grade de libertate: = n (dimensiuni) - 1 (constrângeri) = n-1
Varianța sDouă este definit ca media pătratului abaterilor (sau reziduurilor) eșantionului de n date:
sDouă = (r•r) / (n-1)
Unde r este vectorul reziduurilor r = (x1 -
sDouă = ∑ (xeu -
În orice caz, trebuie remarcat faptul că atunci când se calculează media pătratului reziduurilor, acesta este împărțit la (n-1) și nu la n, deoarece, după cum sa discutat în secțiunea anterioară, numărul de grade de libertate al vector r este (n-1).
Dacă pentru calculul varianței s-au împărțit la n în loc de (n-1), rezultatul ar avea o prejudecată care este foarte semnificativă pentru valorile de n sub 50.
În literatură, formula varianței apare și cu divizorul n în loc de (n-1), când vine vorba de varianța unei populații.
Dar setul variabilei aleatorii a reziduurilor, reprezentat de vector r, Deși are dimensiunea n, are doar (n-1) grade de libertate. Cu toate acestea, dacă numărul de date este suficient de mare (n> 500), ambele formule converg la același rezultat.
Calculatoarele și foile de calcul oferă ambele versiuni ale varianței și abaterii standard (care este rădăcina pătrată a varianței).
Recomandarea noastră, având în vedere analiza prezentată aici, este să alegeți întotdeauna versiunea cu (n-1) de fiecare dată când este necesar să calculați varianța sau abaterea standard, pentru a evita rezultatele părtinitoare..
Unele distribuții de probabilitate în variabile aleatoare continue depind de un parametru numit grad de libertate, este cazul distribuției Chi pătrat (χDouă).
Numele acestui parametru provine tocmai din gradele de libertate ale vectorului aleatoriu subiacent căruia i se aplică această distribuție.
Să presupunem că avem g populații, din care sunt luate probe de mărime n:
X1 = (x11, x1Două,… X1n)
X2 = (x21, x2Două,… X2n)
... .
Xj = (xj1, xjDouă,… Xjn)
... .
Xg = (xg1, xgDouă,… Xgn)
O populatie j ce are media
Variabila standardizată sau normalizată zjeu este definit ca:
zjeu = (xjeu -
Și vectorul Zj este definit astfel:
Zj = (zj1, zjDouă,..., zjeu,..., zjn) și urmează distribuția normală normalizată N (0,1).
Deci variabila:
Î = ((z11 ^ 2 + z21^ 2 +…. + zg1^ 2),…., (Z1n^ 2 + z2n^ 2 +…. + zgn^ 2))
urmați distribuția χDouă(g) numit distribuție chi pătrat cu grad de libertate g.
Când doriți să testați ipoteze pe baza unui anumit set de date aleatorii, trebuie să cunoașteți numărul de grade de libertate g pentru a putea aplica testul Chi pătrat.
De exemplu, vor fi analizate datele colectate cu privire la preferințele înghețatei de ciocolată sau căpșuni în rândul bărbaților și femeilor dintr-o anumită înghețată. Frecvența cu care bărbații și femeile aleg căpșuna sau ciocolata este rezumată în figura 2.
În primul rând, se calculează tabelul frecvențelor așteptate, care este pregătit prin înmulțirea rânduri totale pentru el coloane totale, impartit de date totale. Rezultatul este prezentat în figura următoare:
Apoi continuăm să calculăm pătratul Chi (din date) folosind următoarea formulă:
χDouă = ∑ (Fsau - Fși)Două / Fși
Unde Fsau sunt frecvențele observate (Figura 2) și Fși sunt frecvențele așteptate (Figura 3). Suma merge peste toate rândurile și coloanele, care în exemplul nostru dau patru termeni.
După efectuarea operațiunilor, veți obține:
χDouă = 0,2043.
Acum este necesar să comparăm cu pătratul teoretic Chi, care depinde de numărul de grade de libertate g.
În cazul nostru, acest număr este determinat după cum urmează:
g = (# rânduri - 1) (# coloane - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Se pare că numărul de grade de libertate g din acest exemplu este 1.
Dacă doriți să verificați sau să respingeți ipoteza nulă (H0: nu există nicio corelație între GUST și GEN) cu un nivel de semnificație de 1%, valoarea teoretică Chi-pătrat este calculată cu gradul de libertate g = 1.
Se caută valoarea care face ca frecvența acumulată (1 - 0,01) = 0,99, adică 99%. Această valoare (care poate fi obținută din tabele) este 6.636.
Deoarece Chi-ul teoretic îl depășește pe cel calculat, atunci se verifică ipoteza nulă.
Adică cu datele colectate, Neobservat relația dintre variabilele GUST și GEN.
Nimeni nu a comentat acest articol încă.