date grupate sunt cele care au fost clasificate în categorii sau clase, luându-și frecvența drept criteriu. Acest lucru se face pentru a simplifica manipularea unor cantități mari de date și pentru a stabili tendințele acestuia..
Odată organizate în aceste clase în funcție de frecvențe, datele alcătuiesc un distribuția frecvenței, din care se extrag informații utile prin caracteristicile sale.
Iată un exemplu simplu de date grupate:
Să presupunem că se măsoară înălțimea a 100 de femei, selectate din toate cursurile de bază de fizică ale unei universități și se obțin următoarele rezultate:
Rezultatele obținute au fost împărțite în 5 clase, care apar în coloana din stânga.
Prima clasă, între 155 și 159 cm, are 6 elevi, a doua clasă 160 - 164 cm are 14 elevi, a treia clasă de 165 până la 169 cm are cel mai mare număr de membri: 47. Apoi, clasa continuă 170-174 cm cu 28 de elevi și în cele din urmă 175-174 cm cu doar 5.
Numărul de membri ai fiecărei clase este tocmai frecvență sau Frecvență absolută iar la adăugarea tuturor, se obțin datele totale, care în acest exemplu sunt 100.
Indice articol
După cum am văzut, frecvența este de câte ori se repetă o bucată de date. Și pentru a facilita calculele proprietăților distribuției, cum ar fi media și varianța, sunt definite următoarele mărimi:
-Frecvența cumulativă: se obține prin adăugarea frecvenței unei clase cu frecvența acumulată anterioară. Prima dintre toate frecvențele se potrivește cu cea a intervalului în cauză, iar ultima este numărul total de date.
-Frecventa relativa: calculat prin împărțirea frecvenței absolute a fiecărei clase la numărul total de date. Și dacă înmulțiți cu 100 aveți frecvența procentuală relativă.
-Frecvența relativă cumulativă: este suma frecvențelor relative ale fiecărei clase cu cele acumulate anterior. Ultima dintre frecvențele relative acumulate trebuie să fie egală cu 1.
Pentru exemplul nostru, frecvențele arată astfel:
Se numesc valorile extreme ale fiecărei clase sau intervale limitele clasei. După cum putem vedea, fiecare clasă are o limită mai mică și mai mare. De exemplu, prima clasă din studiul despre înălțimi are o limită inferioară de 155 cm și o limită mai mare de 159 cm..
Acest exemplu are limite clar definite, cu toate acestea este posibil să se definească limite deschise: dacă în loc să definiți valorile exacte, spuneți „înălțime mai mică de 160 cm”, „înălțime mai mică de 165 cm” și așa mai departe.
Înălțimea este o variabilă continuă, deci se poate considera că prima clasă începe de fapt la 154,5 cm, deoarece rotunjirea acestei valori la cel mai apropiat număr întreg dă 155 cm.
Această clasă acoperă toate valorile de până la 159,5 cm, deoarece după aceasta, înălțimile sunt rotunjite la 160,0 cm. O înălțime de 159,7 cm aparține deja clasei următoare.
Limitele reale ale clasei pentru acest exemplu sunt, în cm:
Lățimea unei clase se obține prin scăderea limitelor. Pentru primul interval al exemplului nostru avem 159,5 - 154,5 cm = 5 cm.
Cititorul poate verifica că pentru celelalte intervale ale exemplului, amplitudinea este, de asemenea, de 5 cm. Cu toate acestea, trebuie remarcat faptul că distribuțiile pot fi construite cu intervale de amplitudine diferită.
Este punctul de mijloc al intervalului și se obține prin media dintre limita superioară și limita inferioară.
Pentru exemplul nostru, nota de primă clasă este (155 + 159) / 2 = 157 cm. Cititorul poate vedea că notele de clasă rămase sunt: 162, 167, 172 și 177 cm.
Determinarea notelor de clasă este importantă, deoarece acestea sunt necesare pentru a găsi media aritmetică și varianța distribuției.
Cele mai frecvent utilizate măsuri ale tendinței centrale sunt media, mediana și modul și descriu cu exactitate tendința datelor de a se grupa în jurul unei anumite valori centrale..
Este una dintre principalele măsuri ale tendinței centrale. În datele grupate, media aritmetică poate fi calculată folosind formula:
-X este media
-Feu este frecvența clasei
-meu este marca de clasă
-g este numărul de clase
-n este numărul total de date
Pentru mediană este necesar să se identifice intervalul în care se găsește observația n / 2. În exemplul nostru, această observație este numărul 50, deoarece există un total de 100 de puncte de date. Această observație este cuprinsă între 165-169 cm.
Apoi, trebuie să interpolați pentru a găsi valoarea numerică care corespunde acelei observații, pentru care se folosește formula:
Unde:
-c = lățimea intervalului în care se găsește mediana
-BM = limita inferioară a intervalului la care aparține mediana
-Fm = numărul de observații conținute în intervalul mediu
-n / 2 = jumătate din datele totale
-FBM = numărul total de observații inainte de intervalul median
Pentru mod, se identifică clasa modală, cea care conține cele mai multe observații, a cărei notă de clasă este cunoscută.
Varianța și deviația standard sunt măsuri de dispersie. Dacă notăm varianța cu sDouă și abaterea standard, care este rădăcina pătrată a varianței ca s, pentru datele grupate vom avea respectiv:
Da
Pentru distribuirea înălțimilor studenților universitari propuse la început, calculați valorile:
a) Medie
b) Mediană
c) Moda
d) Varianța și deviația standard.
Să construim următorul tabel pentru a facilita calculele:
Înlocuirea valorilor și efectuarea sumării direct:
X = (6 x 157 + 14 x 162 + 47 x 167 + 28 x 172+ 5 x 177) / 100 cm =
= 167,6 cm
Intervalul la care aparține mediana este de 165-169 cm deoarece este intervalul cu cea mai mare frecvență.
Să identificăm fiecare dintre aceste valori în exemplu, cu ajutorul Tabelului 2:
c = 5 cm (vezi secțiunea de amplitudine)
BM = 164,5 cm
Fm = 47
n / 2 = 100/2 = 50
FBM = 20
Înlocuind în formulă:
Intervalul care conține majoritatea observațiilor este de 165-169 cm, a cărui notă de clasă este de 167 cm.
Extindem tabelul anterior adăugând două coloane suplimentare:
Aplicăm formula:
Și dezvoltăm suma:
sDouă = (6 x 112,36 + 14 x 31,36 + 47 x 0,36 + 28 x 19,36 + 5 x 88,36) / 99 = = 21,35 cmDouă
Prin urmare:
s = √21,35 cmDouă = 4,6 cm
Nimeni nu a comentat acest articol încă.