Explicația regulii Sturges, aplicații și exemple

2927
Simon Doyle

sturges stăpânesc este un criteriu utilizat pentru a determina numărul de clase sau intervale care sunt necesare pentru a reprezenta grafic un set de date statistice. Această regulă a fost enunțată în 1926 de matematicianul german Herbert Sturges.

Sturges a propus o metodă simplă, bazată pe numărul de eșantioane x, care ne-ar permite să găsim numărul de clase și lățimea lor. Regula Sturges este utilizată pe scară largă, în special în domeniul statisticilor, în special pentru a construi histograme de frecvență..

Indice articol

  • 1 Explicație
  • 2 Aplicații
  • 3 Exemplu
  • 4 Referințe

Explicaţie

Regula Sturges este o metodă empirică utilizată pe scară largă în statisticile descriptive pentru a determina numărul de clase care trebuie să existe într-o histogramă de frecvență, pentru a clasifica un set de date care reprezintă un eșantion sau o populație..

Practic, această regulă determină lățimea containerelor grafice, a histogramelor de frecvență.

Pentru a-și stabili regula, Herbert Sturges a considerat o diagramă de frecvență ideală, constând din intervale K, unde intervalul i conține un anumit număr de eșantioane (i = 0, ... k - 1), reprezentate ca:

Acest număr de eșantioane este dat de numărul de moduri în care un subset al unui set poate fi extras; adică prin coeficientul binomial, exprimat după cum urmează:

Pentru a simplifica expresia, el a aplicat proprietățile logaritmilor ambelor părți ale ecuației:

Astfel, Sturges a stabilit că numărul optim de intervale k este dat de expresia:

Poate fi exprimat și ca:

În această expresie:

- k este numărul de clase.

- N este numărul total de observații din eșantion.

- Jurnalul este logaritmul comun al bazei 10.

De exemplu, pentru a construi o histogramă de frecvență care exprimă un eșantion aleatoriu de înălțimea a 142 de copii, numărul de intervale sau clase pe care le va avea distribuția este:

k = 1 + 3.322 * Buturuga10 (N)

k = 1 + 3.322* jurnal (142)

k = 1 + 3.322* 2.1523

k = 8,14 ≈ 8

Astfel, distribuția va fi în 8 intervale.

Numărul de intervale trebuie întotdeauna reprezentat de numere întregi. În cazurile în care valoarea este zecimală, trebuie făcută o aproximare la cel mai apropiat număr întreg.

Aplicații

Regula lui Sturges se aplică în principal în statistici, deoarece permite o distribuție a frecvenței prin calcularea numărului de clase (k), precum și a lungimii fiecăreia dintre acestea, cunoscută și sub numele de amplitudine..

Amplitudinea este diferența dintre limita superioară și inferioară a clasei, împărțită la numărul de clase și se exprimă:

Există multe reguli generale care vă permit să faceți o distribuție a frecvenței. Cu toate acestea, regula lui Sturges este folosită în mod obișnuit deoarece aproximează numărul de clase, care variază în general de la 5 la 15..

Astfel, consideră o valoare care reprezintă în mod adecvat un eșantion sau o populație; adică aproximarea nu reprezintă grupări extreme și nici nu funcționează cu un număr excesiv de clase care nu permit rezumarea eșantionului..

Exemplu

O histogramă de frecvență trebuie făcută în conformitate cu datele furnizate, care corespund vârstelor obținute într-un sondaj la bărbații care fac mișcare într-o sală de gimnastică locală..

Pentru a determina intervalele, trebuie să cunoașteți dimensiunea eșantionului sau numărul de observații; în acest caz, aveți 30.

Atunci se aplică regula Sturges:

k = 1 + 3.322 * Buturuga10 (N)

k = 1 + 3.322* jurnal (30)

k = 1 + 3.322* 1,4771

k = 5,90 ≈ 6 intervale.

Din numărul de intervale, se poate calcula amplitudinea pe care acestea o vor avea; adică lățimea fiecărei bare reprezentată în histograma frecvenței:

Limita inferioară este considerată cea mai mică valoare a datelor, iar limita superioară este cea mai mare valoare. Diferența dintre limitele superioare și inferioare se numește intervalul sau intervalul variabilei (R).

Din tabel avem că limita superioară este 46 și limita inferioară este 13; în acest fel, amplitudinea fiecărei clase va fi:

Intervalele vor fi alcătuite dintr-o limită superioară și inferioară. Pentru a determina aceste intervale, începem prin numărarea de la limita inferioară, adăugând la aceasta amplitudinea determinată de regula (6), după cum urmează:

Apoi, frecvența absolută este calculată pentru a determina numărul de bărbați corespunzător fiecărui interval; în acest caz este:

- Interval 1: 13 - 18 = 9

- Interval 2: 19 - 24 = 9

- Interval 3: 25 - 30 = 5

- Intervalul 4: 31 - 36 = 2

- Intervalul 5: 37 - 42 = 2

- Intervalul 6: 43 - 48 = 3

Când se adaugă frecvența absolută a fiecărei clase, aceasta trebuie să fie egală cu numărul total al eșantionului; în acest caz, 30.

Ulterior, se calculează frecvența relativă a fiecărui interval, împărțind frecvența sa absolută la numărul total de observații:

- Interval 1: fi = 9 ÷ 30 = 0,30

- Intervalul 2: fi = 9 ÷ 30 = 0,30

- Intervalul 3: fi = 5 ÷ 30 = 0,1666

- Intervalul 4: fi = 2 ÷ 30 = 0,0666

- Intervalul 5: fi = 2 ÷ 30 = 0,0666

- Intervalul 4: fi = 3 ÷ 30 = 0,10

Apoi puteți face un tabel care să reflecte datele și, de asemenea, diagrama din frecvența relativă în raport cu intervalele obținute, așa cum se poate vedea în următoarele imagini:

În acest fel, regula Sturges permite determinarea numărului de clase sau intervale în care poate fi împărțit un eșantion, pentru a rezuma un eșantion de date prin elaborarea de tabele și grafice..

Referințe

  1. Alfonso Urquía, M. V. (2013). Modelarea și simularea evenimentelor discrete. UNED,.
  2. Altman Naomi, M. K. (2015). „Regresie liniară simplă”. Metode ale naturii .
  3. Antúnez, R. J. (2014). Statistici în educație. UNITATE digitală.
  4. Fox, J. (1997.). Analiza de regresie aplicată, modele liniare și metode conexe. Publicații SAGE.
  5. Humberto Llinás Solano, C. R. (2005). Statistici descriptive și distribuții de probabilitate. Universitatea din nord.
  6. Panteleeva, O. V. (2005). Bazele probabilității și statisticii.
  7. O. Kuehl, M. O. (2001). Proiectarea experimentelor: principiile statistice ale proiectării și analizei cercetării. Editori Thomson.

Nimeni nu a comentat acest articol încă.