Măsuri ale tendinței centrale pentru formule de date grupate, exerciții

4889
Egbert Haynes
Măsuri ale tendinței centrale pentru formule de date grupate, exerciții

măsuri de tendință central indică valoarea în jurul căreia se află datele unei distribuții. Cea mai cunoscută este media aritmetică sau medie, care constă în adăugarea tuturor valorilor și împărțirea rezultatului la numărul total de date.

Cu toate acestea, dacă distribuția constă dintr-un număr mare de valori și nu sunt prezentate în mod ordonat, nu este ușor să efectuați calculele necesare pentru a extrage informațiile valoroase pe care le conțin..

Figura 1. Măsurile tendinței centrale pentru datele grupate sunt un bun indiciu al comportamentului general al datelor

De aceea sunt grupate în clase sau categorii, pentru a dezvolta un distribuirea de frecvențe. Efectuând această ordonare anterioară a datelor, este mai ușor să calculați măsurile de tendință centrală, printre care:

-Jumătate

-Median

-Modă

-Media geometrică

-Media armonică

Formule

Iată formulele pentru măsurile tendinței centrale pentru datele grupate:

Media aritmetică

Media este cea mai utilizată pentru a caracteriza datele cantitative (valori numerice), deși este destul de sensibilă la valorile extreme ale distribuției. Se calculează după:

Cu:

-X: medie sau medie aritmetică

-Feu: frecvența clasei

-meu: nota clasei

-g: numărul de clase

-n: date totale

Median

Pentru a-l calcula, este necesar să găsiți intervalul care conține observația n / 2 și să interpolați pentru a determina valoarea numerică a respectivei observații, utilizând următoarea formulă:

Unde:

-c: lățimea intervalului la care aparține mediana

-BM: limita inferioară a intervalului menționat

-Fm: numărul de observații conținute în interval

-n / 2: date totale împărțite la 2.

-FBM: numărul de observații inainte de a intervalului care conține mediana.

Prin urmare, mediana este o măsură a poziției, adică împarte setul de date în două părți. De asemenea, pot fi definite quartile, decile Da percentile, care împart distribuția în patru, zece și, respectiv, o sută de părți.

Modă

În datele grupate, se caută clasa sau categoria care conține cele mai multe observații. Acesta este clasa modală. O distribuție poate avea două sau mai multe moduri, caz în care se numește bimodal Da multimodal, respectiv.

De asemenea, puteți calcula modul în date grupate urmând ecuația:

Cu:

-L1: limita inferioară a clasei în care se găsește modul

1: scade între frecvența clasei modale și frecvența clasei care o precedă.

Două: scade între frecvența clasei modale și frecvența clasei următoare.

-c: lățimea intervalului care conține modul

Media armonică

Media armonică este notată cu H. Când aveți un set de n x valori1, XDouă, X3…, Media armonică este inversa sau reciprocă a mediei aritmetice a inverselor valorilor.

Este mai ușor să-l vedeți prin formula:

Și având datele grupate disponibile, expresia devine:

Unde:

-H: medie armonică

-Feu: frecvența clasei

-meu: nota clasei

-g: numărul de clase

-N = f1 + FDouă + F3 +...

Media geometrică

Dacă au n numere pozitive x1, XDouă, X3…, Media sa geometrică G este calculată de a n-a rădăcină a produsului tuturor numerelor:

În cazul datelor grupate, se poate arăta că logaritmul zecimal al jurnalului mediu geometric G este dat de:

Unde:

-G: medie geometrică

-Feu: frecvența clasei

-meu: nota clasei

-g: numărul de clase

-N = f1 + FDouă + F3 +...

Relația dintre H, G și X

Este întotdeauna adevărat că:

H ≤ G ≤ X

Cele mai utilizate definiții

Următoarele definiții sunt necesare pentru a găsi valorile descrise în formulele de mai sus:

Frecvență

Frecvența este definită ca numărul de repetări ale unei date.

Rang

Este diferența dintre cele mai mari și cele mai mici valori, prezente în distribuție.

Numărul de clase

Pentru a ști în câte clase grupăm datele, folosim câteva criterii, de exemplu următoarele:

Limite

Se numesc valorile extreme ale fiecărei clase sau intervale limite și fiecare clasă poate avea ambele limite bine definite, caz în care are o limită inferioară și una superioară. Sau poate avea limite deschise, atunci când este dat un interval, de exemplu cu valori mai mari sau mai mici decât un anumit număr.

Nota de clasă

Acesta constă pur și simplu din punctul de mijloc al intervalului și se calculează prin media limită superioară și limită inferioară.

Lățimea decalajului

Datele pot fi grupate în clase de dimensiuni egale sau diferite, aceasta este lățimea sau lățimea. Prima opțiune este cea mai utilizată, deoarece face calculele mult mai ușoare, deși în unele cazuri este imperativ ca clasele să aibă lățimi diferite.

Lațimea c Intervalul poate fi determinat de următoarea formulă:

c = Interval / Nc

Undec este numărul de clase.

Exercițiul a fost rezolvat

Mai jos avem o serie de măsurători ale vitezei în km / h, luate cu radar, care corespund a 50 de mașini care au trecut printr-o stradă dintr-un anumit oraș:

Figura 2. Tabel pentru exercițiul rezolvat. Sursa: F. Zapata.

Soluţie

Datele prezentate în acest mod nu sunt organizate, așa că primul pas este gruparea lor în clase.

Pași pentru gruparea datelor și construirea tabelului

Pasul 1

Găsiți gama R:

R = (52 - 16) km / h = 36 km / h

Pasul 2

Selectați numărul de clase Nc, conform criteriilor date. Deoarece există 50 de date, putem alege Nc = 6.

Pasul 3

Calculați lățimea c intervalului:

c = Gama / Nc = 36/6 = 6

Pasul 4

Formați clasele și datele de grup după cum urmează: pentru prima clasă, o valoare puțin mai mică decât cea mai mică valoare prezentă în tabel este aleasă ca limită inferioară, apoi valoarea lui c = 6, calculată anterior, se adaugă acestei valori, astfel obține limita superioară a primei clase.

Procedăm în același mod pentru a construi restul claselor, așa cum se arată în tabelul următor:

Fiecare frecvență corespunde unei culori din figura 2, în acest fel se asigură că nicio valoare nu scapă de la numărare..

Calculul mediei

X = (5 x 18,5 +25 x 25,0 + 10 x 31,5 + 6 x 38,0 + 2 x 44,5 + 2 x 51,0) ÷ 50 = 29,03 km / h

Calculul medianei

Mediana se află în clasa 2 a tabelului, deoarece există primele 30 de date ale distribuției.

-Lățimea intervalului la care aparține mediana: c = 6

-Limita inferioară a intervalului în care mediana este: BM = 22,0 km / h

-Numărul de observații pe care le conține intervalul fm = 25

-Datele totale împărțite la 2: 50/2 = 25

-Numărul de observații există inainte de a intervalului care conține mediana: fBM = 5

Iar operațiunea este:

Mediană = 22,0 + [(25-5) ÷ 25] × 6 = 26,80 km / h

Calculul modei

Moda este, de asemenea, în clasa 2:

-Lățimea intervalului: c = 6

-Limita inferioară a clasei în care se găsește modul: L1 = 22,0

-Scădeți între frecvența clasei modale și frecvența clasei care o precedă: Δ1 = 25-5 = 20

-Scădeți între frecvența clasei modale și frecvența clasei care urmează: ΔDouă = 25 - 10 = 15

Cu aceste date operația este:

Mod = 22,0 + [20 ÷ (20 + 15)] x6 = 25,4 km / h

Calculul mediei geometrice

N = f1 + FDouă + F3 +… = 50

log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =

log G = 1,44916053

G = 28,13 km / h

Calcul armonic mediu

1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366

H = 27,32 km / h

Rezumatul măsurilor de tendință centrală

Unitățile variabilelor sunt km / h:

-Medie: 29,03

-Mediană: 26,80

-Modă: 25.40

-Media geometrică: 28,13

-Media armonică: 27,32

Referințe

  1. Berenson, M. 1985. Statistici pentru management și economie. Interamericana S.A.
  2. Canavos, G. 1988. Probabilitate și statistici: aplicații și metode. Dealul Mcgraw.
  3. Devore, J. 2012. Probabilități și statistici pentru inginerie și știință. A 8-a. Ediție. Cengage.
  4. Levin, R. 1988. Statistici pentru administratori. Al 2-lea. Ediție. Prentice hall.
  5. Spiegel, M. 2009. Statistici. Seria Schaum. Al 4-lea Ediție. Dealul Mcgraw.
  6. Tratarea datelor grupate. Recuperat de la: itchihuahua.edu.mx.
  7. Walpole, R. 2007. Probabilități și statistici pentru inginerie și științe. Pearson.

Nimeni nu a comentat acest articol încă.