Pagina principala
Statistici
Măsuri de poziție, tendință centrală și dispersie

Măsuri de poziție, tendință centrală și dispersie

901

141

Basil Manning

măsuri de tendință centrală, dispersie și poziție, sunt valori care sunt utilizate pentru a interpreta corect un set de date statistice. Acestea pot fi lucrate direct, deoarece sunt obținute din studiul statistic, sau pot fi organizate în grupuri de frecvență egală, facilitând analiza..

Cele mai cunoscute trei măsuri ale tendinței centrale și unele dintre proprietățile lor. Sursa: F. Zapata.

Măsuri de tendință centrală

Acestea permit cunoașterea valorilor în care sunt grupate datele statistice.

Media aritmetică

Este cunoscută și ca media valorilor unei variabile și se obține prin adăugarea tuturor valorilor și împărțirea rezultatului la numărul total de date.

Media aritmetică pentru datele negroupate

Fie o variabilă x din care avem n date fără organizare sau grupare, media sa aritmetică este calculată după cum urmează:

Și în notație de însumare:

Exemplu

Proprietarii unui han turistic montan intenționează să știe câte zile stau în medie vizitatorii în facilități. Pentru aceasta, s-a păstrat o evidență a zilelor de permanență a 20 de grupuri de turiști, obținând următoarele date:

1; 1; Două; Două; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; Două; Două; 3; 4; 1

Numărul mediu de zile în care stau turiștii este:

Media aritmetică pentru datele grupate

Dacă datele variabilei sunt organizate într-un tabel al frecvențelor absolute f_eu iar centrele de clasă sunt x₁, X_Două,..., X_n, media se calculează prin:

În notație de însumare:

Median

Mediana unui grup de n valori ale variabilei x este valoarea centrală a grupului, cu condiția ca valorile să fie ordonate în ordine crescătoare. În acest fel, jumătate din toate valorile sunt mai mici decât modul și cealaltă jumătate sunt mai mari..

Mediană a datelor negroupate

Pot apărea următoarele cazuri:

-Numărul n de valori ale variabilei x ciudat: mediana este valoarea care se află chiar în mijlocul grupului de valori:

-Numărul n de valori ale variabilei x pereche: în acest caz, mediana este calculată ca medie a celor două valori centrale ale grupului de date:

Exemplu

Pentru a găsi mediana datelor din pensiunea turistică, acestea sunt mai întâi comandate de la cel mai mic la cel mai mare:

1; 1; 1; 1; 1; 1; 1; Două; Două; Două; Două; 3; 3; 3; 4; 4; 4; 4; 5; 5

Numărul de date este egal, prin urmare există două date centrale: X₁₀ și X_unsprezece și întrucât ambele valorează 2, media lor este, de asemenea.

Mediană = 2

Mediana datelor colectate

Se folosește următoarea formulă:

Simbolurile din formulă înseamnă:

-c: lățimea intervalului care conține mediana

-B_M: limita inferioară a aceluiași interval

-F_m: numărul de observații cuprinse în intervalul la care aparține mediana.

-n: date totale.

-F_BM: numărul de observații inainte de a intervalului care conține mediana.

Modă

Modul pentru datele negroupate este valoarea cu cea mai mare frecvență, în timp ce pentru datele grupate este clasa cu cea mai mare frecvență. Moda este considerată cea mai reprezentativă dată sau clasă a distribuției.

Două caracteristici importante ale acestei măsuri sunt că un set de date poate avea mai mult de un mod, iar modul poate fi determinat atât pentru date cantitative cât și calitative..

Exemplu

Continuând cu datele paradorului turistic, cel care se repetă cel mai mult este 1, prin urmare, cel mai obișnuit lucru este că turiștii stau o zi în parador.

Măsuri de dispersie

Măsurile de dispersie descriu modul în care datele sunt grupate în jurul măsurilor centrale.

Rang

Se calculează prin scăderea celor mai mari date și a celor mai mici date. Dacă această diferență este mare, este un semn că datele sunt împrăștiate, în timp ce valorile mici indică faptul că datele sunt apropiate de medie..

Exemplu

Gama pentru datele paradorului turistic este:

Gama = 5−1 = 4

Varianța

Varianța pentru datele negroupate

Pentru a găsi varianța s^Două Este necesar să se cunoască mai întâi media aritmetică, apoi se calculează diferența pătrată între fiecare bucată de date și media, toate acestea fiind adăugate și împărțite la numărul total de observații. Aceste diferențe sunt cunoscute sub numele de abateri.

Varianța, care este întotdeauna pozitivă (sau zero), indică cât de departe sunt observațiile de medie: dacă varianța este mare, valorile sunt mai dispersate decât atunci când varianța este mică.

Exemplu

Varianța pentru datele de la pensiunea turistică este:

1; 1; Două; Două; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; Două; Două; 3; 4; 1

Varianța pentru datele grupate

Pentru a găsi varianța unui set de date grupate, sunt necesare următoarele: i) media, ii) frecvența f_eu care reprezintă datele totale din fiecare clasă și iii) x_eu sau valoarea clasei:

Abaterea standard este rădăcina pătrată pozitivă a varianței, deci are un avantaj față de varianță: vine în aceleași unități ca variabila studiată și astfel aveți o idee mai directă despre cât de aproape sau de departe este variabila din medie.

Abaterea standard pentru datele negroupate

Se determină pur și simplu prin găsirea rădăcinii pătrate a varianței pentru datele negroupate:

Abaterea standard pentru datele de la pensiunea turistică este:

s = √ (s^Două) = √1.95 = 1.40

Abaterea standard pentru datele grupate

Se calculează prin găsirea rădăcinii pătrate a varianței pentru datele grupate:

Măsurători de poziție

Măsurile de poziție împart un set ordonat de date în bucăți de dimensiuni egale. Mediana, pe lângă faptul că este o măsură a tendinței centrale, este și o măsură a poziției, deoarece împarte întregul în două părți egale. Dar părți mai mici pot fi obținute cu quartile, decile și percentilele.

Quartile

Cvartilele împart setul în patru părți egale, fiecare conținând 25% din date. Sunt notate ca Q₁, Î_Două și Q₃ iar mediana este quartila Q_Două. În acest fel, 25% din date se află sub quartila Q.₁, 50% sub quartila Q_Două sau median și cu 75% sub quartila Q₃.

Figura 2. Cuartilele împart setul de date în patru părți egale. Sursa: F. Zapata.

Cvartile pentru date negroupate

Datele sunt ordonate și totalul este împărțit în 4 grupuri cu același număr de date fiecare. Poziția primei quartile se găsește prin:

Î₁ = (n + 1) / 4

Unde n este datele totale. Dacă rezultatul este un număr întreg, datele corespunzătoare poziției respective sunt localizate, dar dacă sunt zecimale, datele corespunzătoare părții întregi sunt calculate cu următoarea sau, pentru o mai mare precizie, se interpolează liniar între datele respective.

Exemplu

Poziția primului quartile Q₁ pentru datele paradorului turistic este:

Î₁ = (n + 1) / 4 = (20 + 1) / 4 = 5,25

Aceasta este poziția quartilei 1 și, din moment ce rezultatul este zecimal, se caută datele X.₅ și X_6, care sunt respectiv X₅ = 1 și X₆ = 1 și sunt medii, rezultând:

Prima quartilă = 1

1; 1; 1; 1; 1; 1; 1; Două; Două; Două; Două; 3; 3; 3; 4; 4; 4; 4; 5; 5.

Poziția celui de-al doilea quartile Q_Două este:

Î_Două = 2 (n + 1) / 4 = 10,5

Care este media dintre X₁₀ și X_unsprezeceși se potrivește cu mediana:

Al doilea quartile = Median = 2

Poziția celui de-al treilea quartil este calculată prin:

Î₃ = 3 (n + 1) / 4 = 3 (20 + 1) / 4 = 15,75

De asemenea, este zecimal, prin urmare X este calculat cu medie_{cincisprezece} și X₁₆:

1; 1; 1; 1; 1; 1; 1; Două; Două; Două; Două; 3; 3; 3; 4; 4; 4; 4; 5; 5.

Dar, deoarece ambele valorează 4:

A treia quartilă = 4

Formula generală pentru poziția quartilelor în datele negroupate este:

Î_k = k (n + 1) / 4

Cu k = 1,2,3.

Cvartile pentru date grupate

Acestea sunt calculate într-un mod similar cu mediana:

Explicația simbolurilor este:

-B_Î: limita inferioară a intervalului care conține quartila

-c: lățimea intervalului respectiv

-F_ce: numărul de observații conținute în intervalul de quartile.

-n: date totale.

-F_BQ: numărul de date inainte de a intervalului care conține quartila.

Decile și percentile

Decilele și percentilele împart setul de date în 10 părți egale și respectiv 100 părți egale, iar calculul lor se efectuează într-un mod similar cu cel al quartilelor.

Decile și percentile pentru date negroupate

Se folosesc respectiv formulele:

D_k = k (n + 1) / 10

Cu k = 1,2,3 ... 9.

Decile D₅trebuie să fie egală cu mediana.

P_k = k (n + 1) / 100

Cu k = 1,2,3 ... 99.

Percentila P_cincizecitrebuie să fie egală cu mediana.

Exemplu

În exemplul pensiunii turistice, poziția D₃ este:

D₃ = 3 (20 + 1) / 10 = 6,3

Deoarece este un număr zecimal, se calculează X₆ și X_7,ambele egale cu 1:

1; 1; 1; 1; 1; 1; 1; Două; Două; Două; Două; 3; 3; 3; 4; 4; 4; 4; 5; 5

Înseamnă că 3 zecimi din date sunt sub X₇ = 1 și restul de mai sus.

Decile și percentile pentru date grupate

Formulele sunt analoage cu cele pentru quartile. D este folosit pentru a indica decile și P pentru percentile, iar simbolurile sunt interpretate în mod similar:

Regula empirică

Când datele sunt distribuite simetric și distribuția este unimodală, există o regulă numită regula empirică sau regula 68 - 95 - 99, care le grupează în următoarele intervale:

68% din date se află în intervalul:

95% din date se află în intervalul:

99% din date se află în intervalul:

Exemplu

În ce interval este 95% din datele din paradorul turistic?

Sunt în intervalul: [2,5−1,40; 2,5 + 1,40] = [1,1; 3.9].

Referințe

Berenson, M. 1985. Statistici pentru management și economie. Interamericana S.A.
Devore, J. 2012. Probabilități și statistici pentru inginerie și știință. A 8-a. Ediție. Cengage.
Levin, R. 1988. Statistici pentru administratori. Al 2-lea. Ediție. Prentice hall.
Spiegel, M. 2009. Statistici. Seria Schaum. Al 4-lea Ediție. Dealul Mcgraw.
Walpole, R. 2007. Probabilități și statistici pentru inginerie și științe. Pearson.

Nume

Text

Nimeni nu a comentat acest articol încă.

Structură, utilizări, proprietăți ale clorurii feroase (FeCl2)

Chimie

1676

Basil Manning

Structură, utilizări, proprietăți de lauril sulfat de sodiu

Chimie

910

105

Anthony Golden

Formula oxidului percloric (Cl2O7), proprietăți, riscuri

Chimie

3782

336

Anthony Golden

Măsuri de poziție, tendință centrală și dispersie

Măsuri de tendință centrală

Media aritmetică

Media aritmetică pentru datele negroupate

Exemplu

Media aritmetică pentru datele grupate

Median

Mediană a datelor negroupate

Exemplu

Mediana datelor colectate

Modă

Exemplu

Măsuri de dispersie

Rang

Exemplu

Varianța

Varianța pentru datele negroupate

Exemplu

Varianța pentru datele grupate

Abaterea standard pentru datele negroupate

Abaterea standard pentru datele grupate

Măsurători de poziție

Quartile

Cvartile pentru date negroupate

Exemplu

Cvartile pentru date grupate

Decile și percentile

Decile și percentile pentru date negroupate

Exemplu

Decile și percentile pentru date grupate

Regula empirică

Exemplu

Referințe

Structură, utilizări, proprietăți ale clorurii feroase (FeCl2)

Structură, utilizări, proprietăți de lauril sulfat de sodiu

Formula oxidului percloric (Cl2O7), proprietăți, riscuri