Eșantionarea formulelor și ecuațiilor de eroare, calcul, exemple

4958
Abraham McLaughlin

Eroare de eșantionare sau eroare de eșantion În statistici, este diferența dintre valoarea medie a unui eșantion și valoarea medie a populației totale. Pentru a ilustra ideea, să ne imaginăm că populația totală a unui oraș este de un milion de oameni, din care se dorește dimensiunea medie a pantofilor, pentru care se ia un eșantion aleatoriu de o mie de oameni.

Dimensiunea medie care rezultă din eșantion nu va coincide neapărat cu cea a populației totale, deși dacă eșantionul nu este părtinitor, valoarea trebuie să fie apropiată. Această diferență între valoarea medie a eșantionului și cea a populației totale este eroarea de eșantionare.

Figura 1. Deoarece eșantionul este un subset al populației totale, media eșantionului are o marjă de eroare. Sursa: F. Zapata.

În general, valoarea medie a populației totale este necunoscută, dar există tehnici pentru a reduce această eroare și formule de estimare a marja de eroare de eșantionare care va fi expus în acest articol.

Indice articol

  • 1 Formule și ecuații
  • 2 Cum se calculează eroarea de eșantionare
    • 2.1 Pentru un nivel de încredere γ
  • 3 Exemple
    • 3.1 - Exemplul 1
    • 3.2 - Exemplul 2
    • 3.3 - Exemplul 3
    • 3.4 - Exemplul 4
    • 3.5 - Exercițiul 5
  • 4 Referințe

Formule și ecuații

Să presupunem că doriți să cunoașteți valoarea medie a unei anumite caracteristici măsurabile X într-o populație de dimensiuni N, Dar cum N este un număr mare, nu este fezabil să se efectueze studiul asupra populației totale, apoi continuăm să luăm un probă aleatorie de dimensiune n<.

Valoarea medie a eșantionului este notată cu iar valoarea medie a populației totale este notată de litera greacă μ (scrie mu sau miu).

Să presupunem că iau m probe din populația totală N, toate de aceeași dimensiune n cu valori medii 1>, Două>, 3>, ... .m>.

Aceste valori medii nu vor fi identice între ele și vor fi toate în jurul valorii medii a populației μ. marja de eroare de eșantionare E indică separarea așteptată a valorilor medii în ceea ce privește valoarea medie a populației μ într-un procent specificat numit nivelul de încredere γ (gamma).

marja standard de eroare ε eșantion de mărime n este:

ε = σ / √n

Unde σ este abaterea standard (rădăcina pătrată a varianței), care se calculează utilizând următoarea formulă:

σ = √ [(x - )Două/ (n - 1)]

Înțelesul lui marja standard de eroare ε este următorul:

valoare medie obținut prin eșantion de mărime n este în raza de acțiune ( - ε, + ε) cu nivel de încredere 68,3%.

Cum se calculează eroarea de eșantionare

În secțiunea anterioară s-a dat formula pentru a găsi intervalul de erori standard dintr-un eșantion de mărimea n, unde cuvântul standard indică faptul că este o marjă de eroare cu încredere de 68%.

Aceasta indică faptul că dacă s-au prelevat multe eșantioane de aceeași dimensiune n, 68% dintre ei vor da valori medii în intervalul [ - ε, + ε].

Există o regulă simplă, numită regula 68-95-99.7 ceea ce ne permite să găsim marja de eroare de eșantionare E pentru niveluri de încredere de 68%, 95% Da 99,7% cu ușurință, deoarece această marjă este 1⋅ε, 2⋅ε și 3⋅ε respectiv.

Pentru un nivel de încredere γ

Daca el nivelul de încredere γ nu este una dintre cele de mai sus, atunci eroarea de eșantionare este deviația standard σ înmulțit cu factorul , care se obține prin următoarea procedură:

1.- Mai întâi nivel de semnificație α care se calculează din nivelul de încredere γ folosind următoarea relație: α = 1 - γ

2.- Apoi trebuie să calculați valoarea 1 - α / 2 = (1 + γ) / 2, care corespunde frecvenței normale acumulate între -∞ și , într-o distribuție gaussiană normală sau standardizată F (z), a cărei definiție poate fi văzută în figura 2.

3.- Ecuația este rezolvată F (Zγ) = 1 - α / 2 prin intermediul tabelelor distribuției normale (cumulative) F, sau prin intermediul unei aplicații informatice care are funcția Gauss inversă standardizată F-1.

În acest din urmă caz ​​avem:

Zγ = G-1(1 - α / 2).

4.- În cele din urmă, această formulă este aplicată pentru eroarea de eșantionare cu un nivel de fiabilitate γ:

E = Zγ(σ / √n)

Figura 2. Tabelul distribuției normale. Sursa: Wikimedia Commons.

Exemple

- Exemplul 1

Calculați marja standard de eroare în greutatea medie a unui eșantion de 100 de nou-născuți. Calculul greutății medii a fost = 3.100 kg cu o abatere standard σ = 1.500 kg.

Soluţie

marja standard de eroare este ε = σ / √n = (1.500 kg) / √100 = 0.15 kg. Ceea ce înseamnă că, cu aceste date, se poate deduce că greutatea a 68% dintre nou-născuți este între 2.950 kg și 3.25 kg.

- Exemplul 2

A determina marja erorii de eșantionare E și intervalul de greutate de 100 de nou-născuți cu un nivel de încredere de 95% dacă greutatea medie este de 3.100 kg cu deviație standard σ = 1.500 kg.

Soluţie

Dacă regula 68; 95; 99,7 → 1⋅ε; 2⋅ε; 3⋅ε, aveți:

E = 2⋅ε = 2⋅0,15 kg = 0,30 kg

Adică, 95% dintre nou-născuți vor avea greutăți cuprinse între 2.800 kg și 3.400 kg.

- Exemplul 3

Determinați gama de greutăți a nou-născuților din Exemplul 1 cu o marjă de încredere de 99,7%.

Soluţie

Eroarea de eșantionare cu încredere de 99,7% este 3 σ / √n, care pentru exemplul nostru este E = 3 * 0,15 kg = 0,45 kg. De aici se deduce că 99,7% dintre nou-născuți vor avea greutăți cuprinse între 2.650 kg și 3.550 kg.

- Exemplul 4

Determinați factorul pentru un nivel de fiabilitate de 75%. Determinați marja erorii de eșantionare cu acest nivel de fiabilitate pentru cazul prezentat în exemplul 1.

Soluţie

nivel de încredere este γ = 75% = 0,75 care este legat de nivel de semnificație α prin relație γ= (1 - α), astfel încât nivelul de semnificație să fie α = 1 - 0,75 = 0,25.

Aceasta înseamnă că probabilitatea normală cumulată între -∞ și este:

P (Z ≤ ) = 1 - 0,125 = 0,875

Ce corespunde unei valori 1.1503, așa cum se arată în Figura 3.

Figura 3. Determinarea factorului Zγ corespunzător unui nivel de încredere de 75%. Sursa: F. Zapata prin Geogebra.

Adică, eroarea de eșantionare este E = Zγ(σ / √n)= 1.15(σ / √n).

Atunci când este aplicat datelor din exemplul 1, dă o eroare de:

E = 1,15 * 0,15 kg = 0,17 kg

Cu un nivel de încredere de 75%.

- Exercițiul 5

Care este nivelul de încredere dacă Zα / 2 = 2.4 ?

Soluţie

P (Z ≤ Zα / 2 ) = 1 - α / 2

P (Z ≤ 2.4) = 1 - α / 2 = 0.9918 → α / 2 = 1 - 0.9918 = 0.0082 → α = 0.0164

Nivelul de semnificație este:

α = 0,0164 = 1,64%

Și, în cele din urmă, nivelul de încredere rămâne:

1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%

Referințe

  1. Canavos, G. 1988. Probabilitate și statistici: aplicații și metode. Dealul Mcgraw.
  2. Devore, J. 2012. Probabilități și statistici pentru inginerie și știință. A 8-a. Ediție. Cengage.
  3. Levin, R. 1988. Statistici pentru administratori. Al 2-lea. Ediție. Prentice hall.
  4. Sudman, S. 1982. Întrebări: Un ghid practic pentru proiectarea chestionarelor. San Francisco. Jossey bass.
  5. Walpole, R. 2007. Probabilități și statistici pentru inginerie și științe. Pearson.
  6. Wonnacott, T.H. și R.J. Wonnacott. 1990. Statistici introductive. Ed. 5 Wiley
  7. Wikipedia. Eroare de eșantionare. Recuperat de pe: en.wikipedia.com
  8. Wikipedia. Marja de eroare. Recuperat de pe: en.wikipedia.com

Nimeni nu a comentat acest articol încă.