Eroare de eșantionare sau eroare de eșantion În statistici, este diferența dintre valoarea medie a unui eșantion și valoarea medie a populației totale. Pentru a ilustra ideea, să ne imaginăm că populația totală a unui oraș este de un milion de oameni, din care se dorește dimensiunea medie a pantofilor, pentru care se ia un eșantion aleatoriu de o mie de oameni.
Dimensiunea medie care rezultă din eșantion nu va coincide neapărat cu cea a populației totale, deși dacă eșantionul nu este părtinitor, valoarea trebuie să fie apropiată. Această diferență între valoarea medie a eșantionului și cea a populației totale este eroarea de eșantionare.
În general, valoarea medie a populației totale este necunoscută, dar există tehnici pentru a reduce această eroare și formule de estimare a marja de eroare de eșantionare care va fi expus în acest articol.
Indice articol
Să presupunem că doriți să cunoașteți valoarea medie a unei anumite caracteristici măsurabile X într-o populație de dimensiuni N, Dar cum N este un număr mare, nu este fezabil să se efectueze studiul asupra populației totale, apoi continuăm să luăm un probă aleatorie de dimensiune n<
Valoarea medie a eșantionului este notată cu
Să presupunem că iau m probe din populația totală N, toate de aceeași dimensiune n cu valori medii
Aceste valori medii nu vor fi identice între ele și vor fi toate în jurul valorii medii a populației μ. marja de eroare de eșantionare E indică separarea așteptată a valorilor medii
marja standard de eroare ε eșantion de mărime n este:
ε = σ / √n
Unde σ este abaterea standard (rădăcina pătrată a varianței), care se calculează utilizând următoarea formulă:
σ = √ [(x -
Înțelesul lui marja standard de eroare ε este următorul:
valoare medie
În secțiunea anterioară s-a dat formula pentru a găsi intervalul de erori standard dintr-un eșantion de mărimea n, unde cuvântul standard indică faptul că este o marjă de eroare cu încredere de 68%.
Aceasta indică faptul că dacă s-au prelevat multe eșantioane de aceeași dimensiune n, 68% dintre ei vor da valori medii
Există o regulă simplă, numită regula 68-95-99.7 ceea ce ne permite să găsim marja de eroare de eșantionare E pentru niveluri de încredere de 68%, 95% Da 99,7% cu ușurință, deoarece această marjă este 1⋅ε, 2⋅ε și 3⋅ε respectiv.
Daca el nivelul de încredere γ nu este una dintre cele de mai sus, atunci eroarea de eșantionare este deviația standard σ înmulțit cu factorul Zγ, care se obține prin următoarea procedură:
1.- Mai întâi nivel de semnificație α care se calculează din nivelul de încredere γ folosind următoarea relație: α = 1 - γ
2.- Apoi trebuie să calculați valoarea 1 - α / 2 = (1 + γ) / 2, care corespunde frecvenței normale acumulate între -∞ și Zγ, într-o distribuție gaussiană normală sau standardizată F (z), a cărei definiție poate fi văzută în figura 2.
3.- Ecuația este rezolvată F (Zγ) = 1 - α / 2 prin intermediul tabelelor distribuției normale (cumulative) F, sau prin intermediul unei aplicații informatice care are funcția Gauss inversă standardizată F-1.
În acest din urmă caz avem:
Zγ = G-1(1 - α / 2).
4.- În cele din urmă, această formulă este aplicată pentru eroarea de eșantionare cu un nivel de fiabilitate γ:
E = Zγ⋅(σ / √n)
Calculați marja standard de eroare în greutatea medie a unui eșantion de 100 de nou-născuți. Calculul greutății medii a fost
marja standard de eroare este ε = σ / √n = (1.500 kg) / √100 = 0.15 kg. Ceea ce înseamnă că, cu aceste date, se poate deduce că greutatea a 68% dintre nou-născuți este între 2.950 kg și 3.25 kg.
A determina marja erorii de eșantionare E și intervalul de greutate de 100 de nou-născuți cu un nivel de încredere de 95% dacă greutatea medie este de 3.100 kg cu deviație standard σ = 1.500 kg.
Dacă regula 68; 95; 99,7 → 1⋅ε; 2⋅ε; 3⋅ε, aveți:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Adică, 95% dintre nou-născuți vor avea greutăți cuprinse între 2.800 kg și 3.400 kg.
Determinați gama de greutăți a nou-născuților din Exemplul 1 cu o marjă de încredere de 99,7%.
Eroarea de eșantionare cu încredere de 99,7% este 3 σ / √n, care pentru exemplul nostru este E = 3 * 0,15 kg = 0,45 kg. De aici se deduce că 99,7% dintre nou-născuți vor avea greutăți cuprinse între 2.650 kg și 3.550 kg.
Determinați factorul Zγ pentru un nivel de fiabilitate de 75%. Determinați marja erorii de eșantionare cu acest nivel de fiabilitate pentru cazul prezentat în exemplul 1.
nivel de încredere este γ = 75% = 0,75 care este legat de nivel de semnificație α prin relație γ= (1 - α), astfel încât nivelul de semnificație să fie α = 1 - 0,75 = 0,25.
Aceasta înseamnă că probabilitatea normală cumulată între -∞ și Zγ este:
P (Z ≤ Zγ ) = 1 - 0,125 = 0,875
Ce corespunde unei valori Zγ 1.1503, așa cum se arată în Figura 3.
Adică, eroarea de eșantionare este E = Zγ⋅(σ / √n)= 1.15⋅(σ / √n).
Atunci când este aplicat datelor din exemplul 1, dă o eroare de:
E = 1,15 * 0,15 kg = 0,17 kg
Cu un nivel de încredere de 75%.
Care este nivelul de încredere dacă Zα / 2 = 2.4 ?
P (Z ≤ Zα / 2 ) = 1 - α / 2
P (Z ≤ 2.4) = 1 - α / 2 = 0.9918 → α / 2 = 1 - 0.9918 = 0.0082 → α = 0.0164
Nivelul de semnificație este:
α = 0,0164 = 1,64%
Și, în cele din urmă, nivelul de încredere rămâne:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Nimeni nu a comentat acest articol încă.