Formule de distribuție hipergeometrică, ecuații, model

3030
Robert Johnston

distribuție hipergeometrică este o funcție statistică discretă, potrivită pentru calcularea probabilității în experimentele randomizate cu două rezultate posibile. Condiția care este necesară pentru ao aplica este aceea că sunt populații mici, în care extracțiile nu sunt înlocuite și probabilitățile nu sunt constante.. 

Prin urmare, atunci când un element al populației este ales pentru a cunoaște rezultatul (adevărat sau fals) al unei anumite caracteristici, același element nu poate fi ales din nou..

Figura 1. Într-o populație de șuruburi ca aceasta, există cu siguranță exemplare defecte. Sursa: Pixabay.

Cu siguranță, următorul element ales este astfel mai probabil să obțină un rezultat adevărat, dacă elementul anterior a avut un rezultat negativ. Aceasta înseamnă că probabilitatea variază pe măsură ce elementele sunt extrase din eșantion..

Principalele aplicații ale distribuției hipergeometrice sunt: ​​controlul calității în procese cu populație redusă și calculul probabilităților în jocurile de noroc.

În ceea ce privește funcția matematică care definește distribuția hipergeometrică, aceasta constă din trei parametri, care sunt:

- Numărul de elemente ale populației (N)

- Dimensiunea probei (m) 

- Numărul de evenimente din întreaga populație cu un rezultat favorabil (sau nefavorabil) al caracteristicii studiate (n).

Indice articol

  • 1 Formule și ecuații
    • 1.1 Variabile statistice importante
  • 2 Model și proprietăți 
    • 2.1 Principalele proprietăți ale distribuției hipergeometrice
    • 2.2 Aproximarea prin distribuția binomială
  • 3 Exemple
    • 3.1 Exemplul 1
    • 3.2 Exemplul 2
  • 4 exerciții rezolvate
    • 4.1 Exercițiul 1
    • 4.2 Exercițiul 2
    • 4.3 Exercițiul 3
  • 5 Referințe

Formule și ecuații

Formula pentru distribuția hipergeometrică oferă probabilitatea P despre ce X apar cazuri favorabile ale unei anumite caracteristici. Modul de a-l scrie matematic, pe baza numerelor combinatorii este:

În expresia de mai sus N, n Da m sunt parametri și X variabila în sine. 

-Populația totală este N.

-Numărul rezultatelor pozitive ale unei anumite caracteristici binare în raport cu populația totală este n.

-Cantitatea de elemente eșantion este m.

În acest caz, X este o variabilă aleatorie care ia valoarea X Da P (x) indică probabilitatea apariției X cazuri favorabile ale caracteristicii studiate.

Variabile statistice importante

Alte variabile statistice pentru distribuția hipergeometrică sunt:

- Jumătate μ = m * n / N

- Varianța σ ^ 2 = m * (n / N) * (1-n / N) * (N-m) / (N-1)

- Abaterea tipică σ care este rădăcina pătrată a varianței.

Model și proprietăți 

Pentru a ajunge la modelul distribuției hipergeometrice, plecăm de la probabilitatea de a obține X cazuri favorabile într-o dimensiune a eșantionului m. Acest eșantion conține elemente care respectă proprietatea studiată și elemente care nu.

Sa nu uiti asta n reprezintă numărul de cazuri favorabile în totalul populației din N elemente. Atunci probabilitatea ar fi calculată astfel:

P (x) = (# moduri de a obține x # moduri eșuate) / (număr total de moduri de selectare)

Exprimând cele de mai sus sub formă de numere combinatorii, ajungem la următorul model de distribuție a probabilității:

Principalele proprietăți ale distribuției hipergeometrice

Acestea sunt după cum urmează:

- Eșantionul trebuie să fie întotdeauna mic, chiar dacă populația este mare.

- Elementele eșantionului sunt extrase unul câte unul, fără a le încorpora înapoi în populație.

- Proprietatea care trebuie studiată este binară, adică poate lua doar două valori: 1 sau 0, Ei bine anumit sau fals.

În fiecare etapă de extragere a elementelor, probabilitatea se modifică în funcție de rezultatele anterioare.

Aproximare folosind distribuția binomială

O altă proprietate a distribuției hipergeometrice este că poate fi aproximată prin distribuția binomială, notată ca Bi, atâta timp cât populația N este mare și de cel puțin 10 ori mai mare decât proba m. În acest caz, ar arăta astfel:

P (N, n, m; x) = Bi (m, n / N, x)           

Se aplică atâta timp cât N este mare și N> 10m

Exemple

Exemplul 1

Să presupunem că o mașină care produce șuruburi și datele acumulate indică faptul că 1% iese cu defecte. Apoi, într-o cutie de N = 500 șuruburi, numărul defectelor va fi:

n = 500 * 1/100 = 5

Probabilități folosind distribuția hipergeometrică

Să presupunem că din acea cutie (adică din acea populație) luăm un eșantion de m = 60 șuruburi.

Probabilitatea ca niciun șurub (x = 0) din eșantion să nu fie defect este de 52,63%. Acest rezultat este atins utilizând funcția de distribuție hipergeometrică:

P (500, 5, 60, 0) = 0,5263

Probabilitatea ca x = 3 șuruburi din eșantion să fie defecte este: P (500, 5, 60, 3) = 0,0129.

Pe de altă parte, probabilitatea ca x = 4 șuruburi din șaizeci de eșantioane să fie defecte este: P (500, 5, 60; 4) = 0,0008.

În cele din urmă, probabilitatea ca x = 5 șuruburi din proba respectivă să fie defecte este: P (500, 5, 60; 5) = 0.

Dar dacă doriți să cunoașteți probabilitatea ca în acea probă să existe mai mult de 3 șuruburi defecte, atunci trebuie să obțineți probabilitatea cumulativă, adăugând:

P (3) + P (4) + P (5) = 0,0129 + 0,0008 + 0 = 0,0137.

Acest exemplu este ilustrat în figura 2, obținută prin utilizarea GeoGebra un software gratuit utilizat pe scară largă în școli, institute și universități.

Figura 2. Exemplu de distribuție hipergeometrică. Pregătit de F. Zapata cu GeoGebra.

Exemplul 2

Un pachet de punte spaniol are 40 de cărți, dintre care 10 au aur și restul de 30 nu. Să presupunem că 7 cărți sunt extrase aleatoriu din acel pachet, care nu sunt reincorporate în pachet.

Dacă X este numărul de aururi prezent în cele 7 cărți extrase, atunci probabilitatea ca vor exista x aururi într-o extragere de 7 cărți este dată de distribuția hipergeometrică P (40,10,7; x).

Să vedem așa: pentru a calcula probabilitatea de a avea 4 aur într-o extragere de 7 cărți, folosim formula distribuției hipergeometrice cu următoarele valori:

Și rezultatul este: 4,57% probabilitate.

Dar dacă doriți să cunoașteți probabilitatea de a obține mai mult de 4 cărți, atunci trebuie să adăugați:

P (4) + P (5) + P (6) + P (7) = 5,20%

Exerciții rezolvate

Următorul set de exerciții este destinat să ilustreze și să asimileze conceptele prezentate în acest articol. Este important ca cititorul să încerce să le rezolve singur, înainte de a analiza soluția.

Exercitiul 1

O fabrică de prezervative a constatat că din fiecare 1.000 de prezervative produse de o anumită mașină, 5 ies defecte. Pentru controlul calității, 100 de prezervative sunt luate la întâmplare și lotul este respins dacă există cel puțin unul sau mai multe defecte. Răspuns:

a) Care este posibilitatea ca o mulțime de 100 să fie aruncată?

b) Este eficient acest criteriu de control al calității??

Soluţie

În acest caz, vor apărea numere combinatorii foarte mari. Calculul este dificil dacă nu este disponibil un pachet software adecvat.

Dar, deoarece este o populație mare și eșantionul este de zece ori mai mic decât populația totală, este posibil să se utilizeze aproximarea distribuției hipergeometrice prin distribuția binomială:

P (1000,5,100; x) = Bi (100, 5/1000, x) = Bi (100, 0,005, x) = C (100, x) * 0,005 ^ x (1-0,005) ^ (100-x)

În expresia de mai sus C (100, x) este un număr combinatoriu. Atunci probabilitatea de a exista mai mult de un defect va fi calculată astfel:

P (x> = 1) = 1 - Bi (0) = 1- 0,6058 = 0,3942

Este o aproximare excelentă, dacă este comparată cu valoarea obținută prin aplicarea distribuției hipergeometrice: 0,4102

Se poate spune că, cu o probabilitate de 40%, ar trebui aruncat un lot de 100 de profilactice, ceea ce nu este foarte eficient..

Dar, fiind puțin mai exigenți în procesul de control al calității și am renunța la lotul de 100 numai dacă există două sau mai multe defecte, atunci probabilitatea de a arunca lotul ar scădea la doar 8%..

Exercițiul 2

O mașină cu ștecher din plastic funcționează în așa fel încât din fiecare 10 piese, una iese deformată. Într-un eșantion de 5 bucăți, cât de probabil este ca o singură bucată să fie defectă?.

Soluţie

Populație: N = 10

Numărul n de defecte pentru fiecare N: n = 1

Dimensiunea probei: m = 5

P (10, 1, 5; 1) = C (1,1) * C (9,4) / C (10,5) = 1 * 126/252 = 0,5

Prin urmare, există o probabilitate de 50% ca într-un eșantion de 5, un indiciu să iasă deformat.

Exercițiul 3

Într-o întâlnire a tinerilor absolvenți de liceu sunt 7 doamne și 6 domni. Dintre fete, 4 studiază științele umaniste și 3. În grupul de băieți, 1 studiază științele umaniste și 5. Calculați următoarele:

a) Alegerea a trei fete la întâmplare: care este probabilitatea ca toate să studieze științele umaniste?.

b) Dacă trei participanți la întâlnirea prietenilor sunt aleși la întâmplare: Care este posibilitatea ca trei dintre ei, indiferent de sex, să studieze știința toate trei, sau științele umane, de asemenea, toate trei?.

c) Acum selectați doi prieteni la întâmplare și sunați X la variabila aleatorie „numărul celor care studiază științele umaniste”. Între cele două alese, determinați media sau valoarea așteptată a X iar varianța σ ^ 2.

Solutie la 

Populația este numărul total de fete: N = 7. Cei care studiază științele umaniste sunt n = 4, din total. Eșantionul aleatoriu de fete va fi m = 3.

În acest caz, probabilitatea ca toți trei să fie studenți în științe umane este dată de funcția hipergeometrică:

P (N = 7, n = 4, m = 3, x = 3) = C (4, 3) C (3, 0) / C (7, 3) = 0.1143

Deci, există o probabilitate de 11,4% ca trei fete alese la întâmplare să studieze științele umaniste..

Soluția b

Valorile de utilizat acum sunt:

-Populație: N = 14

-Cantitatea care studiază literele este: n = 6 și

-Dimensiunea probei: m = 3.

-Numărul de prieteni care studiază științele umaniste: x

Conform acestui fapt, x = 3 înseamnă că toate trei studiază științele umaniste, dar x = 0 înseamnă că niciunul nu studiază științele umaniste. Probabilitatea ca toți trei să studieze la fel este dată de suma:

P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099

Apoi, avem o probabilitate de 21% ca trei participanți la întâlnire, aleși la întâmplare, să studieze același lucru.

Soluția c

Aici avem următoarele valori:

N = 14 populație totală de prieteni, n = 6 număr total în populația care studiază științe umane, dimensiunea eșantionului este m = 2.

Speranța este:

E (x) = m * (n / N) = 2 * (6/14) = 0,8572

Și varianța:

σ (x) ^ 2 =  m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * (14-2) / (14 -1) =

= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / (13 )  = 0,4521

Referințe

  1. Distribuții de probabilitate discrete. Recuperat de pe: biplot.usal.es
  2. Statistică și probabilitate. Distribuție hipergeometrică. Recuperat de la: projectdescartes.org
  3. CDPYE-UGR. Distribuția hipergeometrică. Recuperat de pe: ugr.es
  4. Geogebra. Geogebra clasică, calcul de probabilitate. Recuperat de la geogebra.org
  5. Încearcă ușor. S-au rezolvat probleme de distribuție hipergeometrică. Recuperat de pe: probafacil.com
  6. Minitab. Distribuție hipergeometrică. Recuperat de la: support.minitab.com
  7. Universitatea din Vigo. Distribuții discrete principale. Recuperat de la: anapg.webs.uvigo.es
  8. Vitutor. Statistică și combinatorică. Recuperat de pe: vitutor.net
  9. Weisstein, Eric W. Distribuție hipergeometrică. Recuperat de pe: mathworld.wolfram.com
  10. Wikipedia. Distribuție hipergeometrică. Recuperat de pe: es.wikipedia.com

Nimeni nu a comentat acest articol încă.