Formule de distribuție Poisson, ecuații, model, proprietăți

2762
Simon Doyle

Distribuția Poisson este o distribuție discretă a probabilității, prin care este posibil să se cunoască probabilitatea ca, într-o dimensiune mare a eșantionului și într-un anumit interval, să se producă un eveniment a cărui probabilitate este mică.

De multe ori, distribuția Poisson poate fi utilizată în locul distribuției binomiale, atâta timp cât sunt îndeplinite următoarele condiții: eșantion mare și probabilitate mică.

Figura 1. Graficul distribuției Poisson pentru diferiți parametri. Sursa: Wikimedia Commons.

Siméon-Denis Poisson (1781-1840) a creat această distribuție care îi poartă numele, foarte utilă atunci când vine vorba de evenimente imprevizibile. Poisson și-a publicat rezultatele în 1837, o lucrare de cercetare privind probabilitatea apariției unor sentințe penale eronate.

Ulterior, alți cercetători au adaptat distribuția în alte zone, de exemplu, numărul de stele care ar putea fi găsite într-un anumit volum de spațiu sau probabilitatea ca un soldat să moară din lovitura unui cal..

Indice articol

  • 1 Formula și ecuațiile
  • 2 Model și proprietăți
    • 2.1 Diferențe cu distribuția binomială
  • 3 Exemple
    • 3.1 Aplicații practice
    • 3.2 Aproximarea distribuției binomiale cu distribuția Poisson
  • 4 exerciții rezolvate
    • 4.1 Exercițiul 1
    • 4.2 Exercițiul 2
  • 5 Referințe

Formula și ecuațiile

Forma matematică a distribuției Poisson este următoarea:

- μ (denumit uneori și λ) este media sau parametrul distribuției

- Numărul lui Euler: e = 2,71828

- Probabilitatea de a obține y = k este P

- k este numărul de succese 0, 1,2,3 ...

- n este numărul de teste sau evenimente (dimensiunea eșantionului)

Variabilele aleatorii discrete, așa cum indică numele lor, depind de șansă și iau doar valori discrete: 0, 1, 2, 3, 4 ..., k.

Media distribuției este dată de:

Varianța σ, care măsoară răspândirea datelor, este un alt parametru important. Pentru distribuția Poisson este:

σ = μ

Poisson a stabilit că atunci când n → ∞ și p → 0, media μ -se numește și valorea estimata- tinde spre o constantă:

μ → constantă

Important: p este probabilitatea apariției evenimentului ținând cont de populația totală, în timp ce P (y) este predicția Poisson pe eșantion.

Model și proprietăți

Distribuția Poisson are următoarele proprietăți:

-Dimensiunea eșantionului este mare: n → ∞.

-Evenimentele sau evenimentele luate în considerare sunt independente unele de altele și se întâmplă aleatoriu.

-Probabilitate P acel anumit eveniment Da apare într-o anumită perioadă de timp este foarte mic: P → 0.

-Probabilitatea ca mai multe evenimente să apară în intervalul de timp este 0.

-Valoarea medie se apropie de o constantă dată de: μ = n.p (n este dimensiunea eșantionului)

-Deoarece dispersia σ este egală cu μ, deoarece adoptă valori mai mari, variabilitatea devine și ea mai mare.

-Evenimentele trebuie distribuite uniform în intervalul de timp utilizat.

-Setul de posibile valori ale evenimentului Da este: 0,1,2,3,4 ... .

-Suma eu variabile care urmează o distribuție Poisson, este, de asemenea, o altă variabilă Poisson. Valoarea sa medie este suma valorilor medii ale acestor variabile.

Diferențe cu distribuția binomială

Distribuția Poisson diferă de distribuția binomială în următoarele moduri importante:

-Distribuția binomială este afectată atât de mărimea eșantionului n, cât și de probabilitate P, dar distribuția Poisson este afectată doar de medie μ.

-Într-o distribuție binomială, valorile posibile ale variabilei aleatorii Da sunt 0,1,2, ..., N, pe de altă parte în distribuția Poisson nu există o limită superioară pentru aceste valori.

Exemple

Poisson și-a aplicat inițial faimoasa distribuție în cazurile legale, dar la nivel industrial, una dintre primele sale utilizări a fost fabricarea berii. În acest proces, culturile de drojdie sunt utilizate pentru fermentare.

Drojdia este formată din celule vii, a căror populație este variabilă în timp. La fabricarea berii este necesar să se adauge cantitatea necesară, de aceea este necesar să se cunoască cantitatea de celule care există pe unitate de volum.

În timpul celui de-al doilea război mondial, distribuția Poisson a fost folosită pentru a afla dacă germanii vizau de fapt Londra de la Calais sau pur și simplu trageau la întâmplare. Acest lucru a fost important pentru aliați pentru a determina cât de bună a fost tehnologia disponibilă pentru naziști..

Aplicații practice

Aplicațiile distribuției Poisson se referă întotdeauna la numărări în timp sau numărări în spațiu. Și din moment ce probabilitatea apariției este mică, este cunoscută și ca „legea evenimentelor rare”.

Iată o listă de evenimente care se încadrează în una dintre aceste categorii:

-Înregistrarea particulelor dintr-o dezintegrare radioactivă, care, la fel ca creșterea celulelor de drojdie, este o funcție exponențială.

-Numărul de vizite pe un anumit site web.

-Sosirea persoanelor într-o linie de plată sau de participare (teoria cozii).

-Numărul de mașini care trec de un anumit punct pe un drum, într-un anumit interval de timp.

Figura 2. Numărul de mașini care trec printr-un punct urmează aproximativ o distribuție Poisson. Sursa: Pixabay.

-Mutații într-un anumit fir ADN după primirea expunerii la radiații.

-Numărul de meteoriți cu un diametru mai mare de 1 m căzut într-un an.

-Defecte pe metru pătrat de țesătură.

-Numărul de celule sanguine în 1 centimetru cub.

-Apeluri pe minut către o centră telefonică.

-Chipsuri de ciocolată prezente în 1 kg de aluat de tort.

-Numărul de copaci infectați de un anumit parazit pe 1 hectar de pădure.

Rețineți că aceste variabile aleatorii reprezintă de câte ori apare un eveniment într-o perioadă fixă ​​de timp (apeluri pe minut către centrala telefonică), sau o anumită regiune de spațiu (defecte ale unei țesături pe metru pătrat).

Aceste evenimente, așa cum sa stabilit deja, sunt independente de timpul care a trecut de la ultima apariție..

Aproximarea distribuției binomiale cu distribuția Poisson

Distribuția Poisson este o bună aproximare la distribuția binomială atâta timp cât:

-Dimensiunea eșantionului este mare: n ≥ 100

-Probabilitate p este mic: p ≤ 0,1

- μ este în ordinea: np ≤ 10

În astfel de cazuri, distribuția Poisson este un instrument excelent, deoarece distribuția binomială poate fi dificil de aplicat în aceste cazuri..

Exerciții rezolvate

Exercitiul 1

Un studiu seismologic a stabilit că, în ultimii 100 de ani, au avut loc 93 de cutremure mari în întreaga lume, cel puțin 6,0 pe scara Richter -logaritmică-. Să presupunem că distribuția Poisson este un model adecvat în acest caz. Găsi:

a) Apariția medie a cutremurelor mari pe an.

b) Da P (y) este probabilitatea apariției Da cutremure în timpul unui an selectat aleatoriu, găsiți următoarele probabilități:

P(0), P(1), P (Două), P (3), P (4), P (5), P (6) și P (7).

c) Rezultatele reale ale studiului sunt următoarele:

- 47 de ani (0 cutremure)

- 31 de ani (1 cutremure)

- 13 ani (2 cutremure)

- 5 ani (3 cutremure)

- 2 ani (4 cutremure)

-  0 ani (5 cutremure)

- 1 an (6 cutremure)

- 1 an (7 cutremure)

Cum se compară aceste rezultate cu cele obținute în partea b? Distribuția Poisson este o alegere bună pentru modelarea acestor evenimente?

Solutie la)

a) Cutremurele sunt evenimente a căror probabilitate p este mic și ne gândim la o perioadă limitată de timp, de un an. Numărul mediu de cutremure este:

μ = 93/100 cutremure / an = 0,93 cutremure pe an.

Soluția b)

b) Pentru a calcula probabilitățile solicitate, valorile sunt înlocuite în formula dată la început:

y = 2

μ = 0,93

e = 2,71828

Este destul de puțin decât P (2).

Rezultatele sunt enumerate mai jos:

P (0) = 0.395, P (1) = 0.367, P (2) = 0.171, P (3) = 0.0529, P (4) = 0.0123, P (5) = 0.00229, P (6) = 0.000355, P (7) = 0,0000471.

De exemplu, am putea spune că există o probabilitate de 39,5% ca niciun cutremur major să nu aibă loc într-un an dat. Sau că există 5,29% din 3 cutremure mari care au avut loc în acel an.

Soluția c)

c) Frecvențele sunt analizate, înmulțind cu n = 100 de ani:

39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 și 0,00471.

De exemplu:

- O frecvență de 39,5 indică faptul că, în 39,5 din 100 de ani, au loc 0 cutremure mari, am putea spune că este destul de aproape de rezultatul real de 47 de ani fără niciun cutremur major..

Să comparăm un alt rezultat Poisson cu rezultatele reale:

- Valoarea obținută de 36,7 înseamnă că într-o perioadă de 37 de ani are loc un mare cutremur. Rezultatul real este că în 31 de ani a avut loc un cutremur major, o potrivire bună cu modelul.

- Se așteaptă 17,1 ani cu 2 cutremure mari și se știe că în 13 ani, care este o valoare apropiată, au existat într-adevăr 2 cutremure mari.

Prin urmare, modelul Poisson este acceptabil pentru acest caz.

Exercițiul 2

O companie estimează că numărul de componente care nu reușesc înainte de a ajunge la 100 de ore de funcționare urmează unei distribuții Poisson. Dacă numărul mediu de eșecuri este 8 în acel moment, găsiți următoarele probabilități:

a) Că o componentă eșuează în 25 de ore.

b) Eșecul a mai puțin de două componente, în 50 de ore.

c) Defecțiunea a cel puțin trei componente în 125 de ore.

Solutie la)

a) Se știe că media eșecurilor în 100 de ore este de 8, deci în 25 de ore se așteaptă un sfert de eșecuri, adică 2 eșecuri. Acesta va fi parametrul μ.

Se solicită probabilitatea ca o componentă să eșueze, variabila aleatorie este „componente care eșuează înainte de 25 de ore” și valoarea sa este y = 1. Prin substituirea funcției de probabilitate:

Cu toate acestea, întrebarea este cât de probabil ar eșua mai puțin de două componente în 50 de ore, nu că exact 2 componente eșuează în 50 de ore, de aceea trebuie să adăugăm probabilitățile că:

-Niciunul nu eșuează

-Eșuează numai 1

P (mai puțin de 2 componente eșuează) = P (0) + P (1)

P (mai puțin de 2 componente eșuează) = 0,0183 + 0,0732 = 0.0915

c) Că nu reușesc macar 3 componente în 125 de ore, înseamnă că 3, 4, 5 sau mai multe pot eșua în acel timp.

Probabilitatea ca aceasta să apară macar unul dintre mai multe evenimente este egal cu 1, minus probabilitatea ca niciunul dintre evenimente să nu apară.

-Evenimentul dorit este acela că 3 sau mai multe componente eșuează în 125 de ore

-Dacă evenimentul nu are loc, înseamnă că mai puțin de 3 componente eșuează, a căror probabilitate este: P (0) + P (1) + P (2)

Parametrul μ al distribuției în acest caz este:

 μ = 8 + 2 = 10 eșecuri în 125 de ore.

P (3 sau mai multe componente eșuează) = 1- P (0) - P (1) - P (2) =

Referințe

  1. MathWorks. Distribuția Poisson. Recuperat de pe: es.mathworks.com
  2. Mendenhall, W. 1981. Statistici pentru management și economie. A treia. ediție. Grupo Editorial Iberoamérica.
  3. Stat Trek. Învățați-vă statistici. Distribuția Poisson. Recuperat de pe: stattrek.com,
  4. Triola, M. 2012. Statistici elementare. 11. Ed. Pearson Education.
  5. Wikipedia. Distribuția Poisson. Recuperat de pe: en.wikipedia.org

Nimeni nu a comentat acest articol încă.