A regula empirică Este rezultatul experienței practice și al observării vieții reale. De exemplu, este posibil să știm ce specii de păsări pot fi observate în anumite locuri în fiecare perioadă a anului și din această observație se poate stabili o „regulă” care descrie ciclurile de viață ale acestor păsări.
În statistici, regula empirică se referă la modul în care observațiile sunt grupate în jurul valorii centrale, media sau media, în unități de deviație standard..
Să presupunem că aveți un grup de oameni cu o înălțime medie de 1,62 metri și o abatere standard de 0,25 metri, atunci regula empirică vă va permite să definiți, de exemplu, câți oameni ar fi într-un interval de medie plus sau minus unul deviație standard?
Conform regulii, 68% din date reprezintă mai mult sau mai puțin o abatere standard de la medie, adică 68% dintre persoanele din grup vor avea o înălțime cuprinsă între 1,37 (1,62-0,25) și 1,87 (1,62 + 0,25) metri.
Indice articol
Regula empirică este o generalizare a teoremei lui Tchebyshev și a distribuției normale.
Teorema lui Tchebyshev spune că: pentru o anumită valoare de k> 1, probabilitatea ca o variabilă aleatorie să se încadreze între media minus k ori deviația standard și media plus k ori, abaterea standard este mai mare sau egală cu (1 - 1 / kDouă).
Avantajul acestei teoreme este că se aplică variabilelor aleatorii discrete sau continue cu orice distribuție de probabilitate, dar regula definită din aceasta nu este întotdeauna foarte precisă, deoarece depinde de simetria distribuției. Cu cât distribuția variabilei aleatorii este mai înclinată, cu atât comportamentul acesteia va fi mai puțin ajustat la regulă.
Regula empirică definită din această teoremă este:
Dacă k = √2, se spune că 50% din date se află în intervalul: [µ - √2 s, µ + √2 s]
Dacă k = 2, se spune că 75% din date se află în intervalul: [µ - 2 s, µ + 2 s]
Dacă k = 3, se spune că 89% din date se află în intervalul: [µ - 3 s, µ + 3 s]
Distribuția normală, sau clopotul Gaussian, permite stabilirea Regulei Empirice sau Regula 68 - 95 - 99.7.
Regula se bazează pe probabilitățile de apariție a unei variabile aleatorii în intervale între media minus una, două sau trei abateri standard și media plus una, două sau trei abateri standard..
Regula empirică definește următoarele intervale:
68,27% din date se află în intervalul: [µ - s, µ + s]
95,45% din date se află în intervalul: [µ - 2s, µ + 2s]
99,73% din date se află în intervalul: [µ - 3s, µ + 3s]
În figură puteți vedea cum sunt prezentate aceste intervale și relația dintre ele atunci când creșteți lățimea bazei graficului.
Standardizarea variabilei aleatoare, adică expresia variabilei aleatoare în termeni de variabilă z sau normală standard, simplifică utilizarea regulii empirice, deoarece variabila z are o medie egală cu zero și o deviație standard egală cu unu.
Prin urmare, aplicarea regulii empirice în scara unei variabile normale standard, z, definește următoarele intervale:
68,27% din date se află în intervalul: [-1, 1]
95,45% din date se află în intervalul: [-2, 2]
99,73% din date se află în intervalul: [-3, 3]
Regula empirică permite calcule prescurtate atunci când se lucrează cu o distribuție normală.
Să presupunem că un grup de 100 de studenți are o vârstă medie de 23 de ani, cu o abatere standard de 2 ani. Ce informații permite regula empirică?
Aplicarea regulii empirice implică urmarea pașilor:
Deoarece media este 23 și abaterea standard este 2, atunci intervalele sunt:
[µ - s, µ + s] = [23 - 2, 23 + 2] = [21, 25]
[µ - 2s, µ + 2s] = [23 - 2 (2), 23 + 2 (2)] = [19, 27]
[µ - 3s, µ + 3s] = [23 - 3 (2), 23 + 3 (2)] = [17, 29]
(100) * 68,27% = 68 studenți aproximativ
(100) * 95,45% = 95 studenți aproximativ
(100) * 99,73% = aproximativ 100 de studenți
Cel puțin 68 de studenți au vârste cuprinse între 21 și 25 de ani.
Cel puțin 95 de studenți au vârste cuprinse între 19 și 27 de ani.
Aproape 100 de studenți au între 17 și 29 de ani.
Regula empirică este o modalitate rapidă și practică de a analiza datele statistice, devenind din ce în ce mai fiabilă pe măsură ce distribuția se apropie de simetrie.
Utilitatea sa depinde de domeniul în care este utilizat și de întrebările care sunt prezentate. Este foarte util să știm că apariția valorilor a trei deviații standard sub sau peste medie este aproape puțin probabilă, chiar și pentru variabilele de distribuție non-normale, cel puțin 88,8% din cazuri se află în intervalul de trei sigme..
În științele sociale, un rezultat general concludent este intervalul medie plus sau minus două sigma (95%), în timp ce în fizica particulelor, un efect nou necesită un interval de cinci sigme (99,99994%) pentru a fi considerat o descoperire..
Într-o rezervație faunei sălbatice se estimează că există în medie 16.000 de iepuri cu o abatere standard de 500 de iepuri. Dacă nu se cunoaște distribuția variabilei „număr de iepuri în rezervă”, este posibil să se estimeze probabilitatea ca populația de iepuri să fie între 15.000 și 17.000 de iepuri?
Intervalul poate fi prezentat în acești termeni:
15000 = 16000 - 1000 = 16000 - 2 (500) = µ - 2 s
17000 = 16000 + 1000 = 16000 + 2 (500) = µ + 2 s
Prin urmare: [15000, 17000] = [µ - 2 s, µ + 2 s]
Aplicând teorema lui Tchebyshev, există o probabilitate de cel puțin 0,75 ca populația de iepuri din rezervația sălbatică să fie între 15.000 și 17.000 de iepuri..
Greutatea medie a copiilor de un an într-o țară este distribuită în mod normal cu o medie de 10 kilograme și o abatere standard de aproximativ 1 kilogram.
a) Estimați procentul copiilor de un an din țară care au o greutate medie cuprinsă între 8 și 12 kilograme.
8 = 10 - 2 = 10 - 2 (1) = µ - 2 s
12 = 10 + 2 = 10 + 2 (1) = µ + 2 s
Prin urmare: [8, 12] = [µ - 2s, µ + 2s]
Conform regulii empirice, se poate afirma că 68,27% dintre copiii de un an din țară au între 8 și 12 kilograme de greutate.
b) Care este probabilitatea de a găsi un copil de un an care să cântărească 7 kilograme sau mai puțin?
7 = 10 - 3 = 10 - 3 (1) = µ - 3 s
Se știe că 7 kilograme de greutate reprezintă valoarea µ - 3s, precum și se știe că 99,73% dintre copii au între 7 și 13 kilograme de greutate. Acest lucru lasă doar 0,27% din totalul copiilor pentru extreme. Jumătate dintre ei, 0,135%, au 7 kilograme sau mai puțin, iar cealaltă jumătate, 0,135%, au 11 kilograme sau mai mult.
Deci, se poate concluziona că există o probabilitate de 0,00135 ca un copil să cântărească 7 kilograme sau mai puțin.
c) Dacă populația țării ajunge la 50 de milioane de locuitori și copiii de 1 an reprezintă 1% din populația țării, câți copii de un an vor cântări între 9 și 11 kilograme?
9 = 10 - 1 = µ - s
11 = 10 + 1 = µ + s
Prin urmare: [9, 11] = [µ - s, µ + s]
Conform regulii empirice, 68,27% dintre copiii de un an din țară se află în intervalul [µ - s, µ + s]
Există 500.000 de copii de un an în țară (1% din 50 de milioane), astfel încât 341.350 de copii (68,27% din 500.000) cântăresc între 9 și 11 kilograme.
Nimeni nu a comentat acest articol încă.