Eșantionare dublă

1077
Egbert Haynes
Eșantionare dublă
În eșantionarea dublă, doriți să cunoașteți mai profund o variabilă a unei populații

Ce este eșantionarea dublă?

eșantionare dublă este o tehnică utilizată în statistici inferențiale atunci când doriți să aflați mai multe detalii și certitudine cu privire la o anumită variabilă, care caracterizează o anumită populație.

Al doilea eșantion de populație se efectuează în general după ce a fost prelevat și analizat un prim eșantion, a cărui analiză nu a dat o concluzie semnificativă statistic asupra oricăreia dintre variabilele studiate..

Din acest motiv, eșantionarea dublă în statistici este, de asemenea, cunoscută ca eșantionare în două etape. Utilitatea celui de-al doilea eșantion este că ajută la determinarea cu mai mare precizie a estimării raporturilor și regresiilor unei anumite variabile auxiliare, care apare în lumina analizei unui prim eșantion..

O altă utilizare dată eșantionării duble este de a colecta informații pentru a efectua o eșantionare pe straturi..

Exemple

Diverse situații în care este necesară prelevarea de probe duble vor fi descrise mai jos..

Controlul calității în producția de piese

Metoda de eșantionare dublă este frecvent utilizată în controlul calității industriale și se face de obicei în două faze..

De exemplu, să presupunem o mașină industrială care produce anumite piese. Indiferent cât de mult este reglat aparatul, nici o piesă nu este identică cu alta, deoarece pot apărea mici variații în dimensiunile și greutatea sa. Este vorba despre a determina dacă un lot de piese fabricate de mașina respectivă îndeplinește criteriile de toleranță pentru ca aceasta să fie acceptată sau respinsă..

În primul rând, se ia un eșantion aleatoriu de piese cu care doriți să verificați dacă una dintre variabile, de exemplu, lungimea piesei, se încadrează în toleranță.

În cazul în care lungimea medie este sub sau peste gradul de toleranță dorit pentru variabila menționată, în acest prim eșantion, atunci se deduce că lotul este defect și trebuie aruncat. În acest caz nu sunt necesare eșantioane noi.

În schimb, dacă valoarea medie se încadrează în intervalul de toleranță, dar abaterea standard a eșantionului este suficient de mare încât adunarea sau scăderea valorii medii se încadrează în afara intervalului, atunci va trebui colectat un al doilea eșantion mai mare..

Acest al doilea eșantion trebuie să includă eșantionul original pentru a reface calculele și astfel să poată lua o decizie finală cu privire la variabila investigată. În acest fel se poate ști dacă lotul este defect sau nu.

Costuri mai mici de eșantionare

În multe ocazii, informațiile despre una dintre variabilele care urmează să fie studiate sunt dificil de accesat. Dar poate exista o variabilă auxiliară mai ușor pentru colectarea datelor.

În acest caz, sunt prelevate două eșantioane, una mare pentru variabila auxiliară, mai puțin costisitoare și o probă mai mică, conținută în eșantionul mai mare al variabilei cele mai scumpe..

Această metodă este aplicabilă ori de câte ori se determină că există o corelație între ambele variabile, care este în general o relație proporțională..

Un exemplu al acestei situații apare în științele forestiere, unde se dorește determinarea procentului de copaci afectați de o plantă parazită (vierme).

Deoarece acestea sunt regiuni foarte extinse și dificil de accesat, studiul populației complete de arbori nu este fezabil în timp și costuri. Acești pași sunt apoi urmați:

Pasul 1: prelevarea probelor

O prelevare preliminară ar consta în utilizarea fotografiei aeriene, iar pădurea este împărțită în loturi. De aici, câteva loturi sunt alese aleatoriu și se estimează, prin analiza imaginilor loturilor alese, câți copaci sunt afectați de pecingine, deoarece culoarea copacilor este afectată de parazit..

Pasul 2: munca pe teren

Dar analiza fotografică poate fi imprecisă, așa că sunt selectate câteva loturi din primul eșantion, de preferință la întâmplare, pentru a face lucrări de teren..

Pasul 3: comparație

Rezultatul câmpului este apoi comparat cu cel fotografic pentru interceptarea celor două seturi de loturi. Această comparație poate fi realizată, de exemplu, prin realizarea unui grafic în care axa orizontală este valoarea obținută pentru fiecare lot prin fotografie și pe axa verticală valoarea obținută pentru fiecare lot prin munca pe teren..

Această metodă grafică permite să identifice vizual dacă există sau nu o corelație între ambele rezultate și să determine, printr-o analiză de regresie, coeficientul de proporționalitate sau raportul dintre ambele eșantioane..

După cel mai mare eșantion, adică eșantionul fotografic, se iau valoarea medie a copacilor infectați și abaterea standard a acestora. Dar, din moment ce coeficientul de proporționalitate și eroarea acestuia cu probele de câmp au fost determinate, atunci este posibil să se corecteze rezultatul probei mai mari (cea fotografică).

Acest rezultat poate fi apoi extrapolat la întreaga populație de arbori.

Avantajele și dezavantajele eșantionării duble

În exemplele descrise, avantajul costurilor este evident, întrucât înlocuirea unei variabile ușor accesibile cu alta variabilă greu accesibilă economisește timp și bani..

Un dezavantaj este că, în cazul eșantionării duble pentru controlul calității, există riscul de a trece prin loturi bune de produse care sunt în afara toleranței..

Exercițiu

Vrem să estimăm numărul copacilor bolnavi dintr-o pădure de 162 de hectare. Deoarece pădurea este foarte extinsă, aceasta este împărțită în 100 de parcele din aceeași zonă. 18 parcele sunt alese aleatoriu și, prin intermediul unui studiu fotografic, se estimează că în aceste 18 parcele există 8,5 copaci bolnavi cu o eroare standard de plus sau minus 4,5 copaci.

Din aceste 18 parcele, se aleg aleatoriu 8 parcele în care se efectuează studiul de teren. Pentru aceste opt parcele, studiul fotografic arată 10 copaci bolnavi cu o eroare de plus sau minus 5.3 copaci..

Pe de altă parte, pentru aceleași opt parcele, studiul de teren arată 12,4 copaci bolnavi cu o eroare de plus minus 6,3 copaci.

Întrebă:

  • a) Determinați coeficientul de proporționalitate între studiul de teren prin regresie liniară.
  • b) Estimați numărul arborilor bolnavi folosind metoda fotografică în suta de parcele.
  • c) Aplicați corecția cu coeficientul de proporționalitate obținut, pentru a estima numărul real de copaci bolnavi din întreaga pădure.

Soluţie

Se face un grafic al numărului de copaci per număr fotografic vs număr câmp pentru cele opt loturi selectate pentru ambele studii..

Număr de fotografii versus număr de câmpuri. Sursa: F. Zapata.

Se montează o linie de trend și se determină panta. În acest caz, se obține că coeficientul de proporționalitate este 1,23. Adică, dacă X este numărul per număr fotografic, atunci se estimează că numărul câmpului va fi Y = 1,23 X.

Numărul de copaci bolnavi în funcție de numărul fotografic din cele 18 loturi selectate va fi:

18 x 8,5 = 153

Dar întrucât întreaga pădure a fost împărțită în 100 de parcele din aceeași suprafață, numărul copacilor bolnavi estimat prin metoda fotografică este: (100/18) x 153 = 850.

Factorul de corecție obținut din comparația dintre câmp și studiul fotografic este acum aplicat:

Numărul real estimat de copaci bolnavi în pădure = 1,23 x 850 = 1046.

Referințe

  1. Eșantionare dublă pentru estimarea raportului, PennState College. Recuperat de la psu.edu
  2. Eșantionare dublă, multiplă și secvențială, Universitatea de Stat din NC. Recuperat din ncsu.edu
  3. Eșantionare simplă aleatorie. Recuperat de la investopedia.com
  4. Ce este eșantionarea dublă? Recuperat de la: nist.gov
  5. Prelevarea de probe. Recuperat de pe: en.wikipedia.org
  6. Eșantionare în mai multe etape. Recuperat de pe: en.wikipedia.org

Nimeni nu a comentat acest articol încă.