Caracteristici variabile categorice și exemple

930
Simon Doyle
Caracteristici variabile categorice și exemple

variabila categorica Este cea utilizată în statistici pentru a atribui o caracteristică sau proprietate nenumerică sau calitativă unui obiect, individ, entitate, condiție sau procedură. Este posibil să se definească tot felul de variabile categorice în funcție de fiecare nevoie. 

Exemple de variabile categorice sunt: ​​culoarea, sexul, grupa sanguină, starea civilă, tipul materialului, forma de plată sau tipul contului bancar și sunt utilizate foarte mult zilnic..

Figura 1: Culoarea este o variabilă categorică. Sursa: pixabay

Cele de mai sus sunt variabile, dar valorile lor posibile sunt calitative, adică de calitate sau caracteristice și nu de măsurare numerică. De exemplu valorile posibile pentru variabilă sex Sunt: masculin , hembra.

Când această variabilă este stocată într-un program de computer, aceasta poate fi declarată ca o variabilă text și singurele valori acceptate vor fi cele deja denumite: Masculin , Femeie.

Cu toate acestea, aceeași variabilă sex poate fi declarat și stocat ca întreg dacă a Masculin este atribuit 1 deja Femeie se atribuie valoarea Două. Din acest motiv, variabilele categorice sunt uneori denumite tip enumerat.

Principala caracteristică a variabilelor categorice este că, spre deosebire de alte variabile, cum ar fi cele continue și discrete, nu este posibil să se facă aritmetica cu ele. Cu toate acestea, puteți face statistici cu ei, așa cum se va vedea mai târziu.

Indice articol

  • 1 Exemple
  • 2 Clasificarea variabilelor categorice
    • 2.1 Categorii nominale 
    • 2.2 Categorii ordinale
    • 2.3 Categorii binare
  • 3 Statistici cu variabile categorice
    • 3.1 Reprezentarea grafică a variabilelor categorice
  • 4 exerciții rezolvate
    • 4.1 Exercițiul 1
    • 4.2 Exemplul 2
    • 4.3 Exemplul 3
  • 5 Referințe

Exemple

Rețineți următoarele exemple de variabile categorice și valorile posibile ale acestora:

-Grupa de sange, Gama de valori: A, B, AB, O

-Stare civila, Valori categorice: Singur (LA), Căsătorit (B), Văduv (C) , Divorţat (D).

-Tipul materialului, Categorii sau valori: 1 = Lemn, 2 = Metal, 3 = Plastic

-Mod de a plăti, Valori sau categorii: (1) Numerar, (2) Debit, (3) Transfer, (4) Credit

În exemplele anterioare, un număr a fost asociat cu fiecare categorie într-un mod complet arbitrar. 

S-ar putea crede atunci că această asociere numerică arbitrară o face egală cu a variabilă cantitativă discretă, dar nu este, deoarece operațiile aritmetice nu se pot face cu aceste numere.

Pentru a ilustra ideea, în variabilă Mod de a plăti, operația sumă nu are sens:

 (1) Numerar + (2) Debit nu va fi niciodată egal (3) Transfer

Clasificarea variabilelor categorice

Clasamentul se bazează pe faptul că au sau nu o ierarhie implicită sau dacă numărul rezultatelor posibile este mai mare de două sau două.

O variabilă categorică cu un singur rezultat posibil nu este o variabilă, este o constantă categorică.

Categorii nominale 

Când nu pot fi reprezentați printr-un număr sau nu au nicio ordine. De exemplu, variabila: Tipul_material, tare valori nominale (Lemn, metal, plastic), nu au ierarhie sau ordine, chiar și atunci când un număr arbitrar este atribuit fiecărui răspuns sau categorie.

Ordinal categoric

Variabil: Performanta academica

Valori nominale: Înalt, mediu, scăzut

Deși valorile acestei variabile nu sunt numerice, ele au o ordine sau o ierarhie implicită.

Categorii binare

Acestea sunt variabile nominale cu două răspunsuri posibile, de exemplu:

-Variabil: Răspuns

-Valori nominale: Adevărat, Fals

Rețineți că variabila Răspuns nu are o ierarhie implicită și are doar două rezultate posibile, deci este o variabilă categorică binară.

Unii autori numesc acest tip variabilă binară, și nu consideră că aparține variabile categorice care sunt limitate la cei cu mai mult de trei categorii posibile.

Statistici cu variabile categorice

Statisticile se pot face cu variabile categorice, deși nu sunt variabile numerice sau cantitative. De exemplu, pentru a cunoaște tendința sau valoarea cea mai probabilă a unei variabile categorice, luați Modă.

Modă este, în acest caz, cel mai repetat rezultat sau valoare a unei variabile categorice. În variabilele categorice nu este posibil să se calculeze nici media și nici mediana.

Media nu poate fi calculată deoarece aritmetica nu poate fi realizată cu variabile categorice. Nici mediana nu este, deoarece variabilele cantitative sau categorice nu au o ordine sau ierarhie, deci nu este posibil să se determine o valoare centrală..

Reprezentarea grafică a variabilelor categorice

Având în vedere o anumită variabilă categorică, se poate găsi frecvența sau numărul de repetări ale rezultatului acelei variabile. Dacă se face acest lucru pentru fiecare rezultat, atunci se poate face un grafic al frecvenței în raport cu fiecare categorie sau rezultat..

Iată câteva exemple despre modul în care variabilele categorice pot fi reprezentate grafic.

Exerciții rezolvate

Exercitiul 1

O companie are înregistrări ale datelor a 170 de angajați. Una dintre variabilele care se află în aceste registre este: Stare civila. Această variabilă are patru categorii sau valori posibile:

Singur (LA), Căsătorit (B), Văduv (C) , Divorţat (D).

Deși este o variabilă nenumerică, este posibil să știm câte dintre înregistrările totale se află într-o anumită categorie și să fie reprezentate sub forma unui grafic cu bare, așa cum se arată în figura următoare:

Figura 2. Reprezentarea rezultatelor unei variabile categorice. Sursa: realizat de sine

Exemplul 2

Un magazin de pantofi ține evidența vânzărilor sale. Printre variabilele care își gestionează înregistrările se numără culoarea pantofilor pentru fiecare model. Variabila: 

Color_Shoe_Model_AW3

Este categoric și are cinci categorii sau valori posibile. Pentru fiecare categorie a acestei variabile, numărul vânzărilor este totalizat și se stabilește procentul acestora. Rezultatele sunt prezentate în graficul din următoarea figură:

Figura 3. Variabilă categorică Culoare _Shoe. În această variabilă modul este Alb. Sursa: realizat de sine.

Se poate spune apoi că modelul de pantof AW3 care se află în Modă, cel care se vinde cel mai frecvent este alb, urmat îndeaproape de Negru

Se mai poate spune că, cu o probabilitate de 70%, următorul pantof vândut al acestui model va fi alb sau Negru.

Aceste informații pot fi utile magazinului atunci când plasați comenzi noi sau chiar pot aplica reduceri la culorile cel mai puțin vândute din cauza stocului excesiv..

Exemplul 3

Pentru o anumită populație de donatori de sânge, doriți să reprezentați numărul de persoane care aparțin unui anumit grup de sânge. O modalitate grafică de a vizualiza rezultatele este prin intermediul unei pictograme, care este în fundal un tabel.

Prima coloană reprezintă variabila Grupa de sange și posibilele sale rezultate sau categorii. A doua coloană are reprezentarea în formă iconică sau picturală a numărului de persoane din fiecare categorie. În exemplul nostru, o picătură roșie este utilizată ca pictogramă, fiecare reprezentând 10 persoane.

Figura 4. Pictogramă. Sursa: realizat de sine

Referințe

  1. Academia Khan. Analiza datelor categorice. Recuperat de pe: khanacademy.org
  2. Formule universale. Variabilă calitativă. Recuperat de pe: univesoformulas.com
  3. Minitab. Care sunt variabile categorice, discrete și continue. Recuperat de la: support.minitab.com
  4. Tutorial Excel. Caracterizarea variabilelor. Recuperat de la: help.xlslat.com.
  5. Wikipedia. Variabilă statistică. Recuperat de pe wikipedia.com
  6. Wikipedia. Variabilă categorică. Recuperat de pe wikipedia.com
  7. Wikipedia. Variabilă categorică. Recuperat de pe wikipedia.com

Nimeni nu a comentat acest articol încă.