Capitolo 6. La statistica:concetti di base (Irene Mazza)
6.
La statistica: i concetti di base 6.1
L’utilizzazione della statistica nelle scienze umane L’intento
che spinge a condurre un esperimento è quello di verificare un’ipotesi che
viene formulata a proposito di un argomento d’indagine e, a seconda della natura
di quest’ultimo, variano le procedure da seguire; nell’ambito delle scienze
umane, è possibile stabilire, tramite opportuni procedimenti, quali siano le
probabilità che le nostre ipotesi hanno di essere validi. È possibile affermare
che un avvenimento è probabile nel caso in cui non sia completamente
prevedibile e si stabilisce se la realizzazione di questo evento sia subordinata
ad una regolarità statistica; la nozione di probabilità ed i modelli matematici
ad essa collegati sono più complicati e comportano precisazioni concettuali
come la distinzione tra eventi dipendenti/indipendenti, eventi mutualmente
escludentisi/che non si escludono. A questo punto è necessario chiedersi: la
quantità di informazioni che ci è trasmessa da ogni prova o esperimento che noi
realizziamo, è sufficiente a farci conoscere qualcosa in più rispetto al
problema che stiamo affrontando? È indispensabile individuare mezzi e strategie
che ci consentono di raccogliere i dati sistemandoli ed ordinandoli nel miglior
modo: è questa la condizione di partenza per cui possiamo pensare di estendere
ad un ampio contesto i risultati del nostro lavoro. 6.2 Le basi teoriche della
statistica Le
basi teoriche su cui si fonda la statistica sono costituite dai seguenti
concetti: a) Qualità/quantità:
questa contrapposizione concerne in fine attribuito alla statistica; nel caso
della statistica qualitativa si descrivono i fenomeni, mentre, quando si è in
grado di misurare un fenomeno e di
classificarlo con strumenti di manipolazione sempre controllabile, si opera nel
campo della statistica quantitativa. b)
Sistema empirico/sistema relazionale: non
possiamo misurare tutti i dati allo stesso modo perché troppo diversi tra loro,
ma possiamo stabilire della particolari modalità di misurazione a seconda di
ciò che ci si pone di fronte utilizzando le scale di misura: a ogni elemento
dell’insieme costituito da fatti, soggetti, oggetti, facciamo corrispondere,
secondo regole specifiche, un elemento di un altro insieme (simbolo: sistema
simbolico; numero: sistema empirico). c)
Esperimento/controllo: si tratta di mettere a
rapporto diverse distribuzioni per ottenere le informazioni desiderate; servono
dunque dei soggetti, definiti gruppo sperimentale, che provino gli assunti di
partenza ed i loro risultati saranno confrontati con un altro gruppo, il gruppo
di controllo, che esegue lo stesso compito senza essere sottoposto
all’influenza degli elementi perturbanti. d)
Campione/universo: si tratta di stabilire
come si passi dalle analisi del campione a previsioni riguardo l’universo dove,
con il termine popolazione, definita universo, si intende l’insieme delle
osservazioni concernenti l’oggetto di indagine, mentre il campione è una parte
di questo universo. e)
Statistica descrittiva/statistica
inferenziale: le operazioni e le tecniche impiegate al fine di ricavare sempre
un indice di tendenza centrale e di dispersione ad esso specifico, appartengono
alla statistica descrittiva; quando invece i dati si generalizzano con
l’intento di estendere i risultati dal campione all’universo, si ha la
statistica inferenziale. f)
Sistema dei parametri/verifica delle ipotesi:
una stima è tanto accurata quanto vi è uguaglianza tra il suo valore e quello
del parametro corrispondente, si parla inoltre di stima puntuale nel caso in cui sarà necessario individuare
quale campione sia effettivamente in grado d rappresentare una popolazione, e
di stima per intervalli segnalando come comporti una decisione in riferimento
al rischio che si corre; la verifica delle ipotesi è un processo più complicato:
nel caso in cui si ponga l’obiettivo di calcolare le probabilità dei possibili
risultati di un esperimento abbiamo la distribuzione campionaria e, se
stabiliamo che la media è il valore di centrazione di ogni campione, avremo che
la media della distribuzione campionaria sarà la media delle medie dei
campioni. g)
Distribuzione normale: quando si ha una
distribuzione nel continuo è possibile attuare la trasformazione da una
variabile discreta ad una variabile continua e tale trasformazione è possibile
mediante la standardizzazione dei valori di cui disponiamo. h)
La costruzione dei campioni (campionamento):
il campione è parte della popolazione esaminata e dev’essere in grado di
rappresentarla con alta percentuale; se il campionamento è l’operazione con cui
si individua un campione, il piano di campionamento è l’elaborazione dello
stesso; si ha un’indagine campionaria quando si presta la massima attenzione
alla rappresentatività del campione; l’ampiezza del campione varia rispetto al
tipo di ricerca che si compie e a seconda dell’ambiente in cui si realizza;
l’unità di campionamento sono le
caratteristiche che definiscono la popolazione da cui si ricava il campione. i)
Popolazione (universo): numero
sufficientemente rilavante di dati statistici che si riferiscono ad una o più
caratteristiche, distinti tra loro solo per la frequenza con cui compaiono
nelle prove o osservazioni. j)
Sub-popolazione (universo): insieme di dati
statistici che sono derivati da un’identica popolazione secondo un criterio
stabilito; le principali tecniche che si impiegano per la costruzione dei
campioni sono: campione casuale, campione stratificato, campionamento
stratificato proporzionale, campionamento a grappoli (cluster), campionamento con
ripetizione e doppio campionamento. k) La
descrizione statistica: è l’ultima operazione che comunemente compone il
processo dell’elaborazione dei dati; in linea generale le differenti situazioni
in cui si imbatte la ricerca statistica sono riconducibili a tre grandi
categorie: nel primo caso conosciamo un risultato e possiamo domandarci quale
valore e significatività abbia; nel secondo caso si è in presenza di un insieme
di risultati e si cercano i fattori che
li producono e come li costituiscono; infine, si ha il caso in cui possediamo
due risultati e vogliamo compararli per giungere ad una decisione. Quest’ultima
è la condizione ottimale della decisione statistica.