Capitolo 6. La statistica:concetti di base (Irene Mazza)

6. La statistica: i concetti di base

6.1 L’utilizzazione della statistica nelle scienze umane

L’intento che spinge a condurre un esperimento è quello di verificare un’ipotesi che viene formulata a proposito di un argomento d’indagine e, a seconda della natura di quest’ultimo, variano le procedure da seguire; nell’ambito delle scienze umane, è possibile stabilire, tramite opportuni procedimenti, quali siano le probabilità che le nostre ipotesi hanno di essere validi. È possibile affermare che un avvenimento è probabile nel caso in cui non sia completamente prevedibile e si stabilisce se la realizzazione di questo evento sia subordinata ad una regolarità statistica; la nozione di probabilità ed i modelli matematici ad essa collegati sono più complicati e comportano precisazioni concettuali come la distinzione tra eventi dipendenti/indipendenti, eventi mutualmente escludentisi/che non si escludono. A questo punto è necessario chiedersi: la quantità di informazioni che ci è trasmessa da ogni prova o esperimento che noi realizziamo, è sufficiente a farci conoscere qualcosa in più rispetto al problema che stiamo affrontando? È indispensabile individuare mezzi e strategie che ci consentono di raccogliere i dati sistemandoli ed ordinandoli nel miglior modo: è questa la condizione di partenza per cui possiamo pensare di estendere ad un ampio contesto i risultati del nostro lavoro.

 

6.2 Le basi teoriche della statistica

 

Le basi teoriche su cui si fonda la statistica sono costituite dai seguenti concetti:

a)   Qualità/quantità: questa contrapposizione concerne in fine attribuito alla statistica; nel caso della statistica qualitativa si descrivono i fenomeni, mentre, quando si è in grado di misurare un fenomeno  e di classificarlo con strumenti di manipolazione sempre controllabile, si opera nel campo della statistica quantitativa.

 

b)   Sistema empirico/sistema relazionale: non possiamo misurare tutti i dati allo stesso modo perché troppo diversi tra loro, ma possiamo stabilire della particolari modalità di misurazione a seconda di ciò che ci si pone di fronte utilizzando le scale di misura: a ogni elemento dell’insieme costituito da fatti, soggetti, oggetti, facciamo corrispondere, secondo regole specifiche, un elemento di un altro insieme (simbolo: sistema simbolico; numero: sistema empirico).

 

c)   Esperimento/controllo: si tratta di mettere a rapporto diverse distribuzioni per ottenere le informazioni desiderate; servono dunque dei soggetti, definiti gruppo sperimentale, che provino gli assunti di partenza ed i loro risultati saranno confrontati con un altro gruppo, il gruppo di controllo, che esegue lo stesso compito senza essere sottoposto all’influenza degli elementi perturbanti.

 

d)   Campione/universo: si tratta di stabilire come si passi dalle analisi del campione a previsioni riguardo l’universo dove, con il termine popolazione, definita universo, si intende l’insieme delle osservazioni concernenti l’oggetto di indagine, mentre il campione è una parte di questo universo.

 

e)   Statistica descrittiva/statistica inferenziale: le operazioni e le tecniche impiegate al fine di ricavare sempre un indice di tendenza centrale e di dispersione ad esso specifico, appartengono alla statistica descrittiva; quando invece i dati si generalizzano con l’intento di estendere i risultati dal campione all’universo, si ha la statistica inferenziale.

 

f)    Sistema dei parametri/verifica delle ipotesi: una stima è tanto accurata quanto vi è uguaglianza tra il suo valore e quello del parametro corrispondente, si parla inoltre di stima puntuale  nel caso in cui sarà necessario individuare quale campione sia effettivamente in grado d rappresentare una popolazione, e di stima per intervalli segnalando come comporti una decisione in riferimento al rischio che si corre; la verifica delle ipotesi è un processo più complicato: nel caso in cui si ponga l’obiettivo di calcolare le probabilità dei possibili risultati di un esperimento abbiamo la distribuzione campionaria e, se stabiliamo che la media è il valore di centrazione di ogni campione, avremo che la media della distribuzione campionaria sarà la media delle medie dei campioni.

 

g)   Distribuzione normale: quando si ha una distribuzione nel continuo è possibile attuare la trasformazione da una variabile discreta ad una variabile continua e tale trasformazione è possibile mediante la standardizzazione dei valori di cui disponiamo.

 

h)   La costruzione dei campioni (campionamento): il campione è parte della popolazione esaminata e dev’essere in grado di rappresentarla con alta percentuale; se il campionamento è l’operazione con cui si individua un campione, il piano di campionamento è l’elaborazione dello stesso; si ha un’indagine campionaria quando si presta la massima attenzione alla rappresentatività del campione; l’ampiezza del campione varia rispetto al tipo di ricerca che si compie e a seconda dell’ambiente in cui si realizza; l’unità di campionamento  sono le caratteristiche che definiscono la popolazione da cui si ricava il campione.

 

i)     Popolazione (universo): numero sufficientemente rilavante di dati statistici che si riferiscono ad una o più caratteristiche, distinti tra loro solo per la frequenza con cui compaiono nelle prove o osservazioni.

 

j)     Sub-popolazione (universo): insieme di dati statistici che sono derivati da un’identica popolazione secondo un criterio stabilito; le principali tecniche che si impiegano per la costruzione dei campioni sono: campione casuale, campione stratificato, campionamento stratificato proporzionale, campionamento a grappoli (cluster), campionamento con ripetizione e doppio campionamento.

 

k)   La descrizione statistica: è l’ultima operazione che comunemente compone il processo dell’elaborazione dei dati; in linea generale le differenti situazioni in cui si imbatte la ricerca statistica sono riconducibili a tre grandi categorie: nel primo caso conosciamo un risultato e possiamo domandarci quale valore e significatività abbia; nel secondo caso si è in presenza di un insieme di risultati  e si cercano i fattori che li producono e come li costituiscono; infine, si ha il caso in cui possediamo due risultati e vogliamo compararli per giungere ad una decisione. Quest’ultima è la condizione ottimale della decisione statistica.

7/9
Edurete.org Roberto Trinchero