Capitolo 7. Il campionamento (Simona Santandrea)
Il ricercatore che vuole indagare una determinata popolazione difficilmente sarà in grado di studiare tutte le unità di analisi che la compongono. Quest’operazione necessiterebbe di uno sforzo notevole, un costo difficilmente sostenibile e tempi di realizzazione molto lunghi; inoltre, la complessità della rilevazione sarebbe viziata da numerosi errori. La difficoltà di reperire delle persone e la possibilità che queste rifiutino la collaborazione, non permetterebbero la somministrazione a tutti del questionario.
Una ricerca che prenda in considerazione tutte le unità di analisi è detta censimento, alternativa a questo c’è l’indagine campionaria.
Per campionamento si intende il procedimento attraverso cui vengono selezionati, all’interno della popolazione oggetto di indagine, le unità di analisi che andranno a far parte del campione.
Per campione si intende una porzione della popolazione oggetto di indagine che il ricercatore andrà a studiare con la speranza di ottenere da essa delle informazioni estendibili all’intera popolazione. La qualità e la rappresentatività di un campione non è data dalla sua ampiezza, ma è data dal modo in cui esso viene estratto. Possiamo distinguere due tecniche di campionamento:
- Probabilistico, ciascun soggetto della popolazione ha, rispetto a tutti gli altri, la stessa probabilità di far parte del campione
a) Il campione casuale semplice viene ottenuto elencando tutti i soggetti della popolazione in una lista, assegnando un numero d’ordine ad ognuno, ed estraendo i soggetti con un generatore di numeri casuali.
b) Il campione sistematico consiste nell’estrarre un soggetto ogni k presenti nella lista di campionamento, partendo dalla posizione i-esima, scelta casualmente.
c) Se la popolazione non è omogenea si può ricorrere al campionamento stratificato, il quale consiste nel dividere la popolazione in strati quanto più possibile omogenei tra di loro ed estrarre un campione casuale da ogni strato.
d) Il campionamento a grappoli è adatto per popolazioni molto grandi, ma comunque con elementi noti e finiti. Si individuano nella popolazione gruppi naturali (grappoli) quanto più eterogenei al loro interno e quanto più omogenei con altri gruppi loro simili. Estraendo in maniera casuale uno o più grappoli, si avrà un campionamento che riprodurrà gran parte dell’eterogeneità della popolazione di partenza.
e) Il campionamento a stadi comporta una serie di selezioni casuali su più livelli. Si scelgono delle unità primarie di campionamento e nell’ambito di queste si scelgono delle unità secondarie. Si continua così fino a giungere alle unità di rilevazione desiderate.
- Non probabilistico, le probabilità di alcuni elementi che compongono la popolazione di far parte del campione non sono note o sono pari a zero
a) Il campionamento a valanga prevede di scegliere un certo numero di soggetti dotati delle caratteristiche richieste dall’indagine, intervistarli e chiedere loro altri nominativi da intervistare, in modo da creare un “effetto valanga”.
b) Il campionamento per quote è simile al campionamento stratificato, da cui si differenzia perché la selezione degli individui all’interno di ogni strato non viene fatta per campionamento casuale ma viene lasciata alla discrezione degli intervistatori.
c) Il campionamento ragionato prevede che il campione venga scelto da ricercatore sulla base dei suoi scopi. Vengono selezionati i soggetti che meglio rispondono agli obiettivi conoscitivi che si pone il progetto di ricerca.
d) Nel campionamento autoselezionato non è il ricercatore a scegliere le persone da includere nel campione bensì sono queste che, spontaneamente, si offrono per partecipare.
Il campione teorico è quello progettato dal ricercatore. Il campione reale è invece quello che concretamente si riesce a realizzare. Più è grande la distanza fra questi due campioni e più è dubbia la generalizzazione dei risultati ottenuti.
La differenza fra campione teorico e quello reale è data da due situazioni ricorrenti: l’impossibilità di mettersi in contatto con la persona selezionata e il rifiuto di questa a collaborare con la ricerca. Quando una di queste situazioni si verifica, occorre sostituire il nominativo estratto con una “riserva” e per ridurre al minimo gli effetti discorsivi che questa comporta è opportune scegliere tra le riserve quella che assomiglia maggiormente al nominativo.
Il campione deve risultare una fotografia della popolazione studiata, ma ciò è quasi impossibile.
La differenza tra i dati che si possono ottenere studiando il campione e quelli effettivamente presenti nella popolazione è detto errore di campionamento. Il ricercatore ha però la possibilità di effettuare una stima circa l’ampiezza massima di tale errore.
Il campione reale molto spesso si discosta in maniera significativa da quello programmato a tavolino, un elevato numero di sostituzioni, rispetto al campione originale, compromette in maniera notevole la rappresentatività del campione stesso, rendendo non affidabile la stima dell’errore ottenuta.