ROMA – L’uscita dell’indagine campionaria “La soddisfazione dei cittadini per le condizioni di vita” (il Testo integrale) del febbraio 2010 è di grande interesse per capire come la crisi politica economica e sociale del paese stia influenzando la vita delle famiglie italiane.
Purtroppo l’annuncio diffuso dell’indagine omette un aspetto fondamentale, la qualità dei dati. La tavola 5.1 illustra quale potrebbe essere il formato di presentazione dei risultati dell’indagine perché sia possibile leggere correttamente i dati. Ogni risposta ha tre risultati, il limite superiore (lim sup) il valore centrale (val cen) e il limite inferiore (lim inf), perché l’estensione dei risultati dal campione alla popolazione implica un intervallo fiduciario di valori (intervallo di confidenza simmetrico rispetto al valore centrale) nel quale il parametro stimato, ossia la percentuale di rispondenti sul totale, si colloca con un errore non superiore al 5%. L’ampiezza di tale intervallo è diversa a seconda dello strato di campionamento considerato, poiché il disegno campionario, che permette la realizzazione dell’indagine, non è altro che un aggregazione di più sub campioni estratti territorialmente a seconda della natura demografica dei comuni, cercando di avere massima omogeneità demografica all’interno di ogni strato. Questo implica che, entrando nel dettaglio del campione, l’intervallo di variabilità della stima varia in base allo schema di campionamento, alla ponderazione data e alla stima della variabilità dello stimatore. Per cui quando si leggono i risultati ci si trova di fronte al prodotto di almeno due operazioni di stima funzionali: quella del peso e quella della variabilità dello stimatore.
L’Istat, che è uno degli istituti di statistica nazionali più rigorosi al mondo, spiega nella nota metodologica che “ad ogni stima corrisponde un errore di campionamento relativo: ciò significa che per consentire una lettura corretta delle tabelle pubblicate sarebbe necessario presentare per ogni stima pubblicata il corrispondente errore di campionamento relativo” (pag 8). Tuttavia prevalgono ragioni di opportunità (costo, lettura, tempo) per le quali si continua pervicacemente a fornire i dati come se i risultati dell’indagine fossero privi di quell’errore che ne qualifica la natura di dati campionari. Fornire l’intervallo di confidenza può agevolare la lettura corretta dei dati senza appesantire troppo la comunicazione pubblica.
Inoltre altre due considerazioni di metodo sono obbligatorie. L’unità di rivelazione è la famiglia (per questa ragione si mostra la tabella sulle famiglie) e non i singoli individui sono calcolati a partire da esse, quindi risultano un prodotto derivato. In altre parole sono le famiglie estratte per il campione. La numerosità campionaria delle famiglie e dei comuni partecipanti all’indagine è calcolata in base ad una funzione vincolata ai costi e alla capacità tecnica di gestire l’indagine in ogni sua fase.
Pertanto l’indagine non può fornire risultati puntuali senza che questi siano corredati di variabilità e valutazione della copertura dell’indagine rispetto al disegno campionario e la scelta del valore centrale è una consuetudine. Ne deriva che l’interpretazione dei dati dovrebbe essere fatta sulle tendenze assunte da ciascuna stima in relazione alle altre.
Sulla base di quanto detto considerando la tavola 5.1 e la tabella dei relativi errori campionari si possono fare le seguenti osservazioni:
• per quel che concerne la situazione economica le risposte “molto peggiorata” ed “invariata” hanno una variazione più ampia delle risposte “un po’ peggiorata”e “molto un po’ migliorata”;
• per quel che concerne le risorse economiche le risposte “insufficienti” ed “adeguate” hanno una variazione molto più ampia delle risposte“ottime” ed “scarse”;
• rispetto all’ampiezza demografica la variabilità è più accentuata nei grandi centri urbani piuttosto che nei piccoli agglomerati nelle risposte estreme;
• territorialmente la variabilità è molto forte nel sud e nelle isole nei confronti tra le risposte estreme;
• le risposte “molto peggiorata”, “molto un po’ migliorata” e “insufficienti” presentano errori relativi di stima superiori al 5% per tutti i dettagli territoriali e demografici;
• la risposta “ottime” presenta errori relativi di stima che variano tra il 13% e il 48% per tutti i dettagli territoriali e demografici
• la risposta “un po’ peggiorata” presenta errori relativi di stima superiori al 5% in tutte le regioni, per la “Periferia dell’area metropolitana” e i Comuni fino a 2000 abitanti;
• le risposte mediane non hanno un comportamento uniforme rispetto al territorio e all’ampiezza demografica dei comuni.
In conclusione i risultati dell’indagine fanno emergere la difficoltà a stabilire la misura del peggioramento estremo e della stabilità nella condizione economica delle famiglie, mentre l’accertamento di “ottime” risorse economiche è particolarmente critica dal profilo dell’errore della stima a dettaglio territoriale e demografico.
A livello territoriale, con la sola eccezione della Valle d’Aosta e Trentino Alto Adige, mai la percezione della situazione economica invariata o migliorata presenta una percentuale superiore al 69%, valore tendenzialmente confermato dalla valutazione delle risorse economiche soddisfacente al massimo (mai superiore 68%). L’Italia, tra le prime 7 potenze economiche sociali del mondo, ha una percentuale di popolazione variabile tra il 32% e il 57%, a seconda del diverso dettaglio territoriale e dell’ampiezza demografica, che manifesta un evidente disagio economico-sociale.
E’ una situazione allarmante che dovrebbe occupare lo spazio pubblico quotidianamente perché sono cifre che pongono l’Italia in una condizione di proto-sottosviluppo. Come provocazione suggerisco il seguente termine di paragone: la più recente indagine campionaria dell’Onu sulla condizione di povertà in Mauritania stima con un campione stratificato sulle famiglie la povertà mauritana tra il 67,8% e il 20% a seconda del dettaglio territoriale e del grado di urbanizzazione.
Tabella degli errori campionari relativi percentuali della tavola 5.1 (in rosso i valori più alti del 5%)