Basi di dati da fonte amministrativa per analisi a livello comunale. Prime esperienze nella statistica ufficiale.

Roberta Vivio – Istat

 

Nell’ambito della strategia dell’Istat per lo sfruttamento di dati amministrativi a fini statistici,  nel 2013 è stato istituito il Progetto ARCHIMEDE per realizzare l’ampliamento dell’offerta informativa dell’Istat mediante la produzione di collezioni di dati elementari longitudinali e cross-section utili alla ricerca sociale ed economica, alla programmazione territoriale, alla valutazione delle politiche pubbliche a livello nazionale, regionale e locale.  Nel 2016 le attività sono state formalizzate in cinque[1] progetti del PSN 2016-18.

Fino ad oggi sono state realizzate e diffuse tre basi di microdati utilizzando esclusivamente fonti  amministrative e/o  registri, e due e-book. Le basi sono relative al 2013, gli e-book all’anno scolastico e accademico 2014/15:

Base dati “Precarietà lavorativa”: contiene informazioni sugli occupati regolari in Italia per osservarne il grado di stabilità lavorativa (http://www.istat.it/it/archivio/191859)

Base dati “Condizioni socio-economiche delle famiglie”: consente di analizzare congiuntamente vari aspetti delle condizioni socio-economiche delle famiglie residenti e individuare eventuali aspetti di fragilità (http://www.istat.it/it/archivio/190365)

Base dati “Popolazione insistente”: è costituita dagli individui che alla data di riferimento risultano insistere sul territorio italiano (http://www.istat.it/it/archivio/189907)

E book “Studenti e bacini universitari”: fornisce alcuni elementi quantitativi e qualitativi sulla mobilità territoriale degli studenti universitari nell’a.a. 2014/15, e sul loro background familiare;  dati sugli atenei italiani raccolti in tavole di dati e indici; cartogrammi, matrici  origine/destinazione .http://www.istat.it/it/archivio/letture+statistiche

E book “Studenti e scuole dell’istruzione primaria e secondaria in Italia” (in uscita)

I concetti e le definizioni amministrative non sempre coincidono con quelle utilizzate nella statistica ufficiale. Per esempio il Reddito familiare in Archimede è Reddito lordo perché acquisito dalla Base dati reddituale che riporta i redditi prima della tassazione. Nelle statistiche correnti è Reddito netto.  In Archimede non si parla di Individui che hanno svolto almeno un’ora di lavoro nella settimana precedente l’intervista ma di Individui con segnali di contributi previdenziali ed assicurativi per attività lavorativa svolta nel mese di dicembre.

 

Il metodo di lavoro di Archimede è stato il seguente:

Evaluate users needs. Sono stati coinvolti Uffici regionali Istat e Uffici di statistica di Regioni e Comuni del Sistan, per verificare le principali  necessità informative, e per testare gli output (utilizzabilità, utilità, limiti)

Relevance and Comparability  E’ emersa una forte richiesta di statistiche a livello comunale non altrimenti disponibili, armonizzate a livello nazionale per consentire confronti tra territori, e aggiornate frequentemente.

Timeliness. Sono stati privilegiati gli archivi con minore ritardo tra l’evento e la disponibilità in Istat; ed il processo di produzione è stato ingegnerizzato.

Coherence and Accuracy. Selezione ragionata di archivi e di variabili a seconda della popolazione target, e del grado di somiglianza dei concetti e delle definizioni amministrative rispetto a quelli statistici..

  • Scelta prioritaria di variabili già validate in altri processi: es. il luogo di lavoro di un individuo all’interno del campo di osservazione del Censimento dell’Industria e dei Servizi è quello individuato all’interno di ASIA, mentre per gli individui fuori campo è stata applicata una procedura studiata ad hoc da Archimede.
  • In caso di molteplicità di informazioni, si è scelta la variabile appartenente all’archivio di livello gerarchico più alto: es. la Residenza anagrafica scelta è quella dell’Anagrafe della Popolazione, il Codice fiscale è quello dell’Anagrafe tributaria, ecc.
  • E’ in sviluppo una procedura di editing per identificare a livello micro le incoerenze fra variabili derivate da fonti differenti.

 

Bibliografia

Working Papers:  Progetto ARCHIMEDE. I risultati sperimentali e le linee di sviluppo (Business Cases gennaio 2014).

 

[1] IST-02661 Popolazioni che usano un territorio e loro mobilità; IST-02645 Quantificazione delle popolazioni in ambiti territoriali potenzialmente a rischio; IST-02662 Precarietà lavorativa; IST-02663 Condizioni socio-economiche delle famiglie; IST-02640 Percorsi di istruzione, formazione e inserimento lavorativo.

Facebooktwitterlinkedinmail