Social Media Data per lo studio della disoccupazione giovanile italiana: il progetto LikeYouth

 di Andrea Bonanomi, Alessandro Rosina, Ciro Cattuto e Kyriaki Kalimeri

 

Il tema del lavoro ha acquistato negli anni di crisi una crescente attenzione nelle famiglie italiane. Si tratta di una preoccupazione trasversale ma che tocca in modo particolare le nuove generazioni. Il tasso di occupazione dei giovani già prima della crisi risultava sceso sotto il 35%, per poi inabissarsi negli anni peggiori della recessione su valori attorno al 20%. Nel corso del 2016 torna leggermente a salire, rimanendo però abbondantemente sotto il 25%. Obiettivo del progetto LikeYouth è descrivere le caratteristiche dei Neet (Not in Education, Employment or Training) in termini di condizioni e atteggiamenti – utili a fini conoscitivi sul fenomeno ma anche potenzialmente in grado di fornire indicazioni di aiuto per misure di intercettazione e ingaggio – andando oltre non solo i dati delle statistiche pubbliche, ma sperimentando anche la combinazione con fonti innovative quali i social media data.

In particolare gli obiettivi dello studio sono molteplici:

  • Identificare in maniera automatizzata la popolazione dei Neet attraverso le loro tracce digitali (likes a pagine Facebook) per raggiungerli agevolmente per interventi ad alta resa;
  • Scoprire caratteristiche comportamentali e individuali e di personalità della popolazione per una miglior comprensione del fenomeno, integrando i risultati con indagini di tipo tradizionale;
  • Prevedere potenziali soggetti a rischio per creare canali comunicativi privilegiati, e favorire misure di policy e campagne mirate.

Per realizzare gli obiettivi prefissati, in collaborazione con il Dipartimento di Scienze Statistiche dell’Università Cattolica di Milano, ISI Foundation, Fondazione Cariplo e Istituto Toniolo è stata realizzata LikeYouth (www.likeyouth.org), una Facebook App in lingua italiana e inglese. Si tratta di un innovativo strumento di raccolta dati che mira alla comprensione dei comportamenti e alla profilatura dei giovani integrando informazioni digitali e valutazione self-reported da questionario. È un sistema aperto, estendibile, modulabile e adattabile per la somministrazione di questionari e per l’integrazione con dati social. Il progetto si basa, nel dettaglio, su risultati recenti di letteratura, che mostrano una forte relazione predittiva è emersa tra le manifestazioni di interesse tipiche di Facebook (i cosiddetti “likes”) e alcuni tratti e profili personali. Il campione consiste di 9358 individui (Indagine Rapporto Giovani), con un’età compresa tra 18 e 33 anni. Circa il 20% (esattamente 1858 soggetti) dei giovani cui è stata proposta l’applicazione ha fatto accesso completo a LikeYouth. Il confronto tra il totale del campione e il campione dei soggetti che hanno fatto accesso a LikeYouth non ha mostrato differenze significative rispetto alle più importanti variabili socio-demografiche. Sono state inoltre confrontati i due campioni per alcuni indicatori psicometrici rilevanti e per fruizione di tecnologia, senza evidenziare alcuna differenza statisticamente significativa. Per tali motivi il campione dei giovani che ha fatto accesso a LikeYouth può essere considerato rappresentativo a tutti gli effetti della popolazione giovanile italiana e mostra come l’utilizzo di strumenti digitali (spesso più economici per il committente e pratici e accattivanti per i partecipanti) possa garantire scientificità completa ad un’indagine su larga scala.

Scopo di questo studio preliminare ed esplorativo è stato quello di fare prediction e clustering, oltre ad uno studio di association. Si è provato a prevedere la condizione lavorativa (dicotomizzandola per semplicità in due categorie, Neet e Not Neet) sulla base del comportamento digitale che agiscono come predittori, si è provato a interpretare e classificare i soggetti in base alle loro tendenze e comportamenti e a indagare eventuali associazioni tra le diverse condizioni e i comportamenti digitali messi in atto, per particolari coorti della popolazione di rilevante interesse. Sono state utilizzate tecniche di Machine Learning largamente utilizzate per la classificazione e la predizione, ovvero i Random Forest Models. La valutazione della performance del modello, ovvero della capacità di predire e classificare, è calcolata con l’indice AUROC. Per la popolazione di interesse, ovvero i Neet, si è in grado di prevedere se una persona sconosciuta è un potenziale Neet con un’accuratezza del 63% (AUROC = 0.63). La numerosità relativamente bassa con cui si è stimato il modello (che generalmente necessita di numerosità campionarie decisamente più ampie) e il livello di precisione raggiunto comunque moderatamente buono indicano le enormi potenzialità di questi strumenti e di questa modellistica.

L’attività su Facebook dei Neet è fortemente legata a pagine di beni di consumo (specialmente prodotti di genere alimentare, per l’infanzia e per la bellezza), a pagine di intrattenimento tv e a tutta quella nicchia di pagine di scontistica, promozioni, concorsi a premi, offerte. Tra coloro che non sono Neet (Not Neet) le pagine più diffuse sono di cultura, satira, ironia, programmi tv di approfondimento, informazione e serie tv.

 

Il progetto mostra come sia possibile ribaltare la visione che la società e la politica spesso hanno dello strumento digitale dei social network, utilizzandoli così a scopo di attivatore sociale. Un welfare che sia al passo dei tempi deve uscire dai canonici contesti di intervento, e attivarsi laddove i giovani trovano naturale spazio, il mondo digital. L’estrema flessibilità della rete deve essere sfruttata nella sua piena e più alta potenzialità.

like you 2

Facebooktwitterlinkedinmail