Comitati organizzatori SUS
L’evento “Stats under the stars” nasce nel 2015 in ambito accademico dall’idea di un gruppo di ricercatori di Padova e di Torino[1], come una sfida in cui le squadre partecipanti si confrontano nell’analisi di un dataset nel corso di un’intera nottata. L’obiettivo principale è di stimolare il dinamismo che lega la Statistica al mondo dei giovani. La prima edizione[2] è stata organizzata a Padova nell’ambito della Conferenza Scientifica della Società Italiana di Statistica Statistics and Demography: the Legacy of Corrado Gini.
L’evento si caratterizza per alcuni tratti che ne contraddistinguono l’originalità e l’orientamento data-driven alla risoluzione di problemi reali:
- il contesto in cui si svolge. Le squadre di giovani analisti si confrontano durante un’intera nottata in un ambiente partecipativo, in cui si stimola la competizione e la collaborazione tra i gruppi.
- il problem solving. L’orientamento alla ricerca è enfatizzato dalla possibilità di affrontare un problema reale a cui non corrisponde una soluzione unica. Diverse sono le possibilità e quindi le tecniche di analisi che si possono utilizzare.
- il sistema premiante. La valutazione finale prende in esame diverse dimensioni del lavoro presentato: dall’accuratezza numerica della soluzione, agli aspetti legati all’interpretazione dei risultati, all’originalità del metodo proposto e alla capacità di fornire un report dettagliato.
Dato il notevole successo riscosso dalla prima edizione tra i giovani statistici italiani, l’iniziativa è riproposta nell’ambito della XLVIII Riunione Scientifica della Società Italiana di Statistica che si svolge presso l’Università degli Studi di Salerno nei giorni 8-10 giugno 2016. La seconda edizione[3] dell’evento “Stat under the stars2” ha luogo nella notte tra il 7 e l’8 giugno nella splendida cornice della Costiera Amalfitana. Anche in questa edizione le squadre partecipanti si confrontano nell’analisi di un problema reale nel corso dell’intera nottata. Una competizione, dunque, che rappresenta un momento di “incontro” e di “confronto” tra giovani statistici, in cui emergerà l’utilità della statistica come strumento chiave in ottica decisionale.
Alle squadre partecipanti è illustrato un case-study su un dataset da analizzare al fine di presentare una soluzione al problema proposto. Oltre all’uso dei dati forniti per la competizione, le squadre hanno la possibilità di integrare le analisi utilizzando dati esterni, purché di dominio pubblico. La competizione si avvale del supporto tecnico fornito da BeeViva s.r.l., uno spin-off dell’Università degli Studi di Padova, proposto dal Dipartimento di Scienze Statistiche, con lo scopo di valorizzare l’importanza dell’analisi dei dati per migliorare le scelte aziendali.
Numerosi sponsor (Bureau van Dijk, CRC Press di Taylor & Francis, CRISMA srl e SAS Italy) mettono a disposizione dei premi per le squadre vincitrici, decretate da una commissione di esperti.
Lo spirito dell’iniziativa è chiaro: unire il momento goliardico dello stare insieme tra giovani in un’atmosfera accogliente e apparentemente rilassata, al momento professionale, in cui il team deve organizzarsi per rendere efficace il lavoro, stressato dalla competizione.
L’evento si pone, quindi, l’obiettivo di rinforzare la consapevolezza – che si sta già facendo strada nell’accademia italiana – di sviluppare quelle competenze nel giovane studioso, utili per affrontare i diversi aspetti legati al trattamento di un problema reale. Si fa riferimento: a) alla “pulizia” del dato, all’identificazione della “variabile”, magari costruirla attraverso degli indicatori, alla decisione del livello di aggregazione del dato, aspetti spesso nascosti nella pratica del laboratorio accademico; b) alla dimensione del problema e alla possibilità di affrontare un dataset reale, di grandi dimensioni, che forse rappresenta il primo momento di incontro-scontro tra teoria e pratica. Una pratica in cui la dimensione del dato diviene sempre più critica e dove l’approccio ai Big Data si deve anche tradurre nel guardare con occhi nuovi ai metodi tradizionali; c) alla capacità relazionale, che si traduce sia in lavoro di squadra, nel saper mettere al servizio degli altri le proprie competenze, sia in capacità di comunicare i risultati, che trasformi cioè il risultato statistico in una chiara decisione operativa. Competenze queste che si stanno diffondendo nel mondo accademico grazie ad un’offerta formativa articolata in 61 Corsi di Laurea in Statistica (di cui 25 Corsi di Laurea triennale). Dai dati MIUR[4] risulta che in totale gli studenti iscritti a tali corsi di laurea nell’a.a. 2014/15 sono 5432 (di cui circa 1200 immatricolati) che si distribuiscono principalmente in 4 sedi universitarie site nelle province di Roma (18,00%), Padova (17,45%), Milano (17,38%) e Bologna (13,51%).
Inoltre, pur sommessamente, riteniamo che eventi come questi possano aiutare i giovani ad affacciarsi alle esigenze della società dei Big Data. Un ambiente nuovo, ancora in divenire, in cui i flussi di dati sono sempre più “liquidi”, altamente fruibili e disponibili, come si dice in gergo, caratterizzati da Volume, Velocità, Varietà (dati destrutturati), Variabilità (attitudine per cui le prime tre caratteristiche si presentano in forma non costante nel tempo) e Complessità (fonti non omogenee e necessità di pre-trattamento)[5]. L’attenzione crescente dei media verso l’era dei Big Data si manifesta nella centralità assunta dalla figura del data scientist, come risposta alla crescente disponibilità e ricchezza dei dati (“We create as much information in two days now, as we did from the dawn of man through 2003” [Google CEO, Eric Schmidt. 2010.] [6]) che si è tradotta in nuove e numerose opportunità lavorative, ergendosi tra le professioni più appetibili per le future generazioni[7].
Da un breve sguardo alle caratteristiche dei partecipanti all’evento, si nota che nel 2015 i 96 giovani studiosi provengono principalmente da Università del Nord Italia (Figura 1a) e in prevalenza dalle due regioni Veneto e Piemonte. Nel 2016 la partecipazione (dato provvisorio: 86 giovani studiosi) si estende anche verso le regioni del Centro-Sud con la Campania e il Lazio in prima linea (Figura 1b). Questo dato conferma, da un lato, la naturale maggiore propensione a partecipare degli studenti che appartengono ad università vicine al luogo in cui è organizzato l’evento, dall’altro lato un allargamento del fronte dei potenziali interessati. L’auspicio è che in futuro la collocazione geografica dell’evento non rappresenti un vincolo alla partecipazione. Per questo si dovrà presumibilmente provvedere a delle misure di incentivazione alla partecipazione, favorendo gli spostamenti e la dimora in loco per gli studenti.
Figura 1 – Distribuzione dei partecipanti per sede regionale dell’Ateneo di appartenenza: a) partecipanti SUS 2015; b) partecipanti SUS2 2016 (valori percentuali) |
|
a) | b) |
Fonte: nostra elaborazione |
[1] Durante D., Canale A., Guidolin M., Finos L., Scarpa B. (2015) A night of Statistics, problem solving, and teamwork, Proceedings Conferenza Scientifica della Società Italiana di Statistica “Statistics and Demography: the Legacy of Corrado Gini”, Treviso.
[2] Sito web Stats under the stars 2015 http://sus.stat.unipd.it/
[3] Sito web Stats under the stars2 2016 http://www.labeconomia.unisa.it/sus2/
[4] Ufficio Statistico del Ministero dell’Istruzione, dell’Università e della Ricerca: Indagine sull’Istruzione Universitaria a.a. 2014-2015 http://statistica.miur.it/ustat/Statistiche/IU_home.asp
[5] Per approfondimenti http://www.sas.com/en_us/insights/big-data/what-is-big-data.html
[6] Per approfondimenti http://techcrunch.com/2010/08/04/schmidt-data/
[7] La figura del data scientist si posiziona al primo posto per le opportunità lavorative nella classifica delle 25 professioni più richieste negli Stati Uniti nel 2016 http://www.fastcompany.com/3055629/the-future-of-work/these-are-the-top-25-jobs-in-the-us-this-year. Si veda anche la classifica riportata sul sito http://www.careercast.com/jobs-rated/best-jobs-2016, dove la professione del Data Scientist si colloca nuovamente al primo posto, seguita immediatamente da quella dello Statistico.