Tutti i dati delle nostre data inchieste… pubblici!

Il New York Times, il Guardian, ProPublica, la Nacion (e pro­ba­bil­men­te altre) sono tut­te testa­te ben note per i loro lavo­ri di data jour­na­li­sm che met­to­no a dispo­si­zio­ne di let­to­ri e col­le­ghi i pro­pri data­set, con varie licen­ze di acces­so e riu­ti­liz­zo. Lavorando in que­sto ambien­te ci sia­mo resi con­to che in Italia, per quan­to ne sap­pia­mo, non esi­ste nul­la del gene­re. Ma pote­va­mo aspet­ta­re i gior­na­li e gli edi­to­ri nostra­ni per vede­re pub­bli­ca­to un archi­vio di dati gior­na­li­sti­ci?

Da oggi Dataninja rila­sce­rà tut­ti i data­set del­le pro­prie inchie­ste e in gene­ra­le dei lavo­ri di data jour­na­li­sm in cui il nostro net­work è coin­vol­to, in con­co­mi­tan­za con la pub­bli­ca­zio­ne dei pez­zi e del­le visua­liz­za­zio­ni. E non lo fare­mo pub­bli­can­do un sem­pli­ce link a un file memo­riz­za­to da qual­che par­te, ma median­te una vera e pro­pria piat­ta­for­ma dedi­ca­ta al rila­scio di dati: dati​.data​ni​n​ja​.it. Si basa su DKAN, una spe­cia­le distri­bu­zio­ne del cele­ber­ri­mo CMS open-sour­ce Drupal, che si ispi­ra espli­ci­ta­men­te alla ben nota CKAN del­la Open Knowledge Foundation, mol­to usa­ta dal­la Pubblica Amministrazione per i pro­pri por­ta­li open data.

datadataninjait

Qualche esem­pio? La nostra inchie­sta sul­le vit­ti­me dell’immigrazione è in fina­le ai Data Journalism Awards 2014 e il data­ba­se è su una piat­ta­for­ma dedi­ca­ta: detec​ti​ve​.io. Noi ripub­bli­chia­mo in open data (quin­di ricer­ca­bi­li, acces­si­bi­li, sca­ri­ca­bi­li, riu­ti­liz­za­bi­li… anche median­te API!) i dati del­le due gran­di fon­ti ori­gi­na­rie (Fortress Europe di Gabriele Del GrandeThe fatal rea­li­ties of for­tress euro­pe del­la United for Intercultural Action), oltre che i nostri. Ma pub­bli­chia­mo anche i dati su cui di vol­ta in vol­ta si basa­no i nostri hac­ka­thon, l’ultimo è quel­lo che si è tenu­to al Festival Internazionale del Giornalismo di Perugia.

Giornalismo e trasparenza

La moti­va­zio­ne che ci spin­ge a lan­cia­re que­sto pro­get­to spe­ri­men­ta­le di data­ba­se jour­na­li­sm è l’esigenza di tra­spa­ren­za rispet­to al nostro lavo­ro: voglia­mo con­di­vi­de­re le basi dati sul­le qua­li pro­du­cia­mo le nostre inchie­ste gior­na­li­sti­che per abi­li­ta­re cit­ta­di­ni e col­le­ghi a un vero fact-chec­king e affin­ché chiun­que pos­sa even­tual­men­te riu­sa­re i dati. Ci sem­bra oppor­tu­no (se non dove­ro­so) anche in rela­zio­ne al nostro lavo­ro di atti­vi­sti nel movi­men­to Open Data ita­lia­no e spe­ria­mo che tut­to ciò ser­va da sti­mo­lo anche per altri sog­get­ti che lavo­ra­no nel mon­do dell’informazione, che a nostro giu­di­zio dovreb­be­ro dotar­si di stru­men­ti ana­lo­ghi per dimo­stra­re mag­gio­re tra­spa­ren­za rispet­to ai pro­pri con­te­nu­ti.

Ma c’è anche altro: la tema­ti­ca open data riguar­da per la mag­gior par­te la Pubblica Amministrazione, ma non può e non deve esau­rir­si lì, per­ché le poten­zia­li­tà insi­te nell’apertura dei dati esi­sto­no per tut­ti i tipi di dati, non solo quel­li di pro­ve­nien­za sta­ta­le. E il gior­na­li­smo digi­ta­le, in par­ti­co­la­re quel­lo data-dri­ven, pro­du­ce una gran quan­ti­tà di data­set, che per defi­ni­zio­ne han­no un valo­re gior­na­li­sti­co (e quin­di socia­le) mol­to ele­va­to (non si rischia la fon­ta­nel­li­te, insom­ma). Ma c’è una pecu­lia­ri­tà, che dif­fe­ren­zia i gior­na­li­sti dagli ammi­ni­stra­to­ri pub­bli­ci: qua­si mai il gior­na­li­sta che lavo­ra su una serie di dati e vi estrae una sto­ria è anche il tito­la­re di quei dati. Lo è pro­ba­bil­men­te del data­set fina­le che costrui­sce a par­ti­re dai dati ori­gi­na­li, ma deve fare i con­ti con la licen­za di rila­scio e riu­ti­liz­zo dei dati pri­ma­ri, quan­do c’è.

La que­stio­ne giu­ri­di­ca è di pri­ma­ria impor­tan­za: rac­col­go dati da varie fon­ti, li con­trol­lo e li vali­do, li incro­cio e li ana­liz­zo, estrag­go e rac­con­to noti­zie… ma se quei dati ori­gi­na­ri non sono open data in par­ten­za? Quali sono i palet­ti attor­no ai qua­li pos­so muo­ver­mi e agi­re? Cosa pos­so ripub­bli­ca­re, a qua­li con­di­zio­ni e con qua­li licen­ze? Rilasciare dati gior­na­li­sti­ci può quin­di esse­re un’occasione pre­zio­sa per pub­bli­ca­re non solo dati, ma anche le indi­ca­zio­ni giu­ri­di­che che li riguar­da­no.

I partner del progetto: CIRSFID e Twinbit

Un pro­get­to come dati​.data​ni​n​ja​.it non potreb­be nem­me­no esse­re pen­sa­to sen­za una squa­dra che aggre­ghi alme­no tre com­pe­ten­ze: gior­na­li­sti­ca, giu­ri­di­ca e tec­no­lo­gi­ca. È per que­sto che que­sta ini­zia­ti­va spe­ri­men­ta­le pog­gia sul con­tri­bu­to e il sup­por­to del CIRSFID, il Centro Interdipartimentale di Storia del Diritto, Filosofia e Sociologia del Diritto e Informatica Giuridica dell’Università di Bologna, e di Twinbit, i maghi ita­lia­ni di Drupal. Per appro­fon­di­re c’è l’ampia pagi­na About e quel­la dedi­ca­ta alla par­te Legal. Per qual­sia­si comu­ni­ca­zio­ne e segna­la­zio­ne, inve­ce, c’è un como­do modu­lo di con­tat­to: fate­ci sape­re cosa ne pen­sa­te e soprat­tut­to come pen­sa­te di riu­ti­liz­za­re i dati! 🙂

Alessio Cimarelli

Alessio Cimarelli

Data scientist at Dataninja
Sono giornalista free-lance, data scientist e sviluppatore web. Dopo la lau­rea in fisica all’Università Sapienza di Roma, ho con­se­guito il master in Comunicazione della Scienza alla SISSA di Trieste e ho comin­ciato a girare l’Italia, tra gior­na­li­, uffici stampa e ricerca pura. Sono co-fondatore di dataninja.it e datamediahub.it e attualmente collaboro con varie testate ita­liane (Wired, L'Espresso, Secolo XIX) e alcune agen­zie edi­to­riali in ambito di data jour­na­lism e svi­luppo web. Sono mem­bro della comu­nità Spaghetti Open Data e ormai scrivo quasi più in java­script e python che in ita­liano o inglese.
Alessio Cimarelli