Il calcio sotto i riflettori su data​jour​na​li​sm​.it

This post is also avai­la­ble in: Inglese

Il mon­do del­lo sport è pie­no di nume­ri e nume­ret­ti e sta­ti­sti­che di ogni tipo, alla base di robe come il cal­cio mer­ca­to, le scom­mes­se, il fan­ta­cal­cio… Qualche tem­po fa io e Gianluca De Martino, cono­sciu­to all’interno di quel bell’esperimento che è Data Wired, abbia­mo mes­so insie­me un po’ di idee che ci frul­la­va­no in testa e svi­lup­pa­to un modo non con­ven­zio­na­le di ana­liz­za­re e visua­liz­za­re i rap­por­ti tra le squa­dre del cam­pio­na­to ita­lia­no.

A set­tem­bre ho affron­ta­to il tema cal­cio ana­liz­zan­do per Data Wired il mer­ca­to esti­vo. Per visua­liz­za­re acqui­sti e ces­sio­ni ho adot­ta­to la meta­fo­ra del­la rete e usa­to un dia­gram­ma a cor­da (chord dia­gram) che risul­ta­va com­pat­to e piut­to­sto usa­bi­le per esplo­ra­re un data­set ampio come quel­lo del cal­cio­mer­ca­to (oltre 2000 even­ti tra tra­sfe­ri­men­ti in entra­ta e usci­ta per serie A e B).

Poi ho avu­to modo di ragio­na­re su un tema appar­te­nen­te a tutt’altro ambi­to, quel­lo cine­ma­to­gra­fi­co: un film è com­po­sto da atto­ri, gli atto­ri si sono for­ma­ti su altri film… ne può veni­re fuo­ri una rete di atto­ri lega­ti dai film fat­ti insie­me (se non cono­sce­te l’Oracolo di Kevin Bacon… cor­re­te a stu­dia­re!), ma anche una rete di film col­le­ga­ti dagli atto­ri che ne han­no costi­tui­to il cast (tec­ni­ca­men­te si chia­ma­no pro­ie­zio­ni di gra­fi bipar­ti­ti). Non vado oltre, per­ché in teo­ria c’è un mio pez­zo in pub­bli­ca­zio­ne su que­sto… 😉

Poi Gianluca ha fat­to due più due e mi ha pro­po­sto di svi­lup­pa­re que­sta idea anche in ambi­to spor­ti­vo, appli­can­do­la, nean­che a dir­lo, al mon­do del cal­cio ita­lia­no (nostra comu­ne pas­sio­ne, tifia­mo pure la stes­sa squa­dra). Così è nato “La rete nel pal­lo­ne”, appe­na pub­bli­ca­to su data​jour​na​li​sm​.it.

  • juventus
  • roma
  • inter
  • fiorentina
  • lazio
  • napoli2
  • milan2

L’idea di fon­do è intui­ti­va. Ogni squa­dra è com­po­sta da una rosa di gio­ca­to­ri. Ogni gio­ca­to­re è il frut­to del­la pro­pria sto­ria per­so­na­le. Professionalmente ogni pre­sen­za fat­ta in car­rie­ra lo ha for­ma­to e ne ha fat­to quel­lo che è oggi. In una car­rie­ra, lun­ga o bre­ve che sia, le varie maglie indos­sa­te han­no lascia­to un segno, han­no con­tri­bui­to alla for­ma­zio­ne del gio­ca­to­re. Quindi una squa­dra capi­ta­liz­za le espe­rien­ze di tut­ti i pro­pri gio­ca­to­ri e attra­ver­so di essi è lega­ta a tut­te le altre squa­dre che li han­no for­ma­ti nel pas­sa­to.

Nel pez­zo fac­cia­mo l’esem­pio di Andrea Pirlo: oggi è nel­la Juventus, ma nel­la sua car­rie­ra ha mili­ta­to nel Brescia, nell’Inter, nel­la Reggina e nel Milan, col­le­zio­nan­do un nume­ro diver­so di pre­sen­ze per ogni squa­dra (nel­la Reggina ci è sta­to 6 mesi, nel Milan 10 anni!). Queste quat­tro squa­dre sono quin­di lega­te alla Juventus attra­ver­so Pirlo, in manie­ra più o meno for­te in base al nume­ro di pre­sen­ze col­le­zio­na­te dal gio­ca­to­re in ognu­na.

Generalizzando que­sto discor­so a tut­ti i gio­ca­to­ri in rosa e con­si­de­ran­do non tan­to le pre­sen­ze asso­lu­te, ma la quo­ta di pre­sen­ze per squa­dra sul tota­le, si può costrui­re una rete per ogni club che evi­den­zia il con­tri­bu­to in espe­rien­za del­le altre squa­dre a quel­la in esa­me. La loro distan­za da quest’ultima è pro­por­zio­na­le alla quo­ta di par­ti­te gio­ca­te con quel­la maglia dai cal­cia­to­ri in esa­me duran­te la loro car­rie­ra.

In coda a que­sto post pote­te sfo­glia­re le set­te reti che abbia­mo pro­dot­to per Juventus, Roma, Inter, Fiorentina, Lazio, Napoli, Milan, men­tre nel pez­zo ci sono con­si­de­ra­zio­ni più spe­ci­fi­che per ogni squa­dra.

Trovare i dati del­le car­rie­re dei gio­ca­to­ri (qua­si 200) non è sta­to dif­fi­ci­le, tra Gazzetta del­lo Sport, Wikipedia e altre fon­ti (tro­va­te tut­ti det­ta­gli su data​jour​na​li​sm​.it). Tutti in (s)comode tabel­le HTML, tira­te giù con DataMiner. Per ana­liz­zar­li son basta­te oppor­tu­ne tabel­le pivot per aggre­ga­re le pre­sen­ze per squa­dra. Poi Gephi ha fat­to il resto, con il Force Layout per otte­ne­re una distan­za tra i nodi pro­por­zio­na­le al peso degli archi. Infine una ritoc­ca­ti­na gra­fi­ca con Inkscape… et voi­là! Buona let­tu­ra!

Alessio Cimarelli

Alessio Cimarelli

Data scientist at Dataninja
Sono giornalista free-lance, data scientist e sviluppatore web. Dopo la lau­rea in fisica all’Università Sapienza di Roma, ho con­se­guito il master in Comunicazione della Scienza alla SISSA di Trieste e ho comin­ciato a girare l’Italia, tra gior­na­li­, uffici stampa e ricerca pura. Sono co-fondatore di dataninja.it e datamediahub.it e attualmente collaboro con varie testate ita­liane (Wired, L'Espresso, Secolo XIX) e alcune agen­zie edi­to­riali in ambito di data jour­na­lism e svi­luppo web. Sono mem­bro della comu­nità Spaghetti Open Data e ormai scrivo quasi più in java­script e python che in ita­liano o inglese.
Alessio Cimarelli