Istituto Italiano di Tecnologia

di Valentina Pasquale

I dati come componente fondamentale della ricerca scientifica

La scienza, come è risaputo, si basa su esperimenti, evidenze e dati che vengono raccolti e che, se condivisi nel modo corretto, moltiplicano le possibilità di essere utili e utilizzati.

In questo lungo periodo di quarantena, mi sono trovata spesso a seguire mia figlia di 8 anni nei compiti scolastici. Ѐ stata l’occasione per riscoprire a distanza di quasi 30 anni, attraverso i suoi occhi, che le maestre insegnano come prima cosa ai bambini che i problemi si risolvono a partire dai “dati” e quando i dati mancano è impossibile arrivare ad una soluzione. Una verità basilare che spesso si dimentica andando avanti negli studi più avanzati e che mai come in quest’ultimo periodo si è resa ancor più evidente.

L’attualità infatti porta a riflettere sulla necessità di avere a che fare con dati completi, accurati e pubblici per affrontare l’emergenza Coronavirus e per la tutela della nostra salute. Soltanto attraverso un’analisi il più possibile estesa dei dati sanitari ed epidemiologici raccolti in questi mesi infatti, si può sperare di arrivare a conclusioni sempre più certe sull’efficacia dei trattamenti farmacologici e sulla loro dipendenza dalle patologie pregresse e dal decorso della malattia, per trovare una cura valida ancor prima che un vaccino.

I dati sono la componente fondamentale su cui si basa la ricerca scientifica. Quasi sempre si producono nuovi dati a partire da quelli precedenti, in un processo incrementale di costruzione della conoscenza. Anche per questo motivo i dati della ricerca devono essere conservati e, quando possibile, condivisi pubblicamente, al fine di rendere la scienza sempre più aperta, riproducibile e affidabile.

Questo scenario alla Commissione Europea è ben noto. I dati della ricerca sono al centro dell’innovazione e permetteranno di vincere le grandi sfide del presente, come la pandemia in atto, e del futuro, come il cambiamento climatico e l’economia sostenibile. Il successo sarà determinato dall’unione di esperienze diverse che valicano i confini nazionali e da tecnologie in sinergia fra loro. Per questo si è reso necessario costruire uno spazio virtuale dove i ricercatori possano mettere a disposizione della comunità i propri dati in sicurezza e accedere a loro volta ai dati di altre discipline, producendo nuove idee, nuove scoperte, nuove soluzioni e nuove cure.

Questo ambiente si chiamerà European Open Science Cloud (EOSC) e diventerà l’infrastruttura nella quale i ricercatori contribuiranno con i loro dati in modo “FAIR”, nell’accezione inglese di “giusto, equo”. FAIR è anche l’acronimo che stabilisce come i dati, ancor prima che aperti, dovranno essere rintracciabili (Findable), accessibili (Accessible), interoperabili (Interoperable) e riutilizzabili (Reusable) per l’uomo e per le macchine. Molta speranza, infatti, è riposta nell’intelligenza artificiale al servizio della scienza e della medicina, necessaria per riconoscere schemi e “pattern” in enormi quantità di dati che per questo devono essere omogenei nei loro formati e accompagnati da tutte le informazioni per renderli leggibili e interpretabili dalle macchine.

L’emergenza sanitaria di oggi rende cruciale velocizzare questo processo e dare una spinta per arrivare prima possibile ad una forma embrionale di EOSC dove condividere e mettere a fattor comune i dati della ricerca su Covid-19, in modo che siano pronti all’uso per tutte le applicazioni di AI.

In linea con la sua vocazione di avanguardia anche IIT sta investendo nella direzione dei FAIR data impegnandosi a costruire un servizio istituzionale di supporto ai ricercatori nella gestione dei dati. A livello internazionale, IIT contribuisce alla cooperazione fra centri di competenza prendendo parte a GO FAIR, un’iniziativa mirata a gettare le basi per la costruzione di EOSC attraverso reti di collaborazione fra scienziati, enti finanziatori, industrie, esperti di data management, focalizzate su tre pilastri fondamentali: infrastrutture informatiche, formazione e cambiamento culturale. Recentemente, proprio al fine di far fronte comune per affrontare l’emergenza Sars-Cov-2, GO FAIR si è unita alle altre tre più grandi organizzazioni attive nel mondo – Research Data AllianceCODATA e World Data Systems – nel consorzio Data Together condividendo attività e obiettivi al fine di arrivare ad una reale e fattiva condivisione dei dati della ricerca su Covid-19, il prima possibile.


*Valentina Pasquale è Research Data Management Specialist di IIT


L’articolo è stato precedentemente pubblicato sul magazine IIT OpenTalk https://opentalk.iit.it/non-ce-scienza-senza-dati/

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.