dATI E METADATI DELLA RICERCA
Per DATI DELLA RICERCA si intendono tutte le informazioni, in qualsiasi formato, che sono state raccolte, osservate, generate e utilizzate al fine di validare i risultati della ricerca stessa.
A titolo meramente esemplificativo sono da intendersi dati della ricerca: risultati (positivi o negativi) di tutti gli esperimenti rilevanti per la ricerca, fatti, osservazioni, esperienze, fonti edite e inedite, riferimenti bibliografici, software e codice, testi, oggetti del presente o del passato, raccolti o creati in formato digitale e/o cartaceo, utilizzati come fonti primarie per la ricerca.
I dati della ricerca possono essere espressi in formato numerico, descrittivo, audio o video. Possono essere grezzi o elaborati.
I PRINCIPI FAIR
Tra il 2014 e il 2016 un gruppo di esperti, composto da ricercatori, enti finanziatori, editori e istituzioni di ricerca ha elaborato alcuni principi (che non costituiscono uno standard) per garantire un uso ottimale dei dati della ricerca (qualità della ricerca, riutilizzo, migliori servizi, conservazione a lungo termine ecc.).
I DATI DELLA RICERCA "APERTI" devono essere gestiti secondo i principi individuati nell'acronimo FAIR: Findable, Accessible, Interoperable, Reusable)
RINTRACCIABILI
Il primo passo per poter riutilizzare i dati è quello di poterli rintracciare.
A tal fine, dati e metadati devono essere associati a un identificatore unico e duraturo. Trai più comuni è oggi lo standard DOI - Digital Object Identifier, la cui indicazione tra i metadati è obbligatoria nel caso di pubblicazioni, dati e metadati nell’ambito dei progetti finanziati con fondi europei. Inoltre, dati e metadati devono essere registrati e indicizzati in una fonte che ne consenta la ricerca.
Infine, i dati e i metadati devono essere resi facilmente leggibili sia dalle persone sia dalle macchine. In particolar modo, l’impiego di metadati descritti in un linguaggio macchina è fondamentale per la ricerca automatica di set di dati e servizi.
ACCESSIBILI
I dati o almeno i loro metadati devono poter essere accessibili dagli esseri umani e dalle macchine anche attraverso sistemi di autenticazione e autorizzazione (non è necessario che i dati depositati siano open access) mediante l'uso di protocolli standard, evitando l’utilizzo di protocolli proprietari.
I dati e i loro metadati devono essere, quindi, depositati in archivi o repository che li rendano possibilmente persistenti nel tempo e rintracciabili in rete. Quando i dati non siano open access è possibile implementare sistemi di autenticazione e autorizzazione, ma almeno i metadati dovrebbero rimanere sempre disponibili in open access.
INTEROPERABILI
I dati devono poter essere combinati e utilizzati insieme con altri dati o strumenti. Il formato dei dati deve pertanto essere aperto e interpretabile da vari strumenti, compresi altre basi di dati. Il concetto di interoperabilità si applica anche ai metadati. Ad esempio, i metadati dovrebbero utilizzare un linguaggio standardizzato e condiviso a livello internazionale dai diversi servizi di indicizzazione.
RIUTILIZZABILI
Sia i metadati, sia i dati devono essere descritti e documentati nel migliore dei modi, a garanzia della loro qualità e al fine di poter essere replicati e/o combinati in contesti diversi. Il trattamento dei dati dovrebbe conformarsi agli standard o ai protocolli riconosciuti dalle comunità scientifiche di riferimento.
La possibilità di riutilizzo dei metadati e dei dati dovrebbe essere esplicitamente indicata tramite l’attribuzione di una/o più licenze aperte.
I METADATI DELLA RICERCA sono informazioni strutturate relative ai dati che consentono di ricostruirne il senso, considerando il processo con cui il dato è stato costruito. Sono legati al ciclo di vita di una risorsa digitale.
Possono essere:
Metadati descrittivi - riguardano i dati fondamentali della risorsa. Nel caso della risorsa “libro” i metadati descrittivi sono rappresentati dai dati fondamentali dell’opera: titolo, autore, anno e luogo di pubblicazione.
Metadati strutturali - così come suggerisce il nome, rappresentano la struttura della risorsa digitale e la relazione tra le parti che la compongono: indicano il numero di capitoli, la loro lunghezza, le eventuali sezioni, con la finalità di dare una panoramica strutturale della risorsa.
Metadati amministrativi - descrivono le informazioni relative alla possibilità di accesso all’oggetto digitale, le licenze e diritti esercitati nonché gli utenti proprietari.
Nel caso di progetti finanziati da fondi europei i metadati amministrativi devono obbligatoriamente contenere l’indicazione del finanziamento e il titolo e il numero di progetto come riportati nel Grant Agreement.
Il formato di metadati più diffuso è il Dublin Core Metadata:
Il DATASET è un insieme di dati omogenei e strutturati in forma relazionale.
In quanto strutturati possono essere facilmente interrogabili e interpretabili da applicazioni di tipo diverso.