dATI E METADATI DELLA RICERCA

Per DATI DELLA RICERCA si intendono tutte le informazioni, in qualsiasi formato, che sono state raccolte, osservate, generate e utilizzate al fine di validare i risultati della ricerca stessa.

A titolo meramente esemplificativo sono da intendersi dati della ricerca: risultati (positivi o negativi) di tutti gli esperimenti rilevanti per la ricerca, fatti, osservazioni, esperienze, fonti edite e inedite, riferimenti bibliografici, software e codice, testi, oggetti del presente o del passato, raccolti o creati in formato digitale e/o cartaceo, utilizzati come fonti primarie per la ricerca.

I dati della ricerca possono essere espressi in formato numerico, descrittivo, audio o video. Possono essere grezzi o elaborati.

I PRINCIPI FAIR

Tra il 2014 e il 2016 un gruppo di esperti, composto da ricercatori, enti finanziatori, editori e istituzioni di ricerca ha elaborato alcuni principi (che non costituiscono uno standard) per garantire un uso ottimale dei dati della ricerca (qualità della ricerca, riutilizzo, migliori servizi, conservazione a lungo termine ecc.).

I DATI DELLA RICERCA "APERTI" devono essere gestiti secondo i principi individuati nell'acronimo FAIR: Findable, Accessible, Interoperable, Reusable)

RINTRACCIABILI

Il primo passo per poter riutilizzare i dati è quello di poterli rintracciare.

A tal fine, dati e metadati devono essere associati a un identificatore unico e duraturo. Trai più comuni è oggi lo standard DOI - Digital Object Identifier, la cui indicazione tra i metadati è obbligatoria nel caso di pubblicazioni, dati e metadati nell’ambito dei progetti finanziati con fondi europei. Inoltre, dati e metadati devono essere registrati e indicizzati in una fonte che ne consenta la ricerca.
Infine, i
dati e i metadati devono essere resi facilmente leggibili sia dalle persone sia dalle macchine. In particolar modo, l’impiego di metadati descritti in un linguaggio macchina è fondamentale per la ricerca automatica di set di dati e servizi.

ACCESSIBILI

I dati o almeno i loro metadati devono poter essere accessibili dagli esseri umani e dalle macchine anche attraverso sistemi di autenticazione e autorizzazione (non è necessario che i dati depositati siano open access) mediante l'uso di protocolli standard, evitando l’utilizzo di protocolli proprietari.
I dati e i loro metadati devono essere, quindi, depositati in archivi o repository che li rendano possibilmente persistenti nel tempo e rintracciabili in rete. Quando i dati non siano open access è possibile implementare sistemi di autenticazione e autorizzazione, ma almeno i metadati dovrebbero rimanere sempre disponibili in open access.

INTEROPERABILI

I dati devono poter essere combinati e utilizzati insieme con altri dati o strumenti. Il formato dei dati deve pertanto essere aperto e interpretabile da vari strumenti, compresi altre basi di dati. Il concetto di interoperabilità si applica anche ai metadati. Ad esempio, i metadati dovrebbero utilizzare un linguaggio standardizzato e condiviso a livello internazionale dai diversi servizi di indicizzazione.

RIUTILIZZABILI

Sia i metadati, sia i dati devono essere descritti e documentati nel migliore dei modi, a garanzia della loro qualità e al fine di poter essere replicati e/o combinati in contesti diversi. Il trattamento dei dati dovrebbe conformarsi agli standard o ai protocolli riconosciuti dalle comunità scientifiche di riferimento.
La possibilità di riutilizzo dei metadati e dei dati dovrebbe essere esplicitamente indicata tramite l’attribuzione di una/o più licenze aperte.

I METADATI DELLA RICERCA sono informazioni strutturate relative ai dati che consentono di ricostruirne il senso, considerando il processo con cui il dato è stato costruito. Sono legati al ciclo di vita di una risorsa digitale.


Possono essere:

  • Metadati descrittivi - riguardano i dati fondamentali della risorsa. Nel caso della risorsa “libro” i metadati descrittivi sono rappresentati dai dati fondamentali dell’opera: titolo, autore, anno e luogo di pubblicazione.

  • Metadati strutturali - così come suggerisce il nome, rappresentano la struttura della risorsa digitale e la relazione tra le parti che la compongono: indicano il numero di capitoli, la loro lunghezza, le eventuali sezioni, con la finalità di dare una panoramica strutturale della risorsa.

  • Metadati amministrativi - descrivono le informazioni relative alla possibilità di accesso all’oggetto digitale, le licenze e diritti esercitati nonché gli utenti proprietari.
    Nel caso di progetti finanziati da fondi europei i metadati amministrativi devono obbligatoriamente contenere l’indicazione del finanziamento e il titolo e il numero di progetto come riportati nel Grant Agreement.

Il formato di metadati più diffuso è il Dublin Core Metadata:

Il DATASET è un insieme di dati omogenei e strutturati in forma relazionale.

In quanto strutturati possono essere facilmente interrogabili e interpretabili da applicazioni di tipo diverso.