Après le DMP (data management plan) traduit en français par le PGD (plan de gestion des données), voici les critères F.A.I.R. Ils sont étroitement liés au DMP

Définition du sigle

Au niveau international, les interlocuteurs traitant de la recherche scientifique, que ce soient les chercheurs, les bailleurs de fonds, les éditeurs, ont désiré que les données de la Recherche soient lisibles et facilement réutilisables. Le FAIR Data en est le principe et permet de valoriser ces données dans des règles partagées par toute la communauté scientifique.

Force 11, groupe international composé de chercheurs, d’éditeurs, de sociétés savantes, d’universités, de bibliothécaires, d’archivistes, tous intéressés par l’avenir de la communication de la recherche scientifique, est chargé de porter le projet FAIR.

Mais que signifie FAIR ? En anglais, d’habitude, on l’utilise dans des expressions telles fair play pour désigner un comportement honnête dans le jeu et par extension dans les relations humaines. Or, le FAIR data implique que les données déposées par les chercheurs obéissent à des règles. La donnée scientifique déposée doit être « Facile à trouver, Accessible, Interopérable et Réutilisable » (en anglais : FindableAccessibleInteroperableReusable, d’où l’acronyme « FAIR »).

En Europe, le programme Horizon 2020 incite au FAIR data dans tous les projets scientifiques financés au moins par moitié par les fonds publics (subventions européennes, etc…). Les DMP rédigés par les unités de recherche lors de candidatures à des appels à projets scientifiques doivent être FAIR pour faciliter les échanges, le traitement, le stockage, la publication des données scientifiques en accès ouvert.

Les critères FAIR

Les principes FAIR

  • F comme Findable (facile à trouver)   

Pour être des  FAIR data, les données d’une recherche scientifique publiées en open access doivent être facilement retrouvables par tous les moteurs de recherche. Chercheuses, chercheurs, à vos mots-clés… Vous devez porter une attention particulière au choix de vos descripteurs ou mots-clés qui seront moissonnés par les moteurs de recherche.

En plus d’un choix cohérent et pertinent de mots-clés, votre travail doit être facilement identifié pour être retrouvé. Vous avez besoin d’un identifiant unique et pérenne pour vous et votre travail. Ce sont les ID que ce soit les Research Identifier tel ORCID par exemple et les Object identifier tel les DOI par exemple. Ces ID vous permettent de vous identifier et d’accéder à votre compte utilisateur sur une plateforme informatique. Cet identifiant unique et pérenne permet de faciliter l’archivage de vos données sur le long terme.

  • A comme accessible

Pour être des FAIR data, vos données doivent être facilement récupérables et en accès ouvert. Les métadonnées descriptives, administratives techniques de vos documents doivent rester disponibles selon des conditions juridiques définies et claires, grâce à l’usage des licences Creative Commons par exemple. Les métadonnées du document doivent rester accessibles même si l’ensemble des données ne l’est plus.

Si les données doivent subir une restriction de publication, il est recommandé de dire pourquoi et pour combien de temps en se référant aux embargos possibles.

Si les données ne sont accessibles que par l’utilisation d’un logiciel open source particulier, vous devez mettre le code source de ce logiciel à disposition sur une plateforme d’échange telle GitHub ou Zenodo. Préférez des plateformes de dépôt certifiées.

  • I comme interopérable

L’interopérabilité est la « capacité que possède un produit ou un système, […] à fonctionner avec d’autres produits ou systèmes existants ou futurs et ce sans restriction d’accès ou de mise en œuvre ». Cela implique que les contenus et les formats utilisés pour les données doivent respecter les grands standards internationaux ouverts en usage.

  • R comme réutilisable

La réutilisation des données doit pouvoir être permise et l’origine doit toujours être signalée.

Les métadonnées doivent être richement décrites :

  • descriptives ( nom, prénom, affiliation, mots -clés décrivant le document),
  • administratives ( adresse mail etc.),
  • techniques ( formats utilisés, poids etc.).

Ce principe du FAIR data doit pouvoir faciliter le data mining, c’est-à-dire la recherche par fouille de données à l’intérieur d’un document ou sur un ensemble de documents.

Le Big Data évolue très rapidement et devant la montée exponentielle des données, il est nécessaire d’organiser des dépôts cohérents, obéissant à des règles claires qui faciliteront ensuite le travail des ordinateurs lors de l’analyse de ces données bien structurées.

Ceux-ci analyseront les données, les mettront en relation, les lieront et produiront eux-mêmes du nouveau. C’est l’avènement de l’intelligence artificielle et l’accélération des processus d’innovation en science.


Le web 3.0

Les enjeux sont donc majeurs pour notre société et son évolution. La recherche scientifique avec l’accès ouvert aux données nous fait rentrer dans l’ère de la donnée, des données liées, du web sémantique et de l’intelligence artificielle.

C’est le web 3.0


DES QUESTIONS ?

Comment rendre vos données FAIR ?

Vous avez besoin de conseils pour rendre vos données FAIR ? Lisez ceci :
https://www.openaire.eu/how-to-make-your-data-fair


Comment choisir une licence ?

RDV sur le site de l’INRAE : https://www6.inra.fr/datapartage/Partager-Publier/Choisir-une-licence


Les données de la Recherche, c’est quoi ?1

« Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. » (OCDE, Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds publics, 2007)

Cette définition apparaît cependant trop restrictive en ce qu’elle exclut d’autres types de données : carnets de recherche, projets, rapports, etc.


Où déposer les données de la recherche ?2

Choisir un portail de données thématique

  • Le répertoire re3data.org recense les archives de données par discipline.
  • Le portail Zenodo

Si vous n’avez pas trouvé d’archive thématique appropriée, le projet OpenAIRE fournit une archive Zenodo qui peut être utilisée pour le dépôt des données de la recherche.

 

 

 

Mise à jour le 30/01/2020

Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution – Pas d’Utilisation Commerciale – Partage dans les Mêmes Conditions 4.0 International.

References