Plan de Gestion de Données

Un Plan de Gestion de Données (PGD) décrit comment traiter les données pendant et au-delà de la durée de vie d’un projet. Il aide à formaliser les processus et les conditions selon lesquels le traitement des données est planifié systématiquement et susceptible d’être réutilisé. Plusieurs modèles de PGD sont proposés par les financeurs de projet de recherche qui demandent à ce qu’ils soient réalisés selon des processus prédéfinis.

Qu’est-ce qu’un Plan de Gestion des Données

Un plan de gestion des données (PGD) est un document qui décrit les données à prévoir ou à générer au cours d’un projet de recherche, la façon comment les gérer, les décrire, les analyser et les stocker et les mécanismes à déployer à la fin du projet pour partager et conserver les données de recherche obtenues. En d’autres termes, les PGD concernent la collecte, l’organisation, l’utilisation, le stockage, la contextualisation, la préservation et le partage des données de recherche. Ils concentrent les ressources, identifient les responsabilités et mettent en évidence les problèmes potentiels de partage et de conservation à long terme des données de recherche. Plus concrètement, un PGD peut envisager des solutions avant que les problèmes potentiels ne deviennent des obstacles insurmontables à la préservation et au partage des données à long terme.

Les PGD sont recommandés, voire exigés, par les bailleurs de fonds qui en font un instrument de contrôle de la qualité des données utilisées et produites par un programme de recherche, raison pour laquelle il est préférable pour un porteur de projet de recherche d’y réfléchir à l’avance plutôt que d’avoir à réagir et à improviser vers la fin d’un projet avec la pression supplémentaire de temps et d’argent pour faire valider le projet.

 

En France, les PGD font partie de la stratégie nationale française pour la Science Ouverte, mise en place en 2018. Ils ont une visée pratique dans l’accompagnement des chercheurs pour la prise en compte des enjeux de la Science Ouverte dans chacune des sections de leur proposition détaillée.

Structure d’un PGD

Un plan de gestion de données typique comprend quatre chapitres :

  1. Collecte de données et documentation : Il s’agit d’indiquer comment les données sont-elles générées et quelles données sont réutilisées, comment les données seront-elles documentées, quelles métadonnées sont nécessaires pour décrire suffisamment et ainsi comprendre les données.

  2. Problèmes d’éthique, juridiques et de sécurité : Il s’agit d’identifier les données soumises à des droits personnels ou à des droits d’auteur, de préciser s’il y a d’autres contrats légaux à respecter, de préciser si les données sont modifiées d’une manière anonyme et si elles peuvent être partagées.

  3. Stockage et conservation des données : Il s’agit de donner des précisions sur comment et où sont stockées les données, à quelle fréquence les sauvegardes sont-elles effectuées et par qui.

  4. Partage et réutilisation des données : Décrire comment et où les données sont partagées, qui est autorisé à y accéder et comment les données sensibles sont protégées.

 

Source : FAIR Data Managementin Horizon 2020

Modèle PGD Horizon 2020

Il existe différentes formes de PGD de recherche et les exigences varient considérablement selon les bailleurs de fonds, l’envergure du projet, etc. Parmi les exemples courant, ceux de la National Science Foundation (NSF) ou de l’Interuniversity Consortium for Political and Social Research (ICPSR) et celui du programme de recherche européen Horizon 2020.

Horizon 2020 ou H2020 est le programme européen pour la recherche et le développement pour la période 2014-2020. Les bénéficiaires d’Horizon 2020 rendent leurs données de recherche identifiables, accessibles, interopérables et réutilisables (Findable, Accessible, Interoperable and Re-usable/FAIR) pour garantir leur bonne gestion.

Le modèle PGD Horizon 2020 intègre les informations suivantes :

  • Le traitement des données de recherche pendant et après la fin du projet
  • Les données à collecter, traiter et / ou à générer
  • La méthodologie et les normes à appliquer
  • Les données à partager / à rendre libres d’accès
  • Les données à conserver (y compris après la fin du projet).

 

Des outils de conception

Les outils de conception de PGD sont souvent des services Web qui utilisent des modèles (templates) construits selon des rubriques répondant aux critères (FAIR : identifiables, accessibles, interopérables et réutilisables) définis par des bailleurs de fonds.

DMP OPIDoR est l’un des outils en ligne qui aide à la création de PGD dans le domaine de l’Enseignement Supérieur et de la Recherche. Il est hébergé et géré par l’INIST-CNRS. Basé sur le code open source DMP Roadmap, il a été adapté aux besoins de la communauté scientifique française.

DMP OPIDoR permet aux services d’accompagnement à la gestion des données de la recherche de guider les chercheurs par l’apport de conseils et d’exemples. Il facilite la coordination entre les acteurs de l’écosystème des données (chercheurs, informaticiens, juristes, centres de données, infrastructures de recherche, etc. et participe à la mise en œuvre des politiques de données des institutions ou communautés disciplinaires par l’ajout de modèles de DMPs adaptés et facilite l’harmonisation des bonnes pratiques communautaires[1].

Source : Digital Repository of Ireland

Les modèles de DMP sont proposés par les financeurs ou par les organisations de recherche, disponibles dans DMP OPIDoR :

  • Modèle de PGD de l’Agence nationale de la recherche (ANR) en France : L’ANR demande l’élaboration d’un Plan de Gestion des Données pour les projets financés à partir de 2019. Elle participe ainsi à l’alignement européen et international en faveur de la structuration et de l’ouverture des données de la recherche.

  • Modèle PGD Horizon 2020 :  Les projets doivent soumettre une première version du PGD (comme livrable) dans les 6 premiers mois du projet. Il est nécessaire de mettre à jour le PGD pendant la durée du projet chaque fois que des modifications significatives interviennent. La Commission européenne fournit un modèle de PGD dont l’usage est recommandé mais non obligatoire

  • Modèle PGD du CIRAD :

  • Modèle PGD CC-IN2P3 : Le Centre de Calcul de l’Institut national de physique nucléaire et de physique des particules du CNRS. Ce modèle est générique et vise à renforcer le processus de planification de la gestion du cycle de vie des données de recherche. Il ne fait pas référence à des technologies ou des services spécifiques. L’objectif principal est d’encourager une réflexion globale sur les différents aspects de la gestion des données de recherche à travers un ensemble de questions organisées en 4 sections: Description générale du projet, Gestion des ensembles de données, Cadre juridique et éthique, Stockage et conservation à long terme.

  • Modèle PGD ERC (European Research Council) : Le Conseil européen de la recherche (ERC) est basé sur les « Directives sur la gestion des données FAIR dans H2020 » de la Commission Européenne, version 3.0. 26.07.2016, Annexe1

  • Le modèle DCC (Digital Curation center) : ce modèle est conçu pour aider les chercheurs à définir les rôles et les responsabilités concernant leurs données, à identifier les risques qui surviennent aux points de transition et à assurer une chaîne de possession appropriée et sûre pour les données numériques.

Les avantages pour les chercheurs de créer un DMP

Rappelons qu’il y a plusieurs avantages de l’utilisation d’un PGD, rappelons :

  • Efficacité: Un PGD augmente l’efficacité du travail sur toute la durée du projet (garantir la récupérabilité, éviter la perte de données), car il définit comment, sur la durée, les données doivent être stockées en toute sécurité et éventuellement partagées. Un PGD engendre un gain de temps lorsque les données sont faciles à trouver et à comprendre.

  • Sécurité: un PGD permet d’éviter les risques en matière de droit d’auteur en définissant qui peut avoir accès à quelles données et comment les données sensibles sont protégées.

  • Citations: Un PGD Permet la réutilisation et l’augmentation de la fréquence de citation des résultats de recherche grâce à l’utilisation d’identifiants persistants (par exemple le DOI), la fourniture de données dans des référentiels, et la réutilisation de ses propres données par d’autres chercheurs.

  • Crédibilité: Un PGD permet d’améliorer sa propre crédibilité et sa confiance dans les autres publications lorsque les données sont librement accessibles ou quand au moins le DMP publié montre comment les données ont été générées et gérées.

Quelques conseils pratique pour préparer un PGD :

Pour rédiger un bon PGD, la précision est de rigueur. En voici quelques conseils :

  1. Préparer le DMP dans un style adressé à des chercheurs qui seront les lecteurs essentiels du projet, mais aussi pour des experts techniques qui connaissent les pratiques de gestion des données en vigueur dans le domaine concerné et qui éventuellement évalueront le projet soumis au financement.
  2. Les détails du PGD devraient être proportionnés à la complexité de l’étude, aux types de données gérées, à leur valeur à long terme et aux exigences de sécurité des données prévues. Un PGD peut ainsi aller en longueur d’un quart de page à 3 ou 4 pages A4.
  3. Viser la précision sans trop entrer dans les détails encombrants. Parmi les exemples de précision à respecter : comment les données peuvent-elles être découvertes par d’autres chercheurs, comment l’accès est géré, comment et par qui la sécurité des données est assurée, quelles sont les normes de référence utilisées par exemple pour la collecte et le codage des données, la sécurité de l’information, l’échange de métadonnées, etc.

 [1] DMP OPIDoR : https://opidor.fr/planifier/

___________________________

Sources recommandées :

–   Briney, K. (2015). Data Management for Researchers : Organize, maintain and share your data for research success. Pelagic Publishing Ltd.
–   Féret, R., Bracco, L., Cheviron, S., Lehoux, E., Arènes, C., & Li, L. (2020). Améliorer les chances de succès de son projet ANR grâce à la Science Ouverte. https://doi.org/10.5281/zenodo.3741666
–   FNS. (s. d.). Data Management Plan (DMP)—Directives pour les chercheuses et chercheurs. Fond National Suisse de la recherche Scientifique. http://www.snf.ch/fr/leFNS/points-de-vue-politique-de-recherche/open_research_data/Pages/data-management-plan-dmp-directives-pour-les-chercheuses-et-chercheurs.aspx
–   Modèles de DMP. (s. d.). Consulté à l’adresse https://dmp.opidor.fr/public_templates
–   Odeh, S. (2017). Les données de la recherche : Transformation ou transmission du métier de documentaliste. I2D Information, donnees documents, Volume 54(4), 4‑7.
–   Plan de Gestion de Données -. (s. d.). Consulté à l’adresse https://data.ird.fr/plan-de-gestion-de-donnees/
–   Université Paris Descartes—Réaliser un plan de gestion de données. (s. d.). Consulté à l’adresse https://hal-descartes.archives-ouvertes.fr/page/data-management-plan

 


 

Vous aimerez aussi...