Analyse de données multi-modales pour les Pathologies complexes par la conception et l’implémentation de Protocoles Reproductibles et Réutilisables

L’étude de pathologies telles les anévrismes intracrâniens nécessite l’utilisation d’une grande variété de données et la conception de protocoles d’analyse complexes. La diversité de leurs implémentations rend leur maintenance et partage difficile et limite la confiance des biologistes dans les données produites. Reproduire et réutiliser les protocoles est pourtant crucial pour comparer systématiquement les résultats biologiques, adapter des protocoles à de nouvelles problématiques et répondre aux exigences des plans de gestion de données. R2-P2 fournit (i) une large bibliothèque de protocoles organisés, (ii) un module de conception et d’exécution de protocoles reproductibles, réutilisables et citables (conception d’algorithmes d’indexation et de recherche efficace de motifs dans les graphes formés par les workflows implémentant les protocoles), (iii) une évaluation de l’approche sur de nouveaux jeux de données et (iv) un ensemble de critères FAIR pour les protocoles.

By Lucie Biton

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.0 France License.

Objectifs du projet

R2-P2 a un double objectif (i) concevoir un cadre pour la conception, l’implémentation, et l’exécution de protocoles d’analyse de données reproductibles et réutilisables pour l’étude des anévrismes intracrâniens et (ii) démontrer l’intérêt de cette approche en ré-utilisant et adaptant les protocoles obtenus en (i) sur des données générées dans de nouveaux projets. Sur le plan informatique, R2-P2 apporte des solutions concrètes à la définition de protocoles FAIR, avec un focus sur les composantes R (réutilisation des protocoles) et F (indexation des protocoles). Les contributions informatiques attendues seront relatives à la conception i) d’algorithmes d’indexation et de recherche efficace de motifs dans les graphes formés par les workflows et ii) la conception et l’implémentation d’outils d’aide à la réutilisation (et à la citation) de workflows. Sur le plan applicatif, R2-P2 fournit des solutions concrètes pour documenter automatiquement les données produites par les protocoles annotés, tel qu’attendu dans un Data Management Plan. R2-P2 fournit un cadre d’échange de protocoles compréhensibles par les pairs, il démontrera sa capacité à réutiliser et adapter facilement des protocoles complexes développés dans un projet sur les données d’un nouveau projet.

Partenaires

Bilan de la première année

Publications et exposés des équipes du projet