Ribo-DB

Le projet Ribo-DB est des projets phares de notre équipe, il implique 4 enseignants-chercheurs ou chercheurs, 2 ingénieurs et un doctorant.

Les protéines ribosomiques sont de plus en plus utilisées car leur nombre (90 protéines), la faible probabilité de transfert horizontaux, leurs caractéristiques évolutives en font des outils indispensables pour l'étude de l'évolution des organismes (phylogénie à large échelle ou à courte échelle évolutive). Par ailleurs ces protéines sont utilisées pour l'identidication en routine des bactéries pathogènes à l'aide de la spectrométrie de masse MALDI-TOF et sont aussi des cibles potentielles pour l'amplication par PCR dans des outils diagnostiques.

Aucune base de donnée généraliste (EMBL, GenBank) ne contient un ensemble exhaustif et validé des séquences de protéines. Après avoir développéun moteur d'identication de ces protéines utilisant des outils de reconnaissance de profil, des validations croisées et des rétro-validations de ces protéinesdans des génomes complets même non annotés, nous avons donc mis en ligne lapremière base de donnée de protéines des ribosomes au niveau mondial, Ribo-DB . L'article publié dans Molecular Biology and Evolution [Jauffrit et al., 2015].

Ce site utilise classACNUC, classe écrite en langage Python que j'ai développée avec Manolo Gouy pour interroger la base de séquences ribo-DB mais aussi les bases de données ACNUC de séquences de façon générique.

Dans l'équipe Ribo-DB je suis chargé des algorithmes d'exploitation de la base de données, mais aussi chargé de l'intégration générale et de l'organisation des serveurs. Je suis aussi en charge de la face applicative du projet et j'ai été à la base de l'implication de la société bioMérieux dans le projet (ANRT, Doctorat CIFRE de F. Jauffrit).

Outre le développement de ce projet et son déploiement nous allons pouvoir exploiter son contenu par des publications scientifiques. Nous avons en cours la réanalyse des relations évolutives des Actinobactéries (Figure ci-dessous) et au sein de cet ensemble du cas des Mycobactéries qui est médicalement important.

La compréhension de l'émergence des groupes les plus pathogènes (Mycobacterium tuberculosis et Mycobacterium leprae) va être abordé avec ce nouvel outil.

BIBI-DB

le projet BIBI a été initié en 2007-2008 est poursuivi et des améliorations constantes sont apportées. Il implique 3 enseignants-chercheurs ou chercheurs et un ingénieur.

Principe de construction

Les bases de données

Plusieurs bases de données consacrées à divers gènes sont intégrés dans BIBI-DB. Le plus important est le SSU-rDNA. D'autres sont des bases de données plus petites d'intérêt général (rpoB) et des bases de données qui sont pertinentes pour un spectre restreint de bactéries ou pour des applications de niche (par exemple, sodA, groEL2). Notez que d'autres bases de données consacrées à des applications ou des projets de recherche spécifiques sont également disponibles sur demande.

Les bases de données SSU ADNr ont cinq «saveurs» :