Comparaison multiple de graphes appliquée aux peptides non-ribosomiaux

[see all job offers] [English version]

Equipe de Recherche

Equipe de bio-informatique SEQUOIA
LIFL, Université Lille 1 / INRIA Lille Nord-Europe

L'équipe SEQUOIA développe des algorithmes et des logiciels pour l'analyse de séquences biologiques: ADN, ARN, protéine. Ses thèmes d'expertise sont l'alignement de séquences, les ARN noncodants, les peptides non ribosomiaux, l'organisation des génomes, la génomique comparative.

Encadrement

Maude Pupin [www]
maude.pupin [@] lifl.fr, 03 59 57 79 19

Thèmes : bio-informatique, algorithmique des graphes, peptides non-ribosomiaux

Durée : 4 à 6 mois (stage financé). Début du stage en 2010. Candidatures ouvertes.

Pré-requis : connaissances de base en algorithmique requises. Connaissances préalables en bioinformatique souhaitées mais pas indispensables.

Contexte scientifique

Les peptides non-ribosomiaux (NRP = NonRibosomal Peptides) sont synthétisés par des complexes enzymatiques appelés synthétases (refs 1 et 2). Ces peptides présentent une grande variété de structures, ils peuvent être linéaires, branchés, cycliques voire polycycliques. De plus, ils sont composés d'acides aminés non protéogéniques (plus de 500 ont été recensés jusqu'à présent). Les peptides NRP possèdent des propriétés biologiques variées telles que antibiotique, immunosuppresseur, chélateur de métaux, ... et ont des applications dans de nombreux domaines. L'équipe Sequoia, en collaboration avec le laboratoire ProBioGem de l'USTL, a développé une base de données, appelée Norine (cf ref 3), recensant ces peptides. Cette ressource est unique, aucun autre site ne dispose d'autant d'informations sur ces peptides. Elle offre différents outils permettant l'analyse et la manipulation des peptides NRP : recherche d'un peptide via les annotations, un motif structural ou une composition en monomère ; visualisation de structures 2D de peptides et dessin d'un peptide à l'aide d'un éditeur.

Sujet du stage

Du fait de leur structure non linéaire, nous représentons les peptides non-ribosomiaux à l'aide de graphes étiquetés, non orientés. Les noeuds représentent les acides aminés incorporés dans les peptides, et les étiquettes le nom de ces acides aminés. Une arête symbolise une liaison chimique entre deux acides aminés.
Nous avons déjà développé un algorithme efficace de recherche d'un motif structurel au sein d'un ensemble de peptides (cf ref 4). Cet algorithme a été adapté pour effectuer une comparaison de deux peptides.
Le but de ce stage est d'étendre la comparaison de deux graphes représentants des peptides à la comparaison de plusieurs graphes en même temps. Cette comparaison multiple sera limitée à des graphes relativement semblables ce qui permettra de réduire considérablement l'espace de recherche.
Pour commencer, l'étudiant étudiera les familles de peptides disponibles dans la base de données Norine afin de recenser les différents cas de figure qui peuvent être rencontrés. Cela permettra de définir les erreurs que l'algorithme devra prendre en compte.
Ensuite, l'étudiant passera à la conception puis au développement d'un algorithme de comparaison multiple de graphes, prenant en compte les contraintes définies précédemment.

Références bibliographiques

  1. D. Konz, M. Marahiel. How do peptide synthetases generate structural diversity ? Chemistry & Biology, 1999, 6 (2), R39-R48
  2. H. Mootz, D. Schwarzer, M. Marahiel. Ways of assembling complex natural products on modular nonribosomal peptide synthetases. ChemBioChem, 2002, 3(6), 490-504
  3. Ségolène Caboche, Maude Pupin, Valérie Leclère, Arnaud Fontaine, Philippe Jacques, and Gregory Kucherov. NORINE: a database of nonribosomal peptides. Nucleic Acids Research, 2008, 36, D326-D331
  4. Ségolène Caboche, Maude Pupin, Valérie Leclère, Philippe Jacques and Gregory Kucherov. Structural pattern matching of nonribosomal peptides. BMC Structural Biology 2009, 9:15