Les laboratoires dont l'activité principale est une activité de génomique sont supposés posséder les compétences en informatique pour réaliser de façon autonome l'essentiel du travail lié à leurs projets. Notre interaction avec ces laboratoires se conçoit alors d'une part comme une aide à la définition des besoins informatiques lors de la mise en place des projets, et d'autre part sous forme d'assistance et de collaborations pour les aspects relevant de compétences en administration des systèmes informatiques, et de la mise en place de bases de données sur les serveurs de l'Institut Pasteur.
L'activité de la société Hybrigenics créée au printemps dernier, consiste à appliquer de façon industrielle l'approche développée au sein du LMA, permettant d'établir des cartes d'interactions entre protéines par la technique de « double-hybride ». Son application à des banques génomiques d'expression conduit en effet à la mise en évidence de réseaux d'interactions entre protéines. À l'échelle de toutes les protéines potentiellement exprimées à partir d'un génome entier, cette approche génère un grand nombre de données expérimentales dont l'analyse, le traitement et la gestion nécessitent des développements informatiques spécifiques.
La collaboration avec le LMA sur ce thème a commencé en 1997. Il s'agit d'un travail de développement d'un outil informatique permettant dans un premier temps d'automatiser le traitement que doivent subir les données brutes issues des expériences (séquences partielles correspondant aux protéines interagissant) pour générer une information plus élaborée (identification dans le génome, dont la séquence est connue, des éléments génétiques correspondant à ces protéines). Ce programme a été mis au point sur les données du génome de la levure Saccharomyces cerevisiae et le travail actuel de Nicolas Joly porte sur son extension aux cas d'autres génomes (aux formats de données différents), plus particulièrement celui d'Helicobacter pylori. Les informations primaires ainsi obtenues (hypothèses quant à l'identité des protéines interagissant) doivent alors être interprétées en relation avec d'autres données expérimentales pour aboutir à une classification des interactions protéine-protéine en fonction de différents critères. Nous avons participé à l'étape de formalisation préalable au développement d'un programme implantant les règles d'interprétation des résultats expérimentaux, ainsi qu'à la définition du cahier des charges correspondant au développement complet du logiciel qui permettra ce traitement des résultats et leur organisation dans une base de données. Les développements informatiques correspondants devraient être réalisés, en interaction avec Nicolas Joly, par des informaticiens que le LMA et Hybrigenics devraient recruter prochainement.