next up previous contents
Next: 1.2.3 La Commission d'Informatique Up: 1.2 Petit historique Previous: 1.2.1 L'état au moment

1.2.2 L'attente des biologistes

De la communauté pasteurienne émanait une demande diffuse de meilleurs moyens techniques et de plus d'assistance humaine pour « l'analyse de séquences ». Tout le monde se rendait bien compte qu'il y avait urgence, et même que l'on frisait le ridicule par rapport à l'état de l'art international. Il y avait bien sûr des chercheurs parfaitement au fait de la réalité désignée par ces mots, mais pour d'autres c'était quelque-chose de mystérieux, rendu nécessaire par l'évolution des exigences des comités de lecture, mais qui ne faisait pas vraiment partie de leur métier de biologistes. Il n'est pas inutile de rappeler l'état d'esprit de cette population mal informée.

Pour beaucoup, la vision de l'avenir meilleur attendu, où leurs séquences seraient analysées, ressemblait à une salle de bureau de poste où derrière les guichets se tiendraient des ingénieurs compétents et disponibles. Les biologistes viendraient apporter leurs séquences sur des disquettes ou des bouts de papier, les donneraient aux ingénieurs qui n'auraient plus qu'à « faire l'analyse ». D'ailleurs à la réflexion on pourrait imaginer de sonner les ingénieurs au téléphone, ce seraient eux qui se dérangeraient ce serait mieux. Cette vision n'est pas une lubie : elle m'a souvent été dépeinte, et beaucoup de ceux à qui je l'ai proposée ironiquement m'ont fait part de leur enthousiasme et de leur désir de la voir réalisée.

Cette vision n'a jamais été réalisée et ne le sera jamais pour une foule de raisons parmi lesquelles deux ou trois que je vais exposer brièvement à l'intention du lecteur peu informé des réalités de la biologie moléculaire.

Le chercheur traditionnel en biologie moléculaire étudie, par exemple, un gène dans un organisme. Pour ce faire il effectue des manipulations longues et complexes (cela peut se compter en mois de travail) qui lui permettent d'obtenir des fragments d'ADN qu'il va séquencer. Tout ceci se passe à la paillasse (en « phase humide »).

Une fois la séquence obtenue, les logiciels de comparaison de séquences vont permettre de la comparer aux séquences des banques pour savoir si on ne vient pas de séquencer un fragment déjà connu du génome de l'organisme étudié, ou si ce fragment n'est pas similaire à un fragment déjà connu d'un autre organisme. D'autres programmes détectent les « régions codantes » et les gènes dans les séquences. Ce ne sont que des exemples, bien d'autres types d'analyses peuvent être entreprises.

Le problème est que ces analyses ne sont pas simples. Les séquences à comparer ne sont pas exactement égales, elles ont une certaine similarité qu'il s'agit d'apprécier au moyen de logiciels. Ceci se paramètre, et selon les valeurs des paramètres les résultats diffèrent. Bref, c'est un travail de recherche, et la recherche doit être faite par les chercheurs. L'idée de porter ses séquences à l'analyse comme ses chemises au pressing est anti-scientifique.

Qu'il s'agisse de la prédiction de séquences codantes, de recherches d'éléments régulateurs dans le génome, de mesure de similitudes entre des séquences, de recherche de motifs particuliers etc, de nombreux programmes informatiques existent, qui produisent des solutions (d'exactitude et de validité variables) à des questions variées. Ces programmes mettent en \oeuvre des méthodes de calcul et reposent sur des modèles et hypothèses biologiques implicites lors de l'utilisation des programmes. Les méthodes de calcul peuvent être exactes ou heuristiques, et de nature purement algorithmique (reposant sur une formalisation précise du problème et de la procédure de calcul) ou probabiliste. Pour évaluer la signification d'un résultat, soupçonner l'existence de faux-positifs ou faux-négatifs, il est nécessaire de connaître les méthodes de calcul mises en oeuvre par les programmes. La connaissance des modèles et hypothèses biologiques incorporés dans les programmes est fondamentale pour donner un sens biologique à l'interprétation des résultats. De façon à correctement choisir le programme approprié et les paramètres adéquats en réponse à un problème particulier dans un cadre scientifique précis, il importe donc de connaître parfaitement ces programmes. Il peut également être opportun de modifier ou d'adapter un programme en fonction de la problématique ou de l'organisme considéré... b.

Une autre source de malentendu tient à l'estimation de la quantité de travail nécessaire à l'analyse classique d'une séquence : le biologiste qui n'a jamais fait lui-même une telle analyse croit volontiers que deux heures suffisent, où souvent il y faut trois semaines. Il est difficile de tomber d'accord à partir de telles divergences. Bien sûr la minorité déjà lancée dans l'analyse de séquences avait d'autres exigences : disposer des logiciels classiques (à l'époque surtout Staden et GCG), avoir des mises à jour plus fréquentes des banques. Mais l'ampleur des malentendus relatifs à la nature du travail d'analyse de séquences et à la nature de l'informatique montrent qu'aux missions évoquées plus haut s'en ajoutera une autre, préalable : un travail d'éducation culturelle pour convaincre les Pasteuriens de l'existence de l'informatique et leur procurer quelques lumières sur sa nature et ses pouvoirs.

Mais aussi, si l'on veut que les biologistes fassent eux-mêmes leurs analyses de séquences, encore faut-il leur donner les moyens de le faire, notamment des logiciels adaptés à l'usage d'un être humain normal, ce qui est loin d'être le cas général pour les programmes issus de la recherche. D'où l'importance du travail signalé déjà de spécification et de développement d'interfaces.

Mais, avant même cela, bien peu imaginaient l'ampleur et la complexité du travail à accomplir pour créer la condition préalable à toute installation et utilisation de banques de séquences et de logiciels d'analyse et à toute éducation informatique : doter l'Institut Pasteur d'un système informatique, d'un réseau de campus et d'un accès à l'Internet dignes de ce nom.



Footnotes

... considéré...b
Cet alinéa est emprunté à un texte de Frédérique Galisson.

next up previous contents
Next: 1.2.3 La Commission d'Informatique Up: 1.2 Petit historique Previous: 1.2.1 L'état au moment