Précédent Suivant Index

Avec quel logiciel écrire votre thèse ?





Parfois nous recevons au SIS la visite d'un chercheur éploré : pour une raison mystérieuse le texte de sa thèse dont il a déjà tapé 150 pages est soudain devenu illisible. Il avait bien une copie de secours, mais dans l'affolement de manoeuvres de récupération désespérées elle a subi le sort de l'original. Et plus d'une fois il a fallu tout retaper : pleurer fut alors légitime.

Qu'était-il arrivé ? L'auteur malheureux n'avait commis aucune fausse manoeuvre, le système du Mac était sain. Simplement en créant un gros document avec sans doute des insertions de figures et d'autres éléments graphiques il avait atteint une limite interne de Word, ce qui avait irrémédiablement perturbé la cohérence du document.

Comme le format de ces documents n'est pas publié et qu'il change à chaque version du logiciel il n'y avait rien à faire. Simplement, la répétition de telles mésaventures suggère l'intérêt de la question du choix du logiciel pour écrire ses documents de travail, et, le logiciel choisi, de la méthode à adopter pour obtenir, sans désastre et en un délai raisonnable, le document voulu avec une présentation décente.

Les logiciels disponibles

Le présent article ne constitue pas un examen systématique et approfondi de tous les logiciels envisageables pour rédiger des thèses ou des articles scientifiques, un gros volume n'y suffirait pas. Il se propose seulement d'attirer l'attention du lecteur sur l'existence de plusieurs logiciels utilisables à l'Institut Pasteur et sur la possibilité donc d'un choix, puis de suggérer quelques critères de choix, enfin de donner pour la réalisation du document quelques conseils indépendants du logiciel choisi.

Les unités de l'Institut Pasteur peuvent acquérir dans des conditions tarifaires relativement favorables les droits d'usage des logiciels Microsoft Word pour Windows ou Macintosh, AppleWorks pour Macintosh, Adobe FrameMaker pour Macintosh, Windows ou Unix. LATEX est disponible gratuitement pour les systèmes Unix, les Macintosh et Windows. L'auteur de ces lignes estime que tous ces logiciels sont utilisables.

Les critères de choix

Les thèses et articles scientifiques ont des exigences de présentation particulières qui influent le choix du logiciel : ces documents comportent des figures, des tableaux, des notes en bas de page ou en fin de document, des références et des annexes bibliographiques, des formules mathématiques ou chimiques, des index, des tables des matières, de multiples parties, chapitres et sections éventuellement contenus dans des fichiers distincts. Le choix d'un logiciel doit tenir compte de l'aptitude à produire ces éléments.

Les documents rédigés par les chercheurs font l'objet d'échanges par courrier électronique ainsi que de publication sur le WWW. Ils doivent donc être faciles à transporter, à relire sur un autre ordinateur et à traduire au format HTML. Ils doivent incorporer des documents d'origines diverses que le logiciel de réalisation doit pouvoir importer.

Le prix est à prendre en compte d'un point de vue économique et aussi parce qu'il est plus facile de demander à un correspondant désireux de relire votre document d'installer un logiciel s'il est gratuit que s'il coûte cher. La taille des documents n'est pas indifférente.

Facile ou efficace

La facilité d'apprentissage et d'usage est un critère. L'écriture d'une thèse est un travail de longue haleine, il convient de prendre en considération le temps d'apprentissage moyen sur toute la période : certains logiciels permettent d'obtenir immédiatement des résultats approximatifs et font perdre beaucoup de temps ensuite pour composer des documents gros et complexes, d'autres nécessitent un apprentissage initial important qui permet ensuite l'obtention commode de meilleurs résultats.

Le problème de l'apprentissage est celui de l'automatisation : la production automatique d'une mise en page régulière, d'une table des matières, d'un index demande une formulation qui s'apparente à la programmation et ce n'est pas facile, mais une fois que c'est fait le temps gagné est considérable. De plus, la régularité des éléments de texte produits automatiquement permet leur traduction ultérieure, par exemple en HTML, alors que les éléments produits « à la main » directement avec les menus déroulants d'un logiciel wysiwyg9 seront dépourvus des balises10 qui permettraient au logiciel de traduction de structurer le document selon le voeu de l'auteur.

Nous pourrions résumer la distinction entre approche wysiwyg et approche programmatique par un aphorisme de Marc Baudoin : dans le premier cas le logiciel « voit » le document, dans le second il le « comprend ». Comprendre est plus difficile mais plus puissant.

L'esthétique ne doit pas être négligée, une mise en page laide dessert le propos du texte. En fait l'habitude que nous avons de la lecture et de l'écriture nous masque l'extrême complexité du document imprimé. Feuilleter quelques manuels élémentaires de typographie comme ceux dont le lecteur trouvera les références à la fin de cet article ne sera sûrement pas du temps perdu. Depuis l'avènement du traitement de texte nous sommes tous devenus des typographes amateurs dramatiquement dépourvus de compétence, et il n'y a pas de honte à combler au moins nos principales lacunes.

On notera que les conventions typographiques sont culturelles et qu'elles diffèrent pour composer des textes en français, en anglais ou dans une autre langue. Le manuel [Bau97] indique les principales différences à prendre en considération. Le manuel [Imp90] mentionne en outre les différences propres à la mise en page.

Examen des espèces

Microsoft Word

Ce logiciel est le plus connu et beaucoup pensent que son emploi est inévitable pour pouvoir communiquer avec le reste du monde. En fait plusieurs autres logiciels sont capables de relire un document composé avec Word, qui lui-même est capable de sauvegarder un document en format texte simple ou, en conservant les mises en forme, au format RTF plus propice aux échanges et qui offre l'avantage important d'être immune aux virus macros.

Même si Word est loin d'être notre logiciel préféré, il convient de dire qu'il comporte les principales fonctions nécessaires à la composition d'une thèse, mais qu'elles sont trop ignorées des utilisateurs. Le mode plan et la structuration en document-maître et sous-documents permet d'éviter de tout avoir dans un énorme document unique, source de catastrophes. Les notes en bas de page, les tables des matières, les index peuvent être traités correctement. Les feuilles de style de paragraphes et de caractères permettent une présentation systématique. Seulement Word n'invite pas vraiment à utiliser ces possibilités.

On peut taper sa thèse avec Word mais pour cela il faut bien connaître le logiciel, ce qui est rarement le cas. Il faut dire qu'en tant qu'objet de connaissance Word est rebutant, et qu'il est conçu pour engendrer l'illusion que l'on peut s'en servir sans lire la documentation, ce qui est faux.

Le principal inconvénient de Word, c'est la politique de son éditeur : versions successives de plus en plus encombrantes et incompatibles entre elles qui imposent pratiquement leur achat systématique, ce qui a un coût financier mais aussi en temps perdu à réapprendre, en feuilles de style à refaire, etc. Comme les formats de fichier changent avec les versions, si la secrétaire de votre unité passe à une nouvelle version vous êtes, en pratique, condamné à faire de même. Bien sûr il est toujours possible de sauvegarder un document au format d'une version précédente, mais le logiciel en dissuade et émet des messages équivoques qui mènent finalement au format récent et incompatible.

L'Institut Pasteur bénéficie de tarifs préférentiels pour ce logiciel, qui est compatible avec EndNote[Nil99].

Nous n'avons jamais vu de beau document produit par Word mais cela existe peut-être.

AppleWorks

AppleWorks est un logiciel de la catégorie de Microsoft Office avec traitement de texte, tableur, outils de dessin et de création de transparents ou diapositives [99].Tant qu'à utiliser un logiciel de ce type, celui-ci est plus sobre, moins cher, moins lourd, en un mot il mérite un essai d'autant plus qu'il est capable de relire les documents Word.

L'Institut Pasteur bénéficie de tarifs préférentiels pour ce logiciel, qui est compatible avec EndNote.

StarOffice

Ce logiciel encore peu connu est une imitation aussi fidèle que possible (techniquement et légalement) de Microsoft Office, avec l'avantage supplémentaire d'être disponible sous Linux et Solaris. Ainsi si vous convertissez votre PC de Windows à Linux vous pourrez relire vos documents Word ainsi que les pièces jointes sous ce format dont vous accablent de nombreux correspondants. Plus d'information ici : http://www.stardivision.com/office/body.html .

Le SIS a commandé la licence de StarOffice pour tout le campus, lorsque nous aurons reçu le CD-ROM il sera à la disposition des utilisateurs. La version 5.0 semble bien améliorée par rapport à la précédente.

Adobe FrameMaker

Voici un vrai logiciel de composition de documents que des imprimeurs professionnels utilisent pour de vrais livres. C'est dire qu'avec lui vous ne risquez pas de manquer de la fonction dont vous avez besoin. Il comporte notamment d'excellents outils de dessin, alors que ceux de Word sont pour le moins limités. Les numéros 5 à 11 du B6 ont été composés avec lui et faire la même chose avec un simple logiciel de traitement de texte aurait été très pénible.

Tout dans FrameMaker[Ado99] est conçu pour réutiliser systématiquement des mises en forme régulières, que ce soit des niveaux de titre ou des maquettes de page. Pour reprendre la distinction ci-dessus, c'est un logiciel wysiwyg mais qui se prête à une utilisation programmatique. Les documents produits sont de petite taille et parfaitement compatibles entre Unix, Macintosh et Windows. Il est possible de composer des formules mathématiques bien plus satisfaisantes qu'avec un traitement de texte. Le logiciel peut créer des pages HTML à partir du document, mais une intervention manuelle peut être utile.

L'apprentissage de FrameMaker est un peu laborieux mais rentable. Il y a un expert local (Daniel Azuelos). Une fois que l'on a acquis un peu de maîtrise c'est d'assez loin de tous les logiciels examinés ici celui qui permet de travailler le plus vite (à notre avis). Un essai sur central ne coûte rien : ouvrir une fenêtre X, taper imaker &, cliquer sur « Nouveau », puis sur « Portrait » puis sur « Aide », se mettre en contact avec Daniel (dan@pasteur.fr).

L'Institut Pasteur bénéficie de tarifs préférentiels pour ce logiciel, qui est compatible avec EndNote.

LATEX

TeX est un logiciel de composition de documents créé par Donald Knuth [Knu84] et LATEX est un système complémentaire destiné à en faciliter l'usage.

Avec LATEX (qui a servi à composer le texte que vous avez sous les yeux) nous pénétrons dans un autre monde : au lieu d'avoir affaire à un logiciel qui présente à l'écran une image plus ou moins exacte de ce qui s'imprimera et qui nous invite à modifier à la souris ce qui ne convient pas, nous écrivons notre texte avec un éditeur comme Emacs en le truffant de commandes de formatage ou balises, puis nous soumettons le fichier ainsi créé à un traducteur LATEX qui produira un fichier imprimable. Par exemple la fin de l'alinéa précédent, le titre de section et le début de celui-ci s'écrivent ainsi :

L'Institut Pasteur bénéficie de tarifs 
préférentiels pour ce logiciel, qui est 
compatible avec \emph{EndNote}.

\subsubsection*{{\LaTeX}}

{\TeX} est un logiciel de composition 
de documents créé par Donald Knuth 
et {\LaTeX} est un système...
Le début du document ressemble à ceci :

\documentclass[a4paper,10pt,twoside]{article}
\usepackage{graphicx}
\usepackage{multicol}
\usepackage{bibunits}
\usepackage{french}
\usepackage{url}
Vous pourrez sans doute deviner qu'ainsi nous demandons à LATEX de composer notre article pour du papier au format A4 en corps 10 avec des pages recto--verso. Nous utiliserons des extensions (packages) qui permettent d'inclure des graphiques, d'avoir plusieurs colonnes de texte par page, les références bibliographiques à la fin de chaque article plutôt qu'à la fin du volume, de respecter les conventions de la typographie française et d'afficher convenablement les URL's.

Bref, toutes les options qu'avec les logiciels évoqués plus haut on sélectionne d'un coup de souris sont ici mentionnées par l'écriture d'une commande insérée dans le texte, généralement à l'endroit où elle doit faire effet. De ce fait, au lieu de deviner la façon de déclencher une mise en forme en déroulant les menus et en cliquant sur les entrées prometteuses, il faut l'avoir apprise dans un livre.

C'est toute la difficulté de commencer à travailler avec LATEX, il faut commencer par apprendre un certain nombre de choses avant de s'en servir. Moyennant quoi, si l'on veut de bons résultats et si on fait le bilan au bout d'un an, la somme de choses qu'il aura fallu apprendre avec LATEX ou avec FrameMaker sera très comparable. L'acquisition de ces connaissances n'est pas une épreuve gratuite, elle correspond peu ou prou à la compétence typographique minimum nécessaire pour produire un texte lisible.

S'il rend le début d'apprentissage pénible, le système de commandes en ligne de LATEX a des avantages. Le fichier source de votre document contient du texte simple que vous pouvez éditer sur un Minitel de chez votre grand-mère. Les connaissances acquises ont vocation à être matérialisées dans des macro-instructions, c'est à dire des séquences de commandes stockées dans un fichier et que vous pourrez réutiliser, alors que se remémorer une séquence de clics de souris est difficile. Une belle collection de macro-instructions mérite le titre d'extension, que l'utilisateur charge s'il en a besoin. Certaines extensions sont des styles destinés à modifier la présentation du document, par exemple pour respecter les conventions typographiques d'une langue ou d'une revue.

LATEX a un avantage qui, il faut bien le dire, peut devenir un inconvénient : concevoir des macro-instructions est un peu programmer, se piquer au plaisir de ce jeu risque de retarder la soutenance.

Il existe une vaste communauté d'adeptes de LATEX qui créent des extensions, des styles et d'autres outils et les mettent gracieusement à la disposition du public pour le bienfait de l'humanité, à l'exemple de Donald Knuth. Citons, parmi beaucoup, Bernard Gaulle, auteur du style french [Gau99], Christophe Pythoud, auteur d'un dictionnaire français [Pyt99] utilisé pour la vérification orthographique, Marie-Paule Kluth, auteur d'une FAQ [Klu99] où celui qui écrit ces lignes a trouvé réponse à la plupart des nombreuses questions qui se sont posées à lui au fil de l'usage de LATEX et Yannis Haralambous, infatigable auteur de polices, de styles et de moteur TeX permettant l'usage des langues et des systèmes d'écriture les plus variés.

Pour ajouter des figures à un document LATEX on peut inclure du PostScript encapsulé. Le logiciel Xfig permet de créer des dessins et de les sauvegarder dans ce format. Il y a un expert LATEX à l'Institut Pasteur (Marc Baudoin).

Bibliographie

Tous les logiciels wysiwyg évoqués ici peuvent exploiter une base de références EndNote. Avec LATEX le plus efficace est d'utiliser le logiciel BibTeX pour constituer la base de références. La philosophie est cohérente avec celle de LATEX, la base est en texte ASCII avec des commandes.

Traduction HTML

Tous les logiciels wysiwyg évoqués ici peuvent sauvegarder un document en HTML. Plusieurs outils traduisent du LATEX en HTML, comme LATEX2HTML [Dra99] ou HeVeA [Mar99]. On gardera néanmoins à l'esprit que tous ces logiciels produisent des pages HTML qui demandent une mise au point plus ou moins manuelle parce que l'éventail de mises en forme possibles sur papier n'est pas le même que sur le WWW et qu'il n'y a donc pas de traduction mot à mot possible.

Conclusion

Tous les logiciels évoqués dans cet article vous permettront de rédiger votre thèse à une condition : que vous preniez la peine de bien les apprendre, précaution généralement négligée en vertu de l'adage micro--informatique qui veut qu'un bon logiciel s'utilise sans lire la documentation et auquel nous opposerons l'injonction unixienne RTFM (Read the f...ing manual). Il vous est maintenant loisible de choisir. En ce qui nous concerne nous hésiterions entre FrameMaker et LATEX.



Laurent Bloch



Édité par :
Service Informatique Scientifique
Institut Pasteur
28 rue du Docteur Roux
75724 Paris CEDEX 15
Tél. : +33 (1) 45 68 85 10
Fax. : +33 (1) 40 61 30 80
Câble : mcb@pasteur.fr

Les contributions et suggestions
sont à adresser à :
Laurent Bloch   bloch@pasteur.fr
Directeur de la publication :
Maxime Schwartz
ISSBN : 1244-524 X

Copyright © Institut Pasteur






Précédent Suivant Index