Alléger le noyau ! - [Site WWW de Laurent Bloch]

À l’heure du Cloud et des processeurs multi-cœurs :

Alléger le noyau !

Operating System Kernel Debloating

Article mis en ligne le 14 juin 2022

dernière modification le 25 juin 2022

par Laurent Bloch

Sommaire

Les ordinateurs et les systèmes d’exploitation gaspillent des ressources
Réduire l’encombrement et la consommation du système d’exploitation
Une nouvelle méthode basée sur QEMU
Langages gloutons, langages sobres

Les ordinateurs et les systèmes d’exploitation gaspillent des ressources

Les ordinateurs contemporains sont dotés de processeurs multi-cœurs (c’est-à-dire en fait de multiprocesseurs) bien trop puissants pour la plupart des usages ordinaires, hormis certains jeux vidéo. La mémoire disponible est également pléthorique. C’est un peu moins vrai pour les serveurs de l’informatique professionnelle, mais là aussi les limites drastiques d’il y a quelques décennies sont oubliées. Alors les auteurs de logiciels, et plus particulièrement les éditeurs de systèmes d’exploitation, ont pris l’habitude de s’étaler. À quoi bon lire un fichier de données ligne par ligne, alors qu’il suffit de le charger d’un bloc en mémoire ? Il en va de même pour les bases de données, etc. Et c’est encore bien pire pour le noyau (kernel) du système d’exploitation, qui, lui, doit rester en permanence en mémoire réelle (par opposition à mémoire virtuelle). Sur la machine que j’utilise pour saisir ce texte, le noyau (vmlinuz-5.15.0-37-generic) fait plus de 11 millions d’octets, auxquels il convient d’ajouter les quelques 62 millions d’octets d’initrd.img qui contient toutes sortes de bricoles nécessaires au démarrage du système, et qui une fois décompressé par unmkinitramf en occupe quand même 195 millions (merci à Papy Tux pour les détails).

Les utilisateurs avaient pris l’habitude de ne pas se soucier de ces gaspillages : après tout, les systèmes d’exploitation contemporains savent diminuer la fréquence d’horloge d’un processeur s’il n’est pas très chargé, et le mettre en veille s’il ne fait rien. Mais avec l’infonuagique (Cloud Computing) et les préoccupations relatives à l’environnement, cela est en train de changer, tant pour le système d’exploitation que pour les programmes d’application. Étant entendu que depuis déjà au moins deux décennies l’économie d’énergie est au cœur des préoccupations des concepteurs de processeurs, avec des résultats spectaculaires obtenus principalement par la miniaturisation des composants.

Réduire l’encombrement et la consommation du système d’exploitation

En des temps (non encore révolus) où le gaspillage de ressources n’était pas un souci, les éditeurs de systèmes d’exploitation, par souci de commodité pour l’utilisateur, livraient des configurations dotées de toutes les fonctionnalités imaginables. En effet, une configuration plus ascétique aurait risqué de provoquer l’échec d’une application, ce genre de situation est difficile à résoudre par l’utilisateur de base, et déclenche des appels au service support, ce qui coûte plus cher que l’ajout de quelques méga-octets au système installé préconfiguré sur l’ordinateur livré. Mais les temps d’opulence ont une fin !

Si l’on utilise un système d’exploitation tel que Windows, on n’a guère de moyens de réduire son empreinte mémoire. Il est plus facile d’agir sur un système ouvert, dont Linux est le spécimen le plus répandu. Le système Linux comporte une partie fixe, le noyau, qui réside en permanence dans la mémoire de la machine (virtuelle ou réelle), des modules chargeables à la demande en fonction des besoins des programmes d’applications, puis des programmes annexes et des bibliothèques de fonctions invoqués en tant que de besoin. Si l’on veut obtenir un système léger, facile à transporter par le réseau pour une exécution en 50 exemplaires dans les nuages à l’autre bout de la planète, le noyau est le premier élément à alléger.

En principe, Linux vient avec tous les outils désirables pour configurer un noyau adapté à ses applications : on peut choisir les modules dont on a besoin et écarter les autres. Simplement, comme le souligne Daniel Lohmann, de l’université Leibniz de Hannovre, commentateur de l’article, il faut choisir parmi plus de 17 000 modules, autant dire qu’à la main c’est impossible.

Plusieurs méthodes d’automatisation ont été tentées : elles consistent à faire fonctionner les applications désirées, à enregistrer les traces du comportement du système pendant l’exécution, à analyser ces traces et à construire un noyau réduit aux seules fonctions dont on aura repéré l’activation dans les traces. Ces méthodes reposent sur la fonction ftrace, qui comme son nom l’indique permet d’analyser le comportement du système par l’instrumentation au niveau du noyau et d’examiner :

– les appels systèmes ;
– les fonctions de traitement d’interruption ;
– les fonction d’ordonnancement ;
– les piles réseau.

Cela semble judicieux, mais malheureusement les résultats ont été décevants. Ils ont rencontré les obstacles suivants :

– ftrace ne permet pas de savoir quel code est chargé par le noyau pendant la phase de boot du système, de ce fait le noyau construit à partir de ces observations risque de ne pas fonctionner, ou de ne pas permettre le fonctionnement des applications envisagées. Les auteurs ont mesuré que 79 % des dispositifs optionnels du noyau ne pouvaient être détectés que pendant la phase de boot.
– Ces méthodes demandent beaucoup de temps, ce qui décourage les utilisateurs.
– ftrace donne des informations au niveau de la fonction, alors qu’il serait utile de descendre à un niveau plus fin.
– On ne peut jamais être sûr que le jeu d’essai soit complet.

Entre parenthèses, les questions soulevées ici expliquent que les éditeurs fassent le choix de ratisser large et d’en mettre plutôt trop que pas assez !

Une nouvelle méthode basée sur QEMU

Un article du numéro de mai 2022 des Communications of the ACM [1] intitulé Set the Configuration for the Heart of the OS : On the Practicality of Operating System Kernel Debloating, écrit par Hsuan-Chi Kuo, Jianyan Chen, Sibin Mohan, et Tianyin Xu, accessible en version préliminaire ici, aborde le problème à nouveaux frais, pour contourner les obstacles mentionnés ci-dessus.

Le principe de leur méthode d’allègement du noyau, implémentée dans le framework COZART, peut se résumer (à grands traits) ainsi :

– Pour effectuer le profilage du noyau, COZART fonctionne au-dessus de QEMU (COZART n’est pas utilisé en production, c’est un appareil de mesure). QEMU est un émulateur qui permet de faire fonctionner des machines virtuelles, qu’elles soient d’architecture identique à celle de la machine hôte, ou d’une architecture différente.
– Comme COZART tourne dans la machine hôte, il peut observer le boot de la machine virtuelle qui fait tourner le jeu d’essai.
– Comme il tourne au-dessus de QEMU, et que QEMU fournit des outils de trace au niveau de l’instruction machine, COZART permet des observations plus fines que les méthodes antérieures.
– La connaissance des adresses des instructions exécutées permet (au prix sans doute d’un travail minutieux considérable) d’identifier précisément les sections de code noyau utilisées par les applications.
– Des observations obtenues comme indiqué ci-dessus les auteurs déduisent une configuration d’un noyau fonctionnel, stable et capable de faire fonctionner les applications considérées.

Selon les applications, sous Linux, COZART permet de gagner 14 % sur le temps de boot et 4 mégaoctets sur la taille du noyau. Le temps de calcul pour obtenir ce réultat se compte en dizaines de secondes. Un approfondissement de la démarche permet des gains encore plus grands, cf. l’article.

Tout cela est bien sûr plus compliqué que ce que suggère le résumé succinct ci-dessus, et l’article expose d’autres détails passionnants, accessibles ici. Les auteurs ont appliqué leur méthode pour construire des noyaux destinés à des machines virtuelles pour les hyperviseurs KVM et Xen, ainsi qu’à une machine hôte pour Docker, à des machines virtuelles pour AWS et au micro-noyau sécurisé L4Re/Fiasco.

La version d’auteur de l’article est accessible en ligne ici.

Un article précédent de ce site présentait une autre méthode de construction de machines virtuelles allégées, parce qu’adaptées à une application particulière et débarrassées des fonctions que cette application n’utilise pas, MirageOS : machines virtuelles compilées à la demande avec le système d’exploitation et l’application.

Langages gloutons, langages sobres

Certains langages ont été conçus sans aucun souci de sobriété. Il en va ainsi de Python, conçu pour écrire de petits scripts destinés à ordonnancer les programmes qui font les calculs, écrits dans des langages plus efficaces (cf. Biopython), et à cet usage il excelle. Mais Python est utilisé aujourd’hui pour des applications de calcul intensif (apprentissage profond, fouille de données, etc.) pour l’unique raison que leurs auteurs le connaissent, avec une efficacité calamiteuse.

Java est un langage de conception plus soucieuse d’efficacité, mais une efficacité des années 1990, quand les processeurs multi-cœurs étaient rares, mais la variété des architectures plus grande qu’aujourd’hui : la facilité pour porter un programme d’un type de processeur à un autre était un facteur de productivité plus important que maintenant, d’où l’idée d’une machine virtuelle standard et le slogan write once, run anywhere. Java vient avec un environnement d’exécution (runtime) très lourd, avec glaneur de cellules (GC, garbage collector), compilation just in time (JIT), JVM (Java Virtual Machine), ce qui fait que le démarrage d’une grosse application Java prend pas mal de temps et de ressources, mémoire notamment. Tant que cela se passait sur un serveur de l’entreprise ou sur la machine de l’utilisateur, ce n’était pas trop gênant, l’application était lancée le matin, voir le lundi matin pour toute la semaine, et cette charge n’était endurée qu’une fois, sur une machine déjà payée. Dès lors que cela se passe dans les nuages, sur des machines virtuelles susceptibles de se multiplier au gré des augmentations de la charge, le tout facturé au temps d’utilisation, cela devient un problème. Bastien Vigneron a exposé cette question de façon systématique et proposé une nouvelle approche du développement logiciel, avec des langages qui optimisent le temps de lancement et d’exécution plutôt que le temps de portage.

Ainsi, Bastien Vigneron conseille, pour les développements nouveaux, d’utiliser le langage Rust pour les choses de bas niveau qui doivent interagir étroitement avec le matériel et le système d’exploitation : c’est un langage sans runtime, donc aussi efficace que C, mais avec un modèle de mémoire qui lui donne la sûreté dont C est dépourvu. Et pour les développements plus ordinaires (de plus haut niveau), il recommande Go, plus facile à programmer que Rust, ce qui optimise le temps de développement. Ces deux langages rendent la programmation concurrente assez facile, ce qui permet de tirer le meilleur parti des architectures multi-cœurs.

Répondre à cet article

Alléger le noyau !

Stéphane Rivière (Numéro 6) - le 21 juin 2022

Bonjour à tous,

Tout d’abord, je salue Nat, avec qui j’ai eu longtemps le plaisir d’échanger dès la fin des années 80 sur Modula BBS... Heureux de te retrouver en si bonne compagnie.

Quelques remarques.

Il existe depuis bien longtemps quelque chose de beaucoup plus abouti et mieux conçu que Rust, à savoir Ada, que Laurent connaît, peut-être dans une version ancienne de ce langage. Rust en est à des années lumières. Mais l’apparition de Rust est néanmoins un très bon signal ! Telle la réinvention de la roue et de l’eau chaude, il n’y a de nouveau que ce qui est oublié. Rust est probablement appelé à un grand avenir. À un point ou Ferrous Systems a contracté avec Adacore pour monter en compétence. https://blog.adacore.com/adacore-and-ferrous-systems-joining-forces-to-support-rust

Rust qui demande de l’aide à Ada, qui accepte, que voilà une coopération intelligente, au bénéfice de tous ! Tout mouvement vers la prise de conscience d’un code meilleur est le bienvenu.

Concernant les OS et Linux en particulier, le volume de lignes est en grande partie due aux pilotes. Quand je rajoute une carte 4G à mon portable Dell, c’est 400 Mo de pilotes à installer pour Windows mais Linux qui va immédiatement reconnaître le module 4G. Avec ce titre racoleur, l’auteur confond beaucoup trop de choses. Un Linux qui ne fait rien ne consomme rien. Le pingouin est bien fichu. S’il y a d’évidentes économies à faire, c’est du coté de l’applicatif : remplacer PHP, Python, JS, Ruby, Java, etc. par des langages compilés de haut niveau diviserait la consommation globale de l’IT par au moins deux (certainement plus d’ailleurs) !

Concernant QEMU, les auteurs de COZART naviguent en pleine idiocratie. Si l’on souhaite tendre vers la frugalité, c’est exactement l’inverse qu’il faut faire. QEMU, c’est environ 2,5 M SLOC et un superbe outil extrêmement pratique pour plein de manips, mais qui doit disparaître en prod ! Chez Sowebio, après quelques semaines de R&D, on a réussi à remplacer, dans notre cloud fondé sur Xen, le mode classique HVM avec QEMU (utilisé par AWS) par le mode PVH (qui supprime QEMU et autorise des performances sans commune mesure, proche du bare-metal : à instance équivalente random read en Mbps : 31 (aws) 114 (sowebio) et en random write en Mbps : 21 (aws) et 76 (sowebio). Nous ne sommes pas meilleurs pas meilleurs qu’AWS mais nous n’avons pas à amortir des dizaines fermes de serveurs de plusieurs hectares. Nous pouvons dès lors commercialiser notre R&D sans délai. D’ailleurs on a débauché des clients d’AWS, très heureux de payer moins cher pour plus de performance.

Enfin j’ai goûté avec délice la citation de Urban Galindo. Tel Dupond et Dupont, je dirais même plus :

La simplicité est la sophistication suprême (Léonard de Vinci).

Tout devrait être fait de manière simple mais non simpliste (Albert Einstein).

En un mot le KISS¹

Bien à vous tous.

Stéphane

¹ Hommage à Clarence Leonard ("Kelly") Johnson a créé (entre autres) l’inconcevable Blackbird SR-71

Répondre à ce message

Alléger le noyau !

Laurent Bloch - le 21 juin 2022

Bonjour Stéphane, merci de ta contribution !

Non, les auteurs de l’article ne proposent pas d’utiliser QEMU en production, mais de s’en servir pour le profilage du noyau. Si mon compte-rendu donne l’impression inverse, c’est maladresse de ma part que je vais corriger.

Répondre à ce message

Alléger le noyau !

Stéphane Rivière (Numéro 6) - le 21 juin 2022

Pardon Laurent, j’avais effectivement mal lu. Merci à toi pour cet espace d’échange bienveillant et très instructif.

Par ailleurs QEMU est un outil fantastique, on l’utilise effectivement pour monter des systèmes dans des cas "particuliers". C’est très souvent notre sauveur dans des cas difficiles, lorsqu’on a pas un accès physique à la machine...

Répondre à ce message

Alléger le noyau !

Nat Makarevitch - le 15 juin 2022

Merci !

Pistes pertinentes :

– le BMC, en général, est encore dynamique. Exemple : http://orion.towson.edu/~karne/dosc/paper20/Navid2.pdf

– l’approche ’Unikernel’ ( https://en.wikipedia.org/wiki/Unikernel ) et son récent avatar l’"anykernel" (peu de documentation étoffée mais quelques projets épars tels que le ’NetBSD rump kernel’ https://en.wikipedia.org/wiki/Rump_kernel )

Répondre à ce message

Alléger le noyau !

URBAN-GALINDO - le 14 juin 2022

Excellent article écrit par une personne qui peut parler des OS en sachant de quoi il retourne.

J’ajoute volontiers à l’argumentaire les problèmes de sécurité qui sont devenus, pour l’architecture Microsoft qui équipe la très grande majorité des postes de travail et est une "porte d’entrée" très exploitée par les malfrats du numérique, quasiment impossible à maitriser.
J’ai risqué un pamphlet : Le Roi est nu ! suite à SolarWinds
https://forumatena.org/le-roi-est-nu/

Depuis quelques trimestres je m’insurge contre la priorité donnée à la forme sur le fond et préconise une simplification des fonctions en revenant aux "fondamentaux" en gros Windows XP + Word 2
Je les crois très suffisantes pour 99,9 % des utilisateurs.

J’ai appris, avec bonheur, que des actions étaient engagées pour lutter contre cette complexité que je crois excessive.
J’avais publié en 2014 une réflexion sur les structures des OS en insistant sur l’importance d’un micro noyau et sur la nécessité de distinguer les applications selon la confiance que l’on pouvait leur accorder. Peut-être verrais-je des "avancée" dans cette direction pour les 10 ans de ma publication, elle n’avait pas soulevé l’enthousiasme ...
Operating Systems la France est-elle condamnée à la dépendance ?
https://www.linkedin.com/pulse/objets-connect%C3%A9s-la-france-est-elle-condamn%C3%A9e-%C3%A0-urban-galindo/

Une citation d’Antoine de St Exupéry qui m’a guidé dans ma carrière industrielle :
"La perfection n’est pas atteinte quand il n’y a plus rien à ajouter mais quand il n’y a plus rien à enlever."

Le Roi est nu ! suite à SolarWinds

Répondre à ce message

Votre inscription a été enregistrée avec succès !

Sommaire

Les ordinateurs et les systèmes d’exploitation gaspillent des ressources

Réduire l’encombrement et la consommation du système d’exploitation

Une nouvelle méthode basée sur QEMU

Langages gloutons, langages sobres

Au menu

Dans la même rubrique