Artificial Intelligence : A Guide for Thinking Humans

Une synthèse récente sur l’intelligence artificielle :

Un livre de Melanie Mitchell

Article mis en ligne le 30 juin 2020

dernière modification le 19 décembre 2023

par Laurent Bloch

Sommaire

Expliquer ce que peut et ne peut pas l’IA
L’expérience d’une praticienne
Petit exemple difficile : le langage humain
Problèmes de Bongard
Pensée réflexive

Expliquer ce que peut et ne peut pas l’IA

L’épidémie d’intelligence artificielle (IA) se déclenche à peu près tous les dix ans, depuis la conférence organisée en 1956 au Dartmouth College par John McCarthy. Celle dont j’ai décrit l’acmé en 2018 semble s’atténuer (mise au point de décembre 2023 : je me trompais lourdement, elle n’a depuis fait que croître et embellir, mais cela ne change rien au fond de la question), le nombre d’articles délirants et les volumes des budgets lancés par les fenêtres diminuent, restent des gens sérieux qui utilisent réseaux de neurones et apprentissage par renforcement pour ce qu’ils peuvent vraiment faire, qui est d’ailleurs remarquable et très utile mais ne mérite guère le terme d’intelligence. Cela dit il faut toujours expliquer le fossé qui sépare les résultats réels des délires de science fiction, bien plus séduisants et qui font vendre.

Lorsque Robert French, chercheur en psychologie expérimentale et sciences cognitives au CNRS, précédemment étudiant puis collaborateur de Douglas Hofstadter et traducteur en français de son livre Gödel, Escher, Bach, m’a recommandé la lecture du livre Artificial Intelligence : A Guide for Thinking Humans de sa collègue Melanie Mitchell, je me suis précipité parce qu’il devient de plus en plus difficile de recommander, à qui cherche une vue d’ensemble et un point de vue critique sur l’IA, le livre (toujours excellent mais paru en 1972) What Computers Can’t Do : The Limits of Artificial Intelligence d’Hubert Dreyfus (traduit en français). Il est d’ailleurs frappant de constater qu’à près de 50 ans de distance Dreyfus, plus philosophe, et Melanie Mitchell, plus mathématicienne, aboutissent à des conclusions étonnamment similaires, par des raisonnements également proches.

Disons tout de suite que si ce livre n’est pas (encore ?) traduit en français [1] (mise à jour 8/09/2021 : traduction parue ce jour chez Dunod), il est écrit dans un anglais tellement clair et fluide que l’on en oublie qu’on lit une langue étrangère, presque comme avec un roman de Jane Austen.

L’expérience d’une praticienne

Melanie Mitchell peut se permettre de juger ce que peut et ce que ne peut pas l’IA, avec une modestie de ton qui n’enlève rien à l’ambition du propos, parce qu’elle est une actrice majeure de la recherche dans ce domaine. Étudiante elle aussi de Douglas Hofstadter, elle a écrit avec lui le logiciel Copycat, modèle de raisonnement par analogie et de cognition humaine qui a permis de nombreuses expériences. Elle a depuis accumulé de nombreux résultats dans le domaine.

Le panorama qu’elle dresse de la discipline est complet et illustré d’exemples présentés de façon pédagogique. À l’origine des temps les pionniers (McCarthy, Minsky, Simon, Newell...) ont cru possible une IA « logique », où l’intelligence (qu’est-ce, d’ailleurs ? les philosophes ne se bousculent pas pour en donner une définition simple) serait « encodée » dans le calcul de propositions. L’échec relatif de ce courant de recherche a ouvert la voie à des démarches inductives, en général par des méthodes d’auto-apprentissage basées soit sur des réseaux de neurones (de plus en plus grands et perfectionnés au fur et à mesure de l’accroissement de la puissance de calcul disponible), soit sur des procédés d’apprentissage par renforcement.

Pour la description précise mais compréhensible de ces différentes méthodes je ne puis que vous renvoyer au livre, et vais plutôt emprunter à l’auteur quelques exemples de problèmes simples que la plupart des êtres humains sont capables de résoudre sans même y penser alors qu’un logiciel d’IA, même entraîné sur des dizaines de millions d’exercices résolus de nature similaire et au prix d’heures de calcul sur des machines dotées de milliers de processeurs ne peut pas (et de l’avis de Melanie Mitchell ne pourra sans doute jamais) résoudre.

Petit exemple difficile : le langage humain

Une première collection de questions faciles pour les humains et difficiles pour les logiciels repose d’une part sur la souplesse et la ductilité du langage humain (locution que Melanie Mitchell préfère comme moi à « langage naturel »), d’autre part sur l’expérience banale de la vie quotidienne que le logiciel serait bien en peine d’acquérir. Ainsi :

– Phrase 1 : « J’ai versé l’eau de la bouteille dans la tasse jusqu’à ce qu’elle soit pleine ».

– Question : Qu’est-ce qui était plein ? A. La bouteille B. La tasse.

– Phrase 2 : « J’ai versé l’eau de la bouteille dans la tasse jusqu’à ce qu’elle soit vide ».

– Question : Qu’est-ce qui était vide ? A. La bouteille B. La tasse.

Remarquez que les deux phrases sont identiques à un mot près. Ce problème, qui appartient à la classe des schémas de Winograd (du nom de leur auteur), est insoluble pour un logiciel d’IA, sauf à tricher et à lui « souffler » la réponse.

Les humains sont équipés d’un bon sens élémentaire, inné ou acquis dès la petite enfance. Ainsi, « même un bébé sait que le monde est divisé en objets, que les parties d’un objet ont tendance à se déplacer ensemble, et que si des parties d’un objet sont cachées à la vue elles n’en continuent pas moins à faire partie de l’objet ». Les logiciels de vision informatique ne savent pas ces choses, ce qui est un obstacle à la conduite automatique, par exemple.

Si je puis me permettre une extrapolation en dehors du texte de Melanie Mitchell, il me semble que l’idée d’un « bon sens » inné rejoint la phénoménologie de Husserl et de Merleau-Ponty, qui met l’intentionnalité à l’origine de la cognition, à l’opposé de la théorie de la Gestalt, qui postule que ce serait la perception qui engendrerait la représentation mentale. Quant aux aspects acquis, ils doivent beaucoup au fait que nous sommes équipés d’un corps, qui nous permet d’éprouver douleur et plaisir, appendice dont le logiciel est irrémédiablement dépourvu.

Problèmes de Bongard

Melanie Mitchell a également remis en lumière les travaux de l’informaticien soviétique Mikhaïl Moïsséiévitch Bongard, qui avait publié en 1967 dans “Проблема узнавания” (Le Problème de la reconnaissance) une collection de petits problèmes graphiques faciles à résoudre pour des humains, et infranchissables pour des logiciels. Chaque problème présente, dans la partie gauche, six boîtes qui illustrent le même « concept », et dans la partie droite six boîtes qui illustrent un concept distinct mais apparenté. Il s’agit de les distinguer. Voici quatre exemples (choisis parmi les plus simples) :

Robert French s’est également penché sur ce type de problème dans son livre The Subtlety of Sameness : A theory and computer model of analogy-making. Les deux auteurs partagent (avec Hofstadter) l’idée que l’abstraction et l’analogie sont deux constituants essentiels de la pensée humaine, sans lesquels il ne pourrait y avoir d’intelligence. Reste à écrire des logiciels dotés de ces aptitudes ou capables de les acquérir. Je risquerai un avis personnel : cela ne sera pas.

Pensée réflexive

Un autre constituant essentiel de la pensée humaine est la capacité à se penser elle-même, à analyser ses démarches, à en identifier les erreurs et les répétitions, ce qui suppose de ne pas se limiter au présent mais à avoir une conception du temps. Ces aptitudes (avec l’abstraction et l’analogie) permettent également de mettre en relation des idées en apparence très éloignées les unes des autres pour en faire la synthèse ou en induire de nouvelles idées.

Je terminerai en évoquant un personnage qui m’est cher et qui est généralement considéré comme intelligent (sauf par des médiocres comme Voltaire), Gottfried Wilhelm Leibniz. En 1701 il reçoit de son ami le jésuite Joachim Bouvet, missionnaire en Chine, un diagramme représentant les 64 hexagrammes de Fuxi.

Chaque trigramme est constitué de trois lignes, chacune d’entre elles continue : | ou interrompue : ¦, pour représenter respectivement le yang ou le yin.

Si elles étaient pour les Chinois de l’antiquité les symboles du yin et du yang, ces deux sortes de lignes peuvent aussi être envisagées comme les deux chiffres de l’arithmétique binaire, 0 et 1. Trois lignes de deux sortes peuvent donner huit combinaisons, pour les nombres de 0 à 7 (2³−1). Les hexagrammes de Fuxi, avec six chiffres binaires, peuvent représenter les nombres de 0 à 63 (2⁶−1).

Leibniz interprète les trigrammes de Fuxi comme des nombres binaires, et dans la suite de son texte il en infère, 250 ans avant la construction du premier ordinateur, que l’arithmétique binaire sera la plus appropriée au calcul automatique.

Ce rapprochement de représentations et d’idées très éloignées les unes des autres pour en dériver des idées nouvelles qui se révéleront géniales un quart de millénaire plus tard me semble caractériser au plus haut point l’intelligence humaine, dont les logiciels d’IA actuels sont encore (et pour très longtemps) à des années-lumière.

Répondre à cet article

Artificial Intelligence : A Guide for Thinking Humans

Urban-Galindo - le 4 juillet 2020

Merci Laurent pour cet article qui, une fois de plus, me remet quelques idées "en ordre" et me confirme l’immensité de mon ignorance, je l’ajoute volontiers à la remarque d’Albert Einstein :
"Il n’existe que deux choses infinies, l’univers et la bêtise humaine... mais pour l’univers, je n’ai pas de certitude absolue !"

un commentaire déposé sur Linkedin ----
Où l’on peine à définir l’intelligence, avec d’ailleurs un sens différent selon Etienne Klein dans une émission sur France Culture en anglais = "traitement" des données, des informations comme dans Intelligence Service et en français qui ajoute un zeste d’induction, d’abstraction. Pour lui le modèle est la formulation de la chute des corps dans le vide (notion contestée à l’époque) par Galilée, en désaccord avec les observations communes.
Etienne Klein mettait au défi tout algorithme d’ "I.A." le plus sophistiqué d’émettre une telle loi, surtout s’il était "nourri" avec quantités de mesures, en particulier si elles éteint très précises.

C’est peut-être la définition que mon épouse a donnée dans son épreuve de philosophie au baccalauréat qui, au delà du réflexe de Pavlov, cerne le mieux ce qu’est l’intelligence :
"Celui qui saisit le rapport des choses ET le rapport des rapports, celui-là seul est intelligent ! "
fin du commentaire Linkedin

Et les avancées de Leibniz vers un langage "calculable"

Répondre à ce message

Artificial Intelligence : A Guide for Thinking Humans

Stéphane Rivière - le 2 juillet 2020

Bonjour Laurent,

Encore un bel article, toujours intellectuellement motivant. J’ai commandé l’ouvrage de Mitchell. Excellente digression sur Leibniz, j’ignorais cette prédiction.

Je serais bien intéressé par quelques pointeurs sur la médiocrité de Voltaire, n’ayant jamais apprécié cet auteur, croisé de force lors de ma scolarité.

Du coup, je lis votre article "L’informatique à la lumière de quelques textes de Leibniz"

Bien cordialement,

Stéphane

Répondre à ce message

Artificial Intelligence : A Guide for Thinking Humans

Laurent Bloch - le 2 juillet 2020

Merci de votre message. Moi non plus je n’ai guère aimé Voltaire, vénéré dans ma famille, équipée de ses œuvres complètes, une édition du XIXe siècle.

Dans « Candide », lecture scolaire, le philosophe Pangloss, qui est moqué, représente Leibniz, qui était mort à l’époque et hors d’état de se défendre (ce dont je pense il se serait peu soucié).

Un jour j’ai acheté sur les quais un livre d’un certain Henri Labroue, “Voltaire anti-juif”, publié en 1942, époque propice. L’auteur se proposait de montrer que Voltaire, représentant du génie français, était un bien meilleur antisémite que les nazis, et bénéficiait de l’antériorité. Pour cela il avait réuni des citations et des extraits de Voltaire, dont la juxtaposition était certes impressionnante.

Mais quand je me suis reporté aux œuvres complètes pour y lire ces extraits dans leur contexte, j’ai constaté que la virulence des citations était diluée dans une bouillie insipide qui en atténuait fortement la portée. Mais j’ai surtout été frappée par la faiblesse de la pensée, collection d’anecdotes superficielles collées bout à bout sans aucune continuité démonstrative. Et ses réflexions sur la religion, les femmes et les domestiques...

Médiocrité de Voltaire

Répondre à ce message

Artificial Intelligence : A Guide for Thinking Humans

Pierre Druilhe - le 2 juillet 2020

Malgré ma grande méconnaissance du sujet, je me dois de m’insurger contre l’appellation fallacieuse de "réseau de neurones" : il entretient à tort la méprise, la confusion qui a fait jusqu’à présent le plus de ravages, comme vous le soulignez, sur cet important sujet et contribue à consolider bien des fantasmes dans le grand public. Or comme j’imagine qu’il ne s’agit que de quelques bouts de silicium, de ce fait en ma qualité de biologiste je ne peux pas laisser un abus de langage qui fait délibérément penser qu’il posséderait les fonctions supérieures, et pour beaucoup encore inconnues, d’une cellule vivante. il faut trouver un autre mot, dans le genre " voulant singer les neurones", (neuron-like serait encore trop laudatif). Par contre j’appelle de mes vœux l’avénement de machines utilisant de vraies cellules vivantes.

Répondre à ce message

Artificial Intelligence : A Guide for Thinking Humans

Bernard Ourghanlian - le 1er juillet 2020

Bonjour Laurent,

Je comprends ton argumentation et ne cherche certainement à prétendre que l’IA est capable de faire ce qu’un enfant de moins d’un an est capable de faire, en particulier de commencer à bénéficier d’un début de "sens commun", d’un début de compréhension du monde, y compris de sa physique ("je lâche un jouet, il tombe"), d’une capacité de reconnaitre un objet à partir d’un nombre très limité d’images, etc. Ce n’est pas autre chose que Yann LeCun explique dans sa série de conférences au Collège de France (cf. https://www.college-de-france.fr/site/yann-lecun/index.htm et ci-joint).

Cependant, et même si la question n’est pas encore complètement résolue, quelques problèmes que tu poses ont bien progressé depuis la publication du livre de Melanie Mitchell. Par exemple la publication ci-jointe sur les problèmes de Bongard ou encore les progrès réalisés sur les réseaux de Winograd auxquels tu fais référence (cf. http://nlpprogress.com/english/common_sense.html). Il y a aussi tous les progrès qui ont été réalisés autour du modèle GPT-2 par OpenAI (cf. papier ci-joint). En fait, jusqu’à un passé récent, les programmes testés sur des collections de schémas Winograd n’étaient pas en mesure de faire beaucoup mieux que la pure devinette aléatoire - c’est-à-dire 50% corrects. Les humains, d’autre part, obtiennent près de 100% de réponses correctes à ces questions.

Au cours de l’année écoulée, à la grande surprise de beaucoup, l’impasse du schéma Winograd a apparemment été surmontée par le modèle GPT-2 et des modèles de langage similaires. A la présentation d’une phrase, GPT-2 calcule les probabilités de tous les mots suivants possibles. Mais GPT-2 peut également être utilisé pour calculer la probabilité de générer une phrase d’entrée entière. Par exemple, supposons que le programme reçoive chacune de ces phrases :

"Les lions ont mangé les zèbres parce que les lions sont des prédateurs."

"Les lions ont mangé les zèbres parce que les zèbres sont des prédateurs."

GPT-2 déterminera que la première phrase est plus susceptible d’être générée que la seconde. De cette façon, il peut répondre à la question "Quels sont les prédateurs ?" en répondant "les lions". Les programmeurs de GPT-2 lui ont donné un ensemble de près de 300 phrases et questions ; le programme était correct sur environ 70 pour cent d’entre eux, dépassant de manière significative l’état de l’art antérieur.

Cela signifie-t-il que GPT-2 a progressé non seulement dans la génération mais aussi dans la compréhension du langage naturel ? C’est loin d’être certain. Certains spécialistes en sciences cognitives ont fait valoir que l’incarnation - avoir un corps qui peut découvrir le monde - est la seule voie possible vers la compréhension. Ils soutiennent que les ordinateurs - sans corps comme le nôtre et sans les types d’expériences que nous rencontrons de la petite enfance à l’âge adulte - n’auront jamais ce qu’il faut pour comprendre le langage, quelle que soit la profondeur du réseau de neurone impliqué ou la richesse de ses données d’entrainement.

Mais que se passerait-il si, contrairement à nos intuitions les plus profondes, la capacité de comprendre réellement le langage n’était pas requise pour qu’un programme d’IA puisse converser avec succès avec nous ? Une grande des grandes surprises de l’IA moderne. est que la reconnaissance vocale peut être effectuée de manière très précise en utilisant simplement des approches statistiques, sans aucune compréhension...

Alors, peut-être que le mot "intelligence" dans "intelligence artificielle" n’est pas pertinent et qu’il relève plus du marketing ou de la mode que d’autre chose. Mais est-ce si grave ? Après-tout si les ordinateurs arrivent à mieux nous comprendre, même si ce n’est que de façon imparfaite et de manière totalement non-anthropomorphe, ce n’est peut-être pas si mal.

Bien à toi et merci,

Bernard

Répondre à ce message

Artificial Intelligence : A Guide for Thinking Humans

Jean Rohmer - le 1er juillet 2020

Ce qui est incompréhensible, c’est que l’on passe son temps aujourd’hui à expliquer que l’IA "moderne" connexionniste est incapable de traiter des petits exemples de traitement symbolique de l’information, tout en disant que l’IA ancienne "symbolique" des années 80 a échoué, plutôt que de dire "remettons-nous à travailler sur l"IA symbolique" avec les machines d’aujourd’hui quelques puissances de 10 fois plus puissante que celle des années 80. Faire du traitement / raisonnement / induction symbolique avec 10000 GPU tournant pendant 3 semaines, ça doit tout de même ouvrit d’autres perspectives que programmer un VAX !

Jean ROHMER

Répondre à ce message

Artificial Intelligence : A Guide for Thinking Humans

Laurent Bloch - le 1er juillet 2020

Merci du message ! Depuis un demi-siècle, chaque nouvelle épidémie d’IA démarre sous la même invocation : « Les tentatives précédentes échouaient faute de moyens de calcul suffisants, mais maintenant avec les progrès de la technique on va y arriver. » Et depuis un demi-siècle ces promesses ne sont pas tenues. La raison des échecs successifs est ailleurs.

La compréhension humaine de tel ou tel phénomène ne repose pas entièrement sur un modèle causal. Interviennent la conscience, et le sens. Les choses ont pour nous un sens parce que nous avons un corps, parce que nous avons eu des parents, parce que nous avons connu la douleur et le plaisir.

Dreyfus, plus philosophe, et Melanie Mitchell, plus mathématicienne, à près de 50 ans de distance, aboutissent à des conclusions étonnamment similaires, par des raisonnements également proches. 100 000 GPU n’y pourront rien. Heureusement d’ailleurs, parce que sinon la justification d’une espèce humaine à la surface de la terre deviendrait problématique en regard des dégâts qu’elle engendre.

Répondre à ce message

Artificial Intelligence : A Guide for Thinking Humans

Jean Rohmer - le 1er juillet 2020

Une petite remarque humoristique -ou sérieuse ?- : "les chercheurs en informatique ne vont tout de même pas passer leur temps à écrire des compilateurs Python ou des bases de données NoSQL !"

Répondre à ce message

Artificial Intelligence : A Guide for Thinking Humans

Laurent Bloch - le 1er juillet 2020

Ah s’ils réussissent à écrire un compilateur Python, un vrai, ce sera vraiment un résultat de recherche méritoire !

Répondre à ce message

Votre inscription a été enregistrée avec succès !

Sommaire

Expliquer ce que peut et ne peut pas l’IA

L’expérience d’une praticienne

Petit exemple difficile : le langage humain

Problèmes de Bongard

Pensée réflexive

Au menu

Dans la même rubrique