Intelligence artificielle
L'intelligence artificielle, souvent abrégée avec le sigle IA, est définie par l’un de ses créateurs, Marvin Lee Minsky, comme « la construction de programmes informatiques qui s’adonnent à des tâches qui sont, pour l’instant, accomplies de façon plus satisfaisantes par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : l’apprentissage perceptuel, l’organisation de la mémoire et le raisonnement critique ».
| Sommaire |
Une définition difficile
Il existe différentes définitions de l’intelligence artificielle, car :
- L’adjectif artificielle est relativement facile à appréhender : ce type d’intelligence est le résultat d’un processus créé par l’homme, plutôt que d’un processus naturel biologique et évolutionnaire,
- En revanche, la notion d'intelligence est difficile à définir :
- La capacité d’acquérir et de retenir les connaissances, d’apprendre ou de comprendre grâce a l’expérience.
- L’utilisation de la faculté de raisonnement pour résoudre des problèmes, et pour répondre rapidement et de manière appropriée à une nouvelle situation, etc.
Les problèmes soulevés par l’intelligence artificielle concernent des domaines divers comme :
- l’ingénierie, notamment pour la construction des robots,
- les sciences de la cognition, pour la simulation de l’intelligence humaine,
- la philosophie pour les questions associées à la connaissance et à la conscience.
L’intelligence artificielle forte
Définition de l’intelligence artificielle forte
Le concept d’intelligence artificielle forte désigne le projet de créer une machine capable non seulement de simuler un comportement intelligent, mais d’éprouver une réelle conscience de soi, de « vrais sentiments » (quoi qu’on puisse mettre derrière ces mots), et une compréhension de ses propres raisonnements.
L’intelligence artificielle forte a servi de moteur à la discipline, mais a également suscité de nombreux débats. En se fondant sur le constat que la conscience a un support biologique et donc matériel, la plupart des scientifiques ne voient pas d’obstacle de principe à créer un jour une intelligence consciente sur un support matériel autre que biologique. En revanche, les opinions divergent sur la nature de ce support, et la capacité des ordinateurs tels qu’ils sont actuellement conçus à atteindre cet objectif.
Diversité des opinions
Les principales opinions pour répondre à la question d’une intelligence artificielle consciente soutenues sont les suivantes :
- Impossible : la conscience serait le propre des organismes vivants, et elle serait liée à la nature des systèmes biologiques. Cette position est défendue principalement par des philosophes et des religieux.
- Problème : Elle rappelle toutefois toutes les controverses passées entre vitalistes et matérialistes, qui ont à plusieurs reprises démenti les positions des premiers.
- Impossible avec des machines manipulant des symboles comme les ordinateurs actuels, mais possible avec des systèmes dont l’organisation matérielle mimerait le fonctionnement du cerveau humain (comme des neurones artificiels).
- Problème : Le système en question répondant exactement de la même façon que sa simulation sur ordinateur - toujours possible - au nom de quel principe leur assigner une différence ? (Thèse CPC de Bruno Marchal)
- Impossible avec les ordinateurs classiques manipulant des symboles, mais possible avec des réseaux de neurones formels (dont l'organisation logique et non matérielle s'inspire des neurones biologiques).
- Problème : le même que pour le point précédent.
- Possible avec des ordinateurs manipulant des symboles. Cette dernière opinion constitue la position la plus engagée en faveur de l'intelligence artificielle forte.
- Problème : ce que fait un ordinateur, un système à base d'échanges de bouts de papier dans une salle immense peut le simuler quelques milliards de fois plus lentement. Or il reste difficile d'admettre que cet échange de bouts de papiers « ait une conscience ». Voir Chambre chinoise.
Il nous manque apparemment encore quelques paradigmes pour sortir de ces impasses.
Des auteurs comme Hofstadter (mais déjà avant lui Arthur C. Clarke ou Alan Turing) expriment par ailleurs un doute sur la possibilité de faire la différence entre une intelligence artificielle qui éprouverait réellement une conscience, et une autre qui simulerait exactement ce comportement. Après tout, nous ne pouvons même pas être certains que d’autres consciences que la nôtre (chez des humains s’entend) éprouvent réellement quoi que ce soit. On retrouve là le problème connu du solipsisme en philosophie.
Voir test de Turing.
Travaux complémentaires
- Le mathématicien de la physique Roger Penrose pense que la conscience viendrait de l'exploitation de phénomènes quantiques dans le cerveau (voir microtubules), empêchant la simulation réaliste de plus de quelques dizaines de neurones sur un ordinateur normal, d’où les résultats encore très partiels de l’IA. Il restait jusqu’à présent isolé sur cette question; un autre chercheur a présenté depuis une thèse de même esprit quoi que moins radicale :
Si cette spéculation se révélait juste (ce qui est loin d'être assuré), le modèle du neurone formel serait alors très incomplet.
- Une autre attaque contre la réduction de la pensée aux neurones formels est liée au rôle apparemment plus important que prévu des cellules gliales, qui remettent en cause le modèle dit du tout-neuronal.
Cela dit, l’intelligence artificielle est loin de se limiter aux seuls réseaux de neurones, qui n’y sont utilisés que comme classifieurs, et parmi d’autres classifieurs dont certains au contraire algorithmiques donnent des résultats voisins.
Culture populaire et intelligence artificielle forte
Le thème d’une machine capable d’éprouver une conscience et des sentiments est un grand classique de la science-fiction, notamment dans la série de romans d’Isaac Asimov sur les robots. Ce sujet a toutefois été exploité très tôt, comme dans le récit des aventures de Pinocchio, publié en 1881, où une marionnette capable d’éprouver de l’amour pour son créateur, cherche à devenir un vrai petit garçon. Cette trame a fortement inspiré le film A.I. intelligence artificielle, réalisé par Steven Spielberg, sur la base des idées de Stanley Kubrick.
L’intelligence artificielle faible
La notion d’intelligence artificielle faible constitue une approche pragmatique d’ingénieur : chercher à construire des systèmes de plus en plus autonomes (pour réduire le coûts de leur supervision), des algorithmes capables résoudre des problèmes d’une certaine classe, etc. Mais, cette fois, la machine semble agir comme si elle était intelligente.
C’est principalement sur base de cette hypothèse que la plupart des techniques actuelles d’intelligence artificielle sont utilisées. C’est par exemple la démarche utilisée par IBM dans son projet nommé Autonomic computing.
Simple évolution, donc, et non révolution : l’intelligence artificielle s’inscrit à ce compte dans la droite succession de ce qu’ont été la recherche opérationnelle dans les années 1960, le process control dans les années 1970, l’aide à la décision dans les années 1980 et le data mining dans les années 1990. Et, qui plus est, avec une certaine continuité.
Les courants de pensée
La cybernétique naissante des années quarante revendiquait très clairement son caractère pluridisciplinaire et se nourrissait des contributions les plus diverses : neurophysiologie, psychologie, logique, sciences sociales… Et c’est tout naturellement qu’elle envisagea deux approches des systèmes, deux approches reprises par les sciences cognitives et de ce fait l’intelligence artificielle :
- une approche par la décomposition (du haut vers le bas),
- une approche de construction globaliste ou systémique (du bas vers le haut).
Ces deux approches, plutôt complémentaires que contradictoires, sont respectivement à la base des hypothèses de travail que constituent le cognitivisme et le connexionisme.
Le cognitivisme
Le cognitivisme considère que le vivant, tel un ordinateur (bien que par des procédés évidemment très différents), manipule essentiellement des symboles élémentaires. Dans son livre Les sociétés de l’esprit, Marvin Minsky, s’appuyant sur des observations du pédagogue Jean Piaget envisage le processus cognitif comme une compétition d’agents fournissant des réponses partielles et dont les avis sont arbitrés par d’autres agents. Il cite les exemples suivants de Piaget :
- L’enfant croit d’abord que plus le niveau d’eau est élevé dans un verre, plus il y a d’eau dans ce verre. Après avoir joué avec des transvasements successifs, il intègre le fait que la notion de hauteur du liquide dans le verre entre en compétition avec celle du diamètre du verre, et arbitre de son mieux entre les deux.
- Il vit ensuite une expérience analogue en manipulant de la pâte à modeler : la réduction de plusieurs objets temporairement représentés à une même boule de pâte l’incite à dégager un concept de conservation de la quantité de matière.
Au bout du compte, ces jeux d’enfants se révèlent essentiels à la formation de l’esprit, qui dégage quelques règles pour arbitrer les différents éléments d’appréciation qu’il rencontre, par essais et erreurs.
Le connexionnisme
Le connexionnisme, se référant aux processus auto-organisationnels, envisage la cognition comme le résultat d’une interaction globale des parties élémentaires d’un système. On ne peut nier que le chien ne dispose d'une sorte de connaissance des équations différentielles du mouvement, puisqu’il arrive à attraper un bâton au vol. Et pas davantage qu’un chat ait aussi une sorte de connaissance de la loi de chute des corps, puisqu’il se comporte comme s’il savait à partir de quelle hauteur il ne doit plus essayer de sauter directement pour se diriger vers le sol. Cette faculté qui évoque un peu l’intuition des philosophes se caractériserait par la prise en compte et la consolidation d’éléments perceptifs dont aucun pris isolément n’atteint le seuil de la conscience, ou en tout cas n’y déclenche d’interprétation particulière...
Domaines d’application de l’intelligence artificielle
On peut envisager de demander les services suivants, ensemble ou séparément, à un dispositif d’intelligence artificielle :
- Interface vocale : se faire comprendre en lui parlant,
- Assistance par des machines dans les tâches dangereuses, ou demandant une grande précision,
- Aide aux diagnostics médicaux (bien qu’un tensiomètre, qui remplit cette fonction, ne soit considéré par personne comme une application de l’intelligence artificielle),
- Résolution de problèmes complexes, sous réserve de quantifier ce mot
- Traduction automatique, si possible en temps réel ou très légèrement différé, comme dans le film « Dune ».
- Intégration automatique d’informations provenant de sources hétérogènes,
- Etc.
En l’état, les réalisations actuelles de l’intelligence artificielle peuvent être regroupées en différents domaines, tels que:
- Les systèmes experts,
- L’apprentissage automatique,
- La compréhension du langage naturel,
- La reconnaissance des formes, des visages et la vision en général...
Au fil du temps, certains langages de programmation se sont avérés plus commodes que d’autres pour écrire des applications d’intelligence artificielle. Parmi ceux-ci, Lisp et Prolog furent sans doute les plus médiatisés. Slip constituait une solution ingénieuse pour faire de l’intelligence artificielle en FORTRAN. ELIZA (le premier chatterbox, donc pas de la « véritable » intelligence artificielle) tenait en trois pages de SNOBOL.
- Conversez avec Eliza (anglais)
On utilise aussi, plus pour des raisons de disponibilité et de performance que de commodité, des langages classiques tels que C ou C++. Lisp au eu pour sa part une série de successeurs plus ou moins inspirés de lui, dont le langage Scheme.
Des programmes de démonstration de théorèmes géométriques simples ont existé dès les années 1960; et des logiciels aussi triviaux que Maple et Mathematica effectuent aujourd’hui des travaux d’intégration symbolique qui il y a trente ans encore était du ressort d’un étudiant de mathématiques supérieures. Mais ces programmes ne savent pas plus qu’ils effectuent des démonstrations géométriques ou algébriques que Deep Blue ne savait qu’il jouait aux échecs (ou un programme de facturation qu’il calcule une facture). Ces cas représentent donc plus des opérations intellectuelles assistées par ordinateur que de l'intelligence artificielle à proprement parler.
Dans l’informatique ludique (les jeux vidéo), l’Intelligence Artificielle (IA) se développe. En effet les nouvelles générations de cartes vidéo traitent un grand nombre d’opérations auparavant dévolues au processeur. Le processeur est donc moins sollicité pour l’affichage et les programmeurs peuvent utiliser sa puissance pour développer des systèmes d’IA plus perfectionnés.
L’intelligence artificielle a connu un essor important pendant les années 1960 et 70, mais à la suite de résultats décevants par rapport aux budgets investis, son succès s’estompa dès le milieu des années 1980.
D’après certains auteurs, les perspectives de l’intelligence artificielle pourraient avoir des inconvénients, si par exemple les machines devenaient plus intelligentes que les humains, et finissaient par les dominer, voire (pour les plus pessimistes) les exterminer, de la même façon que nous cherchons à exterminer certaines séquences d’ARN (les virus) alors que c’est bien de l’ARN qui nous a construits. On reconnaît bien entendu le thème du film Terminator, mais des directeurs de société techniquement très compétents, comme Bill Joy de la société Sun, affirment considérer le risque comme réel à long terme.
Toutes ces possibilités futures ont fait l’objet de quantités de romans de science fiction, tels ceux d’Isaac Asimov ou William Gibson en passant par Arthur C. Clarke.
Précurseurs de l’intelligence artificielle
Si les progrès de l’intelligence artificielle sont récents, ce thème de réflexion est tout à fait ancien, et il apparaît régulièrement au cours de l’histoire. Les premiers signes d’intérêt pour une intelligence artificielle et les principaux précurseurs de cette discipline sont les suivants.
Automates
- Une des plus anciennes traces du thème de « l’homme dans la machine » date de 800 avant notre ère, en Égypte. La statue du dieu Amon levait le bras pour désigner le nouveau pharaon parmi les prétendants qui défilaient devant lui, puis elle « prononçait » un discours de consécration. Les égyptiens étaient probablement conscients de la présence d’un prêtre actionnant un mécanisme et déclarant les paroles sacrées derrière la statue, mais cela ne semblait pas être pour eux contradictoire avec l’incarnation de la divinité.
- Vers la même époque, Homère, dans l'Iliade (XVIII, 370–421), décrit les automates réalisés par le dieu forgeron Héphaïstos : des trépieds munis de roues en or, capables de porter des objets jusqu’à l’Olympe et de revenir seuls dans la demeure du dieu ; ou encore, deux servantes forgées en or qui l’assistent dans sa tâche. De même, le Géant de bronze Talos, gardien des rivages de la Crète, était parfois considéré comme une œuvre du dieu.
- Vitruve, architecte romain, décrit l’existence entre le IIIe et le Ier siècle avant notre ère, d’une école d’ingénieurs fondée par Ctesibius à Alexandrie, et concevant des mécanismes destinés à l’amusement tels des corbeaux qui chantaient.
- Héron l'ancien décrit dans son traité « Automates », un carrousel animé grâce à la vapeur et considéré comme anticipant les machines à vapeur.
- Roger Bacon aurait conçu des automates doués de la parole.
- Léonard de Vinci a construit un automate en forme de lion en l’honneur de Louis XII.
- Gio Battista Aleotti et Salomon de Caus ont construit des oiseaux artificiels et chantants, des flûtistes mécaniques, des nymphes, des dragons et des satyres animés pour égayer des fêtes aristocratiques, des jardins et des grottes.
- René Descartes a conçu en 1649 un automate qu’il appelait « ma fille Francine ». Il conduit par ailleurs une réflexion d’un modernisme étonnant sur les différences entre la nature des automates, et celles d’une part des animaux (pas de différence) et d’autre part celle des hommes (pas d’assimilation). Ces analyses en font le précurseur méconnu d’un des principaux thèmes de la science-fiction : la confusion entre le vivant et l’artificiel, entre les hommes et les robots, les androïdes ou les intelligences artificielles.
- Jacques de Vaucanson a construit en 1738 un « canard artificiel de cuivre doré, qui boit, mange, cancane, barbote et digère comme un vrai canard ». Il était possible de programmer les mouvements de cet automate, grâce à des pignons placés sur un cylindre gravé, qui contrôlaient des baguettes traversant les pattes du canard. L’automate a été exposé pendant plusieurs années en France, en Italie et en Angleterre, et la transparence de l’abdomen permettait d’observer le mécanisme interne. Le dispositif permettant de simuler la digestion et d’expulser une sorte de bouillie verte fait l’objet d’une controverse. Certains commentateurs estiment que cette bouillie verte n’était pas fabriquée à partir des aliments ingérés, mais préparée à l’avance. D’autres estiment que cet avis n’est fondé que sur des imitations du canard de Vaucanson. Malheureusement, l’incendie du Musée de Nijni Novgorod en Russie vers 1879 détruisit cet automate.
- Les artisans Pierre et Louis Jaquet-Droz fabriquèrent parmi les meilleurs automates fondés sur un système purement mécanique, avant le développement des dispositifs électromécaniques.
Pensée automatique
Les processus cognitifs peuvent-ils se réduire à un simple calcul ? Et si tel est le cas, quels sont les symboles et les règles à employer ?
Les premiers essais de formalisation de la pensée sont les suivants :
- Raymond Lulle, missionnaire, philosophe, et théologien espagnol du XIIIe siècle, a fait la première tentative pour engendrer des idées par un système mécanique. Il combinait aléatoirement des concepts grâce à une sorte de règle à calcul, un zairja, sur laquelle pivotaient des disques concentriques gravés de lettres et de symboles philosophiques. Il baptisa sa méthode Grand Art (Ars Magna), fondée sur l’identification de concepts de base, puis leur combinaison mécanique soit entre eux, soit avec des idées connexes. Raymond Lule appliqua sa méthode à la métaphysique, puis à la morale, à la médecine et à l’astrologie. Mais il n’utilisait que la logique déductive, ce qui ne permettait pas à son système d’acquérir un apprentissage.
- Gottfried Wilhelm Leibnitz, au XVIIe siècle, a imaginé un calcul pensant (calculus rationator), en assignant un nombre à chaque concept. La manipulation de ces nombres aurait permis de résoudre les questions les plus difficiles, et même d’aboutir à un langage universel. Leibnitz a toutefois démontré que l’une des principales difficultés de cette méthode, également rencontrée dans les travaux modernes sur l’intelligence artificielle, est l’interconnexion de tous les concepts, ce qui ne permet pas d’isoler une idée de toutes les autres pour simplifier les problèmes liés à la pensée.
- George Boole a inventé la formulation mathématique des processus fondamentaux du raisonnement, connue sous le nom d’algèbre de Boole. Il était conscient des liens de ses travaux avec les mécanismes de l’intelligence, comme le montre le titre de son principal ouvrage paru en 1854 : « Les lois de la pensée » (The laws of thought), sur l’algèbre booléenne.
- Gottlob Frege perfectionna le système de Boole en inventant le concept de prédicat, qui est une entité logique soit vraie, soit fausse (toute maison a un propriétaire), mais contenant des variables non logiques, n’ayant en soit aucun degré de vérité (maison, propriétaire). Cette invention eut une grande importance puisqu’elle permit de démontrer des théorèmes généraux, simplement en appliquant des règles typographiques à des ensembles de symboles. La réflexion en langage courant ne portait plus que sur le choix des règles à appliquer. Par ailleurs, seul l’utilisateur connaît le sens des symboles qu’il a inventés, ce qui ramène au problème de la signification en intelligence artificielle, et de la subjectivité des utilisateurs.
- Bertrand Russell et Alfred North Whitehead publièrent au début du XXe siècle un ouvrage intitulé « Principia mathematica », dans lequel ils résolvent des contradictions internes à la théorie de Gottlob Fredge. Ces travaux laissaient espérer d’aboutir à une formalisation complète des mathématiques.
- Kurt Gödel démontre au contraire que les mathématiques resteront une construction ouverte, en publiant en 1931 un article intitulé « Des propositions formellement indécidables contenues dans les Principia mathematica et autres systèmes similaires ». Sa démonstration est qu’à partir d’une certaine complexité d’un système, on peut y créer plus de propositions logiques qu’on ne peut en démontrer vraies ou fausses. L’arithmétique, par exemple, ne peut trancher par ses axiomes si on doit accepter des nombres dont le carré soit -1. Ce choix reste arbitraire et n’est en rien lié aux axiomes de base. Le travail de Gödel suggère qu’on pourra créer ainsi un nombre arbitraire de nouveaux axiomes, compatibles avec les précédents, au fur et à mesure qu’on en aura besoin. Il est à noter que si l'arithmétique est démontrée incomplète, le calcul des prédicats (logique formelle) est au contraire démontré par Turing comme complet.
- Alan Turing parvient aux mêmes conclusions que Kurt Gödel, en inventant des machines abstraites et universelles (rebaptisées les machines de Turing), dont les ordinateurs modernes sont considérés comme des concrétisations. Il démontre l’existence de calculs anodins qu’aucune machine ne peut faire, sans pour autant que cela constitue pour Turing un motif pour douter de la faisabilité de machines pensantes répondant aux critères du test de Turing.
- Irving John Good, Myron Tribus et E.T. Jaynes ont décrit de façon très claire les principes assez simples d’un robot à logique inductive utilisant les principes de l’inférence bayésienne pour enrichir sa base de connaissances sur la base du Théorème de Cox-Jaynes. Ils n’ont malheureusement pas traité la question de la façon dont on pourrait stocker ces connaissances sans que le mode de stockage entraîne un biais cognitif. Le projet est voisin de celui de Raymond Lulle, mais fondé dette fois-ci sur une logique inductive, et donc propre à résoudre quelques problèmes ouverts.
- Robot à logique inductive (en anglais, PDF)
- Des chercheurs comme Alonzo Church ont posé des limites pratiques aux ambitions de la raison, en orientant la recherche (Herbert Simon, Michael Rabin, Stephen Cook) vers l’obtention des solutions en temps fini, ou avec des ressources limitées, ainsi que vers la catégorisation des problèmes selon des classes de difficulté (en rapport avec les travaux de Cantor sur l’infini).
Principaux projets et réalisations de l’intelligence artificielle
La liste ci-dessous indique les projets et les réalisations marquants dans le domaine de l’intelligence artificielle. La quasi-totalité de ces travaux ont été accomplis aux États-Unis, et il est à noter que nombre d’entre eux ont été financés par l’armée américaine. L’un des principaux financeurs de ces travaux fut la DARPA (Defense Advanced Rechearch Project Agency), célèbre pour avoir initié le réseau Arpanet, qui a donné naissance à Internet.
- Logic Theorist (Théoricien de la logique) (1956) - Ce programme informatique est considéré comme le premier relevant de l’intelligence artificielle. Il a été développé par Allen Newell et Herbert Simon, avec l’assistance de Cliff Shaw. Logic Theorist est un programme de démonstration de théorèmes, fondé sur une recherche sélective. Une hypothèse de base donnée, peut subir toute une gamme de manipulations élémentaires conformes aux lois de la logique. Le résultat obtenu peut passer à son tour par une série de manipulations. La répétition de cette procédure crée une structure arborescente, sous forme « d’arbre de recherche ». L’exploration de celui-ci permet d’aboutir au résultat recherché, après un nombre indéfini d’opérations. Le problème à surmonter est de trouver le chemin qui mène de l’hypothèse de base au résultat recherché. Logic Theorist comportait une liste de règles empiriques appropriées, les heuristiques, qui permettaient de sélectionner laquelle des branches de l’arbre de recherche était la plus susceptible de mener au but. Une fois programmé sur une machine de la RAND, Logic Theorist démontra 38 des 52 premiers théorèmes du 2e chapitre des « Principia mathematica » de Bertrand Russell et Alfred North Whitehead. Le théorème 2.85 faisait même l’objet d’une démonstration plus élégante que celle des auteurs, au grand contentement de Russel. Pour marquer la portée de ce dernier résultat, Allen Newell et Herbert Simon décidèrent de publier cette démonstration dans le « Journal of symbolic logic », en faisant co-signer cette publication par Logic Theorist. Lors de la conférence de Dartmouth de 1956, considérée comme la rencontre fondatrice de l’intelligence artificielle en tant que discipline scientifique, Logic Theorist fut le seul programme opérationnel présenté. Il est par ailleurs considéré comme le lointain précurseur des logiciels de traitement formel des équations.
- IPL (Information Processing Language ou langage de traitement de l’information) (1956) - Dans le cadre de la réalisation de Logic Theorist, le résultat le plus important pour le développement de l’intelligence artificielle, a été l’invention d’un langage de programmation spécifique nommé IPL. Ce langage fut le premier à employer la technique de programmation dite de traitement des listes. Les auteurs de Logic Theorist pensaient que les langages existant à l’époque, comme le FORTRAN, n’étaient pas appropriés pour un tel projet. En effet, ceux-ci exigeaient que les ensembles de nombres et de symboles manipulés soient définis au préalable. Au contraire, les auteurs de Logic Theorist estimaient que la pensée est fondée d’une part sur la création, la modification et la destruction de structures de symboles en interaction, et d’autre part sur le caractère associatif de la mémoire humaine. La technique de traitement de liste est une tentative pour bénéficier de ces deux caractéristiques. Les idées d’Allen Newell et de Herbert Simon inspirèrent John McCarthy lorsque celui-ci inventa son propre langage d’IA : le LISP.
- Global Problem Solver ou GPS (Système général de résolution de problèmes) (1957) - Partant du constat que les humains ne raisonnent pas comme Logic Theorist, Allen Newell et Herbert Simon s’inspirèrent d’expériences de psychologie sur les méthodes de résolution de problèmes par des humains, pour créer GPS. Celui-ci avait l’originalité d’être fondé sur une organisation et un ensemble de règles heuristiques ne renfermant aucune référence à une tâche particulière, d’où le qualificatif de Système général de résolution de problèmes. GPS employait l’analyse fins/moyens, qui fonctionnait comme un principe de rétroaction, détectant puis réduisant les différences entre un état de faits et le but recherché. Cette méthode de résolution était couplée à la capacité à décomposer un problème en plusieurs sous-problèmes. GPS fut employé pour résoudre des casse-têtes, des intégrations symboliques, et des décryptages de codes secrets.
- Sad Sam (1957) - Créé par Robert K. Lindsay, Sad Sam provient de l’étude de l’apprentissage verbal. Ce programme était capable de définir des liens de parenté entre des personnes citées dans des phrases formulées en langage courant, en construisant peu à peu l’équivalent d’un arbre généalogique interne. Sad Sam était donc capable de relier une nouvelle information à d’autres faits déjà enregistrés, pour en tirer des conclusions qui n’avaient pas été apprises. À ce titre, certains chercheurs ont estimé que Sad Sam présentait les premières ébauches de compréhension au sens humain du terme.
- LISP (LISt Processing ou traitement de listes) (1958) - En s’inspirant du langage IPL, John McCarthy inventa au MIT le LISP, qui devint le langage universel de l’IA. En effet, les qualités du LISP en matière de gestion de mémoire et de représentation lui permirent de supplanter ses concurrents comme l’IPL ou le COMIT. Toutefois, dans les conditions de l’informatique des années 1960, où la taille des mémoires était faible, l’encombrement en espace mémoire des langages de traitements de listes a freiné leur adoption. De plus, les premiers LISPs étaient interprétés et non compilés, donc trop lents. Le LISP ne devint attractif qu’à partir de 1970, lorsque la compilation efficace de programmes Lisp devint possible (voir MacLISP).
- Perceptron (1958) - Le Perceptron fut le premier modèle opérationnel de réseau de neurones. Il fut créé par Frank Rosenblatt sous forme d’une simulation tournant sur un IBM 704, à partir des travaux de McCulloch et Pitts sur la notion de neurones formels interconnectés en 1943, et de Hebb sur l’importance du couplage synaptique dans les processus d’apprentissage en 1949. Le Perceptron est inspiré du système visuel, et il se montre capable d’apprentissage en modifiant ses connexions synaptiques. Le Perceptron comprend trois éléments principaux :
- une couche d’unités sensorielles, ou « rétine », fournissant des réponses modulées en fonction de l’intensité du stimulus,
- une couche de cellules d’association, constituant la couche de neurones formels proprement dits, selon la définition de McCulloch et Pitts.
- une couche de cellules de décisions, qui représentent la réponse de sortie du Perceptron.
- Grâce à une procédure inventée par Frank Rosenblatt, l’apprentissage du Perceptron se fait par correction d’erreur, en modifiant les coefficients de poids des signaux entre les cellules. En 1969, Marvin Lee Minsky et Seymour Papert publièrent un ouvrage intitulé Perceptrons, qui démontrait certaines limitations de ces modèles. En particulier, le Perceptron ne peut pas effectuer l’opération binaire de parité (OU exclusif ou XOR). L’autorité de ces auteurs, ainsi que le décès accidentel de Frank Rosenblatt, entraîna un quasi-arrêt des recherches dans ce domaine pendant près de 15 ans, jusqu’à l’apparition des réseaux multicouches de neurones.
Les demandes d’identification, renforcées par le terrorisme, assurent un marché immense à cette technique.
- Geometry Theorem Prover ou GTP (Système de démonstration de théorèmes géométriques) (1959) - Ce programme a été financé par IBM et conçu par Herbert Gelernter. GTP fonctionnait de manière rétrograde à partir du théorème à démontrer, pour remonter par des raisonnements intermédiaires à des théorèmes ou des axiomes connus. Lors de cette phase, le programme s’aidait d’une figure géométrique décrite à partir des coordonnées de ses points. Pour élaguer l’arbre de recherche, GTP cherchait uniquement à démontrer les propriétés qui semblaient vérifiées sur le schéma, comme le font inconsciemment les humains. GTP était ainsi capable de faire des démonstrations nécessitant jusqu’à 10 étapes. Plus important, il fut le premier programme capable de faire référence à un modèle, dans la mesure où la figure géométrique était utilisée comme une représentation interne. À la suite de la notoriété de GTP et d’autres programmes d’IA, IBM décida d’arrêter ces études d’une part en raison de la pression des actionnaires et du service marketing, qui s’alarmaient d’une image trop inquiétante des ordinateurs dans l’esprit du grand public. GTP garde une belle performance à son actif : il découvrit la première démonstration géométrique considérée comme plus élégante que celles des manuels scolaires de son époque. Au problème « Dans un triangle, l’angle B est égal à l’angle C. Démontrez que le côté AB est égal au côté BC », il apporta une démonstration non pas en considérant les deux sous-triangles découpés par la hauteur, mais par : « Considérons les triangles ABC et ACB : ces deux triangles sont semblables et possèdent des côtés correspondants BC et CB égaux. Ils sont donc égaux et AB est en conséquence égal à BC ». La démonstration a surpris par son approche non intuitive.
- SAINT (Symbolic Automatic INTegrator ou intégrateur symbolique automatique) (1961) - James Slagle appliqua la méthodologie de Logic Theorist au domaine de l’intégration symbolique, en la transposant ainsi de la logique à l’algèbre, grâce à la mise au point de procédures d’exploration des arbres ET/OU. Confronté à des sujets d’examens posés aux étudiants du MIT de 1re année, SAINT parvint à résoudre 84 problèmes sur 86. Ce programme a été perfectionné par Joel Moses en 1966 sous le nom de SIN (Symbolic INtégration), avant de donner naissance en 1969 à MACSYMA, qui a inspiré nombre de logiciels de traitement formel des équations aujourd’hui employés (dont un descendant en ligne droite toujours en développement : MAXIMA, ou encore Mathematica).
- ANALOGY (1963) - Tom Evans a créé ce programme en se fondant sur l’idée que le cerveau humain, devant une situation donnée, ne raisonne pas selon les voies de la logique, mais en essayant de trouver des ressemblances avec des problèmes déjà rencontrés. Il a tenté de simuler l’aptitude à chercher des ressemblances avec ce logiciel capable de trouver des analogies entre des figures géométriques employées dans les tests d’intelligence.
- STUDENT (1964) - Daniel Bobrow a inventé ce programme, capable de faire une analyse syntaxique de textes simples, pour résoudre des problèmes algébriques du type « trouvez l’âge du capitaine ».
- SIR (Semantic Information Retrieval ou recherche d’information sémantique) (1964) - Ce programme de Bertram Raphael pouvait interpréter des dialogues simples, en cherchant des analogies avec des modèles de phrases. Cette technique lui permettait de déduire des relations entre les personnes ou les objet cités dans ces phrases, en posant des questions à un opérateur. Toutefois, les capacités de SIR, comme celles de STUDENT étaient très limitées. Les informations traitées concernaient un domaine très restreint, et les programmes butaient rapidement sur des ambiguïtés.
- Shakey (1969) - Créé dans le laboratoire du Stanford Rechearch Institute, Shakey fut le premier robot ayant fait l’objet de publicité dans le grand public, à la suite d’un reportage très sensationnaliste de la revue Life, qui l’avait baptisé la première personne électronique. Shakey était également censé pouvoir circuler sur la lune pendant plusieurs mois sans recevoir une seule directive de la terre ! Shakey était un cube monté sur roues, équipé d’un bras, d’une caméra vidéo, d’un télémètre et d’antennes de liaison radio. Il se déplaçait dans un micromonde constitué de 7 pièces reliées par 8 portes, contenant des boites carrées. Celles-ci étaient contournées, déplacées ou empilées en fonction des instructions que le robot recevait par un clavier. Shakey avait une procédure de contrôle nommée STRIPS, qui était un perfectionnement du General problem Solver, et qui constituait sa principale innovation. Le projet Shakey avait pour objectif de créer un robot capable d’enchaîner une série d’actions : circuler dans une pièce pour trouver un bloc, le déplacer au sommet d’une plate-forme après avoir poussé un plan incliné contre elle, et ainsi de suite. En fait, Shakey devint seulement capable de réaliser ces actions de façon indépendante, avec une forte probabilité d’échec. Constatant que les objectifs du projet étaient hors de portée, la DARPA mit fin au financement de ces travaux.
- PLANNER (1969) - Ce langage de programmation fut inventé par Carl Hewitt à partir de LISP, selon une approche antagoniste du GPS et de ses méthodes de résolution de problèmes fondées sur la logique et les procédures uniformes de démonstration de théorèmes. PLANNER permettait en quelques instructions de fixer des buts à un programme (chercher un cube rouge placé sous une pyramide), des plans et des assertions de façon automatique, sans avoir besoin de programmer des itérations et des marches arrière comme avec LISP. Mais PLANNER présentait l’inconvénient de ne pas faire de distinction entre les connaissances contenues dans ces procédures, et l’exploitation de ces connaissances par ces mêmes procédures. Les programmes étaient donc un mélange inextricable de connaissances et de procédures. Ce manque de structuration a été critiqué et a conduit à l’abandon des langages de type PLANNER. Marvin Lee Minsky estime toutefois que l’intelligence naturelle est organisée selon des principes similaires à PLANNER, avec des agents indépendants hiérarchisés, selon sa théorie de la société de l’esprit.
- SHRDLU et les micro-mondes (1969) - Le nom de SHRDLU est devenu un mythe de l’intelligence artificielle. Programmé avec le langage PLANNER, ce logiciel était la modélisation d’un micro-monde de blocs et de pyramides de couleurs diverses, avec une boite pour les ranger. Un bras virtuel permettait à un utilisateur de manipuler ces objets. L’opérateur pouvait donner des ordres et poser des questions, alors que SHRDLU répondait en décrivant l’emplacement des objets, et les motifs des manipulations effectuées. SHRDLU affichait également sur un écran une image de son micro-monde. Terry Winograd avait nommé son programme en référence au magazine MAD, qui l’employait pour désigner des monstres (et non par référence aux lettres les plus employées en anglais, comme cela est parfois indiqué). Le fait que l’utilisateur et SHRDLU échangeaient des informations constructives, et que ce dernier pouvait expliciter ses motivations, fit une forte impression. Les partisans des micro-mondes espéraient pouvoir enrichir et complexifier progressivement les mondes simulés pour les rapprocher de la réalité, ou bien fusionner plusieurs micro-mondes pour les étendre. Cette approche fut un échec, car il est vite apparu qu’il n’est pas possible d’aller vers un monde plus proche du réel sans prise en compte du sens commun dans le programme. Eugène Charniak prit pour exemple en 1972 le cas d’une tirelire-cochonnet pour enfants. Un programme de type micro-monde ne peut pas se contenter d’une définition tirée d’un dictionnaire. Il faut avoir une description de la taille, de la forme, des couleurs et du poids de l’objet, tout en sachant que ces paramètres peuvent fortement varier. La notion d’argent implique de définir ce que sont l’économie et l’épargne. L’utilisation de cet objet simple se révèle complexe à décrire : mettre de l’argent, secouer le cochonnet pour en interpréter le bruit, retirer l’argent en mettant le cochonnet à l’envers et en employant un couteau, voire utiliser le cochonnet comme une figurine animée. La complexité du savoir à mettre en œuvre est très éloignée de la simplification propre aux micro-mondes.
- Prolog (1977). Le langage « PROgrammation en LOGique » est un moteur d’inférence conçu initialement par A.Colmerauer et P.Roussel pour l’interprétation du langage naturel, mais il est couramment utilisé pour des problèmes d’intelligence artificielle. Prolog est un langage déclaratif, cela signifie que plutôt que d’être constitué de la solution à un problème, un programme consiste en une base de faits d’une part, et d’un ensemble de relations logiques d’autre part. Pour exécuter le programme, il faut poser une question, et Prolog donne la réponse calculée en appliquant les règles sur la base de faits.
Prolog s’adaptait si bien à la réalisation d’applications de combinatoires telles que celles requises par les agences de voyage, par exemple, qu’il fit dire à Philippe Kahn : « Qu’on ne parle plus désormais d’intelligence artificielle! C’était un nom du passé pour un domaine de recherche. Nous sommes aujourd’hui à l’époque des réalisations, et on va réaliser maintenant des applications professionnelles programmées en PROLOG comme on en programmait hier en COBOL ». l’avenir lui donna tort sur le court terme.
Espoirs et méfiances liées à l’intelligence artificielle
Une description spectaculaire d’un possible avenir de l’intelligence artificielle a été faite par le professeur I. J. Good :
« Supposons qu’existe une machine surpassant en intelligence tout ce dont est capable un homme, aussi brillant soit-il. La conception de telles machines faisant partie des activités intellectuelles, cette machine pourrait à son tour créer des machines meilleures qu’elle-même; cela aurait sans nul doute pour effet une réaction en chaîne de développement de l’intelligence, pendant que l’intelligence humaine resterait presque sur place. Il en résulte que la machine ultra intelligente sera la dernière invention que l’homme aura besoin de faire, à condition que ladite machine soit assez docile pour constamment lui obéir. »
La situation en question, correspondant à un changement qualitatif du principe même de progrès, a été nommée par quelques auteurs « La Singularité ».
Good estimait à un peu plus d'une chance sur deux la mise au point d'une telle machine avant la fin du XXe siècle. La prédiction, en 2004, ne s’est pas (encore?) réalisée, mais avait imprégné le public : le cours de l’action IBM quadrupla (bien que les dividendes trimestriels versés restassent à très peu de chose près les mêmes) dans les mois qui suivirent la victoire de Deep Blue sur Gary Kasparov. Une large partie du grand public était en effet persuadée qu’IBM venait de mettre au point le vecteur d’une telle explosion de l’intelligence et que cette compagnie en tirerait profit. L’espoir fut bien entendu déçu : une fois sa victoire acquise, Deep Blue (incapable d’ailleurs de jouer à autre chose qu’aux échecs, et ne sachant même pas qu’il jouait aux échecs) fut reconverti en machine classique utilisée pour le data mining. Nous sommes probablement encore très loin d’une machine possédant ce que nous nommons de l'intelligence générale, et tout autant d’une machine possédant la base de connaissances de n’importe quel chercheur, si humble soit-il.
Principales techniques liées à l’intelligence artificielle
- Métaheuristiques (dont les Algorithmes génétiques) ;
- Programmation Génétique ;
- Apprentissage automatique (Réseaux de neurones, Concepts Formels, etc.) ;
- Data mining ;
- Inférence bayésienne ;
- Système expert ;
- Système multi-agents ;
- Logique floue (Fuzzy logic) ;
- Programmation par contraintes ;
- Raisonnement par cas ;
- Théorie des jeux ;
- Théorème de Cox-Jaynes.
Spécialistes de l’intelligence artificielle
- Irving John Good
- Douglas Lenat ;
- Marvin Lee Minsky
- Seymour Papert
- Pour l’anecdote, citons Daniel Goossens, chercheur à l’Université Paris 8 mais aussi auteur de bandes-dessinées de premier plan.
Liens internes
Liens externes
- (en) Kurzweilai, très bon site d'information sur l'intelligence artificielle ;
- (en) Le projet de Douglas Lenat ;
- (fr) Dossier introductif sur la vie artificielle.
- (en) Site de Joe Halpern, professeur à Cornell
- (en) I.J. Good : Speculations Concerning the First Ultraintelligent Machine (voir aussi Inférence bayésienne)
- (en) Hugo de Garis
- (fr) À quoi rèvent les robots, BD de vulgarisation de Jean-Pierre Petit (en PDF)
L'intelligence artificielle au cinéma
- Colossus : the Forbin project 1969, d’après le roman de Dennis Feltham Jones de 1967 (un système d’IA militaire étatsunien contacte son homologue russe pour qu’ils coopèrent à leur mission commune (éviter la guerre nucléaire)... en neutralisant les humains! A probablement fourni l’idée de départ de Terminator.
- Metropolis de Fritz Lang (1927), où, dans un monde futuriste, les robots et les humains ne parviennent plus à coexister ;
- 2001, l'odyssée de l'espace de Stanley Kubrick, la lutte entre HAL et Dave ;
- L'Homme bicentenaire de Chris Colombus, où un robot cherche à devenir humain quand il découvre ses émotions ;
- D.A.R.Y.L., Daryl a un enfant amnésique recueilli sur une route. Mais finalement, le gouvernement cherche à détruire le data analyzing robot youth lifeform ;
- La trilogie des Terminator avec Arnold Schwarzenegger, où Skynet cherche à éliminer l’espèce humaine
- Ghost in the Shell, où une IA s’éveille à la conscience ;
- La trilogie des Matrix où les machines asservissent les humains ;
- A.I. intelligence artificielle de Steven Spielberg. Le personnage central est certainement un aboutissement ultime - mais pour l’instant seulement imaginaire - de l’intelligence artificielle : un enfant-robot doué d’émotions et de sentiments ;
- I, Robot avec Will Smith, thème semblable au film IA.
