ADHÉSION

Spotlight juin 2022 - Robots pédagogiques

Les machines peuvent-elles apprendre à marcher et à agir dans le monde réel comme le font les enfants ? Partir de zéro, observer, copier, essayer, échouer, réessayer ? Apprendre à bouger n'est pas aussi facile qu'apprendre à penser, mais les robots s'en rapprochent.

PUBLIÉ PAR L'Institut FII

27 juin 2022
Partager cette publication

LES ROBOTS APPRENNENT À APPRENDRE - UN PEU COMME LE FONT NOS ENFANTS

Les machines peuvent-elles apprendre à marcher et à agir dans le monde réel comme le font les enfants ? Partir de zéro, observer, copier, essayer, échouer, réessayer ? Apprendre à bouger n'est pas aussi facile qu'apprendre à penser, mais les robots s'en rapprochent.

 

LA QUESTION EN JEU

MYON SERAIT AUJOURD'HUI UN ÉLÈVE DE 6E ANNÉE. Il a été construit en 2011 par Manfred Hild, professeur de neurorobotique à Berlin.1 Robot d'apparence humanoïde, Myon a été spécifiquement conçu pour - rien. Il n'avait aucune compétence particulière, mais avec 200 capteurs, 50 moteurs et de nombreux membres et articulations, la machine était censée se développer par l'observation de son environnement.

"Myon n'a pas de but", a déclaré sa créatrice Hild. "Mais nous avons un objectif : comprendre les choses". En l'occurrence, comprendre l'apprentissage. "L'intelligence ne vient pas du jour au lendemain. Ni chez les enfants, ni chez les robots. Combien de temps faut-il aux enfants pour se tenir debout, marcher, parler ?

Ainsi, au lieu d'un programme, le nouveau robot a simplement été équipé de quelques règles à suivre. Par exemple, suivre des signaux bien visibles. Ou encore, une fois que l'on a décidé quelque chose, il faut s'y tenir pendant un certain temps. Il a été doté d'un design plutôt enfantin, avec un œil surdimensionné dans la tête. Le facteur câlin était censé abaisser la barrière de communication et augmenter la patience des humains en interaction. C'est un enfant, il apprend encore.

Son heure de gloire est arrivée à l'été 2015 : Myon est devenu acteur à l'opéra. Au Komische Oper Berlin, le Robaby a joué un rôle principal dans le spectacle "My Square Lady". Une combinaison d'enregistrements vidéo et d'actions sur scène a permis au public de participer au projet et d'assister aux premiers succès de Myon, ainsi qu'à ses déboires.

C'est surtout ce dernier point qui a été négligé. La règle "suivre le signal", par exemple, a amené Myon à tourner la tête vers les haut-parleurs, et non vers la chanteuse. Nous savons que la voix d'une soprano appartient à la personne qui se déplace sur scène, mais le robot l'a attribuée à l'endroit d'où provenait le son.

Les performances de Myon ne se sont pas beaucoup améliorées depuis, comme l'admet Benjamin Panreck, l'un de ses co-créateurs.4 Le robot a besoin d'un entraînement intensif pour apprendre des actions spécifiques et ne montre guère de signes de capacité à transférer une leçon apprise une fois dans une situation légèrement différente. Aujourd'hui, Myon est souvent utilisé pour enseigner aux étudiants du laboratoire de neurorobotique du professeur Hild comment former des robots, mais sa propre courbe d'apprentissage reste au mieux superficielle. LES ROBOTS PEUVENT APPRENDRE GRÂCE À DES INCITATIONS Mais attendez une minute, ne vivons-nous pas à l'ère de l'apprentissage automatique ? Oui, nous vivons à l'ère de l'apprentissage automatique. Tout a commencé il y a 25 ans, lorsque Jürgen Schmidhuber et Sepp Hochreiter ont publié leurs travaux novateurs sur la mémoire à long terme (LSTM ; voir l'encadré page 3)5 . Avec suffisamment de données d'entraînement, ces réseaux neuronaux récurrents peuvent produire des résultats étonnants pour des tâches telles que la reconnaissance vocale ou la traduction automatique. Et ils peuvent le faire de manière presque autonome, avec relativement peu d'efforts de formation de la part de l'homme. Les réseaux neuronaux à apprentissage autonome sont devenus très courants. Les robots autonomes, tels que les voitures à conduite autonome, sont déjà un concept familier. Mais les robots qui apprennent de manière autonome ne sont encore qu'une aspiration. Les robots qui apprennent à se déplacer et à agir dans le monde réel dépendent encore largement de l'intervention humaine.

Comment les robots apprennent-ils ? Le principal principe d'éducation des robots est celui qu'ils partagent avec les enfants et les bébés : l'apprentissage par l'incitation. Le robot se comporte d'abord de manière aléatoire, puis évalue l'efficacité de ses comportements. Cela peut se faire par le biais d'un retour d'information de la part de l'instructeur, qui indique au robot si ses actions ont été efficaces ou non. Le robot choisit le comportement qui lui offre la plus grande récompense, puis passe à l'itération suivante. Il applique un certain nombre de variations aléatoires au comportement choisi et détermine par essais et erreurs lequel des nouveaux comportements est désormais le plus efficace, et ainsi de suite.

Cette méthode est appelée "apprentissage renforcé "7 et, tant que l'on reste dans le monde pur des données, elle n'est pas très différente de la "porte de l'oubli" conçue par Schmidhuber et Hochreiter. Mais les robots, par définition, entrent en contact avec un monde physique au-delà des données pures, et les choses deviennent alors différentes - et plus complexes. Prenons un robot qui apprend à marcher. Dans de nombreux cas, le résultat est une chute, généralement non souhaitée. Le robot ne doit pas simplement oublier l'essai, mais s'en souvenir pour ne pas le reproduire, comme un enfant qui touche une plaque chauffante pour la première fois. L'apprentissage robotique par le biais d'incitations peut donc aller dans les deux sens, récompense et punition. Quant aux chutes, elles sont coûteuses. Chaque fois que le robot tombe ou sort de son environnement d'entraînement, il faut quelqu'un pour le ramasser et le remettre sur la bonne voie. Cela représente beaucoup de main-d'œuvre, car les robots ont besoin de beaucoup de formation. De plus, le robot risque d'être endommagé. Vous pouvez essayer de construire un robot robuste, mais pour pouvoir marcher, il doit aussi être flexible, avec de nombreuses pièces mobiles - articulations, moteurs et capteurs. Et même si le risque d'endommagement est faible pour un seul événement, les robots qui apprennent à marcher produiront un grand nombre d'événements de ce type au cours de leur formation.

 

 

 

Publications connexes

N'oubliez pas notre planète
Plongez dans une reprise verte ; explorez les solutions basées sur la nature pour un avenir durable et résilient.
en savoir plus
L'équité en matière de soins de santé - un impératif moral
Le "Healthcare Impact report 2020" publié par l'Institut FII souligne que l'équité en matière de santé est un impératif moral. La grande différence d'espérance de vie en fonction de l'endroit où l'on est né témoigne d'une inégalité criante en matière de santé à l'échelle mondiale. En outre, un double fardeau apparaît lorsque les coûts des soins de santé dépassent un certain pourcentage du revenu des ménages, ce qui oblige à prendre des décisions difficiles [...]
en savoir plus
1 2 3 ... 29

Participez à la conversation

Tweetez à propos de cette publication et mentionnez #FIIPublications pour entrer en contact avec l'auteur.
chevron vers le basflèche-droite