Sauf dans les films de SF comme "Matrix revolutions", où d'effrayants robots calamars manoeuvrent avec une incroyable aisance, la plupart des robots réels sont trop maladroits pour se déplacer autour d'obstacles à vitesse élevée.
Ceci est vrai en grande partie parce qu'ils ont du mal à déterminer, dans les images qu'ils observent, la distance exacte à laquelle se trouvent les obstacles. Des informaticiens de Stanford dévoilent un algorithme de vision pour machines qui donne aux robots la capacité d'évaluer les distances sur de simples images fixes.
"Beaucoup de gens pensent que l'évaluation de le profondeur à partir d'une image monoculaire simple est impossible", remarque le professeur d'informatique Andrew Ng, qui présente un rapport sur ses recherches à la conférence Neural Information Processing Systems de Vancouver. "En fait, dans les applications pratiques, l'évaluation monoculaire de la profondeur non seulement fonctionne bien, mais peut également s'avérer très utile".
A l'aide d'énormes treillis de capteurs et d'un investissement considérable, certains robots parviennent à se diriger convenablement. Stanley, le véhicule robot de Stanford qui a participé au grand défi de la DARPA dans le désert en octobre dernier (voir notre
news), utilisait des lasers, des radars et des caméras pour scruter la route devant ses roues. En utilisant les travaux du professeur Ng et de ses élèves, les robots trop petits pour embarquer de nombreux capteurs ou qui doivent être construits à bon marché pourraient se diriger au moyen d'une seule caméra vidéo. Et déjà, en utilisant une version simplifiée de cet algorithme, le professeur Ng est parvenu à ce qu'un véhicule radiocommandé se pilote d'une manière autonome pendant plusieurs minutes dans une zone fortement boisée avant de se crasher.
Induire la profondeur
Pour donner aux robots la perception de la profondeur, Ng et ses élèves Ashutosh Saxena et Sung H. Chung ont conçu un logiciel capable d'apprendre à repérer certaines caractéristiques de profondeur dans des images fixes. Ces indices incluent les variations de texture (les surfaces qui semblent plus détaillées sont supposées être proches), les contours (des lignes qui semblent converger, comme les bords d'un chemin, indiquent une distance croissante) et le "brouillard" (les objets qui apparaissent brumeux sont susceptibles d'être plus lointains).
Pour analyser ces caractères indicateurs de la manière la plus exhaustive, le logiciel découpe les images en sections et les analyse d'abord individuellement puis en relation avec les sections voisines. Ceci permet au logiciel de déduire les relations entre les objets de l'image. Le logiciel recherche également des indices dans l'image à des niveaux variables de grossissement pour s'assurer qu'il ne rate aucun détail ni aucune tendance dominante, autrement dit et au sens propre, pour que "les arbres ne lui cachent pas la forêt".
En utilisant l'algorithme de Stanford, les robots pourraient juger des distances dans des environnements intérieurs ou extérieurs avec une erreur moyenne d'environ 35%. En d'autres termes, un arbre réellement distant de 9 mètres serait perçu à une distance comprise entre 6 et 12 mètres. Un robot se déplaçant à 30 kilomètres par heure et évaluant les distances grâce aux images d'une vidéo à 10 trames par seconde aurait suffisamment de temps pour calculer son itinéraire, cela, même avec cette incertitude. Le Professeur Ng précise que comparé aux algorithmes de vision stéréo traditionnels - ceux qui emploient deux caméras et font usage de la triangulation pour calculer la profondeur - le nouveau logiciel pouvait détecter avec certitude des obstacles cinq à dix fois plus éloignés.
"La difficulté de faire fonctionner la perception visuelle de la profondeur à grande distance a toujours été une barrière importante pour le déplacement à grande vitesse des robots ", indique Ng. "J'aimerais construire un véhicule volant capable d'évoluer dans une forêt en esquivant habilement chaque arbre". Cela fait naturellement penser aux images d'un autre film: la scène de poursuite dans la forêt sur la planète des Ewoks dans le "Retour du Jedi". Le Professeur Ng veut transposer cette idée du royaume de la fiction dans le monde réel.