Voitures autonomes : une nouvelle façon de "voir" les objets
Les capteurs laser actuellement utilisés pour détecter des objets 3D sur les traces de voitures autonomes sont volumineux, laids, coûteux, énergivores et peu précis.
Remplacer la technologie LIDAR par des caméras stéréoscopiques
Ces capteurs LiDAR (Light Detection and Ranging) sont fixés sur les toits des voitures, où ils augmentent la résistance du vent, un inconvénient particulier des voitures électriques. Ils peuvent ajouter environ 10 000 dollars au coût d’une voiture. Cependant, malgré leurs inconvénients, la plupart des experts ont considéré les capteurs LiDAR comme le seul moyen plausible pour les véhicules autonomes de percevoir en toute sécurité les piétons, les voitures et les autres objets sur la route.
Des chercheurs de Cornell ont découvert qu’une méthode plus simple, utilisant deux caméras peu coûteuses de part et d’autre du pare-brise, permettait de détecter des objets avec une précision proche de celle du LiDAR et pour une fraction du coût. Les chercheurs ont constaté que l’analyse des images capturées à vol d’oiseau plutôt que de la vue frontale plus traditionnelle avait plus que triplé la précision des voitures, faisant de la caméra stéréo une alternative viable et peu coûteuse.
«L’un des problèmes essentiels des voitures autonomes est d’identifier les objets qui les entourent – c’est évidemment essentiel pour une voiture afin de naviguer dans son environnement efficacement», a déclaré Kilian Weinberger, professeur agrégé d’informatique, «la conviction commune est qu’il est impossible de fabriquer des voitures autonomes sans LiDAR. Nous avons montré, au moins en principe, que c’était possible. », explique Weinberger.
Les capteurs LiDAR utilisent des lasers pour créer des cartes 3D de leur environnement, mesurant la distance des objets via la vitesse de la lumière. Les caméras stéréo, qui reposent sur deux perspectives pour établir la profondeur, comme le font les yeux humains, semblaient prometteuses. Mais leur précision dans la détection des objets étaient très faible, et l’opinion courante était qu’ils étaient trop imprécis.
L’écart de précision est apparu au moment de l’analyse des données
Mais Yan Wang, doctorant en informatique, et ses collaborateurs ont examiné de plus près les données des caméras stéréo. À leur grande surprise, ils ont constaté que leurs informations étaient presque aussi précises que LiDAR. Ils ont constaté que l’écart de précision était apparu au moment de l’analyse des données des caméras stéréoscopiques.
Pour la plupart des voitures autonomes, les données capturées par des caméras ou des capteurs sont analysées à l’aide de réseaux de neurones à convolution, une sorte d’apprentissage automatique qui identifie les images en appliquant des filtres reconnaissant des motifs qui leur sont associés. Ces réseaux de neurones de convolution se sont révélés très efficaces pour identifier des objets sur des photographies couleur standard, mais ils peuvent déformer les informations 3D si elles sont représentées de face.
La précision a plus que triplé
Ainsi, lorsque Wang et ses collègues ont basculé la représentation d’un point de vue frontal à un nuage de points observé à vol d’oiseau, la précision a plus que triplé.
«Lorsque vous avez des images venant d’une caméra, c’est tentant de regarder la vue frontale, car c’est ce que la caméra voit», a déclaré Weinberger. « Mais le problème réside également à cet endroit, car si vous voyez des objets de face, leur traitement est effectivement déformé, ce qui rend les objets flous dans l’arrière-plan et altère leurs formes. »
En fin de compte, a déclaré Weinberger, les caméras stéréo pourraient potentiellement être utilisées comme moyen principal d’identification d’objets dans des voitures moins chères, ou comme méthode de secours dans les voitures haut de gamme également équipées de LiDAR.
«L’industrie automobile autonome a été réticente à s’éloigner de LiDAR, malgré les coûts élevés, en raison de son excellente précision, ce qui essentielle pour la sécurité d’une voiture autonome», a déclaré Mark Campbell, professeur de John A. Mellowes60 et et coauteur du document.
« L’amélioration spectaculaire de la détection de la distance et de la précision, avec la représentation à vol d’oiseau des données d’une caméra, pourrait révolutionner ce secteur. » Les résultats ont des implications au-delà des voitures autonomes, a déclaré le coauteur Bharath Hariharan, professeur adjoint en informatique.
Une pratique erronée qui mène à une imprécision
«Les pratiques actuelles ont tendance à alimenter les données telles quelles à des algorithmes d’apprentissage automatique complexes, en partant du principe que ces algorithmes peuvent toujours extraire des informations pertinentes», a déclaré Hariharan. « Nos résultats suggèrent que ce n’est pas nécessairement vrai, et que nous devrions réfléchir à la manière dont les données sont représentées. »
Les résultats de cette recherche ont été prépubliés dans ArXiv
Source : Cornell University
Crédit photo sur Unsplash : Jonas Von Werne