Thèses : « Apprentissage robotique »

1

Filliat, David. « Navigation, perception et apprentissage pour la robotique ». Habilitation à diriger des recherches, Université Pierre et Marie Curie - Paris VI, 2011. http://tel.archives-ouvertes.fr/tel-00649692.

Texte intégral

Résumé :

Nous avons mené des travaux de recherche principalement dans les domaines de la navigation, la perception et l'apprentissage pour la robotique mobile. Ces travaux, orientés vers une robotique " cognitive ", ont pour objectif général de per- mettre aux robots de s'adapter à leur environnement, en fournissant les primitives de base telles que l'espace libre, la position ou la présence d'objets nécessaires au choix des actions. Une grande partie de ces travaux sont guidés par une inspi- ration biologique essentiellement fonctionnelle, s'inspirant de capacités trouvées dans la nature, sans chercher à en reproduire précisément le fonctionnement. La navigation, plus particulièrement la cartographie, a été jusqu'à présent le thème principal de nos travaux. Durant notre thèse, nous avons développé une méthode de cartographie utilisant un filtre bayésien, appliqué à une structure de carte et à des perceptions inspirées des connaissances biologiques sur les capacités de navigation du rat. L'intérêt de cette approche est de permettre, à partir de capteurs très simples, une localisation globale durant la cartographie, apportant ainsi une bonne robustesse à la navigation, au prix d'une exploration relativement lente. Cette inspiration biologique s'est ensuite effacée dans les tra- vaux menés à la Direction Générale pour l'Armement ou nous avons participé à la mise en place d'un démonstrateur utilisant des techniques de cartographie classiques à base de télémétrie laser et d'évitement d'obstacles en environnement dynamique. Depuis 2005 à l'ENSTA ParisTech, nos travaux se sont orientés sur les problèmes de navigation topologique, avec une approche de navigation topo- logique par apprentissage dans laquelle un utilisateur désigne les pièces à re- connaître et montre le chemin entre les différentes pièces. Nous avons également développé une approche de cartographie topologique utilisant un algorithme de détection de fermetures de boucles qui permet de détecter le retour d'un robot à une position connue. Enfin, ces travaux se sont maintenant étendus, depuis 2009 dans le cadre du projet ANR PACOM, à la problématique de la cartographie sé- mantique. L'objectif est d'obtenir des modèles de l'environnement contenant des informations de plus haut niveau; en particulier des informations plus proches de celles utilisées par l'humain, telles que les pièces ou les objets présents dans l'environnement. Au niveau de la perception, certains de ces travaux ont fait appel à la télémétrie laser, qui est bien adaptée à la navigation. Ils sont néanmoins axés principalement sur l'utilisation de la vision. En particulier, nous nous sommes intéressés au problème de la représentation de l'information visuelle qui est essentielle pour apporter une robustesse au bruit tout en fournissant l'information nécessaire aux applications. Nous avons ainsi développé une approche incrémentale inspirée des modèles de " sac de mots " visuels que nous avons appliqué à la localisation qualitative, topologique, au guidage visuel et à la reconnaissance d'objets. En collaboration avec Pierre-Yves Oudeyer nous avons étendu cette représentation à la reconnaissance auditive et audio-visuelle. Nous nous sommes également intéressés au problème de la perception active afin d'améliorer les capacités de localisation et d'améliorer la robustesse du guidage visuel. Enfin, la plupart de ces travaux ont fait appel à des méthodes d'apprentissage pour apporter de l'adaptabilité à la localisation, à la cartographie ou à la re- connaissance d'objets. Nous avons principalement travaillé avec des méthodes Bayésiennes et nous avons notamment développé des méthodes actives, permet- tant au robot de sélectionner les exemples d'apprentissage pour améliorer ses performances. Ces méthodes permettent également de profiter d'interactions avec l'utilisateur pour adapter les concepts appris par le robot. Nous les avons appli- quées à la reconnaissance de pièces et d'objets. Nous avons également appliqué la technique de factorisation en matrices non-négatives, une méthode d'appren- tissage non supervisée, pour la reconnaissance audio-visuelle d'objets. Cette der- nière application se place dans le cadre de la robotique développementale où nous cherchons à nous inspirer de l'homme pour créer des méthodes d'apprentis- sage intuitives et à long terme pour la robotique, approche que nous développons actuellement dans le cadre du projet ANR MACSi. Dans la continuité de ces travaux, nous souhaitons poursuivre nos recherches sur le thème de la navigation sémantique et de l'apprentissage pour la percep- tion dans le cadre de la robotique développementale. Ces recherches auront pour objectif commun de fournir au robot ou à son utilisateur des modèles d'environ- nement riches et contenant des informations utiles à l'analyse de la situation ou aux tâches du robot. Ces méthodes s'appliqueront essentiellement dans le cadre de la navigation en milieu intérieur ou urbain et à la robotique de service ou d'assistance, en interaction directe avec l'homme.