Thèses sur le sujet « Apprentissage robotique »

Pour voir les autres types de publications sur ce sujet consultez le lien suivant : Apprentissage robotique.

Créez une référence correcte selon les styles APA, MLA, Chicago, Harvard et plusieurs autres

Choisissez une source :

Consultez les 50 meilleures thèses pour votre recherche sur le sujet « Apprentissage robotique ».

À côté de chaque source dans la liste de références il y a un bouton « Ajouter à la bibliographie ». Cliquez sur ce bouton, et nous générerons automatiquement la référence bibliographique pour la source choisie selon votre style de citation préféré : APA, MLA, Harvard, Vancouver, Chicago, etc.

Vous pouvez aussi télécharger le texte intégral de la publication scolaire au format pdf et consulter son résumé en ligne lorsque ces informations sont inclues dans les métadonnées.

Parcourez les thèses sur diverses disciplines et organisez correctement votre bibliographie.

1

Filliat, David. « Navigation, perception et apprentissage pour la robotique ». Habilitation à diriger des recherches, Université Pierre et Marie Curie - Paris VI, 2011. http://tel.archives-ouvertes.fr/tel-00649692.

Texte intégral
Résumé :
Nous avons mené des travaux de recherche principalement dans les domaines de la navigation, la perception et l'apprentissage pour la robotique mobile. Ces travaux, orientés vers une robotique " cognitive ", ont pour objectif général de per- mettre aux robots de s'adapter à leur environnement, en fournissant les primitives de base telles que l'espace libre, la position ou la présence d'objets nécessaires au choix des actions. Une grande partie de ces travaux sont guidés par une inspi- ration biologique essentiellement fonctionnelle, s'inspirant de capacités trouvées dans la nature, sans chercher à en reproduire précisément le fonctionnement. La navigation, plus particulièrement la cartographie, a été jusqu'à présent le thème principal de nos travaux. Durant notre thèse, nous avons développé une méthode de cartographie utilisant un filtre bayésien, appliqué à une structure de carte et à des perceptions inspirées des connaissances biologiques sur les capacités de navigation du rat. L'intérêt de cette approche est de permettre, à partir de capteurs très simples, une localisation globale durant la cartographie, apportant ainsi une bonne robustesse à la navigation, au prix d'une exploration relativement lente. Cette inspiration biologique s'est ensuite effacée dans les tra- vaux menés à la Direction Générale pour l'Armement ou nous avons participé à la mise en place d'un démonstrateur utilisant des techniques de cartographie classiques à base de télémétrie laser et d'évitement d'obstacles en environnement dynamique. Depuis 2005 à l'ENSTA ParisTech, nos travaux se sont orientés sur les problèmes de navigation topologique, avec une approche de navigation topo- logique par apprentissage dans laquelle un utilisateur désigne les pièces à re- connaître et montre le chemin entre les différentes pièces. Nous avons également développé une approche de cartographie topologique utilisant un algorithme de détection de fermetures de boucles qui permet de détecter le retour d'un robot à une position connue. Enfin, ces travaux se sont maintenant étendus, depuis 2009 dans le cadre du projet ANR PACOM, à la problématique de la cartographie sé- mantique. L'objectif est d'obtenir des modèles de l'environnement contenant des informations de plus haut niveau; en particulier des informations plus proches de celles utilisées par l'humain, telles que les pièces ou les objets présents dans l'environnement. Au niveau de la perception, certains de ces travaux ont fait appel à la télémétrie laser, qui est bien adaptée à la navigation. Ils sont néanmoins axés principalement sur l'utilisation de la vision. En particulier, nous nous sommes intéressés au problème de la représentation de l'information visuelle qui est essentielle pour apporter une robustesse au bruit tout en fournissant l'information nécessaire aux applications. Nous avons ainsi développé une approche incrémentale inspirée des modèles de " sac de mots " visuels que nous avons appliqué à la localisation qualitative, topologique, au guidage visuel et à la reconnaissance d'objets. En collaboration avec Pierre-Yves Oudeyer nous avons étendu cette représentation à la reconnaissance auditive et audio-visuelle. Nous nous sommes également intéressés au problème de la perception active afin d'améliorer les capacités de localisation et d'améliorer la robustesse du guidage visuel. Enfin, la plupart de ces travaux ont fait appel à des méthodes d'apprentissage pour apporter de l'adaptabilité à la localisation, à la cartographie ou à la re- connaissance d'objets. Nous avons principalement travaillé avec des méthodes Bayésiennes et nous avons notamment développé des méthodes actives, permet- tant au robot de sélectionner les exemples d'apprentissage pour améliorer ses performances. Ces méthodes permettent également de profiter d'interactions avec l'utilisateur pour adapter les concepts appris par le robot. Nous les avons appli- quées à la reconnaissance de pièces et d'objets. Nous avons également appliqué la technique de factorisation en matrices non-négatives, une méthode d'appren- tissage non supervisée, pour la reconnaissance audio-visuelle d'objets. Cette der- nière application se place dans le cadre de la robotique développementale où nous cherchons à nous inspirer de l'homme pour créer des méthodes d'apprentis- sage intuitives et à long terme pour la robotique, approche que nous développons actuellement dans le cadre du projet ANR MACSi. Dans la continuité de ces travaux, nous souhaitons poursuivre nos recherches sur le thème de la navigation sémantique et de l'apprentissage pour la percep- tion dans le cadre de la robotique développementale. Ces recherches auront pour objectif commun de fournir au robot ou à son utilisateur des modèles d'environ- nement riches et contenant des informations utiles à l'analyse de la situation ou aux tâches du robot. Ces méthodes s'appliqueront essentiellement dans le cadre de la navigation en milieu intérieur ou urbain et à la robotique de service ou d'assistance, en interaction directe avec l'homme.
Styles APA, Harvard, Vancouver, ISO, etc.
2

Droniou, Alain. « Apprentissage de représentations et robotique développementale : quelques apports de l'apprentissage profond pour la robotique autonome ». Thesis, Paris 6, 2015. http://www.theses.fr/2015PA066056/document.

Texte intégral
Résumé :
Afin de pouvoir évoluer de manière autonome et sûre dans leur environnement, les robots doivent être capables d'en construire un modèle fiable et pertinent. Pour des tâches variées dans des environnements complexes, il est difficile de prévoir de manière exhaustive les capacités nécessaires au robot. Il est alors intéressant de doter les robots de mécanismes d'apprentissage leur donnant la possibilité de construire eux-mêmes des représentations adaptées à leur environnement. Se posent alors deux questions : quelle doit être la nature des représentations utilisées et par quels mécanismes peuvent-elles être apprises ? Nous proposons pour cela l'utilisation de l'hypothèse des sous-variétés afin de développer des architectures permettant de faire émerger une représentation symbolique de flux sensorimoteurs bruts. Nous montrons que le paradigme de l'apprentissage profond fournit des mécanismes appropriés à l'apprentissage autonome de telles représentations. Nous démontrons que l'exploitation de la nature multimodale des flux sensorimoteurs permet d'en obtenir une représentation symbolique pertinente. Dans un second temps, nous étudions le problème de l'évolution temporelle des stimuli. Nous discutons les défauts de la plupart des approches aujourd'hui utilisées et nous esquissons une approche à partir de laquelle nous approfondissons deux sous-problèmes. Dans une troisième partie, nous proposons des pistes de recherche pour permettre le passage des expériences de laboratoire à des environnements naturels. Nous explorons plus particulièrement la problématique de la curiosité artificielle dans des réseaux de neurones non supervisés
This thesis studies the use of deep neural networks to learn high level representations from raw inputs on robots, based on the "manifold hypothesis"
Styles APA, Harvard, Vancouver, ISO, etc.
3

Droniou, Alain. « Apprentissage de représentations et robotique développementale : quelques apports de l'apprentissage profond pour la robotique autonome ». Electronic Thesis or Diss., Paris 6, 2015. http://www.theses.fr/2015PA066056.

Texte intégral
Résumé :
Afin de pouvoir évoluer de manière autonome et sûre dans leur environnement, les robots doivent être capables d'en construire un modèle fiable et pertinent. Pour des tâches variées dans des environnements complexes, il est difficile de prévoir de manière exhaustive les capacités nécessaires au robot. Il est alors intéressant de doter les robots de mécanismes d'apprentissage leur donnant la possibilité de construire eux-mêmes des représentations adaptées à leur environnement. Se posent alors deux questions : quelle doit être la nature des représentations utilisées et par quels mécanismes peuvent-elles être apprises ? Nous proposons pour cela l'utilisation de l'hypothèse des sous-variétés afin de développer des architectures permettant de faire émerger une représentation symbolique de flux sensorimoteurs bruts. Nous montrons que le paradigme de l'apprentissage profond fournit des mécanismes appropriés à l'apprentissage autonome de telles représentations. Nous démontrons que l'exploitation de la nature multimodale des flux sensorimoteurs permet d'en obtenir une représentation symbolique pertinente. Dans un second temps, nous étudions le problème de l'évolution temporelle des stimuli. Nous discutons les défauts de la plupart des approches aujourd'hui utilisées et nous esquissons une approche à partir de laquelle nous approfondissons deux sous-problèmes. Dans une troisième partie, nous proposons des pistes de recherche pour permettre le passage des expériences de laboratoire à des environnements naturels. Nous explorons plus particulièrement la problématique de la curiosité artificielle dans des réseaux de neurones non supervisés
This thesis studies the use of deep neural networks to learn high level representations from raw inputs on robots, based on the "manifold hypothesis"
Styles APA, Harvard, Vancouver, ISO, etc.
4

Rolland, de Rengervé Antoine. « Apprentissage Interactif en Robotique Autonome : vers de nouveaux types d'IHM ». Phd thesis, Université de Cergy Pontoise, 2013. http://tel.archives-ouvertes.fr/tel-00969519.

Texte intégral
Résumé :
Un robot autonome collaborant avec des humains doit être capable d'apprendre à se déplacer et à manipuler des objets dans la même tâche. Dans une approche classique, on considère des modules fonctionnels indépendants gérant les différents aspects de la tâche (navigation, contrôle du bras...). A l'opposé, l'objectif de cette thèse est de montrer que l'apprentissage de tâches de natures différentes peut être abordé comme un problème d'apprentissage d'attracteurs sensorimoteurs à partir d'un petit nombre de structures non spécifiques à une tâche donnée. Nous avons donc proposé une architecture qui permet l'apprentissage et l'encodage d'attracteurs pour réaliser aussi bien des tâches de navigation que de contrôle d'un bras.Comme point de départ, nous nous sommes appuyés sur un modèle inspiré des cellules de lieu pour la navigation d'un robot autonome. Des apprentissages en ligne et interactifs de couples lieu/action sont suffisants pour faire émerger des bassins d'attraction permettant à un robot autonome de suivre une trajectoire. En interagissant avec le robot, on peut corriger ou orienter son comportement. Les corrections successives et leur encodage sensorimoteur permettent de définir le bassin d'attraction de la trajectoire. Ma première contribution a été d'étendre ce principe de construction d'attracteurs sensorimoteurs à un contrôle en impédance pour un bras robotique. Lors du maintien d'une posture proprioceptive, les mouvements du bras peuvent être corrigés par une modification en-ligne des commandes motrices exprimées sous la forme d'activations musculaires. Les attracteurs moteurs résultent alors des associations simples entre l'information proprioceptive du bras et ces commandes motrices. Dans un second temps, j'ai montré que le robot pouvait apprendre des attracteursvisuo-moteurs en combinant les informations proprioceptives et visuelles. Le contrôle visuo-moteur correspond à un homéostat qui essaie de maintenir un équilibre entre ces deux informations. Dans le cas d'une information visuelle ambiguë, le robot peut percevoir un stimulus externe (e.g. la main d'un humain) comme étant sa propre pince. Suivant le principe d'homéostasie, le robot agira pour réduire l'incohérence entre cette information externe et son information proprioceptive. Il exhibera alors un comportement d'imitation immédiate des gestes observés. Ce mécanisme d'homéostasie, complété par une mémoire des séquences observées et l'inhibition des actions durant l'observation, permet au robot de réaliser des imitations différées et d'apprendre par observation. Pour des tâches plus complexes, nous avons aussi montré que l'apprentissage de transitions peut servir de support pour l'apprentissage de séquences de gestes, comme c'était le cas pour l'apprentissage de cartes cognitives en navigation. L'utilisation de contextes motivationnels permet alors le choix entre les différentes séquences apprises.Nous avons ensuite abordé le problème de l'intégration dans une même architecture de comportements impliquant une navigation visuomotrice et le contrôle d'un bras robotique pour la préhension d'objets. La difficulté est de pouvoir synchroniser les différentes actions afin que le robot agisse de manière cohérente. Les comportements erronés du robot sont détectés grâce à l'évaluation des actions proposées par le modèle vis à vis des corrections imposées par le professeur humain. Un apprentissage de ces situations sous la forme de contextes multimodaux modulant la sélection d'action permet alors d'adapter le comportement afin que le robot reproduise la tâche désirée.Pour finir, nous présentons les perspectives de ce travail en terme de contrôle sensorimoteur, pour la navigation comme pour le contrôle d'un bras robotique, et son extension aux questions d'interface homme/robot. Nous insistons sur le fait que différents types d'imitation peuvent être le fruit des propriétés émergentes d'une architecture de contrôle sensorimotrice.
Styles APA, Harvard, Vancouver, ISO, etc.
5

Rolland, de Rengerve Antoine. « Apprentissage Interactif en Robotique Autonome : vers de nouveaux types d'IHM ». Thesis, Cergy-Pontoise, 2013. http://www.theses.fr/2013CERG0664/document.

Texte intégral
Résumé :
Un robot autonome collaborant avec des humains doit être capable d'apprendre à se déplacer et à manipuler des objets dans la même tâche. Dans une approche classique, on considère des modules fonctionnels indépendants gérant les différents aspects de la tâche (navigation, contrôle du bras...). A l'opposé, l'objectif de cette thèse est de montrer que l'apprentissage de tâches de natures différentes peut être abordé comme un problème d'apprentissage d'attracteurs sensorimoteurs à partir d'un petit nombre de structures non spécifiques à une tâche donnée. Nous avons donc proposé une architecture qui permet l'apprentissage et l'encodage d'attracteurs pour réaliser aussi bien des tâches de navigation que de contrôle d'un bras.Comme point de départ, nous nous sommes appuyés sur un modèle inspiré des cellules de lieu pour la navigation d'un robot autonome. Des apprentissages en ligne et interactifs de couples lieu/action sont suffisants pour faire émerger des bassins d'attraction permettant à un robot autonome de suivre une trajectoire. En interagissant avec le robot, on peut corriger ou orienter son comportement. Les corrections successives et leur encodage sensorimoteur permettent de définir le bassin d'attraction de la trajectoire. Ma première contribution a été d'étendre ce principe de construction d'attracteurs sensorimoteurs à un contrôle en impédance pour un bras robotique. Lors du maintien d'une posture proprioceptive, les mouvements du bras peuvent être corrigés par une modification en-ligne des commandes motrices exprimées sous la forme d'activations musculaires. Les attracteurs moteurs résultent alors des associations simples entre l'information proprioceptive du bras et ces commandes motrices. Dans un second temps, j'ai montré que le robot pouvait apprendre des attracteursvisuo-moteurs en combinant les informations proprioceptives et visuelles. Le contrôle visuo-moteur correspond à un homéostat qui essaie de maintenir un équilibre entre ces deux informations. Dans le cas d'une information visuelle ambiguë, le robot peut percevoir un stimulus externe (e.g. la main d'un humain) comme étant sa propre pince. Suivant le principe d'homéostasie, le robot agira pour réduire l'incohérence entre cette information externe et son information proprioceptive. Il exhibera alors un comportement d'imitation immédiate des gestes observés. Ce mécanisme d'homéostasie, complété par une mémoire des séquences observées et l'inhibition des actions durant l'observation, permet au robot de réaliser des imitations différées et d'apprendre par observation. Pour des tâches plus complexes, nous avons aussi montré que l'apprentissage de transitions peut servir de support pour l'apprentissage de séquences de gestes, comme c'était le cas pour l'apprentissage de cartes cognitives en navigation. L'utilisation de contextes motivationnels permet alors le choix entre les différentes séquences apprises.Nous avons ensuite abordé le problème de l'intégration dans une même architecture de comportements impliquant une navigation visuomotrice et le contrôle d'un bras robotique pour la préhension d'objets. La difficulté est de pouvoir synchroniser les différentes actions afin que le robot agisse de manière cohérente. Les comportements erronés du robot sont détectés grâce à l'évaluation des actions proposées par le modèle vis à vis des corrections imposées par le professeur humain. Un apprentissage de ces situations sous la forme de contextes multimodaux modulant la sélection d'action permet alors d'adapter le comportement afin que le robot reproduise la tâche désirée.Pour finir, nous présentons les perspectives de ce travail en terme de contrôle sensorimoteur, pour la navigation comme pour le contrôle d'un bras robotique, et son extension aux questions d'interface homme/robot. Nous insistons sur le fait que différents types d'imitation peuvent être le fruit des propriétés émergentes d'une architecture de contrôle sensorimotrice
An autonomous robot collaborating with humans should be able to learn how to navigate and manipulate objects in the same task. In a classical approach, independent functional modules are considered to manage the different aspects of the task (navigation, arm control,...) . To the contrary, the goal of this thesis is to show that learning tasks of different kinds can be tackled by learning sensorimotor attractors from a few task nonspecific structures. We thus proposed an architecture which can learn and encode attractors to perform navigation tasks as well as arm control.We started by considering a model inspired from place-cells for navigation of autonomous robots. On-line and interactive learning of place-action couples can let attraction basins emerge, allowing an autonomous robot to follow a trajectory. The robot behavior can be corrected and guided by interacting with it. The successive corrections and their sensorimotor coding enables to define the attraction basin of the trajectory. My first contribution was to adapt this principle of sensorimotor attractor building for the impedance control of a robot arm. While a proprioceptive posture is maintained, the arm movements can be corrected by modifying on-line the motor command expressed as muscular activations. The resulting motor attractors are simple associations between the proprioceptive information of the arm and these motor commands. I then showed that the robot could learn visuomotor attractors by combining the proprioceptive and visual information with the motor attractors. The visuomotor control corresponds to a homeostatic system trying to maintain an equilibrium between the two kinds of information. In the case of ambiguous visual information, the robot may perceive an external stimulus (e.g. a human hand) as its own hand. According to the principle of homeostasis, the robot will act to reduce the incoherence between this external information and its proprioceptive information. It then displays a behavior of immediately observed gestures imitation. This mechanism of homeostasis, completed by a memory of the observed sequences and action inhibition capability during the observation phase, enables a robot to perform deferred imitation and learn by observation. In the case of more complex tasks, we also showed that learning transitions can be the basis for learning sequences of gestures, like in the case of cognitive map learning in navigation. The use of motivational contexts then enables to choose between different learned sequences.We then addressed the issue of integrating in the same architecture behaviors involving visuomotor navigation and robotic arm control to grab objects. The difficulty is to be able to synchronize the different actions so the robot act coherently. Erroneous behaviors of the robot are detected by evaluating the actions predicted by the model with respect to corrections forced by the human teacher. These situations can be learned as multimodal contexts modulating the action selection process in order to adapt the behavior so the robot reproduces the desired task.Finally, we will present the perspectives of this work in terms of sensorimotor control, for both navigation and robotic arm control, and its link to human robot interface issues. We will also insist on the fact that different kinds of imitation behavior can result from the emergent properties of a sensorimotor control architecture
Styles APA, Harvard, Vancouver, ISO, etc.
6

Aklil, Nassim. « Apprentissage actif sous contrainte de budget en robotique et en neurosciences computationnelles. Localisation robotique et modélisation comportementale en environnement non stationnaire ». Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066225/document.

Texte intégral
Résumé :
La prise de décision est un domaine très étudié en sciences, que ce soit en neurosciences pour comprendre les processus sous tendant la prise de décision chez les animaux, qu’en robotique pour modéliser des processus de prise de décision efficaces et rapides dans des tâches en environnement réel. En neurosciences, ce problème est résolu online avec des modèles de prises de décision séquentiels basés sur l’apprentissage par renforcement. En robotique, l’objectif premier est l’efficacité, dans le but d’être déployés en environnement réel. Cependant en robotique ce que l’on peut appeler le budget et qui concerne les limitations inhérentes au matériel, comme les temps de calculs, les actions limitées disponibles au robot ou la durée de vie de la batterie du robot, ne sont souvent pas prises en compte à l’heure actuelle. Nous nous proposons dans ce travail de thèse d’introduire la notion de budget comme contrainte explicite dans les processus d’apprentissage robotique appliqués à une tâche de localisation en mettant en place un modèle basé sur des travaux développés en apprentissage statistique qui traitent les données sous contrainte de budget, en limitant l’apport en données ou en posant une contrainte de temps plus explicite. Dans le but d’envisager un fonctionnement online de ce type d’algorithmes d’apprentissage budgétisé, nous discutons aussi certaines inspirations possibles qui pourraient être prises du côté des neurosciences computationnelles. Dans ce cadre, l’alternance entre recherche d’information pour la localisation et la décision de se déplacer pour un robot peuvent être indirectement liés à la notion de compromis exploration-exploitation. Nous présentons notre contribution à la modélisation de ce compromis chez l’animal dans une tâche non stationnaire impliquant différents niveaux d’incertitude, et faisons le lien avec les méthodes de bandits manchot
Decision-making is a highly researched field in science, be it in neuroscience to understand the processes underlying animal decision-making, or in robotics to model efficient and rapid decision-making processes in real environments. In neuroscience, this problem is resolved online with sequential decision-making models based on reinforcement learning. In robotics, the primary objective is efficiency, in order to be deployed in real environments. However, in robotics what can be called the budget and which concerns the limitations inherent to the hardware, such as computation times, limited actions available to the robot or the lifetime of the robot battery, are often not taken into account at the present time. We propose in this thesis to introduce the notion of budget as an explicit constraint in the robotic learning processes applied to a localization task by implementing a model based on work developed in statistical learning that processes data under explicit constraints, limiting the input of data or imposing a more explicit time constraint. In order to discuss an online functioning of this type of budgeted learning algorithms, we also discuss some possible inspirations that could be taken on the side of computational neuroscience. In this context, the alternation between information retrieval for location and the decision to move for a robot may be indirectly linked to the notion of exploration-exploitation compromise. We present our contribution to the modeling of this compromise in animals in a non-stationary task involving different levels of uncertainty, and we make the link with the methods of multi-armed bandits
Styles APA, Harvard, Vancouver, ISO, etc.
7

Do, Huu Nicolas. « Apprentissage de représentations sensori-motrices pour la reconnaissance d'objet en robotique ». Phd thesis, Université Paul Sabatier - Toulouse III, 2007. http://tel.archives-ouvertes.fr/tel-00283073.

Texte intégral
Résumé :
Depuis plusieurs années, la robotique mobile tente de s'extraire de l'espace amniotique des laboratoires de recherche afin d'explorer l'univers imprévisible, voire hostile, de nos lieux de vie, de travail, pour nous servir ou nous divertir. Or, les méthodes classiques de l'intelligence artificielle nécessitent des modèles du robot, de ses actions et de ses perceptions, conçus a priori. Elles sont donc peu adaptées à l'inattendu et à la nouveauté. D'autre part, les systèmes d'apprentissage artificiel, souvent d'inspiration biologique, semblent à présent en voie de fournir les capacités d'adaptation manquantes à ces premières. Nous envisageons dans cette thèse l'apprentissage comme un mécanisme central de l'architecture robotique. Celle-ci peut être représentée sous les traits d'une boucle sensori-motrice où actions et perceptions se rejoignent au sein d'une structure associative. L'apprentissage permet l'acquisition de connaissances nouvelles sur l'environnement mais il intervient également dans la modélisation des actions du robot : en associant des combinaisons de consignes simples sur les moteurs, et en mémorisant les effets de ces actions sur l'environnement ou sur le robot lui-même. Cette forme d'apprentissage a pour support un réseau de neurones permettant un apprentissage en ligne non supervisé. Cette architecture permet également d'exprimer les motivations et les objectifs du robot par le biais d'un second système d'apprentissage en associant une valeur de récompense aux représentations des actions ou des perceptions, par un apprentissage par renforcement. C'est donc l'utilité de chaque action, qui permettra finalement à un processus décisionnel d'avoir lieu.
Styles APA, Harvard, Vancouver, ISO, etc.
8

Do, Huu Nicolas Chatila Raja. « Apprentissage de représentations sensori-motrices pour la reconnaissance d'objet en robotique ». Toulouse (Université Paul Sabatier, Toulouse 3), 2008. http://thesesups.ups-tlse.fr/190.

Texte intégral
Styles APA, Harvard, Vancouver, ISO, etc.
9

Salaün, Camille. « Apprentissage De Modèles Pour La Commande De La Mobilité Interne En Robotique ». Phd thesis, Université Pierre et Marie Curie - Paris VI, 2010. http://tel.archives-ouvertes.fr/tel-00545534.

Texte intégral
Résumé :
La robotique de service est un domaine émergent où il est nécessaire de commander des robots en interaction forte avec leur environnement. Ce travail présente une méthode adaptative de commande combinant de l'apprentissage de modèles de la mécanique à de la commande dans l'espace opérationnel de robots redondants. L'apprentissage des modèles cinématiques est obtenu soit par dérivation de modèles géométriques appris, soit par apprentissage direct. Ces modèles cinématiques, également appelés matrices Jacobiennes, peuvent être utilisés dans le calcul de pseudo-inverses ou de projecteurs pour la commande de robots. Cette combinaison de méthodes permet d'obtenir un contrôleur qui s'adapte à la géométrie du robot command é. En utilisant les mêmes algorithmes d'apprentissage, il est possible d'apprendre un modèle dynamique inverse du robot contr^olé de manière à le commander en couple plutôt qu'en vitesse, l'avantage étant de pouvoir s'adapter aux modifications dynamiques qui s'appliquent sur le robot comme par exemple l'application d'une force extérieure ou l'ajout d'un poids. Des expériences en simulation menées dans le cadre de cette thèse montrent comment réaliser plusieurs tâches hiérarchiques ou comment s'adapter à des perturbations avec des modèles appris. Des expériences sur le robot iCub ont également été menées afin de rendre compte de la plausibilité de l'approche proposée sur un système réel.
Styles APA, Harvard, Vancouver, ISO, etc.
10

Lazaric, Nathalie. « Apprentissage organisationnel et développement technologique : la création robotique dans l'industrie automobile allemande ». Compiègne, 1993. http://www.theses.fr/1992COMP563E.

Texte intégral
Résumé :
L'objet de cette thèse a été de montrer comment l'innovation est façonnée par de nombreuses variables. Plus précisément, il existe des conditions organisationnelles minimales pour que le développement technologique soit adopté et approprié par les acteurs. Tout au long de notre investigation, nous avons démontré cette proposition. En effet, l'observation empirique au sein des firmes automobiles allemandes nous a permis de mieux appréhender la création robotique et l'environnement interagissant sur cette dynamique. Cette analyse inductive n'a pas été neutre sur nos présupposés théoriques et a permis de construire une grille d'analyse de l'apprentissage organisationnel pour mieux cerner les propriétés, les caractéristiques et les éventuelles ambiguïtés de cet apprentissage. L'apprentissage organisationnel tel que nous le définissons repose sur une dualité: intériorité et extériorité. Il prend place au sein des firmes tout d'abord, à travers une redéfinition de leurs objectifs et de leurs routines lors de la robotisation et entre les firmes par la suite à travers l'échange et le transfert de savoir-faire. Ceci aboutit à la construction d'un équilibre organisationnel qui modifie le comportement innovateur. Ce dernier est mis en place dans un contexte spécifique celui du système national d'innovation allemand
Styles APA, Harvard, Vancouver, ISO, etc.
11

Boutin, Luc. « Biomimétisme, génération de trajectoires pour la robotique humanoïde à partir de mouvements humains ». Poitiers, 2009. http://theses.edel.univ-poitiers.fr/theses/2009/Boutin-Luc/2009-Boutin-Luc-These.pdf.

Texte intégral
Résumé :
La reproduction fidèle de la locomotion humaine est une problématique d'actualité concernant les robots humanoïdes. Les travaux présentés dans ce mémoire ont pour objectif de définir une procédure permettant l'imitation par les robots humanoïdes du mouvement humain. Dans un premier temps les techniques de l'analyse du mouvement humain sont présentées. Le protocole de mesure adopté est exposé, ainsi que le calcul des angles articulaires. La problématique de la détection des évènements de contact est abordée en proposant l'adaptation des méthodes existantes pour des mouvements complexes. Les algorithmes sont validés par une série de mesures effectuées sur une trentaine de sujets sains. La deuxième partie traite de la transposition du mouvement humain aux robots. Une fois la problématique générale et le processus de transposition définis, le critère d'équilibre des robots marcheurs est présenté. A partir des données du mouvement humain capturé, les trajectoires de référence des pieds et du ZMP sont définies. Une modification de ces trajectoires est ensuite effectuée dans le cas de risque de collision entre les pieds notamment dans le cas de l'exécution d’un slalom. Finallement un algorithme de cinématique inverse, développé pour cette problématique est utilisé pour déterminer les angles articulaires du robot associés aux trajectoires de référence des pieds et du ZMP. Plusieurs applications sur les robots HOAP-3 et HPR-2 sont présentées. Les trajectoires sont validées vis-à-vis du maintien de l'équilibre grâce à des simulations dynamiques du mouvement ainsi que vis-à-vis des limites des actionneurs
The true reproduction of human locomotion is a topical issue on humanoid robots. The goal of this work is to define a process to imitate the human motion with humanoid robots. In the first part, the motion capture techniques are presented. The measurement protocol adopted is exposed and the calculation of joint angles. An adaptation of three existing algorithms is proposed to detect the contact events during complex movements. The method is valided by measurements on thirty healthy subjects. The second part deals with the generation of humanoid trajectories imitating the human motion. Once the problem and the imitation process are defined, the balance criterion of walking robots is presented. Using data from human motion capture, the reference trajectories of the feet and ZMP are defined. These paths are modified to avoid collision between feet, particularly in the case of executing a slalom. Finally an inverse kinematics algorithm developed for this problem is used to determine the joint angles associated with the robot reference trajectories of the feet and ZMP. Several applications on robots HOAP-3 and HRP-2 are presented. The trajectories are validated according to the robot balance through dynamic simulations of the computed motion, and respecting the limits of actuators
Styles APA, Harvard, Vancouver, ISO, etc.
12

Paquier, Williams. « Apprentissage ouvert de représentations et de fonctionalités en robotique : analyse, modèles et implémentation ». Toulouse 3, 2004. http://www.theses.fr/2004TOU30233.

Texte intégral
Résumé :
L'acquisition autonome de représentations et de fonctionnalités en robotique pose de nombreux problèmes théoriques. Aujourd'hui, les systèmes robotiques autonomes sont conçus autour d'un ensemble de fonctionnalités. Leurs représentations du monde sont issues de l’analyse d'un problème et d'une modélisation préalablement données par les concepteurs. Cette approche limite les capacités d'apprentissage. Nous proposons dans cette thèse un système ouvert de représentations et de fonctionnalités. Ce système apprend en expérimentant son environnement et est guidé par l’augmentation d’une fonction de valeur. L'objectif du système consiste à agir sur son environnement pour réactiver les représentations dont il avait appris une connotation positive. Une analyse de la capacité à généraliser la production d'actions appropriées pour ces réactivations conduit à définir un ensemble de propriétés nécessaires pour un tel système. Le système de représentation est constitué d'un réseau d'unités de traitement semblables et utilise un codage par position. Le sens de l'état d'une unité dépend de sa position dans le réseau. Ce système de représentation possède des similitudes avec le principe de numération par position. Une représentation correspond à l'activation d'un ensemble d'unités. Ce système a été implémenté dans une suite logicielle appelée NeuSter qui permet de simuler des réseaux de plusieurs millions d'unités et milliard de connexions sur des grappes hétérogènes de machines POSIX. Les premiers résultats permettent de valider les contraintes déduites de l'analyse. Un tel système permet d'apprendre dans un même réseau, de façon hiérarchique et non supervisée, des détecteurs de bords et de traits, de coins, de terminaisons de traits, de visages, de directions de mouvement, de rotations, d'expansions, et de phonèmes. NeuSter apprend en ligne en utilisant uniquement les données de ses capteurs. Il a été testé sur des robots mobiles pour l'apprentissage et le suivi d'objets
Autonomous acquisition of representations and functionalities by a machine address several theoretical questions. Today’s autonomous robots are developed around a set of functionalities. Their representations of the world are deduced from the analysis and modeling of a given problem, and are initially given by the developers. This limits the learning capabilities of robots. In this thesis, we propose an approach and a system able to build open-ended representation and functionalities. This system learns through its experimentations of the environment and aims to augment a value function. Its objective consists in acting to reactivate the representations it has already learnt to connote positively. An analysis of the generalization capabilities to produce appropriate actions enable define a minimal set of properties needed by such a system. The open-ended representation system is composed of a network of homogeneous processing units and is based on position coding. The meaning of a processing unit depends on its position in the global network. This representation system presents similarities with the principle of numeration by position. A representation is given by a set of active units. This system is implemented in a suite of software called NeuSter, which is able to simulate million unit networks with billions of connections on heterogeneous clusters of POSIX machines. .
Styles APA, Harvard, Vancouver, ISO, etc.
13

Cuperlier, Nicolas. « Apprentissage et prédiction de séquences sensori-motrices : architecture neuromimétique pour la navigation et la planification d'un robot mobile ». Cergy-Pontoise, 2006. http://www.theses.fr/2006CERG0316.

Texte intégral
Résumé :
La navigation autonome d’un robot mobile en environnement inconnu est une tâche complexe qui soulève de nombreux problèmes liésà la perception, la categorisation, la planification et au contrôle moteur. Résoudre l’ensemble de ces problèmes de manière intégrée demeure un défi pour les roboticiens. Ainsi nous proposons une architecture neuronale unifiée, fondée sur la modélisation de fonctionnalités de différentes parties du cerveau des mammifères: l’hippocampe, le cortex prefrontal et les ganglions de la base. L’intégration de données multimodales telles que la vision (entrée principale), l’intégration de chemin, et la motivation ainsi que les interactions internes et externes des différentes structures en sont des points importants. Une première partie de notre travail a ainsi consisté à modéliser des réseaux de neurones permettant l’apprentissage et la prédiction d’associations sensorimotrices, sous la forme de cellules de transition, supports d’une carte cognitive employée afin d’effectuer une planification selon des motivations parfois contradictoires. . . L’apprentissage de la carte cognitive, lors de périodes d’exploration et réalisé de façon latente, sans utiliser de coordonnées cartésiennes ni de grille d’occupation. Les liens de cette carte sont appris ou renforces selon le comportement supportant ainsi des changements dynamiques de l’environnement. Les périodes d’explorations peuvent être entrecoupées de période de planification. La deuxieme partie de cette these apporte à notre modele une solution pour explorer de fa¸conpréférentielle les zones inconnues de l’environnement et d’améliorer la précision du mouvement planifié via une compétition souple (à plusieurs gagnants), offrant une meilleure généralisation du mouvement et par conséquent un déplacement plus précis en planification. La commande motrice finale correspond à la solution stable d’un système dynamique : un champ neuronal à une dimension. Notre modele fournit ainsi une architecture de controle capable d’exhiber sur une plate forme robotique des comportements de navigation inspirés de la biologie. Cette architecture peut donc être considérée comme une tentative d’explication des mécanismes sous-jacent mis en oeuvre par les mammifères dans ces types de comportement. D’autre part les capacités de notre modèle en terme de localisation, d’exploration active, de planification et de cartographie en ligne d’un environnement incomplètement exploré en font une proposition originale au problème du S. L. A. M (Simultaneous Localization and Map building of an unknown environment)
Navigation of an autonomous mobile robot in an unknown environment is a complex task that raises numerous issues in perception, categorisation, planning, and motor control. Solving all these problems in an integrated manner remains a challenge for roboticians. Thus, we propose a unified neuronal framework, based on the modeling of different parts of the mammalian brain’s functionalities: the hippocampus, the prefrontal cortex and the basal ganglia. Key topics are the multi-modal data integration like vision (the prevailing input), path integration, motivation, and also the inner and outer interactions between the structures. A first part of our work consists in modeling neural networks able to learn and predict sensory-motor combinations (transition cells) which are inputs of a cognitive map used to plan according to conflicting motivations. The cognitive map is learned without using any Cartesian coordinates nor occupancy grids. Already known transitions are used in exploration in order to preferentially explore unknown zones to reduce exploration time and enhance the completion of the cognitive map. Links of this map are learned or reinforced according to the behavior and enable to take into account dynamical changes of the environment. Exploration periods may be alternated with planning periods. The second part of this thesis brings an interesting solution for computing and selecting the final movement to perform. It also gives a stable motor control. Instead of using a (( Winner Takes All )) mechanism to select the movement, we increase the planned movement accuracy via a soft competition. Hence several movements are proposed and fed in another layer where the final motor command is obtained as the stable solution of a dynamical system: a one dimensional neural field coding for the heading direction. This field allows to endow the system with a final movement selection leading to a better movement generalization and consequently to a more reliable movement while planning. Our model gives a control architecture allowing to exhibit on a mobile robot navigation behaviors inspired from biology. This architecture can be considered as an attempt to explain underlying mechanisms implemented by mammals for these kind of behaviors. Furthermore, we can list the following benefits of our model: on-line localization, active exploration, planning and mapping in an uncompletely explored environment. These benifits cast an original light on the S. L. A. M problem (Simultaneous Localization and Map building of an unknown environment)
Styles APA, Harvard, Vancouver, ISO, etc.
14

Djian, David. « Contribution à l'analyse de scènes par vision active : utilisation de réseaux Bayesiens ». ENSMP, 1997. http://www.theses.fr/1997ENMP0739.

Texte intégral
Résumé :
Dans ce mémoire, l'analyse de scènes a pour but l'amélioration de l'autonomie en robotique. Afin de percevoir un environnement complexe, nous avons choisi la vision pour la richesse des informations qu'elle fournit, dans un cadre de vision active consistant à ne traiter que les données pertinentes (régions d'intérêt dans l'image). La prise en compte des incertitudes dans les modèles des capteurs améliore la robustesse aux erreurs de mesure, et nous étudions l'apprentissage des modèles d'objets que l'on veut reconnaître. Nous proposons un modèle hiérarchique de l'environnement qui incorpore explicitement les actions de perception dans le graphe représentant un objet. On associe aux noeuds du graphe les parties constituant l'objet, et aux arcs du graphe les actions de perception permettant de reconnaître l'objet. Le modèle des capteurs choisi est une extension des capteurs logiques de Henderson. Nous introduisons la notion d'observateur dynamique comme l'association d'une région d'intérêt dans l'image avec des traitements élémentaires de vision et leur modèle d'incertitude correspondant. Le mécanisme de déplacement de l'observateur dans l'image est contenu dans le modèle du capteur logique. Le processus de reconnaissance est piloté par une stratégie de perception qui décide à quel endroit et à quel moment lancer les observateurs dynamiques. Les réseaux Bayesiens offrent un formalisme rigoureux et unifié, fondé sur la théorie des probabilités, pour la mise en oeuvre de chacune des trois composantes de notre système de reconnaissance. Ils permettent de représenter la connaissance a priori sur les modèles d'objets, la connaissance incrémentale obtenue au cours de la reconnaissance, et les stratégies de perception (raisonnement avec incertitudes). Nous présentons des résultats expérimentaux d'apprentissage et de reconnaissance de modèles d'objets complexes sur des images réelles
In this thesis, scene analysis is aimed at improving autonomy in robotics. In order to perceive a complex environment, we have chosen vision which provides rich information. The framework of active vision consists in processing only relevant data (regions of interest in an image). Robustness to sensor errors is improved by taking into account uncertainty in the sensor models used. Finally, we study the learning of object models for recognition. We propose a hierarchical model of the environment which incorporates explicitely sensor actions in a graph representing an object. Graph nodes correspond to object parts, and graph links correspond to the perception actions which detect object parts during recognition. Our sensor model is an extension of Henderson's logicial sensors. We have introduced the concept of dynamic observers as a region of interest in the image coupled with elementary vision algorithms and their associated model of uncertainty. Observers are moved in the image thanks to an internal mechanism decided in the sensor models. The recognition process is driven by a strategy of perception which decides where and when dynamic observers should be started. Bayes nets offer a rigorous and unified framework based o probability theory to implement the three components of our recognition system. They can represent prior knowledge about objet models, incremental knowledge gathered during recognition, and various strategies of perception (reasoning under certainty). We show sucessful results for the learning and the recognition of complex object models on real images
Styles APA, Harvard, Vancouver, ISO, etc.
15

Infantes, Guillaume. « Apprentissage de modèles de comportement pour le contrôle d'exécution et la planification robotique ». Phd thesis, Université Paul Sabatier - Toulouse III, 2006. http://tel.archives-ouvertes.fr/tel-00129505.

Texte intégral
Résumé :
Les systèmes robotiques autonomes évoluent dans des environnements fortement imprévisibles, et sont sujets à des très grandes imprécisions des capteurs et de leur connaissance en général. De fait, ils sont construits dans l'objectif de robustesse et non pas de fournir des modèles de leur comportement, qui sont nécessaires à la prise de décision de plus haut niveau, type planification ou contrôle d'exécution. Dans les applications actuelles, ils sont souvent très abstraits et simplifiés par rapport à une application réelle. Nous proposons d'explorer la construction automatique de modèles intermédiaires stochastiques pour des systèmes robotiques réels. Dans un premier temps, nous expliquons la construction de modèles de Markov cachés, des données brutes à la définition d'états inobservables, et leur apprentissage. Nous passons ensuite à des modèles d'expressivité plus grande, et expliquons pourquoi les méthodes de calcul exact sont impossibles à appliquer. Nous montrons alors un algorithme original d'apprentissage quantitatif de tels modèles, et passons en revue différentes méthodes d'apprentissage de la causalité sous-jacente. Nous montrons une utilisation de tels modèles pour optimiser un comportement robotique, et pour que le système puisse décider d'apprendre.
Styles APA, Harvard, Vancouver, ISO, etc.
16

PAQUIER, Williams. « Apprentissage ouvert de representations et de fonctionnalites en robotique : anayse, modeles et implementation ». Phd thesis, Université Paul Sabatier - Toulouse III, 2004. http://tel.archives-ouvertes.fr/tel-00009324.

Texte intégral
Résumé :
L'acquisition autonome de representations et de fonctionnalites en robotique pose de nombreux problemes theoriques. Aujourd'hui, les systemes robotiques autonomes sont concus autour d'un ensemble de fonctionnalites. Leurs representations du monde sont issues de l'analyse d'un probleme et d'une modelisation prealablement donnees par les concepteurs. Cette approche limite les capacites d'apprentissage. Nous proposons dans cette these un systeme ouvert de representations et de fonctionnalites. Ce systeme apprend en experimentant son environnement et est guide par l'augmentation d'une fonction de valeur. L'objectif du systeme consiste a agir sur son environnement pour reactiver les representations dont il avait appris une connotation positive. Une analyse de la capacite a generaliser la production d'actions appropriees pour ces reactivations conduit a definir un ensemble de proprietes necessaires pour un tel systeme. Le systeme de representation est constitue d'un reseau d'unites de traitement semblables et utilise un codage par position. Le sens de l'etat d'une unite depend de sa position dans le reseau. Ce systeme de representation possede des similitudes avec le principe de numeration par position. Une representation correspond a l'activation d'un ensemble d'unites. Ce systeme a ete implemente dans une suite logicielle appelee NeuSter qui permet de simuler des reseaux de plusieurs millions d'unites et milliard de connexions sur des grappes heterogenes de machines POSIX. Les premiers resultats permettent de valider les contraintes deduites de l'analyse. Un tel systeme permet d'apprendre dans un meme reseau, de facon hierarchique et non supervisee, des detecteurs de bords et de traits, de coins, de terminaisons de traits, de visages, de directions de mouvement, de rotations, d'expansions, et de phonemes. NeuSter apprend en ligne en utilisant uniquement les donnees de ses capteurs. Il a ete teste sur des robots mobiles pour l'apprentissage et le suivi d'objets.
Styles APA, Harvard, Vancouver, ISO, etc.
17

Hugues, Louis. « Apprentissage de comportements pour un robot autonome ». Paris 6, 2002. http://www.theses.fr/2002PA066414.

Texte intégral
Styles APA, Harvard, Vancouver, ISO, etc.
18

Renaudo, Erwan. « Des comportements flexibles aux comportements habituels : meta-apprentissage neuro-inspiré pour la robotique autonome ». Thesis, Paris 6, 2016. http://www.theses.fr/2016PA066508/document.

Texte intégral
Résumé :
Dans cette thèse, nous proposons d'intégrer la notion d'habitude comportementale au sein d'une architecture de contrôle robotique, et d'étudier son interaction avec les mécanismes générant le comportement planifié. Les architectures de contrôle robotiques permettent à ce dernier d'être utilisé efficacement dans le monde réel et au robot de rester réactif aux changements dans son environnement, tout en étant capable de prendre des décisions pour accomplir des buts à long terme (Kortenkamp et Simmons, 2008). Or, ces architectures sont rarement dotées de capacités d'apprentissage leur permettant d'intégrer les expériences précédentes du robot. En neurosciences et en psychologie, l'étude des différents types d'apprentissage montre pour que ces derniers sont une capacité essentielle pour adapter le comportement des mammifères à des contextes changeants, mais également pour exploiter au mieux les contextes stables (Dickinson, 1985). Ces apprentissages sont modélisés par des algorithmes d'apprentissage par renforcement direct et indirect (Sutton et Barto, 1998), combinés pour exploiter leurs propriétés au mieux en fonction du contexte (Daw et al., 2005). Nous montrons que l'architecture proposée, qui s'inspire de ces modèles du comportement, améliore la robustesse de la performance lors d'un changement de contexte dans une tâche simulée. Si aucune des méthodes de combinaison évaluées ne se démarque des autres, elles permettent d'identifier les contraintes sur le processus de planification. Enfin, l'extension de l'étude de notre architecture à deux tâches (dont l'une sur robot réel) confirme que la combinaison permet l'amélioration de l'apprentissage du robot
In this work, we study how the notion of behavioral habit, inspired from the study of biology, can benefit to robots. Robot control architectures allow the robot to be able to plan to reach long term goals while staying reactive to events happening in the environment (Kortenkamp et Simmons, 2008). However, these architectures are rarely provided with learning capabilities that would allow them to acquire knowledge from experience. On the other hand, learning has been shown as an essential abiilty for behavioral adaptation in mammals. It permits flexible adaptation to new contexts but also efficient behavior in known contexts (Dickinson, 1985). The learning mechanisms are modeled as model-based (planning) and model-free (habitual) reinforcement learning algorithms (Sutton et Barto, 1998) which are combined into a global model of behavior (Daw et al., 2005). We proposed a robotic control architecture that take inspiration from this model of behavior and embed the two kinds of algorithms, and studied its performance in a robotic simulated task. None of the several methods for combining the algorithm we studied gave satisfying results, however, it allowed to identify some properties required for the planning process in a robotic task. We extended our study to two other tasks (one being on a real robot) and confirmed that combining the algorithms improves learning of the robot's behavior
Styles APA, Harvard, Vancouver, ISO, etc.
19

Renaudo, Erwan. « Des comportements flexibles aux comportements habituels : meta-apprentissage neuro-inspiré pour la robotique autonome ». Electronic Thesis or Diss., Paris 6, 2016. http://www.theses.fr/2016PA066508.

Texte intégral
Résumé :
Dans cette thèse, nous proposons d'intégrer la notion d'habitude comportementale au sein d'une architecture de contrôle robotique, et d'étudier son interaction avec les mécanismes générant le comportement planifié. Les architectures de contrôle robotiques permettent à ce dernier d'être utilisé efficacement dans le monde réel et au robot de rester réactif aux changements dans son environnement, tout en étant capable de prendre des décisions pour accomplir des buts à long terme (Kortenkamp et Simmons, 2008). Or, ces architectures sont rarement dotées de capacités d'apprentissage leur permettant d'intégrer les expériences précédentes du robot. En neurosciences et en psychologie, l'étude des différents types d'apprentissage montre pour que ces derniers sont une capacité essentielle pour adapter le comportement des mammifères à des contextes changeants, mais également pour exploiter au mieux les contextes stables (Dickinson, 1985). Ces apprentissages sont modélisés par des algorithmes d'apprentissage par renforcement direct et indirect (Sutton et Barto, 1998), combinés pour exploiter leurs propriétés au mieux en fonction du contexte (Daw et al., 2005). Nous montrons que l'architecture proposée, qui s'inspire de ces modèles du comportement, améliore la robustesse de la performance lors d'un changement de contexte dans une tâche simulée. Si aucune des méthodes de combinaison évaluées ne se démarque des autres, elles permettent d'identifier les contraintes sur le processus de planification. Enfin, l'extension de l'étude de notre architecture à deux tâches (dont l'une sur robot réel) confirme que la combinaison permet l'amélioration de l'apprentissage du robot
In this work, we study how the notion of behavioral habit, inspired from the study of biology, can benefit to robots. Robot control architectures allow the robot to be able to plan to reach long term goals while staying reactive to events happening in the environment (Kortenkamp et Simmons, 2008). However, these architectures are rarely provided with learning capabilities that would allow them to acquire knowledge from experience. On the other hand, learning has been shown as an essential abiilty for behavioral adaptation in mammals. It permits flexible adaptation to new contexts but also efficient behavior in known contexts (Dickinson, 1985). The learning mechanisms are modeled as model-based (planning) and model-free (habitual) reinforcement learning algorithms (Sutton et Barto, 1998) which are combined into a global model of behavior (Daw et al., 2005). We proposed a robotic control architecture that take inspiration from this model of behavior and embed the two kinds of algorithms, and studied its performance in a robotic simulated task. None of the several methods for combining the algorithm we studied gave satisfying results, however, it allowed to identify some properties required for the planning process in a robotic task. We extended our study to two other tasks (one being on a real robot) and confirmed that combining the algorithms improves learning of the robot's behavior
Styles APA, Harvard, Vancouver, ISO, etc.
20

Barate, Renaud. « Apprentissage de fonctions visuelles pour un robot mobile par programmation génétique ». Phd thesis, Université Pierre et Marie Curie - Paris VI, 2008. http://pastel.archives-ouvertes.fr/pastel-00004864.

Texte intégral
Résumé :
En robotique mobile, les techniques d'apprentissage qui utilisent la vision artificielle représentent le plus souvent l'image par un ensemble de descripteurs visuels. Ces descripteurs sont extraits en utilisant une méthode fixée à l'avance ce qui compromet les capacités d'adaptation du système à un environnement visuel changeant. Nous proposons une méthode permettant de décrire et d'apprendre des algorithmes de vision de manière globale, depuis l'image perçue jusqu'à la décision finale. L'application visée est la fonction d'évitement d'obstacles, indispensable à tout robot mobile. Nous décrivons de manière formelle la structure des algorithmes d'évitement d'obstacles basés sur la vision en utilisant une grammaire. Notre système utilise ensuite cette grammaire et des techniques de programmation génétique pour apprendre automatiquement des contrôleurs adaptés à un contexte visuel donné. Nous utilisons un environnement de simulation pour tester notre approche et mesurer les performances des algorithmes évolués. Nous proposons plusieurs techniques permettant d'accélérer l'évolution et d'améliorer les performances et les capacités de généralisation des contrôleurs évolués. Nous comparons notamment plusieurs méthodes d'évolution guidée et nous en présentons une nouvelle basée sur l'imitation d'un comportement enregistré. Par la suite nous validons ces méthodes sur un robot réel se déplaçant dans un environnement intérieur. Nous indiquons finalement comment ce système peut être adapté à d'autres applications utilisant la vision et nous proposons des pistes pour l'adaptation d'un comportement en temps réel sur le robot.
Styles APA, Harvard, Vancouver, ISO, etc.
21

Grizou, Jonathan. « Apprentissage simultané d'une tâche nouvelle et de l'interprétation de signaux sociaux d'un humain en robotique ». Thesis, Bordeaux, 2014. http://www.theses.fr/2014BORD0146/document.

Texte intégral
Résumé :
Cette thèse s'intéresse à un problème logique dont les enjeux théoriques et pratiques sont multiples. De manière simple, il peut être présenté ainsi : imaginez que vous êtes dans un labyrinthe, dont vous connaissez toutes les routes menant à chacune des portes de sortie. Derrière l'une de ces portes se trouve un trésor, mais vous n'avez le droit d'ouvrir qu'une seule porte. Un vieil homme habitant le labyrinthe connaît la bonne sortie et se propose alors de vous aider à l'identifier. Pour cela, il vous indiquera la direction à prendre à chaque intersection. Malheureusement, cet homme ne parle pas votre langue, et les mots qu'il utilise pour dire ``droite'' ou ``gauche'' vous sont inconnus. Est-il possible de trouver le trésor et de comprendre l'association entre les mots du vieil homme et leurs significations ? Ce problème, bien qu'en apparence abstrait, est relié à des problématiques concrètes dans le domaine de l'interaction homme-machine. Remplaçons le vieil homme par un utilisateur souhaitant guider un robot vers une sortie spécifique du labyrinthe. Ce robot ne sait pas en avance quelle est la bonne sortie mais il sait où se trouvent chacune des portes et comment s'y rendre. Imaginons maintenant que ce robot ne comprenne pas a priori le langage de l'humain; en effet, il est très difficile de construire un robot à même de comprendre parfaitement chaque langue, accent et préférence de chacun. Il faudra alors que le robot apprenne l'association entre les mots de l'utilisateur et leur sens, tout en réalisant la tâche que l'humain lui indique (i.e.trouver la bonne porte). Une autre façon de décrire ce problème est de parler d'auto-calibration. En effet, le résoudre reviendrait à créer des interfaces ne nécessitant pas de phase de calibration car la machine pourrait s'adapter,automatiquement et pendant l'interaction, à différentes personnes qui ne parlent pas la même langue ou qui n'utilisent pas les mêmes mots pour dire la même chose. Cela veut aussi dire qu'il serait facile de considérer d’autres modalités d'interaction (par exemple des gestes, des expressions faciales ou des ondes cérébrales). Dans cette thèse, nous présentons une solution à ce problème. Nous appliquons nos algorithmes à deux exemples typiques de l'interaction homme robot et de l'interaction cerveau machine: une tâche d'organisation d'une série d'objets selon les préférences de l'utilisateur qui guide le robot par la voix, et une tâche de déplacement sur une grille guidé par les signaux cérébraux de l'utilisateur. Ces dernières expériences ont été faites avec des utilisateurs réels. Nos résultats démontrent expérimentalement que notre approche est fonctionnelle et permet une utilisation pratique d’une interface sans calibration préalable
This thesis investigates how a machine can be taught a new task from unlabeled humaninstructions, which is without knowing beforehand how to associate the human communicative signals withtheir meanings. The theoretical and empirical work presented in this thesis provides means to createcalibration free interactive systems, which allow humans to interact with machines, from scratch, using theirown preferred teaching signals. It therefore removes the need for an expert to tune the system for eachspecific user, which constitutes an important step towards flexible personalized teaching interfaces, a key forthe future of personal robotics.Our approach assumes the robot has access to a limited set of task hypotheses, which include the task theuser wants to solve. Our method consists of generating interpretation hypotheses of the teaching signalswith respect to each hypothetic task. By building a set of hypothetic interpretation, i.e. a set of signallabelpairs for each task, the task the user wants to solve is the one that explains better the history of interaction.We consider different scenarios, including a pick and place robotics experiment with speech as the modalityof interaction, and a navigation task in a brain computer interaction scenario. In these scenarios, a teacherinstructs a robot to perform a new task using initially unclassified signals, whose associated meaning can bea feedback (correct/incorrect) or a guidance (go left, right, up, ...). Our results show that a) it is possible tolearn the meaning of unlabeled and noisy teaching signals, as well as a new task at the same time, and b) itis possible to reuse the acquired knowledge about the teaching signals for learning new tasks faster. Wefurther introduce a planning strategy that exploits uncertainty from the task and the signals' meanings toallow more efficient learning sessions. We present a study where several real human subjects controlsuccessfully a virtual device using their brain and without relying on a calibration phase. Our system identifies, from scratch, the target intended by the user as well as the decoder of brain signals.Based on this work, but from another perspective, we introduce a new experimental setup to study howhumans behave in asymmetric collaborative tasks. In this setup, two humans have to collaborate to solve atask but the channels of communication they can use are constrained and force them to invent and agree ona shared interaction protocol in order to solve the task. These constraints allow analyzing how acommunication protocol is progressively established through the interplay and history of individual actions
Styles APA, Harvard, Vancouver, ISO, etc.
22

Guerry, Joris. « Reconnaissance visuelle robuste par réseaux de neurones dans des scénarios d'exploration robotique. Détecte-moi si tu peux ! » Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLX080/document.

Texte intégral
Résumé :
L'objectif principal ce travail de thèse est la reconnaissance visuelle pour un robot mobile dans des conditions difficiles. En particulier nous nous intéressons aux réseaux de neurones qui présentent aujourd'hui les meilleures performances en vision par ordinateur. Nous avons étudié le principe de sélection de méthodes pour la classification d'images 2D en utilisant un réseau de neurones sélecteur pour choisir le meilleur classifieur disponible étant donnée la situation observée. Cette stratégie fonctionne lorsque les données peuvent être facilement partitionnées vis-à-vis des classifieurs disponibles, ce qui est le cas quand des modalités complémentaires sont utilisées. Nous avons donc utilisé des données RGB-D (2.5D) en particulier appliquées à la détection de personnes. Nous proposons une combinaison de réseaux de neurones détecteurs indépendants propres à chaque modalité (couleur & carte de profondeur) basés sur une même architecture (le Faster RCNN). Nous partageons des résultats intermédiaires des détecteurs pour leur permettre de se compléter et d'améliorer la performance globale en situation difficile (perte de luminosité ou bruit d'acquisition de la carte de profondeur). Nous établissons un nouvel état de l'art dans le domaine et proposons un jeu de données plus complexe et plus riche à la communauté (ONERA.ROOM). Enfin, nous avons fait usage de l'information 3D contenue dans les images RGB-D au travers d'une méthode multi-vue. Nous avons défini une stratégie de génération de vues virtuelles 2D cohérentes avec la structure 3D. Pour une tâche de segmentation sémantique, cette approche permet d'augmenter artificiellement les données d'entraînement pour chaque image RGB-D et d'accumuler différentes prédictions lors du test. Nous obtenons de nouveaux résultats de référence sur les jeux de données SUNRGBD et NYUDv2. Ces travaux de thèse nous ont permis d'aborder de façon originale des données robotiques 2D, 2.5D et 3D avec des réseaux de neurones. Que ce soit pour la classification, la détection et la segmentation sémantique, nous avons non seulement validé nos approches sur des jeux de données difficiles, mais également amené l'état de l'art à un nouveau niveau de performance
The main objective of this thesis is visual recognition for a mobile robot in difficult conditions. We are particularly interested in neural networks which present today the best performances in computer vision. We studied the concept of method selection for the classification of 2D images by using a neural network selector to choose the best available classifier given the observed situation. This strategy works when data can be easily partitioned with respect to available classifiers, which is the case when complementary modalities are used. We have therefore used RGB-D data (2.5D) in particular applied to people detection. We propose a combination of independent neural network detectors specific to each modality (color & depth map) based on the same architecture (Faster RCNN). We share intermediate results of the detectors to allow them to complement and improve overall performance in difficult situations (luminosity loss or acquisition noise of the depth map). We are establishing new state of the art scores in the field and propose a more complex and richer data set to the community (ONERA.ROOM). Finally, we made use of the 3D information contained in the RGB-D images through a multi-view method. We have defined a strategy for generating 2D virtual views that are consistent with the 3D structure. For a semantic segmentation task, this approach artificially increases the training data for each RGB-D image and accumulates different predictions during the test. We obtain new reference results on the SUNRGBD and NYUDv2 datasets. All these works allowed us to handle in an original way 2D, 2.5D and 3D robotic data with neural networks. Whether for classification, detection and semantic segmentation, we not only validated our approaches on difficult data sets, but also brought the state of the art to a new level of performance
Styles APA, Harvard, Vancouver, ISO, etc.
23

Lyubova, Natalia. « Developmental approach of perception for a humanoid robot ». Palaiseau, École nationale supérieure de techniques avancées, 2013. http://www.theses.fr/2013ESTA0003.

Texte intégral
Résumé :
Les robots de service ou d'assistance doivent évoluer dans un environnent humain en constant changement, souvent imprévisible. Ils doivent donc être capables de s'adapter à ces changements, idéalement de manière autonome, afin de ne pas dépendre de la présence constante d'une supervision. Une telle adaptation en environnements non structurés nécessite notamment une détection et un apprentissage continu des nouveaux objets présents, que l'on peut imaginer inspirés des enfants, basés sur l'interaction avec leur parents et la manipulation motivée par la curiosité. Notre travail vise donc à concevoir une approche développementale permettant à un robot humanoïde de percevoir son environnement. Nous nous inspirons à la fois de la perception humaine en termes de fonctionnalités et du développements cognitifs observé chez les infants. Nous proposons une approche qui permet à un robot humanoïde d'ex- plorer son environnement de manière progressive, comme un enfant, grâce à des interactions physiques et sociales. Suivant les principes de la robotique développementale, nous nous concentrons sur l'apprentissage progressif, continu et autonome qui ne nécessite pas de connaissances a priori des objets. Notre système de perception débute par la segmentation de l'espace visuel en proto-objets, qui serviront d'unités d'attention. Chaque proto-objet est représenté par des caractéristiques bas-niveaux (la couleur et la texture) et sont eux-mêmes intégrés au sein de caractéristiques de plus haut niveau pour ensuite former un modèle multi-vues. Cet apprentissage s'effectue de manière incrémentale et chaque proto-objet est associé à une ou plusieurs entités physiques distinctes. Les entités physiques sont ensuite classés en trois catégories : parties du robot, parties des humains et objets. La caractérisation est basée sur l'analyse de mouvements des entités physiques provenant de la vision ainsi que sur l'information mutuelle entre la vison et proprioception. Une fois que le robot est capable de catégoriser les entités, il se concentre sur l'interaction active avec les objets permettant ainsi d'acquérir de nouvelles informations sur leur apparence qui sont intégrés dans leurs modèles de représentation. Ainsi, l'interaction améliore les connaissances sur les objets et augmente la quantité d'information dans leurs modèles. Notre système de perception actif est évalué avec le robot humanoïde iCub en utilisant une base expérimentale de 20 objets. Le robot apprend par interaction avec un partenaire humain ainsi que par ses propres actions sur les objets. Notre système est capable de créer de manière non supervisée des modèles cohérents des différentes entités et d'améliorer les modèles des objets par apprentissage interactif et au final de reconnaître des objets avec 88. 5% de réussite.
Styles APA, Harvard, Vancouver, ISO, etc.
24

Gaudiello, Ilaria. « Learning robotics, with robotics, by robotics : a study on three paradigms of educational robotics, under the issues of robot representation, robot acceptance, and robot impact on learning ». Thesis, Paris 8, 2015. http://www.theses.fr/2015PA080081.

Texte intégral
Résumé :
La relation entre progrès technologique et innovation pédagogique a récemment engendré un nouveau champ de recherche, à la croisée des chemins entre la Psychologie, les Sciences de l’Education et l’Intelligence Artificielle : la Robotique Educationnelle (RE). La présente thèse fournit un état de l’art critique sur la RE, ses origines et son positionnement au sein des technologies de l’information et de la communication pour l’enseignement (TICE). A travers une analyse des finalités éducatives atteignables en fonction du statut technologique et des modalités d’apprentissage spécifiques aux différents types de robots, nous définissons trois paradigmes pédagogiques : (i) l’apprentissage de la robotique, (ii) l'apprentissage avec la robotique, et (iii) l'apprentissage par la robotique. Ces trois paradigmes sont abordés à travers trois thématiques, dans une perspective de recherche fondamentale en Psychologie : (i) les représentations mentales que les humains ont du robot, (ii) l’acceptation et la confiance dans les interactions homme-robot et (iii) les apprentissages favorisés par les robots en contexte éducatif
Through a psychological perspective, the thesis concerns the three ER learning paradigms that are distinguished upon the different hardware, software, and correspondent modes of interaction allowed by the robot. Learning robotics was investigated under the issue of robot representation. By robot representation, we mean its ontological and pedagogical status and how such status change when users learn robotics. In order to answer this question, we carried out an experimental study based on pre- and post-inquiries, involving 79 participants. Learning with robotics was investigated under the issue of robot’s functional and social acceptance. Here, the underlying research questions were as follows: do students trust in robot’s functional and social savvy? Is trust in functional savvy a pre-requisite for trust in social savvy? Which individuals and contextual factors are more likely to influence this trust? In order to answer these questions, we have carried an experimental study with 56 participants and an iCub robot. Trust in the robot has been considered as a main indicator of acceptance in situations of perceptual and socio-cognitive uncertainty and was measured by participants’ conformation to answers given by iCub. Learning by robotics was investigated under the issue of robot’s impact on learning. The research questions were the following: to what extent the combined RBI & IBSE frame has a positive impact on cognitive, affective, social and meta-cognitive dimensions of learning? Does this combined educational frame improve both domain-specific and non-domain specific knowledge and competences of students? In order to answer these questions, we have carried a one-year RBI & IBSE experimental study in the frame of RObeeZ, a research made through the FP7 EU project Pri-Sci-Net. The longitudinal experiments involved 26 pupils and 2 teachers from a suburb parisian primary school
Styles APA, Harvard, Vancouver, ISO, etc.
25

Chapelle, Jérôme. « Une architecture multi-agents pour un apprentissage autonome guidé par les émotions ». Montpellier 2, 2006. http://www.theses.fr/2006MON20181.

Texte intégral
Styles APA, Harvard, Vancouver, ISO, etc.
26

Lucidarme, Philippe. « Apprentissage et adaptation pour des ensembles de robots réactifs coopérants ». Phd thesis, Université Montpellier II - Sciences et Techniques du Languedoc, 2003. http://tel.archives-ouvertes.fr/tel-00641563.

Texte intégral
Résumé :
Ces travaux de thèse se placent dans le contexte des systèmes multi-agents distribués. L'objectif est l'étude de méthodes d'auto-apprentissage appliquées à des ensembles de robots réactifs. Ces travaux se focalisent sur l'apprentissage de comportements sensorimoteurs de bas niveaux. Il nous semble important que les méthodes proposées puissent être appliquées sur des systèmes réels, dont les contraintes sont parfois loin de celles de la simulation. C'est pour cette raison que nous avons imaginé et conçu une plate-forme expérimentale composée de 4 robots mobiles, un manipulateur mobile miniature et un système de vision stéréoscopique. Cette étude se décompose en deux parties. La première, appliquée aux systèmes homogènes, présente l'étude de méthodes évolutionnistes appliquées aux systèmes multirobots. La seconde, appliquée aux systèmes hétérogènes, s'intéresse à la possibilité d'utiliser la technique du recuit simulé pour optimiser les poids d'un contrôleur neuronal. Toujours dans ce contexte d'hétérogénéité, une seconde méthode basée sur l'apprentissage par renforcement est expérimentée.
Styles APA, Harvard, Vancouver, ISO, etc.
27

Henaff, Patrick. « Commande bio-inspirée et genèse de mouvements rythmiques en robotique ». Habilitation à diriger des recherches, Université de Cergy Pontoise, 2011. http://tel.archives-ouvertes.fr/tel-00667651.

Texte intégral
Résumé :
Les travaux présentés dans cette HDR visent à mieux comprendre le fonctionnement des mécanismes d'apprentissage qui sont liés au contrôle moteur bas niveau chez l'humain, pour les modéliser et les intégrer dans les contrôleurs des robots humanoïdes. L'objectif est de rendre ces derniers plus robustes face aux perturbations externes dues à l'environnement, ou à leur interaction avec l'humain (forces externes, glissement, pentes ou irrégularités du sol), ou aux dommages internes, soudains ou progressifs, qu'ils peuvent subir et qui mettent en péril leur mission (usures articulaires, amputation de membres moteurs, pertes sensorielles...). Pour ce faire, les capacités de généralisation offertes par les algorithmes d'apprentissage des réseaux de neurones et les synergies de leurs mécanismes adaptatifs (homéostasie, plasticité neuronale et synaptique) ont été étudiées. Les solutions ont été évaluées en soumettant les robots à des perturbations ou à des dysfonctionnements externes ou internes, lents ou brusques. Des réponses aux questions suivantes ont été apportées: comment la marche adaptative des robots peut elle être produite? Comment peut-elle être contrôlée? Quels types d'architecture permettent à la fois la production de rythmes locomoteurs et le contrôle de la posture? Quels sont les mécanismes adaptatifs sensori-moteurs qui régissent ces architectures pour les marches normales et déficientes des robots? Quelles sont les méthodologies possibles pour modéliser et reproduire ces architectures? Quelles sont les limites de ces approches ?.
Styles APA, Harvard, Vancouver, ISO, etc.
28

Dromnelle, Rémi. « Architecture cognitive générique pour la coordination de stratégies d'apprentissage en robotique ». Electronic Thesis or Diss., Sorbonne université, 2021. http://www.theses.fr/2021SORUS039.

Texte intégral
Résumé :
L’objectif principal de cette thèse est de proposer une nouvelle méthode d’adaptation en ligne de l’apprentissage robotique, permettant aux robots d’adapter dynamiquement et de manière autonome leur comportement en fonction des variations de leur propre performance. La méthode élaborée est suffisamment générale et tâche-indépendante pour qu’un robot l’utilisant puisse effectuer différentes tâches dynamiques de nature variée sans ajustement des algorithmes ou des paramètres par le programmeur. Les algorithmes qui sous-tendent cette méthode consistent en un système de méta-contrôle permettant au robot de faire appel à deux experts décisionnels suivant une stratégie comportementale différente. L’expert model-based construit un modèle des effets des actions à long-terme et utilise ce modèle pour décider ; cette stratégie est coûteuse en termes de ressources calculatoires, mais converge rapidement vers la solution. L’expert model-free est quant à lui peu coûteux en termes de ressources calculatoires, mais met du temps à converger vers la solution optimale. Dans ce travail, nous avons élaboré un nouveau critère de coordination de ces deux experts permettant au robot de changer dynamiquement de stratégie au cours du temps. Nous montrons dans ce travail que notre méthode de coordination de comportements permet au robot de maintenir une performance optimale en termes de performance et de temps de calcul. Nous montrons aussi que la méthode permet de faire face à des changements brusques de l’environnement, des changements d’objectifs ou de comportements du partenaire humain dans le cas des tâches d’interaction
The main objective of this thesis is to propose a new method for online adaptation of robotic learning, allowing robots to dynamically and autonomously adapt their behavior according to variations in their own performance. The developed method is sufficiently general and task-independent that a robot using it can perform different dynamic tasks of various nature without any algorithm or parameter adjustment by the programmer. The algorithms underlying this method consist of a meta-control system that allows the robot to call upon two decision-making experts following a different behavioral strategy. The model-based expert builds a model of the effects of long-term actions and uses this model to decide; this strategy is computationally expensive, but quickly converges to the solution. The model-free expert is inexpensive in terms of computational resources, but takes time to converge to the optimal solution. In this work, we have developed a new criterion for the coordination of these two experts allowing the robot to dynamically change its strategy over time. We show in this work that our behavior coordination method allows the robot to maintain an optimal performance in terms of performance and computation time. We also show that the method can cope with abrupt changes in the environment, changes in goals or changes in the behavior of the human partner in the case of interaction tasks
Styles APA, Harvard, Vancouver, ISO, etc.
29

Lesort, Timothée. « Continual Learning : Tackling Catastrophic Forgetting in Deep Neural Networks with Replay Processes ». Thesis, Institut polytechnique de Paris, 2020. http://www.theses.fr/2020IPPAE003.

Texte intégral
Résumé :
Les humains apprennent toute leur vie. Ils accumulent des connaissances à partir d'une succession d'expériences d'apprentissage et en mémorisent les aspects essentiels sans les oublier. Les réseaux de neurones artificiels ont des difficultés à apprendre dans de telles conditions. Ils ont en général besoin d'ensembles de données rigoureusement préparés pour pouvoir apprendre à résoudre des problèmes comme de la classification ou de la régression. En particulier, lorsqu'ils apprennent sur des séquences d'ensembles de données, les nouvelles expériences leurs font oublier les anciennes. Ainsi, ils sont souvent incapables d'appréhender des scénarios réels tels ceux de robots autonomes apprenant en temps réel à s'adapter à de nouvelles situations et devant résoudre des problèmes sans oublier leurs expériences passées.L'apprentissage continu est une branche de l'apprentissage automatique s'attaquant à ce type de scénarios. Les algorithmes continus sont créés pour apprendre des connaissances, les enrichir et les améliorer au cours d'un curriculum d'expériences d'apprentissage.Dans cette thèse, nous proposons d'explorer l'apprentissage continu avec rejeu de données. Les méthodes de rejeu de données rassemblent les méthodes de répétitions et les méthodes de rejeu par génération. Le rejeu par génération consiste à utiliser un réseau de neurones auxiliaire apprenant à générer les données actuelles. Ainsi plus tard le réseau auxiliaire pourra être utilisé pour régénérer des données du passé et les remémorer au modèle principal. La répétition a le même objectif, mais cette méthode sauve simplement des images spécifiques et les rejoue plus tard au modèle principal pour éviter qu'il ne les oublie. Les méthodes de rejeu permettent de trouver un compromis entre l'optimisation de l'objectif d'apprentissage actuel et ceux du passé. Elles permettent ainsi d'apprendre sans oublier sur des séquences de tâches.Nous montrons que ces méthodes sont prometteuses pour l'apprentissage continu.En particulier, elles permettent la réévaluation des données du passé avec des nouvelles connaissances et de confronter des données issues de différentes expériences. Nous démontrons la capacité des méthodes de rejeu à apprendre continuellement à travers des tâches d'apprentissage non-supervisées, supervisées et de renforcements
Humans learn all their life long. They accumulate knowledge from a sequence of learning experiences and remember the essential concepts without forgetting what they have learned previously. Artificial neural networks struggle to learn similarly. They often rely on data rigorously preprocessed to learn solutions to specific problems such as classification or regression.In particular, they forget their past learning experiences if trained on new ones.Therefore, artificial neural networks are often inept to deal with real-lifesuch as an autonomous-robot that have to learn on-line to adapt to new situations and overcome new problems without forgetting its past learning-experiences.Continual learning (CL) is a branch of machine learning addressing this type of problems.Continual algorithms are designed to accumulate and improve knowledge in a curriculum of learning-experiences without forgetting.In this thesis, we propose to explore continual algorithms with replay processes.Replay processes gather together rehearsal methods and generative replay methods.Generative Replay consists of regenerating past learning experiences with a generative model to remember them. Rehearsal consists of saving a core-set of samples from past learning experiences to rehearse them later. The replay processes make possible a compromise between optimizing the current learning objective and the past ones enabling learning without forgetting in sequences of tasks settings.We show that they are very promising methods for continual learning. Notably, they enable the re-evaluation of past data with new knowledge and the confrontation of data from different learning-experiences. We demonstrate their ability to learn continually through unsupervised learning, supervised learning and reinforcement learning tasks
Styles APA, Harvard, Vancouver, ISO, etc.
30

Spach, Michel. « Activités robotiques à l'école primaire et apprentissage de concepts informatiques : quelle place du scénario pédagogique ? Les limites du co-apprentissage ». Thesis, Sorbonne Paris Cité, 2017. http://www.theses.fr/2017USPCB198/document.

Texte intégral
Résumé :
Cette recherche, qui s'inscrit dans le cadre des travaux en didactique de l'informatique de Baron et Bruillard, analyse la façon dont des enseignants du primaire, non experts en informatique,conçoivent et mettent en œuvre des scénarios impliquant des robots pédagogiques de sol dans leurs classes. La mise en œuvre de ces robots a été étudiée avec l'objectif, d'apporter un éclairage sur leurs possibles apports pédagogiques. Il s'est agi de préciser comment ces enseignants parviennent à définir des situations didactiques de ces objets de connaissances auxquels ils n'ont jamais été confrontés et d'analyser la manière dont ils parviennent à développer chez les élèves une pensée informatique en actes. L'activité des élèves a été analysée, au travers l'approche instrumentale (Rabardel), en vue de comprendre de quelle manière l'apprentissage de concepts en informatique émerge de ces activités. La question des apprentissages des concepts et méthodes propres au domaine informatique par le biais de la robotique est analysée en prenant appui sur la théorie des champs conceptuels (Vergnaud). Cette recherche apporte des éléments permettant de comprendre comment ces enseignants parviennent, de manière intuitive, à développer et à mettre en œuvre des scénarios pour enseigner quelques concepts informatiques. Elle témoigne de leur capacité à intégrer des objets tangibles ou symboliques dans des séances d'apprentissage en informatique, en procédant à une analyse préalable à minima du fonctionnement du robot. Au cours des activités dans lesquelles ils sont mobilisés, outils robotiques et aides pédagogiques accompagnent les apprentissages. Sur le plan des apprentissages, les élèves se sont forgés, par des démarches d'instrumentation et d'instrumentalisation, des instruments et des méthodes pour comprendre l'objet informatique. Les concepts et notions en jeu sont particulièrement dépendants des contextes technologiques spécifiques à chacun des robots. Des méthodes propres à la production logicielle ont permis le séquençage de l'activité de programmation en phases de spécification, conception, réalisation et mise au point. Des paradigmes de programmation ont aussi été approchés, comme la programmation procédurale dans le cas du robot Bee-Bot et la programmation événementielle dans le cas de l'étude du comportement du robot Thymio. En dehors du domaine informatique, la résolution de problème, en étant placée au cœur des scénarios, a permis aux élèves de développer des démarches de tâtonnements, d'essais-erreurs dans un contexte de travail en petit groupe favorisant les échanges et les interactions entre les élèves
This research, which takes place within the framework of Baron and Bruillard's research in didactics of computer science,analyzes how primary school teachers, not computer experts, design and implement scenarios involving ground pedagogical robots in their classrooms. The integration of these robots has been studied with the aim of shedding light on their possible pedagogical contributions. It shows how these teachers succeed in defining pedagogical situations of these knowledge objects to which they have never been confronted before and in developing pupils' thinking in action. Student activity was analyzed, through the instrumental approach (Rabardel), in order to understand how the learning of computational concepts emerges from these activities. The question of the learning of concepts and methods specific to the computer domain through robotics is analyzed using the theory of conceptual fields (Vergnaud). This research provides additional understanding how these teachers intuitively develop and implement scenarios to teach a few computer concepts. It demonstrates their ability to integrate tangible or symbolic objects into computer learning sessions by performing a minimum analysis of the robot's functionality. During the activities in which they are mobilized, robotic tools and teaching aids accompany learning. In terms of learning, pupils have forged, through instrumentation and instrumentalities, tools and methods to understand the computer object. The concepts and notions involved are particularly dependent on the technological contexts specific to each robot. Methods specific to software production allowed the sequencing of the programming activity into phases of specification, design, realization and development. Programming paradigms were also approached, such as procedural programming in the case of the Bee-Bot robot and event programming in the case of the study of the behavior of the Thymio robot. Outside the computer field, problem solving, by being placed at the heart of the scenarios, allowed students to develop trial and error approaches in a small group work environment that facilitate exchanges and interactions between students
Styles APA, Harvard, Vancouver, ISO, etc.
31

Marquez-Gamez, David. « Vers une navigation visuelle en environnement dynamique inconnu : apprentissage et exécution de trajectoire avec détection et suivi d'objets mobiles ». Phd thesis, INSA de Toulouse, 2012. http://tel.archives-ouvertes.fr/tel-00842378.

Texte intégral
Résumé :
L'objectif de ces travaux porte sur la navigation de robots autonomes sur de grandes distances dans des environnements extérieurs dynamiques, plus précisément sur le développement et l'évaluation de fonctions avancées de perception, embarquées sur des véhicules se déplaçant en convoi sur un itinéraire inconnu a priori, dans un environnement urbain ou naturel. Nous avons abordé trois problématiques : d'abord nous avons exploité plusieurs méthodes de l'état de l'art, pour qu'un véhicule A, équipé d'un capteur stéréoscopique, apprenne à la fois une trajectoire et un modèle de l'environnement supposé d'abord statique. Puis nous avons proposé deux modes pour l'exécution de cette trajectoire par un véhicule B équipé d'une simple caméra : soit un mode différé, dans lequel B charge toute la trajectoire apprise par A, puis l'exécute seul, soit un mode convoi, dans lequel B suit A, qui lui envoie par une communication HF, les tronçons de la trajectoire au fur et à mesure qu'ils sont appris. Enfin nous avons considéré le cas des environnements évolutifs et dynamiques, en traitant de la détection d'événements depuis les images acquises depuis un véhicule mobile: détection des changements (disparition ou apparition d'objets statiques, typiquement des véhicules garés dans un milieu urbain), ou de la détection d'objets mobiles (autres véhicules ou piétons).
Styles APA, Harvard, Vancouver, ISO, etc.
32

Beaussé, Nils. « Apprentissage visuo-moteur, implication pour le développement sensorimoteur et l’émergence d'interactions sociales ». Thesis, Cergy-Pontoise, 2019. http://www.theses.fr/2019CERG1051.

Texte intégral
Résumé :
Cette thèse tente d'apporter des éléments de réponse à la question de l’apprentissage et du développement sensorimoteur lors d’une interaction entre humain et robot dans un environnement réel non contraint. Pour ce faire nous défendons dans cette thèse le fait que les êtres humains interagissent non seulement de façon intentionnelle ou consciente, mais également que les propriétés de leur système moteur à bas niveau, de leur corps, et des boucles d’apprentissage sensorimoteur, leur permettent de faciliter implicitement et naturellement cette interaction. Ainsi, nous abordons cette question par l’étude des propriétés du système sensorimoteur chez l’humain et notamment des mécanismes de développement de certaines de ces propriétés chez l’enfant. Dans un premier temps, nous étudions les propriétés du robot Tino qui est un prototype de robot humanoïde hydraulique unique en France et qui représente la plateforme expérimentale principale utilisée durant cette thèse. Nous avons ainsi analysé finement certaines des propriétés intéressantes du prototype qui peuvent avoir une analogie avec les propriétés du système moteur humain présentant un intérêt implicite dans un cadre d’interaction avec l’environnement ou avec un partenaire. En accord avec le paradigme de « l’intelligence du corps », nous montrons comment certaines de ces propriétés peuvent être exploitées pour simplifier la tâche au système de contrôle. Nous étudions également les limites de cette analogie et de son exploitation. Nous étudions ensuite dans cette thèse la modélisation des boucles motrices bas niveaux et des propriétés du système musculaire humain afin d’en isoler les propriétés utiles à l’interaction. Nous en proposons une implémentation sur robot et analysons les propriétés du système de contrôle proposé en simulation et sur la plateforme robotique Tino en lien avec les caractéristiques spécifiques de cette dernière. Par la suite nous développons une architecture neuronale bio-inspirée et développementale capable d’apprendre des associations visuo-motrices lors de phases de babillage moteur (« babbling »). Nous montrons à l’aide de ce modèle implémenté sur le robot Tino l’émergence implicite d’interactions sociales grâce aux propriétés des boucles sensorimotrices. Plus précisément, l’ambiguïté perceptive appliquée à cet algorithme permet l’émergence d’une imitation immédiate et d’un geste de pointage. Ce modèle utilise un système d’apprentissage associatif simple qui ne fournit qu’un « répertoire d’action ». Il est incapable de réagir finement aux contraintes de l’environnement ou d’un partenaire et il est notamment incapable de prendre en compte l’environnement pour planifier des trajectoires cohérentes dans celui-ci. Nous avons alors développé, à travers deux simulations de complexité croissante, un modèle d’apprentissage par renforcement bio-inspiré pour permettre à notre architecture d’apprendre à planifier la trajectoire permettant par exemple d’atteindre un objet présent dans l’environnement posé sur une table. Nous montrons ensuite les analogies entre ce modèle et les expériences sur la prise en compte de l’intention dans les actions motrices chez l’humain. Enfin, nous nous sommes intéressés aux dynamiques d’interactions entre humains et à l’apport que pourrait amener l’intégration de contrôleurs neuronaux oscillatoires dans les architectures de contrôle sensorimoteur, pour ce faire nous avons proposé plusieurs types de modèles oscillant capable d’apprendre et de s’adapter en fonction de la dynamique des informations entrantes, afin de pouvoir s’adapter à des architectures bio-inspirés se développant en interaction avec un environnement non contraint
This thesis try to bring answers to the question of the sensorimotor learning and development in the context of human-robot interactions in a real non-constrained environment. To achieve this goal we defend in this thesis the fact that human being interacts through intentional and conscious strategy but also depends of the property of their low level motor system, their body, and of their sensorimotor learning loops, allowing these to facilitate implicitly this interaction. We try to answer these questions through the study of the sensorimotor loops in humans, and through the study of the development of these properties in infants. First, we study here the properties of our robot « Tino », which is a prototype of an humanoid hydraulic robot, unique in France and which is the main experimental platform used in this thesis. We analyses in this thesis the property of this robot and made analogies with the human motor system properties that are implied in the interaction between human, the environment and other humans. We show how certain of these properties could be used to simplify tasks for the control system. We study finally the limit of this analogy and of the exploitation of these properties. After this part we study in this thesis the modeling of low level motor loop and of the properties of the human muscular system in order to capture the main interesting properties for interactions. We propose an implementation on robot and analyses the properties of this control system in simulation and on the robotic platform Tino. Then, we propose a bio-inspired and developmental neural architecture that is able to learn visuomotor association with babbling exploration of the environment. We show with this model implemented on the robot Tino that we can observe the emergence of implicit social interaction through the sensorimotor loops, such are imitation and pointing gesture. But this model use a simple associative learning which is able to construct an “actions repertoire” but is unable to react to the environment and humans finely. To solve this problem we have developed, through two simulations, a learning model based on reinforcement learning to allow our system to produce coherent trajectory in order to act in an environment. We applied this in a simulated task of grasping and moving an object on a table. We show then the analogies between this model and historic experiments about the impact of intention on the motor actions and trajectories in humans Finally we study in this thesis the dynamic of interactions and the interest of bringing oscillatory neural network in these sensorimotor architectures. To this end we propose in this thesis several oscillatory models able to learn and to adapt in the context of bio-inspired architecture that learn in interaction with a real environment
Styles APA, Harvard, Vancouver, ISO, etc.
33

Martinez, Margarit Aleix. « Apprentissage visuel dans un système de vision active : application dans un contexte de robotique et reconnaissance du visage ». Paris 8, 1998. http://www.theses.fr/1998PA081521.

Texte intégral
Résumé :
Dans cette these, nous presentons de nouvelles idees pour le developpement des plates-formes actives qui aident un agent autonome (artificiel) a reconnaitre des objets et a se reperer dans un environnement spatial. Pour resoudre ce probleme, nous avons etudie des representations distinctes basees sur l'aspect exterieur. Plus concretement, nous avons etudie l'utilisation de divers filtres gaussiens et particulierement les filtres orientables. Nous montrons comment ces filtres s'adaptent bien aux situations reelles et peuvent etre utilises de maniere efficace sur des plates-formes de vision active. Nous presentons des idees de base avec la description de sujets et l'etude de representation de donnees visuelles. Pour ceci, nous analyserons les differents filtres (gaussiens, premiere et deuxieme derivee de la gaussienne), ainsi qu'une nouvelle idee de representation iconique basee sur des filtres orientes. Posterieurement, nous decrivons une nouvelle idee pour l'utilisation de cette representation iconique dans des applications reelles, basee sur le balayage du systeme visuel humain. Des ordres assez simples, permettent d'obtenir de tres bons resultats en reconnaissance de visages et d'environnements spatiaux. Le systeme se divise en trois parties : 1) attention visuelle. 2) extraction de l'information et reduction de la dimensionnalite. 3) strategie de balayage visuel. L'objectif final est d'ameliorer quelques uns des problemes evoques dans les chapitres precedents. Pour obtenir de meilleurs resultats, nous avons formalise l'algorithme em (esperance - maximisation) avec des algorithmes genetiques. Nous avons implemente un nouvel algorithme de navigation active pour la navigation d'un robot dans un environnement inconnu. Ce systeme de navigation utilise des annotations de haut niveau pour la communication avec l'usager et les autres modules du systeme. Le dernier chapitre decrit les conclusions et les lignes de poursuite de la these.
Styles APA, Harvard, Vancouver, ISO, etc.
34

Ouanezar, Sofiane. « Contrôle moteur par le cervelet et interface Cerveau-Machine pour commander un doigt robotique ». Phd thesis, Télécom ParisTech, 2010. http://pastel.archives-ouvertes.fr/pastel-00577959.

Texte intégral
Résumé :
Cette thèse porte sur la modélisation de la commande motrice chez le Primate suivant deux approches : - Tout d'abord, en suivant une formalisation mathématique de la préparation par le Cerveau des signaux de commande d'un mouvement volontaire dirigé vers une cible. La méthode utilisée dans cette étude a été de recenser les contraintes fonctionnelles et d'en déduire un circuit de traitement des signaux moteurs, compatible avec l'organisation anatomique des voies cérébelleuses. Ce circuit a permis une optimisation hiérarchisée, sous les contraintes de rapidité d'exécution et d'économie de la dépense énergétique. Cette approche a été appliquée à la commande d'un bras robotique à 2 d.d.l mû par des muscles de McKibben, et à la modélisation du système oculomoteur du Primate. - Ensuite, en suivant une approche par codage. Nous présentons ici la conception et la mise au point d'une Interface Cerveau-Machine asynchrone qui décode les données cérébrales enregistrées chez le Macaque afin de contrôler un doigt robotique.
Styles APA, Harvard, Vancouver, ISO, etc.
35

Raiola, Gennaro. « Co-manipulation with a library of virtual guides ». Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLY001/document.

Texte intégral
Résumé :
Les robots ont un rôle fondamental dans la fabrication industrielle. Non seulement ils augmentent l'efficacité et la qualité des lignes de production, mais aussi diminuent considérablement la charge de travail des humains.Cependant, en raison des limites des robots industriels en termes de flexibilité, de perception et de sécurité,Leur utilisation est limitée à un environnement structuré bien connu. En outre, il n'est pas toujours rentable d'utiliser des robots autonomes industriels dans de petites usines à faibles volumes de production.Cela signifie que des travailleurs humains sont encore nécessaires dans de nombreuses chaînes d'assemblage pour exécuter des tâches spécifiques.Par conséquent, ces dernières années, une grande impulsion a été donnée à la co-manipulation homme-robot.En permettant aux humains et aux robots de travailler ensemble, il est possible de combiner les avantages des deux; La compréhension des tâches abstraites et la perception robuste typique d'un être humain avec la précision et la force d'un robot industriel.Une approche réussie pour faciliter la co-manipulation homme-robot, est l'approche de guides virtuels qui contraint le mouvement du robot sur seulement certaines trajectoires pertinentes. Le guide virtuel ainsi réalisé agit comme un outil passif qui améliore les performances de l'utilisateur en termes de temps de tâche, de charge de travail mentale et d'erreurs.L'aspect innovant de notre travail est de présenter une bibliothèque de guides virtuels qui permet à l'utilisateur de facilement sélectionner, générer et modifier les guides grâce à une interaction intuitive haptique avec le robot.Nous avons démontré, dans deux tâches industrielles, que ces innovations fournissent une interface novatrice et intuitive pour l'accomplissement des tâches par les humains et les robots
Robots have a fundamental role in industrial manufacturing. They not only increase the efficiency and the quality of production lines, but also drastically decrease the work load carried out by humans.However, due to the limitations of industrial robots in terms of flexibility, perception and safety, their use is limited to well-known structured environment. Moreover, it is not always cost-effective to use industrial autonomous robots in small factories with low production volumes.This means that human workers are still needed in many assembly lines to carry out specific tasks.Therefore, in recent years, a big impulse has been given to human-robot co-manipulation.By allowing humans and robots to work together, it is possible to combine the advantages of both; abstract task understanding and robust perception typical of human beings with the accuracy and the strength of industrial robots.One successful method to facilitate human-robot co-manipulation, is the Virtual Guides approach which constrains the motion of the robot along only certain task-relevant trajectories. The so realized virtual guide acts as a passive tool that improves the performances of the user in terms of task time, mental workload and errors.The innovative aspect of our work is to present a library of virtual guides that allows the user to easily select, generate and modify the guides through an intuitive haptic interaction with the robot.We demonstrated in two industrial tasks that these innovations provide a novel and intuitive interface for joint human-robot completion of tasks
Styles APA, Harvard, Vancouver, ISO, etc.
36

Cogrel, Benjamin, et Benjamin Cogrel. « Sélection contextuelle de services continus pour la robotique ambiante ». Phd thesis, Université Paris-Est, 2013. http://tel.archives-ouvertes.fr/tel-00961567.

Texte intégral
Résumé :
La robotique ambiante s'intéresse à l'introduction de robots mobiles au sein d'environnements actifs où ces derniers fournissent des fonctionnalités alternatives ou complémentaires à celles embarquées par les robots mobiles. Cette thèse étudie la mise en concurrence des fonctionnalités internes et externes aux robots, qu'elle pose comme un problème de sélection de services logiciels. La sélection de services consiste à choisir un service ou une combinaison de services parmi un ensemble de candidats capables de réaliser une tâche requise. Pour cela, elle doit prédire et évaluer la performance des candidats. Ces performances reposent sur des critères non-fonctionnels comme la durée d'exécution, le coût ou le bruit. Ce domaine applicatif a pour particularité de nécessiter une coordination étroite entre certaines de ses fonctionnalités. Cette coordination se traduit par l'échange de flots de données entre les fonctionnalités durant leurs exécutions. Les fonctionnalités productrices de ces flots sont modélisées comme des services continus. Cette nouvelle catégorie de services logiciels impose que les compositions de services soient hiérarchiques et introduit des contraintes supplémentaires pour la sélection de services. Cette thèse met en évidence la présence d'un important couplage non-fonctionnel entre les performances des instances de services de différents niveaux, même lorsque les flots de données sont unidirectionnels. L'approche proposée se concentre sur la prédiction de la performance d'une instance de haut-niveau sachant son organigramme à l'issue de la sélection. Un organigramme regroupe l'ensemble des instances de services sollicitées pour réaliser une tâche de haut-niveau. L'étude s'appuie sur un scénario impliquant la sélection d'un service de positionnement en vue de permettre le déplacement d'un robot vers une destination requise. Pour un organigramme considéré, la prédiction de performance d'une instance de haut-niveau de ce scénario introduit les exigences suivantes : elle doit (i)être contextuelle en tenant compte, par exemple, du chemin suivi pour atteindre la destination requise, (ii) prendre en charge le remplacement d'une instance de sous-service suite à un échec ou, par extension, de façon opportuniste. En conséquence, cette sélection de services est posée comme un problème de prise de décision séquentielle formalisé à l'aide de processus de décision markoviens à horizon fini. La dimensionnalité importante du contexte en comparaison à la fréquence des déplacements du robot rend inadaptées les méthodes consistant à apprendre directement une fonction de valeur ou une fonction de transition. L'approche proposée repose sur des modèles de dynamique locaux et exploite le chemin de déplacement calculé par un sous-service pour estimer en ligne les valeurs des organigrammes disponibles dans l'état courant. Cette estimation est effectuée par l'intermédiaire d'une méthode de fouille stochastique d'arbre, Upper Confidence bounds applied to Trees
Styles APA, Harvard, Vancouver, ISO, etc.
37

Bideaux, Eric. « Stan : systeme de transport a apprentissage neuronal. application de la vision omnidirectionnelle a la localisation d'un robot mobile autonome ». Besançon, 1995. http://www.theses.fr/1995BESA2008.

Texte intégral
Résumé :
Ce travail introduit une nouvelle methode d'interpretation de la vision du monde reel et applique cette technique a la navigation d'un robot mobile autonome dans un milieu industriel. Stan, systeme de transport a apprentissage neuronal, a pour objectif d'accroitre a moindre cout, la flexibilite et l'autonomie locale de robots mobiles. Cette proposition s'appuie essentiellement sur deux points. Premierement, le systeme de perception, base sur un systeme de vision omnidirectionnelle, permet de collecter des informations dans toutes les directions autour du robot en une seule prise d'image. Ce systeme consiste en la photographie du reflet de l'environnement sur un miroir conique. L'image obtenue fournit une signature caracteristique de la position dans l'environnement. Cette methode de perception est etudiee a travers deux prototypes: l'un permettant la prise d'une seule image, l'autre realisant la prise d'un couple d'images stereoscopiques. Deuxiemement, notre point de vue revise les developpements actuels des methodes de guidage et de navigation. Il s'appuie sur la reconnaissance des signatures caracteristiques de la position que fournit le systeme de perception afin de calculer la position du vehicule. La methode se decompose en deux etapes: un mode apprentissage ou un operateur enseigne la trajectoire de travail au robot, et, un mode operatoire ou le robot realise une reconnaissance des images recues. Ces deux phases constituent les etapes d'entrainement et d'utilisation de reseaux de neurones a retropropagation du gradient. Ce memoire souligne dans un premier temps la problematique liee a l'utilisation de vehicules autonomes dans un milieu industriel. Ces observations amenent alors la proposition d'une solution originale dont les differents points specifiques sont ensuite abordes a travers une presentation generale du projet stan. Un ensemble de resultats issus de simulations et experimentations permet ensuite la validation de l'idee generale a travers la comparaison de plusieurs architectures neuronales. Un bilan des contributions et des perspectives ouvertes par le projet stan conclut enfin sur l'avancement des travaux
Styles APA, Harvard, Vancouver, ISO, etc.
38

Moualla, Aliaa. « Un robot au Musée : Apprentissage cognitif et conduite esthétique ». Thesis, CY Cergy Paris Université, 2020. http://www.theses.fr/2020CYUN1002.

Texte intégral
Résumé :
Un robot au Musée: Apprentissage cognitif et conduite esthétique.Dans ma thèse je traite le sujet d'un apprentissage autonome basé sur la référenciation sociale dans un environnement réel, "le musée". Je m'intéresse à l’ajout et l'analyse de mécanismes nécessaires pour qu'un robot puisse poursuivre un tel type d'apprentissage. Je m'intéresse également à l'impact d'un apprentissage spécifique et individuel à chaque robot sur l'ensemble d'un groupe de robots confronté à une situation connue ou au contraire nouvelle, plus précisément :Dans le premier chapitre, nous aborderons de manière didactique les outils nécessaires à la compréhension des modèles et des méthodes que nous utiliserons tout au long de nos travaux. Nous aborderons les bases du formalisme neuronal, de l’apprentissage par conditionnement, de la catégorisation, et des champs de neurones dynamiques.Dans le deuxième chapitre, nous présenterons brièvement le système visuel biologique puis nous passerons en revue un état de l’art des différents modèles traitant la perception visuelle et la reconnaissance d'objet. Dans le cadre d’une approche bio-inspirée, nous présenterons ensuite le modèle du système visuel du robot "Berenson", l’architecture sensori-motrice permettant d’associer une valeur émotionnelle à un objet observé. Puis nous étudions les performances du système visuel avec et sans mécanisme de compétition spatiale.Dans le troisième chapitre nous passerons au niveau des interactions Homme-Machine, nous montrerons que l’intérêt des visiteurs porté au robot ne dépend pas que de sa forme, mais de son comportement et plus précisément de sa capacité à interagir aussi sur un registre émotionnel (ici des expressions faciales). Nous analysons tout d'abord l'impact du système visuel sur le contrôle bas niveau des actions du robot. Nous montrons que le bas niveau de la compétition spatiale entre les valeurs associées aux zones d’intérêt de l’image est important pour la reconnaissance d'objets et affecte donc la cohérence du comportement du robot et donc par la suite la lisibilité de ce comportement. Nous introduisons ensuite des modifications sur le contrôle des mouvements des yeux, de la tête et du corps en s'inspirant de processus biologiques (changement du cadre de référence). À la fin, nous analysons les tests effectués dans le musée afin d’évaluer la lisibilité du comportement du robot (ses mouvements et ses expressions faciales).Dans le quatrième chapitre nos travaux se poursuivent par l’ajout de mécanismes neuronaux élémentaires bio inspirés permettant l’émergence de capacité d’attention conjointe importante pour obtenir des interactions plus " naturelles " avec les visiteurs du musée mais aussi pour discuter d’un point de vue théorique l’émergence de la notion d’agentivité. Berenson représente donc aujourd’hui une forme d’expérimentation unique dans les sciences sociales comme en robotique du développement.Dans le cinquième chapitre, nous intéresserons à l’évaluation de l’effet de l’émergence de préférences esthétiques sur toute une population de robots (en simulation). Nous soutenons que la variabilité de l'apprentissage offerte par des environnements spéciaux tels qu'un musée conduit à l'individuation des robots. Nous nous interrogeons également sur l’intérêt d’enseigner des systèmes artificiels utilisant une seule grande base de données dans le but d’améliorer leurs performances. Éviter une réponse uniforme à une situation inconnue dans une population d'individus augmente ses chances de réussite
In my thesis I treat the subject of autonomous learning based on social referencing in a real environment, "the museum". I am interested in adding and analyzing the mechanisms necessary for a robot to pursue such a type of learning. I am also interested in the impact of a specific and individual learning to each robot on the whole of a group of robots confronted with a known situation or on the contrary new, more precisely:In the first chapter, we will discuss in a didactic way the tools needed to understand the models and methods that we will use throughout our work. We will discuss the basics of neural formalism, conditioning learning, categorization, and dynamic neural fields.In the second chapter, we will briefly present the biological visual system then we will review a state of the art of different models dealing with visual perception and object recognition. As part of a bio-inspired approach, we will then present the model of the visual system of the "Berenson" robot, the sensorimotor architecture allowing to associate an emotional value with an observed object. Then we study the performances of the visual system with and without space competition mechanism.In the third chapter we will move to the level of human-machine interactions, we will show that the interest of visitors to the robot does not only depend on its shape, but on its behavior and more specifically its ability to interact on an emotional level. (here facial expressions). We first analyze the impact of the visual system on the low level control of robot actions. We show that the low level of the spatial competition between the values ​​associated with the zones of interest of the image is important for the recognition of objects and thus affects the coherence of the behavior of the robot and therefore the legibility of this behavior. . We then introduce modifications on the control of eye, head and body movements inspired by biological processes (change of the frame of reference). In the end, we analyze the tests performed in the museum to assess the readability of the behavior of the robot (its movements and facial expressions).In the fourth chapter, our work continues with the addition of inspired bio-based neural mechanisms that allow the emergence of important joint attention capacity to achieve more "natural" interactions with visitors to the museum but also to discuss a point from a theoretical point of view the emergence of the notion of agency. Berenson represents today a form of experimentation unique in the social sciences as in development robotics.In the fifth chapter, we will focus on evaluating the effect of the emergence of aesthetic preferences on a whole population of robots (in simulation). We argue that the variability of learning offered by special environments such as a museum leads to the individuation of robots. We also question the interest of teaching artificial systems using a single large database in order to improve their performance. Avoiding a uniform response to an unknown situation in a population of individuals increases its chances of success
Styles APA, Harvard, Vancouver, ISO, etc.
39

Chenu, Alexandre. « Leveraging sequentiality in Robot Learning : Application of the Divide & ; Conquer paradigm to Neuro-Evolution and Deep Reinforcement Learning ». Electronic Thesis or Diss., Sorbonne université, 2023. http://www.theses.fr/2023SORUS342.

Texte intégral
Résumé :
"Pour réussir, il ne suffit pas de prévoir, il faut aussi savoir improviser." Cette citation d’Isaac Asimov, père fondateur de la robotique et auteur des Trois lois de la robotique, souligne toute l’importance d’être capable de s’adapter et d’agir dans l’instant présent pour réussir. Même si, aujourd’hui, les robots peuvent résoudre des tâches d’une complexité qui était inimaginable il y a encore quelques années, ces capacités d’adaptation leur font encore défaut, ce qui les empêche d’être déployé à une plus grande échelle. Pour remédier à ce manque d’adaptabilité, les roboticiens utilisent des algorithmes d’apprentissage afin de permettre aux robots de résoudre des tâches complexes de manière autonome. Deux types d’algorithmes d’apprentissage sont particulièrement adaptés à l’apprentissage autonome de contrôleurs par les robots : l’apprentissage profond par renforcement et la neuro-évolution. Cependant, ces deux classes d’algorithmes ne sont capables de résoudre des problèmes d’exploration difficiles, c’est-à- dire des problèmes avec un horizon long et un signal de récompense rare, que s’ils sont guidés dans leur processus d’apprentissage. Différentes approches peuvent être envisagées pour permettre à un robot de résoudre un tel problème sans être guidé. Une première approche consiste à rechercher une diversité de comportements plutôt qu’un comportement spécifique. L’idée étant que parmi cette diversité, certains comportements seront probablement capables de résoudre la tâche qui nous intéresse. Nous les appelons les algorithmes de recherche de diversité. Une deuxième approche consiste à guider le processus d’apprentissage en utilisant des démonstrations fournies par un expert. C’est ce qu’on appelle l’apprentissage par démonstration. Cependant, chercher des comportements divers ou apprendre par démonstration peut être inefficace dans certains contextes. En effet, la recherche de comportements divers peut être fastidieuse si l’environnement est complexe. D’autre part, l’apprentissage à partir d’une seule et unique démonstration peut être très difficile. Dans cette thèse, nous tentons d’améliorer l’efficacité des approches de recherche par diversité et d’apprentissage à partir d’une seule démonstration dans des problèmes d’exploration difficiles. Pour ce faire, nous supposons que les comportements robotiques complexes peuvent être décomposés en sous-comportements plus simples. Sur la base de ce biais séquentiel, nous adoptons une stratégie dite de "diviser-pour-régner", qui est bien connue pour être efficace lorsque le problème est composable. Nous proposons deux approches en particulier. Premièrement, après avoir identifié certaines limites des algorithmes de recherche de diversité basés sur la l’évolution de réseaux de neurones artificiels, nous proposons Novelty Search Skill Chaining. Cet algorithme combine la recherche de diversité avec l’enchaînement de compétences pour naviguer efficacement dans des labyrinthes qui sont difficiles à explorer pour des algorithmes de l’état-de-l’art. Dans une deuxième série de contributions, nous proposons les algorithmes Divide & Conquer Imitation Learning. L’intuition derrière ces méthodes est de décomposer la tâche complexe d’apprentissage à partir d’une seule démonstration en plusieurs sous-tâches plus simples consistant à atteindre des sous-buts successifs. DCIL-II, la variante la plus avancée, est capable d’apprendre des comportements de marche pour des robots humanoïdes sous-actionnés avec une efficacité sans précédent. Au-delà de souligner l’efficacité du paradigme de diviser-pour-régner dans l’apprentissage des robots, cette thèse met également en évidence les difficultés qui peuvent survenir lorsqu’on compose de comportements, même dans des environnements élémentaires. Il faudra inévitablement résoudre ces difficultés avant d’appliquer ces algorithmes directement à des robots réels. C’est peut-être une condition nécessaire pour le succès des prochaines générations [...]
“To succeed, planning alone is insufficient. One must improvise as well.” This quote from Isaac Asimov, founding father of robotics and author of the Three Laws of Robotics, emphasizes the importance of being able to adapt and think on one’s feet to achieve success. Although robots can nowadays resolve highly complex tasks, they still need to gain those crucial adaptability skills to be deployed on a larger scale. Robot Learning uses learning algorithms to tackle this lack of adaptability and to enable robots to solve complex tasks autonomously. Two types of learning algorithms are particularly suitable for robots to learn controllers autonomously: Deep Reinforcement Learning and Neuro-Evolution. However, both classes of algorithms often cannot solve Hard Exploration Problems, that is problems with a long horizon and a sparse reward signal, unless they are guided in their learning process. One can consider different approaches to tackle those problems. An option is to search for a diversity of behaviors rather than a specific one. The idea is that among this diversity, some behaviors will be able to solve the task. We call these algorithms Diversity Search algorithms. A second option consists in guiding the learning process using demonstrations provided by an expert. This is called Learning from Demonstration. However, searching for diverse behaviors or learning from demonstration can be inefficient in some contexts. Indeed, finding diverse behaviors can be tedious if the environment is complex. On the other hand, learning from demonstration can be very difficult if only one demonstration is available. This thesis attempts to improve the effectiveness of Diversity Search and Learning from Demonstration when applied to Hard Exploration Problems. To do so, we assume that complex robotics behaviors can be decomposed into reaching simpler sub-goals. Based on this sequential bias, we try to improve the sample efficiency of Diversity Search and Learning from Demonstration algorithms by adopting Divide & Conquer strategies, which are well-known for their efficiency when the problem is composable. Throughout the thesis, we propose two main strategies. First, after identifying some limitations of Diversity Search algorithms based on Neuro-Evolution, we propose Novelty Search Skill Chaining. This algorithm combines Diversity Search with Skill- Chaining to efficiently navigate maze environments that are difficult to explore for state-of-the-art Diversity Search. In a second set of contributions, we propose the Divide & Conquer Imitation Learning algorithms. The key intuition behind those methods is to decompose the complex task of learning from a single demonstration into several simpler goal-reaching sub-tasks. DCIL-II, the most advanced variant, can learn walking behaviors for under-actuated humanoid robots with unprecedented efficiency. Beyond underlining the effectiveness of the Divide & Conquer paradigm in Robot Learning, this work also highlights the difficulties that can arise when composing behaviors, even in elementary environments. One will inevitably have to address these difficulties before applying these algorithms directly to real robots. It may be necessary for the success of the next generations of robots, as outlined by Asimov
Styles APA, Harvard, Vancouver, ISO, etc.
40

Fontbonne, Nicolas. « Individual and group learning dynamics in evolutionary collective robotics ». Electronic Thesis or Diss., Sorbonne université, 2023. http://www.theses.fr/2023SORUS069.

Texte intégral
Résumé :
Avec leur prolifération dans l'industrie et la vie quotidienne, les robots sont désormais de plus en plus amenés à interagir entre eux. Cette thèse traite du problème de la coordination entre robots dans un contexte où ils doivent apprendre leur politique de contrôle de manière autonome. Ces politiques sont optimisées avec des algorithmes d'apprentissage automatique qui tirent parti d'une fonction de récompense pour augmenter progressivement les performances. La structure de cette fonction va influencer significativement la dynamique d'apprentissage et donc les comportements possibles des agents. Nous étudions d'abord les systèmes où les agents reçoivent individuellement une récompense locale adaptée à leurs actions et doivent converger vers un comportement collectif optimal. Nous introduisons un algorithme d'apprentissage évolutif distribué appelé Horizontal Information Transfer (HIT) qui s'attaque à ce problème particulier. Les agents interagissent en ligne dans leur environnement et doivent apprendre leur politique de contrôle avec un algorithme évolutif embarqué et un système d'échange de paramètres. Il a l'avantage de faire face aux capacités de calcul et de communication limitées des robots à faible coût, qui sont souvent utilisés dans la robotique en essaim. Nous analysons les caractéristiques et la dynamique d'apprentissage de cet algorithme sur une tâche de recherche de nourriture. Nous étudions ensuite des systèmes où la récompense est donnée globalement à toute l'équipe. Ainsi, cette évaluation ne représente pas nécessairement la performance de chaque agent et il peut être difficile de calculer une contribution individuelle. Nous introduisons un algorithme co-évolutif coopératif centralisé (CCEA) qui module le nombre de modifications des politiques des agents pour trouver un compromis entre la qualité de l'évaluation et la vitesse d'exécution. Cette modulation aide également à effectuer des tâches où l'amélioration des performances de l'équipe nécessite la mise à jour de plusieurs agents de manière synchronisée. Nous utilisons un problème de sélection de ressources multi-robot et un problème d'exploration multi-rover simulé pour fournir des validations expérimentales des algorithmes proposés
With their proliferation in industry and daily life, robots are now increasingly required to interact with each other. This thesis deals with the problem of coordination between robots in a context where they have to learn their control policy autonomously. These policies are optimized with machine learning algorithms that take advantage of a reward function to increase performance incrementally. The structure of this function will significantly influence the learning dynamics and, then, the possible behaviours of the agents. We first study systems where agents individually receive a local reward adapted to their actions and must converge towards an optimal collective behaviour. We introduce a distributed evolutionary learning algorithm called Horizontal Information Transfert (HIT) that tackles this particular issue. Agents interact on-line in their environment and must learn their control policy with an embedded evolutionary algorithm and a parameter exchange system. It has the advantage of coping with the limited computation and communication capabilities of low-cost robots, which are often used in swarm robotics. We analyze this algorithm's characteristics and learning dynamics on a foraging task. We then study systems where the reward is given globally to the entire team. Therefore, this evaluation does not necessarily represent each agent's performance, and it can be challenging to calculate an individual contribution. We introduce a centralized cooperative co-evolutionary algorithm (CCEA) that modulates the number of agents' policies modification to find a compromise between evaluation quality and execution speed. This modulation also helps in completing tasks where improving team performance requires multiple agents to update in a synchronized manner. We use a multi-robot resource selection problem and a simulated multi-rover exploration problem to provide experimental validations of the proposed algorithms
Styles APA, Harvard, Vancouver, ISO, etc.
41

Risser-Maroix, Olivier. « Similarité visuelle et apprentissage de représentations ». Electronic Thesis or Diss., Université Paris Cité, 2022. http://www.theses.fr/2022UNIP7327.

Texte intégral
Résumé :
L’objectif de cette thèse CIFRE est de développer un moteur de recherche par image, basé sur la vision par ordinateur, afin d’assister les officiers des douanes. En effet, nous constatons, paradoxalement, une augmentation des menaces sécuritaires (terrorisme, trafic, etc.) couplée d’une diminution des effectifs en Douane. Les images de cargos acquises par des scanners à rayons X permettent déjà l’inspection d’un chargement sans nécessiter l’ouverture et la fouille complète d’un chargement contrôlé. En proposant automatiquement des images similaires, un tel moteur de recherche permettrait d’aider le douanier dans sa prise de décision face à des signatures visuelles de produits peu fréquents ou suspects. Grâce à l’essor des techniques modernes en intelligence artificielle (IA), notre époque subit de grands changements : l’IA transforme tous les secteurs de l’économie. Certains voient dans cet avènement de la "robotisation" la déshumanisation de la force de travail, voire son remplacement. Cependant, réduire l’utilisation de l’IA à la simple recherche de gains de productivité serait réducteur. En réalité, l’IA pourrait permettre d’augmenter la capacité de travail des humains et non à les concurrencer en vue de les remplacer. C’est dans ce contexte, la naissance de l’Intelligence Augmentée, que s’inscrit cette thèse. Ce manuscrit consacré à la question de la similarité visuelle se décompose en deux parties. Deux cas pratiques où la collaboration entre l’Homme et l’IA est bénéfique sont ainsi proposés. Dans la première partie, le problème de l’apprentissage de représentations pour la recherche d’images similaires fait encore l’objet d’investigations approfondies. Après avoir implémenté un premier système semblable à ceux proposés par l’état de l’art, l’une des principales limitations est pointée du doigt : le biais sémantique. En effet, les principales méthodes contemporaines utilisent des jeux de données d’images couplées de labels sémantiques uniquement. Les travaux de la littérature considèrent que deux images sont similaires si elles partagent le même label. Cette vision de la notion de similarité, pourtant fondamentale en IA, est réductrice. Elle sera donc remise en question à la lumière des travaux en psychologie cognitive afin de proposer une amélioration : la prise en compte de la similarité visuelle. Cette nouvelle définition permet une meilleure synergie entre le douanier et la machine. Ces travaux font l’objet de publications scientifiques et d’un brevet. Dans la seconde partie, après avoir identifié les composants clefs permettant d’améliorer les performances du système précédemment proposé, une approche mêlant recherche empirique et théorique est proposée. Ce second cas, l’intelligence augmentée est inspirée des développements récents en mathématiques et physique. D’abord appliquée à la com- préhension d’un hyperparamètre important (la température), puis à une tâche plus large (la classification), la méthode proposée permet de fournir une intuition sur l’importance et le rôle de facteurs corrélés à la variable étudiée (ex. hyperparamètre, score, etc.). La chaîne de traitement ainsi mise en place a démontré son efficacité en fournissant une solution hautement explicable et en adéquation avec des décennies de recherches en apprentissage automatique. Ces découvertes permettront l’amélioration des solutions précédemment développées
The objective of this CIFRE thesis is to develop an image search engine, based on computer vision, to assist customs officers. Indeed, we observe, paradoxically, an increase in security threats (terrorism, trafficking, etc.) coupled with a decrease in the number of customs officers. The images of cargoes acquired by X-ray scanners already allow the inspection of a load without requiring the opening and complete search of a controlled load. By automatically proposing similar images, such a search engine would help the customs officer in his decision making when faced with infrequent or suspicious visual signatures of products. Thanks to the development of modern artificial intelligence (AI) techniques, our era is undergoing great changes: AI is transforming all sectors of the economy. Some see this advent of "robotization" as the dehumanization of the workforce, or even its replacement. However, reducing the use of AI to the simple search for productivity gains would be reductive. In reality, AI could allow to increase the work capacity of humans and not to compete with them in order to replace them. It is in this context, the birth of Augmented Intelligence, that this thesis takes place. This manuscript devoted to the question of visual similarity is divided into two parts. Two practical cases where the collaboration between Man and AI is beneficial are proposed. In the first part, the problem of learning representations for the retrieval of similar images is still under investigation. After implementing a first system similar to those proposed by the state of the art, one of the main limitations is pointed out: the semantic bias. Indeed, the main contemporary methods use image datasets coupled with semantic labels only. The literature considers that two images are similar if they share the same label. This vision of the notion of similarity, however fundamental in AI, is reductive. It will therefore be questioned in the light of work in cognitive psychology in order to propose an improvement: the taking into account of visual similarity. This new definition allows a better synergy between the customs officer and the machine. This work is the subject of scientific publications and a patent. In the second part, after having identified the key components allowing to improve the performances of thepreviously proposed system, an approach mixing empirical and theoretical research is proposed. This secondcase, augmented intelligence, is inspired by recent developments in mathematics and physics. First applied tothe understanding of an important hyperparameter (temperature), then to a larger task (classification), theproposed method provides an intuition on the importance and role of factors correlated to the studied variable(e.g. hyperparameter, score, etc.). The processing chain thus set up has demonstrated its efficiency byproviding a highly explainable solution in line with decades of research in machine learning. These findings willallow the improvement of previously developed solutions
Styles APA, Harvard, Vancouver, ISO, etc.
42

Paulin, Mathias. « Contributions à l'apprentissage automatique de réseau de contraintes et à la constitution automatique de comportements sensorimoteurs en robotique ». Phd thesis, Université Montpellier II - Sciences et Techniques du Languedoc, 2008. http://tel.archives-ouvertes.fr/tel-00340438.

Texte intégral
Résumé :
Dans le cadre de cette thèse, nous nous intéressons à l'acquisition automatique de réseau de contraintes, aussi appelée apprentissage automatique de réseau de contraintes, qui consiste à développer des solutions capables d'aider un utilisateur à modéliser un problème combinatoire sous la forme d'un réseau de contraintes. Notre travail se focalise plus précisément sur la plate-forme d'acquisition automatique de réseau de contraintes CONACQ. Dans son implémentation standard, CONACQ est passive vis-à-vis de l'utilisateur, c'est-à-dire basée sur la capacité de ce dernier à fournir des instances significatives de son problème. Dans la première partie de cette thèse, nous proposons une version interactive de CONACQ, capable de poser à l'utilisateur des questions dont le but est d'augmenter plus rapidement et de manière conséquente la connaissance acquise par la plate-forme. Afin de limiter le nombre d'interactions, nous proposons différentes stratégies de questionnement que nous validons ensuite empiriquement. Dans la seconde partie, nous nous intéressons à une utilisation pratique de l'acquisition automatique de réseau de contraintes qui vise à automatiser le processus de définitions de comportements sensorimoteurs en robotique. Dans cette optique, nous proposons une architecture logicielle, complémentaire aux architectures de contrôle existantes, qui utilise le paradigme de la programmation par contraintes pour modéliser, planifier et superviser l'exécution de comportements sensorimoteurs. Elle utilise la plate-forme CONACQ étudiée dans la première partie de cette thèse pour modéliser automatiquement les actions élémentaires d'un robot sous la forme de réseaux de contraintes. Notre architecture utilise par ailleurs un planificateur de tâches inspiré de CSP-Plan pour combiner les réseaux de contraintes acquis et ainsi définir automatiquement des comportements sensorimoteurs. Différents résultats expérimentaux sont par ailleurs présentés afin de valider notre approche.
Styles APA, Harvard, Vancouver, ISO, etc.
43

Bredèche, Nicolas. « Ancrage de lexique et perceptions : changements de représentation et apprentissage dans le contexte d'un agent situé et mobile ». Paris 11, 2002. http://www.theses.fr/2002PA112225.

Texte intégral
Résumé :
En intelligence artificielle, le problème de l'ancrage de symboles dans le monde est un élément primordial du point de vue du sens des connaissances que peut manipuler un agent artificiel. Les travaux que nous présentons abordent le problème de l'ancrage pour un robot situé et mobile qui évolue dans le monde. Le problème que nous nous posons est de donner la capacité à un tel agent d'ancrer un lexique constitué de mots connus par des interlocuteurs humains et se référant à des objets physiques présents dans l'environnement. Ancrer un tel lexique est rendu difficile par un environnement dynamique, complexe et fortement bruité. De plus, pour un objet particulier à ancrer, un nom donné par un interlocuteur humain peut se référer à un grand nombre de formes observables alors que l'agent n'observe généralement que peu d'exemples de vues de chaque objet. Il n'est pas non plus possible d'utiliser de modèle ad hoc du fait de la grande diversité des objets à ancrer. Par conséquent la question se pose de savoir comment construire l'ancrage d'un symbole quelconque. Dans le cadre de cette thèse, nous reformulons le problème de l'ancrage de symboles comme un problème d'apprentissage automatique supervisé. Nous proposons ensuite une approche qui repose sur la mise en oeuvre d'opérateurs d'abstraction exploitant les informations de granularités et de structures contenues dam les perceptions de l'agent Pour chaque symbole, la définition de ces opérateurs est fixée à l'aide de changements de représentation successifs et rend ainsi possible la construction d'un ancrage efficace et adapté. Finalement, nous avons développé les outils PLIC et WMplic qui mettent en oeuvre avec succès notre approche pour construire et maintenir un ancrage à long terme dans le cadre d'un robot mobile autonome Pioneer2DX évoluant dans les couloirs du Laboratoire d'informatique de Paris 6
In Artificial Intelligence, the symbol grounding problem is considered as an important issue regarding the meaning of symbols used by an artificial agent. Our work is concerned with the grounding of symbols for a situated mobile robot that navigates through a real world environment. In this setting, the main problem the robot encounters is to ground symbols given by a human teacher that refers to physical entities (e. G. A door, a human, etc. ). Grounding such a lexicon is a difficult task because of the intrinsic nature of the environment: it is dynamic, complex and noisy. Moreover, one specific symbol (e. G. "door") may refer to different physical objects in size, shape or colour while the robot may acquire only a small number of examples for each symbol. Also, it is not possible to rely on ad-hoc physical models of symbols due to the great number of symbols that may be grounded. Thus, the problem is to define how to build a grounded representation in such a context. In order to address this problem, we have reformulated the symbol grounding problem as a supervised learning problem. We present an approach that relies on the use of abstraction operators. Thanks to these operators, information on granularity and structural configuration is extracted from the perceptions in order to case the building of an anchor. For each symbol, the appropriate definition for these operators is found out thanks to successive changes of representation that provide an efficient and adapted anchor. In order to implement our approach, we have developed PLIC and WMplic which are successfully used for long term symbol grounding by a PIONEER2 DX mobile robot in the corridors of the Computer Sciences Lab of the University of Paris 6
Styles APA, Harvard, Vancouver, ISO, etc.
44

Cogrel, Benjamin. « Sélection contextuelle de services continus pour la robotique ambiante ». Thesis, Paris Est, 2013. http://www.theses.fr/2013PEST1079/document.

Texte intégral
Résumé :
La robotique ambiante s'intéresse à l'introduction de robots mobiles au sein d'environnements actifs où ces derniers fournissent des fonctionnalités alternatives ou complémentaires à celles embarquées par les robots mobiles. Cette thèse étudie la mise en concurrence des fonctionnalités internes et externes aux robots, qu'elle pose comme un problème de sélection de services logiciels. La sélection de services consiste à choisir un service ou une combinaison de services parmi un ensemble de candidats capables de réaliser une tâche requise. Pour cela, elle doit prédire et évaluer la performance des candidats. Ces performances reposent sur des critères non-fonctionnels comme la durée d'exécution, le coût ou le bruit. Ce domaine applicatif a pour particularité de nécessiter une coordination étroite entre certaines de ses fonctionnalités. Cette coordination se traduit par l'échange de flots de données entre les fonctionnalités durant leurs exécutions. Les fonctionnalités productrices de ces flots sont modélisées comme des services continus. Cette nouvelle catégorie de services logiciels impose que les compositions de services soient hiérarchiques et introduit des contraintes supplémentaires pour la sélection de services. Cette thèse met en évidence la présence d'un important couplage non-fonctionnel entre les performances des instances de services de différents niveaux, même lorsque les flots de données sont unidirectionnels. L'approche proposée se concentre sur la prédiction de la performance d'une instance de haut-niveau sachant son organigramme à l'issue de la sélection. Un organigramme regroupe l'ensemble des instances de services sollicitées pour réaliser une tâche de haut-niveau. L'étude s'appuie sur un scénario impliquant la sélection d'un service de positionnement en vue de permettre le déplacement d'un robot vers une destination requise. Pour un organigramme considéré, la prédiction de performance d'une instance de haut-niveau de ce scénario introduit les exigences suivantes : elle doit (i)être contextuelle en tenant compte, par exemple, du chemin suivi pour atteindre la destination requise, (ii) prendre en charge le remplacement d'une instance de sous-service suite à un échec ou, par extension, de façon opportuniste. En conséquence, cette sélection de services est posée comme un problème de prise de décision séquentielle formalisé à l'aide de processus de décision markoviens à horizon fini. La dimensionnalité importante du contexte en comparaison à la fréquence des déplacements du robot rend inadaptées les méthodes consistant à apprendre directement une fonction de valeur ou une fonction de transition. L'approche proposée repose sur des modèles de dynamique locaux et exploite le chemin de déplacement calculé par un sous-service pour estimer en ligne les valeurs des organigrammes disponibles dans l'état courant. Cette estimation est effectuée par l'intermédiaire d'une méthode de fouille stochastique d'arbre, Upper Confidence bounds applied to Trees
Ambient robotics aims at introducing mobile robots in active environments where the latter provide new or alternative functionalities to those shipped by mobile robots. This thesis studies the competition between robot and external functionalities, which is set as a service selection problem. Service selection consists in choosing a service or a combination of services among a set of candidates able to fulfil a given request. To do this, it has to predict and evaluate candidate performances. These performances are based on non-functional requirements such as execution time, cost or noise. This application domain requires tight coordination between some of its functionalities. Tight coordination involves setting data streams between functionalities during their execution. In this proposal, functionalities producing data streams are modelled as continuous services. This new service category requires hierarchical service composition and adds some constraints to the service selection problem. This thesis shows that an important non-functional coupling appears between service instances at different levels, even when data streams are unidirectional. The proposed approach focuses on performance prediction of an high-level service instance given its organigram. This organigram gathers service instances involved in the high-level task processing. The scenario included in this study is the selection of a positioning service involved in a robot navigation high-level service. For a given organigram, performance prediction of an high-level service instance of this scenario has to: (i) be contextual by, for instance, considering moving path towards the required destination, (ii) support service instance replacement after a failure or in an opportunist manner. Consequently, this service selection is set as a sequential decision problem and is formalized as a finite-horizon Markov decision process. Its high contextual dimensionality with respect to robot moving frequency makes direct learning of Q-value functions or transition functions inadequate. The proposed approachre lies on local dynamic models and uses the planned moving path to estimate Q-values of organigrams available in the initial state. This estimation is done using a Monte-Carlo tree search method, Upper Confidence bounds applied to Trees
Styles APA, Harvard, Vancouver, ISO, etc.
45

Hanna, Elias. « Improving Novelty Search Sample Efficiency with Models or Archive Bootstrapping ». Electronic Thesis or Diss., Sorbonne université, 2024. https://accesdistant.sorbonne-universite.fr/login?url=https://theses-intra.sorbonne-universite.fr/2024SORUS038.pdf.

Texte intégral
Résumé :
Dans le contexte de la recherche de politiques pour les systèmes robotiques, l'efficacité en données est une priorité. Les algorithmes évolutionnaires ont été utilisés au cours des dix dernières années pour obtenir des résultats significatifs dans le domaine de la robotique, car leur approche darwiniste de l'optimisation leur permet de contourner les problèmes souvent rencontrés par les méthodes d'optimisation basées sur le gradient de la récompense, telles que l'apprentissage par renforcement. Néanmoins, ces méthodes restent très coûteuses en données et presque impossibles à transférer directement sur un système robotique réel. Cette thèse de doctorat s'intéresse à la résolution de ce problème d'efficacité en données, en particulier pour l'algorithme Novelty Search, un algorithme évolutionnaire basé sur la nouveauté. L'incorporation de modèles appris dans le processus d'optimisation a été une solution à l'efficacité en données pendant de nombreuses années, mais peu de travaux abordent cette question dans le cadre de la recherche de nouveauté. Trois axes de recherche dans ce cadre sont explorés dans ce manuscrit. Tout d'abord, l'impact du pré-entraînement du modèle appris avec des données recueillies à l'aide de processus aléatoires de corrélation temporelle variable est évalué. Il est démontré sur des algorithmes issus de l'état de l'art que l'impact est négligeable sur un algorithme évolutionnaire utilisant un modèle appris, mais qu'il est significatif sur un algorithme d'apprentissage par renforcement basé modèle avec des récompenses initiales jusqu'à dix fois plus grandes entre le meilleur et le pire processus aléatoire utilisé. Deuxièmement, une étude préliminaire est réalisée sur une nouvelle approche visant à orienter la population initiale de l'algorithme Novelty Search vers une population plus diversifiée sur le plan comportemental en utilisant des ensembles de modèles dynamiques aléatoires. Il est montré que cette approche réduit avec succès le nombre d'évaluations requises par la recherche de nouveauté pour couvrir l'environnement d'une base mobile à deux roues. Il est également démontré que cette approche échoue sur un environnement de locomotion plus complexe d'un robot hexapode, et que le manque de diversité capturé par les ensembles de modèles aléatoires utilisés en est la cause. Enfin, un nouvel algorithme évolutionnaire basé sur les modèles, appelé Model-Based Novelty Search, est proposé, dans le but de préserver les fortes capacités d'exploration de Novelty Search tout en réduisant le nombre d'évaluations nécessaires pour atteindre la même couverture de l'espace comportemental. Les résultats obtenus sur trois tâches robotiques montrent une réduction de l'utilisation de données 30 % à 75 % selon la tâche considérée tout en conservant la même couverture de l'espace comportemental, ce qui constitue une avancée significative vers un algorithme de recherche de nouveauté plus efficace en termes d'échantillons
In the context of policy search for robotic systems, being sample-efficient is a most. Evolutionary Algorithms have been used in the past ten years to achieve significant results in the robotics domain as their Darwinist approach to optimization allows them to bypass problems often encountered by gradient-based optimization methods like Reinforcement Learning. Nevertheless, such methods remain sample greedy and almost impossible to transfer directly onto a real robotic system. This Ph.D thesis takes interest in solving that sample-efficiency problem, especially for the Novelty Search algorithm, a novelty-driven Evolutionary Algorithm. Incorporating learned models in the optimization process has been a solution towards sample-efficiency for many years, but few works address this within the Novelty Search framework. Three research axis within that framework are explored in this manuscript. Firstly, the impact of pre-training the learned model with data gathered using random processes of varying time-correlation is evaluated. It is shown that the impact is negligible on a state-of-the-art model-based Evolutionary Algorithm, but that it is significant on a model-based Reinforcement Learning algorithm with returns with up to ten-fold differences between the best and worst random process used. Secondly, a preliminary study is made on a new approach aiming at biasing the initial population of the Novelty Search algorithm towards a more behavioraly diverse one using random dynamics models ensembles. It is shown that this approach successfully reduces the number of evaluations required by Novelty Search to cover the environment of a two-wheeled robot. It is also shown that this approach fails on a more complex locomotion environment of an hexapod robot, and the lack of diversity captured by the random models ensembles used is determined as the cause. Finally, a new model-based Evolutionary Algorithm, dubbed Model-Based Novelty Search, is proposed, with the aim of preserving the strong exploration capabilities of Novelty Search while reducing the numbers of evaluations needed to reach the same coverage of the Behavioral Space. Results on three robotic tasks show a reduction in sample usage compared to Novelty Search of 30% up to 75% depending on the considered task, a significant advance towards a more sample-efficient Novelty Search algorithm
Styles APA, Harvard, Vancouver, ISO, etc.
46

Laflaquière, Alban. « Approche sensorimotrice de la perception de l'espace pour la robotique autonome ». Phd thesis, Université Pierre et Marie Curie - Paris VI, 2013. http://tel.archives-ouvertes.fr/tel-00865091.

Texte intégral
Résumé :
L'approche classique de conception des robots obéit à une organisation interne du type sentir-planifier-agir, proposée dès l'apparition des problématiques d'Intelligence Artificielle. Elle implique le développement amont de modèles d'interaction entre le robot et son environnement et d'algorithmes de traitement du flux sensoriel conduisant, à terme, à la génération de commandes motrices. Dans ce contexte particulier, les caractéristiques de l'environnement perçues par le robot dérivent fondamentalement des traitements du flux sensoriel implémentés par le roboticien. Elles peuvent donc se révéler inadaptées vis-à-vis de l'interaction sensorimotrice réelle que le robot entretient avec le monde. Une autre approche, développée dans cette thèse, consiste à repenser la problématique de la perception en robotique. Elle s'inspire de la théorie des contingences sensorimotrices qui propose de concevoir notre perception non pas comme un phénomène se produisant dans le cerveau mais comme une interaction que nous entretenons avec l'environnement. Cette perspective, radicalement opposée aux postulats classiques, induit que percevoir n'est pas inné mais s'acquiert par la découverte des relations sensorimotrices qui sous-tendent notre expérience du monde. L'objectif de cette thèse est d'appliquer ce nouveau paradigme au champ de la robotique. Plus précisément, les travaux menés visent à déterminer comment un robot naïf peut découvrir et caractériser l'espace dans lequel son corps et l'environnement sont plongés au travers de l'analyse de son seul flux sensorimoteur. Pour se faire, une approche sera développée sur la base de la compensabilité des variations sensorielles générées par les déplacements du système robot/environnement, concept initialement introduit par H.Poincaré. Elle permettra à nos robots de déterminer la dimension de l'espace géométrique extérieur puis d'en construire une représentation interne, permettant à terme d'interpréter intrinsèquement leur expérience et de guider leur action.
Styles APA, Harvard, Vancouver, ISO, etc.
47

Perez, Manuela. « Chirurgie robotique : de l'apprentissage à l'application ». Thesis, Université de Lorraine, 2012. http://www.theses.fr/2012LORR0113/document.

Texte intégral
Résumé :
Le développement croissant de la chirurgie robotique pose le problème de la formation. Cette nouvelle technologie tend à suppléer dans les procédures complexes la coelioscopie. Elle nécessite une adaptation du chirurgien. Il est, en effet, nécessaire de maîtriser à la fois le télémanipulateur et les procédures chirurgicales, qui ne sont pas de simples transpositions des gestes coelioscopiques. Initialement, nous avons réalisé un historique du développement de la chirurgie mini-invasive coelioscopique et robotique, ainsi qu'un historique de l'apprentissage de la chirurgie. Puis, nous nous sommes intéressés à l'apprentissage de la robotique. Les simulateurs de chirurgie coelioscopique sont très couramment employés dans l'apprentissage. En robotiques, ils ont fait récemment leur apparition sur le marché. Nous avons étudié la validité du simulateur dV-Trainer dans l'apprentissage de la chirurgie robotique. Nous avons démontré l'intérêt de cet outil dans l'acquisition de la gestuelle et des automatismes propres au robot. Nous avons par ailleurs étudié l'impact d'une formation en micro-chirurgie sur les performances développées en chirurgie robotique car, au cours d'une étude préliminaire nous avions constaté que les micro-chirurgiens présentaient de meilleures aptitudes sur le simulateur de chirurgie robotique que ceux sans expérience en micro-chirurgie. Dans un troisième temps, nous nous sommes intéressés à la téléchirurgie à longue distance qui est impactée par deux contraintes que sont la latence de transmission et le volume des informations à transmettre. Une première étude a étudié l'impact du délai de transmission sur les performances des chirurgiens. Une deuxième étude a consisté à réaliser une évaluation subjective par des chirurgiens de la qualité de vidéos de chirurgie robotique compressées afin de déterminer un seuil de compression maximal acceptable
The huge expansion of minimally invasive robotic devices for surgery ask the question of the training of this new technology. Progress of robotic-assisted surgical techniques allows today mini- invasive surgery to be more accurate, providing benefits to surgeons and patients for complex surgical procedures. But, it resulted from an increasing need for training and development of new pedagogical strategies. Indeed, the surgeon has to master the telemanipulator and the procedure, which is different from a simple transposition of a laparoscopic skill. The first part of this work treats about historical development of minimal invasive surgery from laparoscopy to robotic surgery. We also develop the evolution of training program in surgery. Virtual simulators provide efficient tools for laparoscopy training. The second part of this work, study some possible solutions for robotic training. We assess the validity of a new robotic virtual simulator (dV-Trainer). We demonstrate the usefulness of this tool for the acquisition of the basic gesture for robotic surgery. Then, we evaluate the impact of a previous experience in micro-surgery on robotic training. We propose a prospective study comparing the surgical performance of micro-surgeons to that of general surgeons on a robotic simulator. We want to determine if this experience in micro-surgery could significantly improve the abilities and surgeons performance in the field of basic gesture in robotic surgery. The last part of the study also looks to the future. Currently, telesurgery need sophisticated dedicated technical resources. We want to develop procedures for clinical routine used. Therefore, we evaluate the impact of the delay on the surgical procedure. Also, reducing data volume allow decreasing latency. An appropriate solution to reduce the amount of data could be found by introducing lossy compression for the transmission using the well-known MPEG-2 and H-264 standards
Styles APA, Harvard, Vancouver, ISO, etc.
48

Ramoly, Nathan. « Contextual integration of heterogeneous data in an open and opportunistic smart environment : application to humanoid robots ». Thesis, Université Paris-Saclay (ComUE), 2018. http://www.theses.fr/2018SACLL003/document.

Texte intégral
Résumé :
L'association de robots personnels et d’intelligences ambiantes est une nouvelle voie pour l’aide à domicile. Grâce aux appareils intelligents de l'environnement, les robots pourraient fournir un service de haute qualité. Cependant, des verrous existent pour la perception, la cognition et l’action.En effet, une telle association cause des problèmes de variétés, qualités et conflits, engendrant des données hétérogènes et incertaines. Cela complique la perception du contexte et la cognition, i.e. le raisonnement et la prise de décision. La connaissance du contexte est utilisée par le robot pour effectuer des actions. Cependant, il se peut qu’il échoue, à cause de changements de contexte ou par manque de connaissance. Ce qui annule ou retarde son plan. La littérature aborde ces sujets, mais n’offre aucune solution viable et complète. Face à ces verrous, nous avons proposé des contributions, autour à la fois du raisonnement et de l’apprentissage. Nous avons d’abord conçu un outil d'acquisition de contexte qui gère et modélise l’incertitude. Puis, nous avons proposé une technique de détection de situations anormales à partir de données incertaines. Ensuite, un planificateur dynamique, qui considère les changements de contexte, a été proposé. Enfin, nous avons développé une méthode d'apprentissage par renforcement et expérience pour éviter proactivement les échecs.Toutes nos contributions ont été implémentées et validées via simulation ou à l’aide d’un robot dans une plateforme d’espaces intelligents
Personal robots associated with ambient intelligence are an upcoming solution for domestic care. In fact, helped with devices dispatched in the environment, robots could provide a better care to users. However, such robots are encountering challenges of perception, cognition and action.In fact, such an association brings issues of variety, data quality and conflicts, leading to the heterogeneity and uncertainty of data. These are challenges for both perception, i.e. context acquisition, and cognition, i.e. reasoning and decision making. With the knowledge of the context, the robot can intervene through actions. However, it may encounter task failures due to a lack of knowledge or context changes. This causes the robot to cancel or delay its agenda. While the literature addresses those topics, it fails to provide complete solutions. In this thesis, we proposed contributions, exploring both reasoning and learning approaches, to cover the whole spectrum of problems. First, we designed novel context acquisition tool that supports and models uncertainty of data. Secondly, we proposed a cognition technique that detects anomalous situation over uncertain data and takes a decision in accordance. Then, we proposed a dynamic planner that takes into consideration the last context changes. Finally, we designed an experience-based reinforcement learning approach to proactively avoid failures.All our contributions were implemented and validated through simulations and/or with a small robot in a smart home platform
Styles APA, Harvard, Vancouver, ISO, etc.
49

Dermy, Oriane. « Prédiction du mouvement humain pour la robotique collaborative : du geste accompagné au mouvement corps entier ». Thesis, Université de Lorraine, 2018. http://www.theses.fr/2018LORR0227/document.

Texte intégral
Résumé :
Cette thèse se situe à l’intersection de l’apprentissage automatique et de la robotique humanoïde, dans le domaine de la robotique collaborative. Elle se focalise sur les interactions non verbales humain-robot, en particulier sur l’interaction gestuelle. La prédiction de l’intention, la compréhension et la reproduction de gestes sont les questions centrales de cette thèse. Dans un premier temps, le robot apprend des gestes par démonstration : un utilisateur prend le bras du robot et lui fait réaliser les gestes à apprendre plusieurs fois. Le robot doit alors reproduire ces différents mouvements tout en les généralisant pour les adapter au contexte. Pour cela, à l’aide de ses capteurs proprioceptifs, il interprète les signaux perçus pour comprendre le mouvement guidé par l’utilisateur, afin de pouvoir en générer des similaires. Dans un second temps, le robot apprend à reconnaître l’intention de l’humain avec lequel il interagit, à partir des gestes que ce dernier initie. Le robot produit ensuite des gestes adaptés à la situation et correspondant aux attentes de l’utilisateur. Cela nécessite que le robot comprenne la gestuelle de l’utilisateur. Pour cela, différentes modalités perceptives ont été explorées. À l’aide de capteurs proprioceptifs, le robot ressent les gestes de l’utilisateur au travers de son propre corps : il s’agit alors d’interaction physique humain-robot. À l’aide de capteurs visuels, le robot interprète le mouvement de la tête de l’utilisateur. Enfin, à l’aide de capteurs externes, le robot reconnaît et prédit le mouvement corps entier de l’utilisateur. Dans ce dernier cas, l’utilisateur porte lui-même des capteurs (vêtement X-Sens) qui transmettent sa posture au robot. De plus, le couplage de ces modalités a été étudié. D’un point de vue méthodologique, nous nous sommes focalisés sur les questions d’apprentissage et de reconnaissance de gestes. Une première approche permet de modéliser statistiquement des primitives de mouvements representant les gestes : les ProMPs. La seconde, ajoute à la première du Deep Learning, par l’utilisation d’auto-encodeurs, afin de modéliser des gestes corps entier contenant beaucoup d’informations, tout en permettant une prédiction en temps réel mou. Différents enjeux ont notamment été pris en compte, concernant la prédiction des durées des trajectoires, la réduction de la charge cognitive et motrice imposée à l’utilisateur, le besoin de rapidité (temps réel mou) et de précision dans les prédictions
This thesis lies at the intersection between machine learning and humanoid robotics, under the theme of human-robot interaction and within the cobotics (collaborative robotics) field. It focuses on prediction for non-verbal human-robot interactions, with an emphasis on gestural interaction. The prediction of the intention, understanding, and reproduction of gestures are therefore central topics of this thesis. First, the robots learn gestures by demonstration: a user grabs its arm and makes it perform the gestures to be learned several times. The robot must then be able to reproduce these different movements while generalizing them to adapt them to the situation. To do so, using its proprioceptive sensors, it interprets the perceived signals to understand the user's movement in order to generate similar ones later on. Second, the robot learns to recognize the intention of the human partner based on the gestures that the human initiates. The robot can then perform gestures adapted to the situation and corresponding to the user’s expectations. This requires the robot to understand the user’s gestures. To this end, different perceptual modalities have been explored. Using proprioceptive sensors, the robot feels the user’s gestures through its own body: it is then a question of physical human-robot interaction. Using visual sensors, the robot interprets the movement of the user’s head. Finally, using external sensors, the robot recognizes and predicts the user’s whole body movement. In that case, the user wears sensors (in our case, a wearable motion tracking suit by XSens) that transmit his posture to the robot. In addition, the coupling of these modalities was studied. From a methodological point of view, the learning and the recognition of time series (gestures) have been central to this thesis. In that aspect, two approaches have been developed. The first is based on the statistical modeling of movement primitives (corresponding to gestures) : ProMPs. The second adds Deep Learning to the first one, by using auto-encoders in order to model whole-body gestures containing a lot of information while allowing a prediction in soft real time. Various issues were taken into account during this thesis regarding the creation and development of our methods. These issues revolve around: the prediction of trajectory durations, the reduction of the cognitive and motor load imposed on the user, the need for speed (soft real-time) and accuracy in predictions
Styles APA, Harvard, Vancouver, ISO, etc.
50

Munzer, Thibaut. « Représentations relationnelles et apprentissage interactif pour l'apprentissage efficace du comportement coopératif ». Thesis, Bordeaux, 2017. http://www.theses.fr/2017BORD0574/document.

Texte intégral
Résumé :
Cette thèse présente de nouvelles approches permettant l’apprentissage efficace et intuitif de plans de haut niveau pour les robots collaboratifs. Plus précisément, nous étudions l’application d’algorithmes d’apprentissage par démonstration dans des domaines relationnels. L’utilisation de domaines relationnels pour représenter le monde permet de simplifier la représentation de comportements concurrents et collaboratifs. Nous avons commencé par développer et étudier le premier algorithme d’apprentissage par renforcement inverse pour domaines relationnels. Nous avons ensuite présenté comment utiliser le formalisme RAP pour représenter des tâches collaboratives comprenant un robot et un opérateur humain. RAP est une extension des MDP relationnels qui permet de modéliser des activités concurrentes. Utiliser RAP nous a permis de représenter à la fois l’humain et le robot dans le même processus, mais également de modéliser des activités concurrentes du robot. Sous ce formalisme, nous avons montré qu’il était possible d’apprendre le comportement d’une équipe, à la fois comme une politique et une récompense. Si des connaissances a priori sur la tâche à réaliser sont disponibles, il est possible d’utiliser le même algorithme pour apprendre uniquement les préférences de l’opérateur. Cela permet de s’adapter à l’utilisateur. Nous avons montré que l’utilisation des représentations relationnelles permet d’apprendre des comportements collaboratifs à partir de peu de démonstrations.Ces comportements sont à la fois robustes au bruit, généralisables à de nouveaux états, et transférables à de nouveaux domaines (par exemple en ajoutant des objets). Nous avons également introduit une architecture d’apprentissage interactive qui permet au système de faire moins d’erreurs tout en demandant moins d’efforts à l’opérateur humain. Le robot, en estimant sa confiance dans ses décisions, est capable de demander des instructions quand il est incertain de l’activité à réaliser. Enfin, nous avons implémenté ces approches sur un robot et montré leurs impacts potentiels dans un scenario réaliste
This thesis presents new approaches toward efficient and intuitive high-level plan learning for cooperative robots. More specifically this work study Learning from Demonstration algorithm for relational domains. Using relational representation to model the world, simplify representing concurrentand cooperative behavior.We have first developed and studied the first algorithm for Inverse ReinforcementLearning in relational domains. We have then presented how one can use the RAP formalism to represent Cooperative Tasks involving a robot and a human operator. RAP is an extension of the Relational MDP framework that allows modeling concurrent activities. Using RAP allow us to represent both the human and the robot in the same process but also to model concurrent robot activities. Under this formalism, we have demonstrated that it is possible to learn behavior, as policy and as reward, of a cooperative team. Prior knowledge about the task can also be used to only learn preferences of the operator.We have shown that, using relational representation, it is possible to learn cooperative behaviors from a small number of demonstration. That these behaviors are robust to noise, can generalize to new states and can transfer to different domain (for example adding objects). We have also introduced an interactive training architecture that allows the system to make fewer mistakes while requiring less effort from the human operator. By estimating its confidence the robot is able to ask for instructions when the correct activity to dois unsure. Lastly, we have implemented these approaches on a real robot and showed their potential impact on an ecological scenario
Styles APA, Harvard, Vancouver, ISO, etc.
Nous offrons des réductions sur tous les plans premium pour les auteurs dont les œuvres sont incluses dans des sélections littéraires thématiques. Contactez-nous pour obtenir un code promo unique!

Vers la bibliographie