Siga este link para ver outros tipos de publicações sobre o tema: Apprentissage pour la planification.

Teses / dissertações sobre o tema "Apprentissage pour la planification"

Crie uma referência precisa em APA, MLA, Chicago, Harvard, e outros estilos

Selecione um tipo de fonte:

Veja os 50 melhores trabalhos (teses / dissertações) para estudos sobre o assunto "Apprentissage pour la planification".

Ao lado de cada fonte na lista de referências, há um botão "Adicionar à bibliografia". Clique e geraremos automaticamente a citação bibliográfica do trabalho escolhido no estilo de citação de que você precisa: APA, MLA, Harvard, Chicago, Vancouver, etc.

Você também pode baixar o texto completo da publicação científica em formato .pdf e ler o resumo do trabalho online se estiver presente nos metadados.

Veja as teses / dissertações das mais diversas áreas científicas e compile uma bibliografia correta.

1

Hren, Jean-François. "Planification optimiste pour systèmes déterministes". Thesis, Lille 1, 2012. http://www.theses.fr/2012LIL10188/document.

Texto completo da fonte
Resumo:
Dans le domaine de l'apprentissage par renforcement, la planification dans le cas de systèmes déterministes consiste à effectuer une recherche avant grâce à un modèle génératif du système considéré et ce pour trouver l'action à appliquer dans son état courant. Dans notre cas, cette recherche avant conduira à la construction d'un arbre des possibilités, sa racine correspondant à l'état courant du système. Dans le cas où les ressources computationnelles sont limitées et inconnues, il convient d'utiliser un algorithme cherchant à minimiser son regret. Autrement dit, un algorithme retournant une action à effectuer qui soit la plus proche possible de l'optimale en terme de qualité et en fonction des ressources computationnelles. Nous présentons l'algorithme de planification optimiste dans le cas où l'espace d'action est discret. Nous prouvons une borne inférieure et supérieure sur son regret dans le pire des cas ainsi que dans une classe particulière de problèmes. Nous présentons ensuite deux autres algorithmes inspirés de l'approche optimiste dans le cas où l'espace d'action est continu
In the field of reinforcement learning, planning in the case of deterministic systems consists of doing a forward search using a generative model of the system so as to find the action to apply in its current state. In our case, the forward search leads us to build a look-ahead tree, its root being the current state of the system. If the computational resources are limited and unknown, we have to use an algorithm which tries to minimize its regret. In other words, an algorithm returning an action to apply which is as close as possible to the optimal one in term of quality and with respect to the computational resources used. We present the optimistic planing algorithm in the case of a discrete action space. We prove a lower and upper bound in the worst case and in a particular class of problems. Also we present two algorithms using the optimistic approach but in the case of a continuous action space
Estilos ABNT, Harvard, Vancouver, APA, etc.
2

Padonou, Esperan. "Apprentissage Statistique en Domaine Circulaire Pour la Planification de Contrôles en Microélectronique". Thesis, Lyon, 2016. http://www.theses.fr/2016LYSEM009/document.

Texto completo da fonte
Resumo:
Motivés par des besoins en industrie microélectronique, ces travaux apportent des contributions en modélisation probabiliste de données spatiales, et en maîtrise statistique de procédés.Le problème spatial a pour spécificité d’être posé sur un domaine circulaire. Il se représente par un modèle de krigeage dont la partie déterministe est constituée de polynômes orthogonaux et la partie stochastique de processus gaussiens. Traditionnellement définis avec la norme euclidienne et la mesure uniforme sur le disque, ces choix n’exploitent pas les informations a priori sur les procédés d’usinage.Pour tenir compte des mécanismes de rotation ou de diffusion à partir du centre, nous formalisons les processus gaussiens polaires sur le disque. Ces processus intègrent les corrélations radiales et angulaires dans le modèle de krigeage, et en améliorent les performances dans les situations considérées. Ils sont ensuite interprétés par décomposition de Sobol et généralisés en dimension supérieure. Des plans d’expériences sont proposés dans le cadre de leur utilisation. Au premier rang figurent les cylindres latins qui reproduisent en coordonnées polaires les caractéristiques des hypercubes latins.Pour intégrer à la fois les aspects spatiaux et temporels du problème industriel, la maîtrise statistique de procédé est abordée en termes d’application de cartes de contrôle aux paramètres des modèles spatiaux. Les séries temporelles suivies ont aussi la particularité de comporter des données atypiques et des changements structurels, sources de biais en prévision, et de fausses alarmes en suivi de risque. Ce problème est traité par lissage robuste et adaptatif
Driven by industrial needs in microelectronics, this thesis is focused on probabilistic models for spatial data and Statistical Process Control. The spatial problem has the specificity of being defined on circular domains. It is addressed through a Kriging model where the deterministic part is made of orthogonal polynomials and the stochastic term represented by a Gaussian process. Defined with the Euclidean distance and the uniform measure over the disk, traditional Kriging models do not exploit knowledge on manufacturing processes. To take rotations or diffusions from the center into account, we introduce polar Gaussian processes over the disk. They embed radial and angular correlations in Kriging predictions, leading to significant improvements in the considered situations. Polar Gaussian processes are then interpreted via Sobol decomposition and generalized in higher dimensions. Different designs of experiments are developed for the proposed models. Among them, Latin cylinders reproduce in the space of polar coordinates the properties of Latin hypercubes. To model spatial and temporal data, Statistical Process Control is addressed by monitoring Kriging parameters, based on standard control charts. Furthermore, the monitored time – series contain outliers and structural changes, which cause bias in prediction and false alarms in risk management. These issues are simultaneously tackled with a robust and adaptive smoothing
Estilos ABNT, Harvard, Vancouver, APA, etc.
3

Hérail, Philippe. "Apprentissage de Modèles Hiérarchiques par Démonstration pour la Planification et l'Action Délibérée". Electronic Thesis or Diss., Université de Toulouse (2023-....), 2024. http://www.theses.fr/2024TLSEI006.

Texto completo da fonte
Resumo:
Le développement d'agents autonomes, en particulier d'agents physiques tels que les robots, nécessite des architectures complexes fonctionnant à différents niveaux d'abstraction. Compte tenu de la complexité des environnements réels, l'élaboration manuelle des modèles utilisés pour les différents niveaux devient rapidement difficile. Ces dernières années, de plus en plus de travaux se sont concentrés sur l'apprentissage de modèles au niveau sensorimoteur, c'est-à-dire pour la perception et les capacités motrices de base.L'apprentissage de modèles de plus haut niveau permettant les fonctions délibératives n'a pas bénéficié de la même attention.Parmi ces modèles de haut niveau, nous nous intéresserons aux réseaux de tâches hiérarchiques (Hierarchical Task Networks, HTN), qui constituent un formalisme de planification communément utilisé dans de nombreuses applications pratiques, des jeux vidéo aux robots. Actuellement, la conception de modèles HTN reste une tâche essentiellement manuelle, qui nécessite une expertise à la fois du domaine d'application et des systèmes utilisés pour la planification hiérarchique. Bien que certaines approches existent pour l'apprentissage des HTN, elles souffrent de certaines limitations, principalement au niveau de la structure des domaines qui peuvent être appris ou des annotations requises au niveau des données d'entrée.Dans cette thèse, nous proposerons une technique d'apprentissage pour des HTN à plusieurs niveaux hiérarchiques avec un minimum d'annotation des données d'entrée. Pour cela, nous proposerons deux contributions principales : une procédure d'apprentissage des structures HTN à partir de démonstrations et une procédure d'apprentissage de leurs paramètres à partir de ces démonstrations.L'approche d'apprentissage des structures s'appuiera sur des techniques d'extraction de motifs fréquents pour détecter des blocs intéressants à abstraire dans les démonstrations. Nous associerons cette extraction à un algorithme d'apprentissage de HTN existant. La qualité d'une structure HTN donnée sera évaluée, au cours de la recherche, au moyen d'une nouvelle métrique basée sur le principe de la longueur de description minimale (Minimum Description Length, MDL), qui servira de substitut à une couteuse évaluation des performances de planification.En outre, nous proposons une nouvelle méthode d'identification d'un ensemble pertinent de paramètres pour les HTN, reposant sur une approche MAX-SMT, qui peut être appliquée à la plupart des modèles HTN. L'association de nos contributions pour l'apprentissage d'une structure de modèle HTN et l'identification de ses paramètres nous permet de produire des modèles HTN complets que nous évaluons sur des domaines standard de la communauté de planification hiérarchique
The development of autonomous agents, especially embodied agents such as robots, requires complex architectures operating at different levels of abstractions. Given the complexity of real environments, hand-crafting all the models used at the different levels quickly becomes impractical. In recent years, there has been a growing body of work focusing on learning such models at the sensorimotor level, i.e. for perception and basic motor capabilities. However, thesame cannot be said for high-level models enabling deliberative functions.Among such high-level models, we will focus our attention on Hierarchical Task Networks (HTNs), which are a common planning formalism used in many practical applications, from video-games to robotic agents. Presently, designing HTN models remains a mostly manual task, which requires expertise both of the application domain and of the systems used for hierarchical planning. While some approaches do exist for learning HTNs, they suffer from some limitations, mainly in the structure of the domains that can be learned or in the required data annotation.In this thesis, we will propose a technique for learning HTNs with multiple hierarchy levels with minimal annotation work required. To this end, we will propose two main contributions: a procedure for learning HTN structures from demonstrations and one for learning their parameters from these demonstrations.The structure learning approach will leverage frequent pattern mining to detect interesting behavioural patterns to abstract in the demonstrations, which we couple with an existing goal regression algorithm. The quality of a given HTN structure during the search will be evaluated through a novel metric based on the Minimum Description Length (MDL) principle to use as an efficient proxy for planning performance.In addition, we propose a new method for identifying a sensible set of parameters for HTNs, relying on a MAX-SMT approach, which can be applied to most HTN models. Coupling our contributions for learning an HTN model structure and the identification of its parameters allows us to produces complete HTN models which we evaluate on standard benchmarks of the HTN planning community
Estilos ABNT, Harvard, Vancouver, APA, etc.
4

Infantes, Guillaume. "Apprentissage de modèles de comportement pour le contrôle d'exécution et la planification robotique". Phd thesis, Université Paul Sabatier - Toulouse III, 2006. http://tel.archives-ouvertes.fr/tel-00129505.

Texto completo da fonte
Resumo:
Les systèmes robotiques autonomes évoluent dans des environnements fortement imprévisibles, et sont sujets à des très grandes imprécisions des capteurs et de leur connaissance en général. De fait, ils sont construits dans l'objectif de robustesse et non pas de fournir des modèles de leur comportement, qui sont nécessaires à la prise de décision de plus haut niveau, type planification ou contrôle d'exécution. Dans les applications actuelles, ils sont souvent très abstraits et simplifiés par rapport à une application réelle. Nous proposons d'explorer la construction automatique de modèles intermédiaires stochastiques pour des systèmes robotiques réels. Dans un premier temps, nous expliquons la construction de modèles de Markov cachés, des données brutes à la définition d'états inobservables, et leur apprentissage. Nous passons ensuite à des modèles d'expressivité plus grande, et expliquons pourquoi les méthodes de calcul exact sont impossibles à appliquer. Nous montrons alors un algorithme original d'apprentissage quantitatif de tels modèles, et passons en revue différentes méthodes d'apprentissage de la causalité sous-jacente. Nous montrons une utilisation de tels modèles pour optimiser un comportement robotique, et pour que le système puisse décider d'apprendre.
Estilos ABNT, Harvard, Vancouver, APA, etc.
5

Tremblet, David. "Apprentissage de contraintes pour améliorer la précision des modèles de planification et ordonnancement". Electronic Thesis or Diss., Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire, 2024. http://www.theses.fr/2024IMTA0417.

Texto completo da fonte
Resumo:
Les décisions de fabrication s'appuient souvent sur des modèles mathématiques pour suggérer des décisions aux responsables en charge de la production. Par exemple, les modèles de dimensionnement des lots sont couramment utilisés pour planifier la production des entreprises. Dans ces modèles, la consommation de la capacité du plan est déterminée par une approximation grossière qui ne tient pas compte de toutes les complexités rencontrées dans l'atelier de production. Bien que cette approximation permette une résolution efficace du modèle, la décision qui en résulte conduit généralement à des erreurs lorsque le plan est exécuté dans l'atelier. Cette thèse vise à utiliser l'apprentissage automatique pour améliorer les modèles traditionnellement utilisés dans la recherche opérationnelle pour les problèmes industriels. Cette méthodologie vise à remplacer certaines parties d’un modèle mathématique (contraintes, objectifs) par des modèles d'apprentissage automatique (régression linéaire, réseaux de neurones, etc.) préalablement entraînés sur des données disponibles. Ces outils peuvent s’appuyer sur la quantité massive de données générées dans l'atelier et des sources de données externes pour prendre de meilleures décisions. Cette approche est évaluée sur un problème de dimensionnement des lots où les contraintes liées à la consommation de la capacité sont remplacées par des modèles d'apprentissage automatique. Le modèle qui en résulte détermine des plans de production optimaux pour lesquels les quantités produites restent réalisables une fois transférées vers l'atelier. L'outil qui en résulte est adapté aux systèmes de production actuels, qui sont de plus en plus reconfigurables et en constante évolution. Le modèle peut également être réappris à partir des données de l'atelier au fur et à mesure que des changements se produisent dans l'atelier, ce qui évite à un expert de devoir modifier le modèle d'optimisation à chaque fois que l'atelier évolue
Manufacturing decisions often rely on mathematical models to suggest decisions to the managers in charge of production. For example, lot-sizing models are commonly used to plan factory production. The model calculates capacity usage for a plan with a rough approximation that does not account for all the complexities encountered on the shop floor. Although this approximation allows the model to be solved efficiently, the resulting decision usually leads to errors when the plan is executed on the shop floor. This thesis aims to use machine learning to improve the models traditionally used in operations research for manufacturing applications. The methodology aims to replace parts of the optimization models (constraints, objectives) with machine learning models (linear regression, neural networks, etc.) previously trained on available data. As a result, these tools can take advantage of the massive amount of data generated on the shop floor and external data sources to make better decisions. This approach is evaluated on a lot-sizing model where we learn capacity utilization constraints from the production schedule using machine learning models. The resulting model determines optimal production plans where production quantities remain feasible once sent to the shop floor. The resulting tool is also well adapted to today's production systems, which are increasingly reconfigurable and constantly evolving. The model can be retrained from shop floor data as changes occur on the shop floor, eliminating the need for an optimization expert to modify the optimization model each time the shop floor evolves
Estilos ABNT, Harvard, Vancouver, APA, etc.
6

Castellanos-Paez, Sandra. "Apprentissage de routines pour la prise de décision séquentielle". Thesis, Université Grenoble Alpes (ComUE), 2019. http://www.theses.fr/2019GREAM043.

Texto completo da fonte
Resumo:
Intuitivement, un système capable d'exploiter son expérience devrait être capable d'atteindre de meilleures performances. Une façon de tirer parti des expériences passées est d'apprendre des macros (c.-à-d. des routines), elle peuvent être ensuite utilisés pour améliorer la performance du processus de résolution de nouveaux problèmes. Le défi de la planification automatique est de développer des techniques de planification capables d'explorer efficacement l'espace de recherche qui croît exponentiellement. L'apprentissage de macros à partir de connaissances précédemment acquises s'avère bénéfique pour l'amélioration de la performance d'un planificateur.Cette thèse contribue principalement au domaine de la planification automatique, et plus spécifiquement à l’apprentissage de macros pour la planification classique. Nous nous sommes concentrés sur le développement d'un modèle d'apprentissage indépendant du domaine qui identifie des séquences d'actions (même non adjacentes) à partir de plans solutions connus. Ce dernier sélectionne les routines les plus utiles (c'est-à-dire les macros), grâce à une évaluation a priori, pour améliorer le domaine de planification.Tout d'abord, nous avons étudié la possibilité d'utiliser la fouille de motifs séquentiels pour extraire des séquences fréquentes d'actions à partir de plans de solutions connus, et le lien entre la fréquence d'une macro et son utilité. Nous avons découvert que la fréquence seule peut ne pas fournir une sélection cohérente de macro-actions utiles (c.-à-d. des séquences d'actions avec des objets constants).Ensuite, nous avons discuté du problème de l'apprentissage des macro-opérateurs (c'est-à-dire des séquences d'actions avec des objets variables) en utilisant des algorithmes classiques de fouille de motifs dans la planification. Malgré les efforts, nous nous sommes trouvés dans une impasse dans le processus de sélection car les structures de filtrage de la fouille de motifs ne sont pas adaptées à la planification.Finalement, nous avons proposé une nouvelle approche appelée METEOR, qui permet de trouver les séquences fréquentes d'opérateurs d'un ensemble de plans sans perte d'information sur leurs caractéristiques. Cette approche a été conçue pour l'extraction des macro-opérateurs à partir de plans solutions connus, et pour la sélection d'un ensemble optimal de macro-opérateurs maximisant le gain en nœuds. Il s'est avéré efficace pour extraire avec succès des macro-opérateurs de différentes longueurs pour quatre domaines de référence différents. De plus, grâce à la phase de sélection l'approche a montré un impact positif sur le temps de recherche sans réduire drastiquement la qualité des plans
Intuitively, a system capable of exploiting its past experiences should be able to achieve better performance. One way to build on past experiences is to learn macros (i.e. routines). They can then be used to improve the performance of the solving process of new problems. In automated planning, the challenge remains on developing powerful planning techniques capable of effectively explore the search space that grows exponentially. Learning macros from previously acquired knowledge has proven to be beneficial for improving a planner's performance. This thesis contributes mainly to the field of automated planning, and it is more specifically related to learning macros for classical planning. We focused on developing a domain-independent learning framework that identifies sequences of actions (even non-adjacent) from past solution plans and selects the most useful routines (i.e. macros), based on a priori evaluation, to enhance the planning domain.First, we studied the possibility of using sequential pattern mining for extracting frequent sequences of actions from past solution plans, and the link between the frequency of a macro and its utility. We found out that the frequency alone may not provide a consistent selection of useful macro-actions (i.e. sequences of actions with constant objects).Second, we discussed the problem of learning macro-operators (i.e. sequences of actions with variable objects) by using classic pattern mining algorithms in planning. Despite the efforts, we find ourselves in a dead-end with the selection process because the pattern mining filtering structures are not adapted to planning.Finally, we provided a novel approach called METEOR, which ensures to find the frequent sequences of operators from a set of plans without a loss of information about their characteristics. This framework was conceived for mining macro-operators from past solution plans, and for selecting the optimal set of macro-operators that maximises the node gain. It has proven to successfully mine macro-operators of different lengths for four different benchmarks domains and thanks to the selection phase, be able to deliver a positive impact on the search time without drastically decreasing the quality of the plans
Estilos ABNT, Harvard, Vancouver, APA, etc.
7

Qiu, Danny. "Nouvelles méthodes d'apprentissage automatique pour la planification des réseaux mobiles". Electronic Thesis or Diss., Institut polytechnique de Paris, 2023. http://www.theses.fr/2023IPPAS010.

Texto completo da fonte
Resumo:
La connectivité mobile est un moteur important de nos sociétés, c'est pourquoi l'usage des données mobiles n'a cessé de croître à travers le monde. Pour éviter la saturation, les opérateurs mobiles sont amenés à faire évoluer leurs réseaux. Les réseaux mobiles sont renforcés grâce à l'installation de nouvelles stations de base et antennes. Ce chantier étant très coûteux, une grande attention est accordée à l'identification des déploiements les plus rentables et permettant d'être compétitif. L'objectif de la thèse est d'utiliser apprentissage automatique pour proposer des solutions améliorant les décisions de déploiement. Le premier volet de la thèse est consacré au développement de modèles d'apprentissage pour assister le déploiement des stations de base sur de nouveaux emplacements. En l'absence de connaissance réseau d'une zone non couverte, les modèles sont entraînés en s'appuyant entièrement sur des données du tissu urbain. Au départ, les prédictions consistaient simplement à estimer la classe d'activité majoritaire d'une station de base. Par la suite, ces travaux ont été étendus pour prédire le profil horaire type de l'affluence hebdomadaire. Les temps d'entraînement parfois longs ont conduit à analyser plusieurs méthodes de réduction de données mobiles. Le deuxième volet de la thèse est consacré au déploiement de nouvelles cellules sur des sites existants afin d'augmenter leur capacité. Pour cela, un modèle de couverture cellulaire a été mis au point en dérivant le diagramme de Voronoi modélisant la couverture des stations de base. La première étude a porté sur la réutilisation de fréquences de générations technologiques antérieures pour les générations les plus récentes. Les modèles entraînés ont pour objectif d'aider à prioriser les ajouts capacitifs sur les secteurs pouvant bénéficier de la plus forte amélioration de la disponibilité des ressources. La deuxième étude a porté sur l'ajout d'une nouvelle génération de réseau en considérant deux axes de déploiement: priorisation de la rentabilité ou de l'amélioration de la qualité de service. Ainsi, les méthodes développées par cette thèse visent à s'intégrer dans un outil de géo-marketing, en proposant des modèles pouvant prédire la demande de connectivité d'un territoire ainsi que son évolution. Ces informations pourront également servir à rendre le dimensionnement des réseaux plus précis
Mobile connectivity is an important driver of our societies, which is why mobile data consumption has continued to grow steadily worldwide. To avoid global congestion, mobile network operators are bound to evolve their networks.Mobile networks are strengthened through the deployment of new base stations and antennas. As this task is very expensive, a great attention is given to identifying cost-effective and competitive deployments.In this context, the objective of this thesis is to use machine learning to improve deployment decisions.The first part of the thesis is dedicated to developing machine learning models to assist in the deployment of base stations in new locations. Assuming that network knowledge for an uncovered area is unavailable, the models are trained solely on urban fabric features.At first, models were simply trained to estimate the class of major activity of a base station.Subsequently, this work was extended to predict the typical hourly profile of weekly traffic. Since the train time could be long, several methods for reducting mobile data have been studied.The second part of the thesis focuses on the deployment of new cells to increase the capacity of existing sites. For this purpose, a cell coverage model was developed by deriving the Voronoi diagram representing the coverage of base stations.The first study examined the spectrum refarming of former generations of mobile technology for the deployment of the newest generations.Models are trained to assist in prioritizing capacity additions on sectors that can benefit from the greatest improvement in resource availability.The second study examined the deployment of a new generation of mobile technology, considering two deployment strategies: driven by profitability or by the improvement of the quality of service.Therefore, the methods developed in this thesis offer ways to train models to predict the connectivity demand of a territory as well as its evolution. These models could be integrated into a geo-marketing tool, as well as providing useful information for network dimensioning
Estilos ABNT, Harvard, Vancouver, APA, etc.
8

Grand, Maxence. "Apprentissage de Modèle d'Actions basé sur l'Induction Grammaticale Régulière pour la Planification en Intelligence Artificielle". Electronic Thesis or Diss., Université Grenoble Alpes, 2022. http://www.theses.fr/2022GRALM044.

Texto completo da fonte
Resumo:
Le domaine de l’intelligence artificielle vise à concevoir des agents autonomes capables de percevoir, d’apprendre et d’agir sans aucune intervention humaine pour accomplir des tâches complexes. Pour accomplir des tâches complexes, l’agent autonome doit planifier les meilleures actions possibles et les exécuter. Pour ce faire, l’agent autonome a besoin d’un modèle d’action. Un modèle d’action est une représentation sémantique des actions qu’il peut exécuter. Dans un modèle d’actions, une action est représentée à l’aide (1) d’une précondition: l’ensemble des conditions qui doivent être satisfaites pour que l’action puisse être exécutée et (2) des effets: l’ensemble des propriétés du monde qui vont être modifiées par l’exécution de l’action. La planification STRIPS est une méthode classique pour concevoir ces modèles d’actions. Cependant, les modèles d’actions STRIPS sont généralement trop restrictifs pour être utilisés dans des applications réelles. Il existe d’autres forme de modèles d’actions: les modèles d’actions temporels permettant de représenter des actions pouvant être exécutées en concurrence, les modèles d’actions HTN permettant de représenter les actions sous formes de tâches et de sous tâches, etc. Ces modèles sont moins restrictifs, mais moins les modèles sont restrictifs plus ils sont difficiles à concevoir. Dans cette thèse, nous nous intéressons aux méthodes facilitant l’acquisition de ces modèles d’actions basées sur les techniques d’apprentissage automatique.Dans cette thèse, nous présentons AMLSI (Action Model Learning with State machine Interaction), une approche d’apprentissage de modèles d’actions basée sur l’induction grammaticale régulière. Dans un premier temps nous montrerons que l’approche AMLSI permet d’apprendre des modèles d’actions STRIPS. Nous montrerons les différentes propriétés de l’approche prouvant son efficacité: robustesse, convergence, requiert peu de données d’apprentissage, qualité des modèles appris. Dans un second temps, nous proposerons deux extensions pour l’apprentissage de modèles d’actions temporels et de modèles d’actions HTN
The field of artificial intelligence aims to design and build autonomous agents able to perceive, learn and act without any human intervention to perform complex tasks. To perform complex tasks, the autonomous agent must plan the best possible actions and execute them. To do this, the autonomous agent needs an action model. An action model is a semantic representation of the actions it can execute. In an action model, an action is represented using (1) a precondition: the set of conditions that must be satisfied for the action to be executed and (2) the effects: the set of properties of the world that will be altered by the execution of the action. STRIPS planning is a classical method to design these action models. However, STRIPS action models are generally too restrictive to be used in real-world applications. There are other forms of action models: temporal action models allowing to represent actions that can be executed concurrently, HTN action models allowing to represent actions as tasks and subtasks, etc. These models are less restrictive, but the less restrictive the models are the more difficult they are to design. In this thesis, we are interested in approaches facilitating the acquisition of these action models based on machine learning techniques.In this thesis, we present AMLSI (Action Model Learning with State machine Interaction), an approach for action model learning based on Regular Grammatical Induction. First, we show that the AMLSI approach allows to learn (STRIPS) action models. We will show the different properties of the approach proving its efficiency: robustness, convergence, require few learning data, quality of the learned models. In a second step, we propose two extensions for temporal action model learning and HTN action model learning
Estilos ABNT, Harvard, Vancouver, APA, etc.
9

Arora, Ankuj. "Apprentissage du modèle d'action pour une interaction socio-communicative des hommes-robots". Thesis, Université Grenoble Alpes (ComUE), 2017. http://www.theses.fr/2017GREAM081/document.

Texto completo da fonte
Resumo:
Conduite dans le but de rendre les robots comme socio-communicatifs, les chercheurs ont cherché à mettre au point des robots dotés de compétences sociales et de «bon sens» pour les rendre acceptables. Cette intelligence sociale ou «sens commun» du robot est ce qui finit par déterminer son acceptabilité sociale à long terme.Cependant, ce n'est pas commun. Les robots peuvent donc seulement apprendre à être acceptables avec l'expérience. Cependant, en enseignant à un humanoïde, les subtilités d'une interaction sociale ne sont pas évidentes. Même un échange de dialogue standard intègre le panel le plus large possible de signes qui interviennent dans la communication et sont difficiles à codifier (synchronisation entre l'expression du corps, le visage, le ton de la voix, etc.). Dans un tel scénario, l'apprentissage du modèle comportemental du robot est une approche prometteuse. Cet apprentissage peut être réalisé avec l'aide de techniques d'IA. Cette étude tente de résoudre le problème de l'apprentissage des modèles comportementaux du robot dans le paradigme automatisé de planification et d'ordonnancement (APS) de l'IA. Dans le domaine de la planification automatisée et de l'ordonnancement (APS), les agents intelligents nécessitent un modèle d'action (plans d'actions dont les exécutions entrelacées effectuent des transitions de l'état système) afin de planifier et résoudre des problèmes réels. Au cours de cette thèse, nous présentons deux nouveaux systèmes d'apprentissage qui facilitent l'apprentissage des modèles d'action et élargissent la portée de ces nouveaux systèmes pour apprendre les modèles de comportement du robot. Ces techniques peuvent être classées dans les catégories non optimale et optimale. Les techniques non optimales sont plus classiques dans le domaine, ont été traitées depuis des années et sont de nature symbolique. Cependant, ils ont leur part de quirks, ce qui entraîne un taux d'apprentissage moins élevé que souhaité. Les techniques optimales sont basées sur les progrès récents dans l'apprentissage en profondeur, en particulier la famille à long terme (LSTM) de réseaux récurrents récurrents. Ces techniques sont de plus en plus séduisantes par la vertu et produisent également des taux d'apprentissage plus élevés. Cette étude met en vedette ces deux techniques susmentionnées qui sont testées sur des repères d'IA pour évaluer leurs prouesses. Ils sont ensuite appliqués aux traces HRI pour estimer la qualité du modèle de comportement du robot savant. Ceci est dans l'intérêt d'un objectif à long terme d'introduire l'autonomie comportementale dans les robots, afin qu'ils puissent communiquer de manière autonome avec les humains sans avoir besoin d'une intervention de «magicien»
Driven with the objective of rendering robots as socio-communicative, there has been a heightened interest towards researching techniques to endow robots with social skills and ``commonsense'' to render them acceptable. This social intelligence or ``commonsense'' of the robot is what eventually determines its social acceptability in the long run.Commonsense, however, is not that common. Robots can, thus, only learn to be acceptable with experience. However, teaching a humanoid the subtleties of a social interaction is not evident. Even a standard dialogue exchange integrates the widest possible panel of signs which intervene in the communication and are difficult to codify (synchronization between the expression of the body, the face, the tone of the voice, etc.). In such a scenario, learning the behavioral model of the robot is a promising approach. This learning can be performed with the help of AI techniques. This study tries to solve the problem of learning robot behavioral models in the Automated Planning and Scheduling (APS) paradigm of AI. In the domain of Automated Planning and Scheduling (APS), intelligent agents by virtue require an action model (blueprints of actions whose interleaved executions effectuates transitions of the system state) in order to plan and solve real world problems. During the course of this thesis, we introduce two new learning systems which facilitate the learning of action models, and extend the scope of these new systems to learn robot behavioral models. These techniques can be classified into the categories of non-optimal and optimal. Non-optimal techniques are more classical in the domain, have been worked upon for years, and are symbolic in nature. However, they have their share of quirks, resulting in a less-than-desired learning rate. The optimal techniques are pivoted on the recent advances in deep learning, in particular the Long Short Term Memory (LSTM) family of recurrent neural networks. These techniques are more cutting edge by virtue, and produce higher learning rates as well. This study brings into the limelight these two aforementioned techniques which are tested on AI benchmarks to evaluate their prowess. They are then applied to HRI traces to estimate the quality of the learnt robot behavioral model. This is in the interest of a long term objective to introduce behavioral autonomy in robots, such that they can communicate autonomously with humans without the need of ``wizard'' intervention
Estilos ABNT, Harvard, Vancouver, APA, etc.
10

Cuperlier, Nicolas. "Apprentissage et prédiction de séquences sensori-motrices : architecture neuromimétique pour la navigation et la planification d'un robot mobile". Cergy-Pontoise, 2006. http://www.theses.fr/2006CERG0316.

Texto completo da fonte
Resumo:
La navigation autonome d’un robot mobile en environnement inconnu est une tâche complexe qui soulève de nombreux problèmes liésà la perception, la categorisation, la planification et au contrôle moteur. Résoudre l’ensemble de ces problèmes de manière intégrée demeure un défi pour les roboticiens. Ainsi nous proposons une architecture neuronale unifiée, fondée sur la modélisation de fonctionnalités de différentes parties du cerveau des mammifères: l’hippocampe, le cortex prefrontal et les ganglions de la base. L’intégration de données multimodales telles que la vision (entrée principale), l’intégration de chemin, et la motivation ainsi que les interactions internes et externes des différentes structures en sont des points importants. Une première partie de notre travail a ainsi consisté à modéliser des réseaux de neurones permettant l’apprentissage et la prédiction d’associations sensorimotrices, sous la forme de cellules de transition, supports d’une carte cognitive employée afin d’effectuer une planification selon des motivations parfois contradictoires. . . L’apprentissage de la carte cognitive, lors de périodes d’exploration et réalisé de façon latente, sans utiliser de coordonnées cartésiennes ni de grille d’occupation. Les liens de cette carte sont appris ou renforces selon le comportement supportant ainsi des changements dynamiques de l’environnement. Les périodes d’explorations peuvent être entrecoupées de période de planification. La deuxieme partie de cette these apporte à notre modele une solution pour explorer de fa¸conpréférentielle les zones inconnues de l’environnement et d’améliorer la précision du mouvement planifié via une compétition souple (à plusieurs gagnants), offrant une meilleure généralisation du mouvement et par conséquent un déplacement plus précis en planification. La commande motrice finale correspond à la solution stable d’un système dynamique : un champ neuronal à une dimension. Notre modele fournit ainsi une architecture de controle capable d’exhiber sur une plate forme robotique des comportements de navigation inspirés de la biologie. Cette architecture peut donc être considérée comme une tentative d’explication des mécanismes sous-jacent mis en oeuvre par les mammifères dans ces types de comportement. D’autre part les capacités de notre modèle en terme de localisation, d’exploration active, de planification et de cartographie en ligne d’un environnement incomplètement exploré en font une proposition originale au problème du S. L. A. M (Simultaneous Localization and Map building of an unknown environment)
Navigation of an autonomous mobile robot in an unknown environment is a complex task that raises numerous issues in perception, categorisation, planning, and motor control. Solving all these problems in an integrated manner remains a challenge for roboticians. Thus, we propose a unified neuronal framework, based on the modeling of different parts of the mammalian brain’s functionalities: the hippocampus, the prefrontal cortex and the basal ganglia. Key topics are the multi-modal data integration like vision (the prevailing input), path integration, motivation, and also the inner and outer interactions between the structures. A first part of our work consists in modeling neural networks able to learn and predict sensory-motor combinations (transition cells) which are inputs of a cognitive map used to plan according to conflicting motivations. The cognitive map is learned without using any Cartesian coordinates nor occupancy grids. Already known transitions are used in exploration in order to preferentially explore unknown zones to reduce exploration time and enhance the completion of the cognitive map. Links of this map are learned or reinforced according to the behavior and enable to take into account dynamical changes of the environment. Exploration periods may be alternated with planning periods. The second part of this thesis brings an interesting solution for computing and selecting the final movement to perform. It also gives a stable motor control. Instead of using a (( Winner Takes All )) mechanism to select the movement, we increase the planned movement accuracy via a soft competition. Hence several movements are proposed and fed in another layer where the final motor command is obtained as the stable solution of a dynamical system: a one dimensional neural field coding for the heading direction. This field allows to endow the system with a final movement selection leading to a better movement generalization and consequently to a more reliable movement while planning. Our model gives a control architecture allowing to exhibit on a mobile robot navigation behaviors inspired from biology. This architecture can be considered as an attempt to explain underlying mechanisms implemented by mammals for these kind of behaviors. Furthermore, we can list the following benefits of our model: on-line localization, active exploration, planning and mapping in an uncompletely explored environment. These benifits cast an original light on the S. L. A. M problem (Simultaneous Localization and Map building of an unknown environment)
Estilos ABNT, Harvard, Vancouver, APA, etc.
11

Chaouche, Ahmed Chawki. "Une approche multi-agent pour la conception de systèmes d'intelligence ambiante : un modèle formel intégrant planification et apprentissage". Thesis, Paris 6, 2015. http://www.theses.fr/2015PA066084/document.

Texto completo da fonte
Resumo:
Ce travail présente une architecture logicielle concrète dédiée aux besoins et caractéristiques des systèmes d'Intelligence Ambiante (AmI). Le modèle comportemental proposé, appelé Higher-order Agent (HoA), capture simultanément l'évolution de l'état mental de l'agent ainsi que l'état de son plan d'actions. Les expressions du plan sont écrites et composées en utilisant un langage algébrique formel, nommé AgLOTOS. Les plans sont construits automatiquement et à la volée, comme un système de processus concurrents, déduits des intentions de l'agent et de ses préférences d'exécution. Basé sur une sémantique de plans et d'actions concurrentes, un service de guidance est aussi proposé afin d'assister l'agent dans le choix de ses prochaines exécutions. Cette guidance permet d'améliorer la satisfaction des intentions de l'agent au regard des plans concurrents possibles et en fonction du contexte actuel de l'agent. La "localité" et le "temps" étant considérés comme des informations contextuelles clés dans l'activité de l'agent, nous les prenons en compte au travers de deux fonctions utilitaires originales conçues à partir des expériences des exécutions d'action et pouvant être combinées suivant les préférences stratégiques de l'agent. La structure compositionnelle des expressions AgLOTOS est mise à profit pour permettre des révisions ciblées du plan de l'agent, Les révisions des sous-plans sont donc réalisées automatiquement en fonction des mises à jour apportées aux intentions, tout en maintenant la consistance du comportement de l'agent. Un cas d'étude est développé afin de montrer comment l'agent peut agir, même s'il subit des changements inattendus de son contexte, en fonction de ses expériences passées qui révèlent certains cas de d'échecs
This work presents a concrete software architecture dedicated to ambient intelligence (AmI) features and requirements. The proposed behavioral model, called Higher-order Agent (HoA) captures the evolution of the mental representation of the agent and the one of its plan simultaneously. Plan expressions are written and composed using a formal algebraic language, namely AgLOTOS, so that plans are built automatically and on the fly, as a system of concurrent processes. Due to the compositional structure of AgLOTOS expressions, the updates of sub-plans are realized automatically accordingly to the revising of intentions, hence maintaining the consistency of the agent. Based on a specific semantics, a guidance service is also proposed to assist the agent in its execution. This guidance allows to improve the satisfaction of the agent's intentions with respect to the possible concurrent plans and the current context of the agent. Adopting the idea that "location" and "time" are key stones information in the activity of the agent, we show how to enforce guidance by ordering the different possible plans. As a major contribution, we demonstrate two original utility functions that are designed from the past-experiences of the action executions, and that can be combined accordingly to the current balance policy of the agent. A use case scenario is developed to show how the agent can act, even if it suffers from unexpected changes of contexts, it does not have many experiences and whose past experiences reveals some failure cases
Estilos ABNT, Harvard, Vancouver, APA, etc.
12

Chaouche, Ahmed Chawki. "Une approche multi-agent pour la conception de systèmes d'intelligence ambiante : un modèle formel intégrant planification et apprentissage". Electronic Thesis or Diss., Paris 6, 2015. http://www.theses.fr/2015PA066084.

Texto completo da fonte
Resumo:
Ce travail présente une architecture logicielle concrète dédiée aux besoins et caractéristiques des systèmes d'Intelligence Ambiante (AmI). Le modèle comportemental proposé, appelé Higher-order Agent (HoA), capture simultanément l'évolution de l'état mental de l'agent ainsi que l'état de son plan d'actions. Les expressions du plan sont écrites et composées en utilisant un langage algébrique formel, nommé AgLOTOS. Les plans sont construits automatiquement et à la volée, comme un système de processus concurrents, déduits des intentions de l'agent et de ses préférences d'exécution. Basé sur une sémantique de plans et d'actions concurrentes, un service de guidance est aussi proposé afin d'assister l'agent dans le choix de ses prochaines exécutions. Cette guidance permet d'améliorer la satisfaction des intentions de l'agent au regard des plans concurrents possibles et en fonction du contexte actuel de l'agent. La "localité" et le "temps" étant considérés comme des informations contextuelles clés dans l'activité de l'agent, nous les prenons en compte au travers de deux fonctions utilitaires originales conçues à partir des expériences des exécutions d'action et pouvant être combinées suivant les préférences stratégiques de l'agent. La structure compositionnelle des expressions AgLOTOS est mise à profit pour permettre des révisions ciblées du plan de l'agent, Les révisions des sous-plans sont donc réalisées automatiquement en fonction des mises à jour apportées aux intentions, tout en maintenant la consistance du comportement de l'agent. Un cas d'étude est développé afin de montrer comment l'agent peut agir, même s'il subit des changements inattendus de son contexte, en fonction de ses expériences passées qui révèlent certains cas de d'échecs
This work presents a concrete software architecture dedicated to ambient intelligence (AmI) features and requirements. The proposed behavioral model, called Higher-order Agent (HoA) captures the evolution of the mental representation of the agent and the one of its plan simultaneously. Plan expressions are written and composed using a formal algebraic language, namely AgLOTOS, so that plans are built automatically and on the fly, as a system of concurrent processes. Due to the compositional structure of AgLOTOS expressions, the updates of sub-plans are realized automatically accordingly to the revising of intentions, hence maintaining the consistency of the agent. Based on a specific semantics, a guidance service is also proposed to assist the agent in its execution. This guidance allows to improve the satisfaction of the agent's intentions with respect to the possible concurrent plans and the current context of the agent. Adopting the idea that "location" and "time" are key stones information in the activity of the agent, we show how to enforce guidance by ordering the different possible plans. As a major contribution, we demonstrate two original utility functions that are designed from the past-experiences of the action executions, and that can be combined accordingly to the current balance policy of the agent. A use case scenario is developed to show how the agent can act, even if it suffers from unexpected changes of contexts, it does not have many experiences and whose past experiences reveals some failure cases
Estilos ABNT, Harvard, Vancouver, APA, etc.
13

Mezine, Adel. "Conduite d'expériences par apprentissage actif pour l'identification de systèmes dynamiques biologiques : application à l'estimation de paramètres d'équations différentielles ordinaires". Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLE030/document.

Texto completo da fonte
Resumo:
Ces dernières années, les progrès continuels des techniques de criblage et de séquençage à haut débit ont nourri la biologie des systèmes, ouvrant la voie à l’identification de systèmes dynamiques biologiques tels que des réseaux de régulation génique. Cependant, l’insuffisance et la mauvaise qualité des données expérimentales se traduisent trop souvent par des estimations incertaines des paramètres d’intérêt des systèmes étudiés : ces incertitudes peuvent être levées en produisant de nouvelles données dans des conditions expérimentales variées, ce qui implique un coût potentiellement élevé. Dans cette thèse, nous proposons un nouvel algorithme d’apprentissage actif, destiné à recommander de manière séquentielle les expériences les plus utiles à l’identification de systèmes dynamiques biologiques modélisés par des équations différentielles. Le problème est formulé sous la forme d’un jeu à un joueur : le joueur se voit attribuer un budget dédié aux expérimentations, et un coût spécifique est affecté à chaque expérience ; à chaque tour, il est amené à choisir une, voire plusieurs expériences réalisées sur le système étudié dans le but de maximiser la qualité de l’estimation, une fois le budget épuisé. Notre approche, intitulée « ExperimentalDEsign for Network inference » (EDEN), s’appuie sur la classe d’algorithme UCT (Upper Confidence bounds for Trees search) qui allie la souplesse de la recherche arborescente de Monte-Carlo à l’efficacité des algorithmes de bandits multi-bras pour parcourir l’ensemble des séquences d’expériences possibles en privilégiant surtout celles qui sont les plus prometteuses. EDEN présente le grand avantage d’anticiper les expériences suivantes en sélectionnant à chaque tour des expériences sachant qu’elles seront suivies par un certain nombre d’autres expériences. Illustrée sur deux cas d’étude, le réseau de signalisation JAK/STAT et un des réseaux de régulation génique proposé dans la compétition internationale DREAM7, EDEN, entièrement automatique, obtient de très bonnes performances pour un budget limité et un large choix d’expériences (perturbations, mesures)
Continuous progress in screening and high-throughput sequencing techniques in recent years paves the way for the identification of dynamic biological systems such as gene regulatory networks. However, the scarcity of the experimental data often leads to anuncertain estimation of parameters of interest. These uncertainties can be solved by generating new data in different experimental conditions, which induces additional costs. This thesis proposes a general active learning approach to develop tools of sequential experimental design for the identification of dynamical biological systems. The problem is formulated as a one-player game : the player has a budget dedicated for his experiments, each experiment has a different cost ; at every turn, he chooses one or more experiments to be performed on the system with the ultimate aim of maximizing the quality of the estimate, until the available budget is exhausted. The proposed approach called Experimental DEsign for Network inference (EDEN), is based on UCT (Upper Confident bounds for Trees) algorithm which combines Monte-Carlo tree search algorithms with multi-arm bandits to perform an effective exploration of the possible sequences of experiments. A strong point of the approach is anticipation : an experiment is selected at each round, knowing that this round will be followed by a number of other experiments, according to the available budget. This generic approach is rolled out in parameter estimation in nonlinear ordinary differential equations using partial observations. EDEN is applied on two problems : signaling network and gene regulatory network identification. Compared to the competitors, it exhibits very good results on a DREAM7 challenge where a limited budget and a wide range of experiments (perturbations, measurements) are available
Estilos ABNT, Harvard, Vancouver, APA, etc.
14

Pessoa, Luís. "Méthodologie d'apprentissage interactif dirigeants / consultant pour la formulation et la mise en oeuvre de la stratégie". Lyon 3, 2007. https://scd-resnum.univ-lyon3.fr/out/theses/2007_out_pessoa_l.pdf.

Texto completo da fonte
Resumo:
Partant toujours du principe de contribuer à i'augmentation de l'efficacité et de l'efficience des organisations (finalité pratique) nous avons développé un Processus de Réflexion Stratégique, assorti d'un ensemble d'aptitudes, d'une série de concepts-clé et d'une méthode de travail susceptibles de guider les dirigeants et les cadres supérieurs des organisations dans la construction, par eux mêmes, d'une stratégie et de sa mise en oeuvre pratique, les aidant aussi à solutionner leurs propres problémes stratégiques. La méthodologie d'apprentissage interactif que se presente est composée des processus, concepts, aptitudes et méthode inter-relationnelle, est une praxéologie, une pensée pour l'action collective organisationelle, renouvelée sans cesse, constituant une heuristique, un instrument puissant pour l'entendement, le pigement et la construction de la stratégie
Departing from a contributing principle for the growth of organisations efficacity and Efficiency (pratical purpose) we develloped a Strategic Reflexion Process containing a set of skills, a set of key-concepts and a working method that can guide organisation excutives and managers to build, themselves, a strategy and it's practical implementation, aiding them to work out a solution for their strategic problems. The "interactive learning methodology" that is presented is composed of interrelational processes, concepts, skills and working method, it is a praxeology, a thinking way for organisational collective action, renewed without end, forming an heuristic and powerfull instrument to knowledge, judgement and construction of strategy
Estilos ABNT, Harvard, Vancouver, APA, etc.
15

Zaninotti, Marion. "Planification en ligne de la stratégie de navigation pour un drone autonome en environnement urbain". Electronic Thesis or Diss., Toulouse, ISAE, 2024. http://www.theses.fr/2024ESAE0063.

Texto completo da fonte
Resumo:
Les drones peuvent aujourd'hui être utilisés pour diverses applications, notamment la robotique de service, l'exploration et la surveillance d'environnements, l'agriculture de précision, ainsi que les missions de recherche et sauvetage. Le besoin de navigation autonome pour les drones devient donc de plus en plus important.Un grand nombre de drones utilisent le GPS (Global Positioning System) pour se localiser.Cependant, en environnement urbain, la position mesurée peut être imprécise, voire indisponible, ce qui peut compromettre la sécurité d'une mission.Dans ce contexte, le problème de navigation efficace et sûre pour un drone autonome, sous une disponibilité du GNSS incertaine, a été modélisé comme un POMDP (Partially Observable Markov Decision Process).Toutefois, la planification dans un modèle aussi complexe souffre d'un coût de calcul élevé et atteint des résultats insuffisants sous des contraintes de temps-réel.Récemment, des recherches se sont concentrées sur l'intégration d'un apprentissage hors ligne afin de guider la planification en ligne.Inspirés par la modélisation de l'état de l'art CAMP (Context-specific Abstract Markov decision Process), nous proposons une méthode consistant à apprendre une contrainte à imposer lors de la planification en ligne de ce problème. Imposer cette contrainte permet de réaliser une abstraction de l'espace d'état, en limitant la navigation du drone à l'intérieur d'un couloir de l'environnement.Nous généralisons ensuite cette méthode à l'ensemble des problèmes de navigation SSP (Stochastic Shortest Path) avec dead ends. Le poids attribué à la sécurité par rapport à l'efficacité du chemin est appris, puis un chemin global est planifié en fonction de ce poids, et la contrainte est déduite de ce chemin global. La résolution repose alors sur une hybridation entre la planification de chemin global et la planification de chemin en ligne.Puis, nous appliquons cette méthode généralisée au problème FrozenLake, dans lequel un agent cherche un chemin à travers un lac gelé menant à un but tout en évitant les trous, et au problème initial de navigation de drone.Les conclusions de l'ensemble des expérimentations démontrent que l'utilisation d'une telle méthode peut améliorer la qualité des solutions obtenues par une planification en ligne, en particulier pour des environnements et missions de navigation complexes
UAVs can now be used for various applications, including service robotics, exploration and monitoring of environments, precision agriculture, as well as search and rescue missions. The need for autonomous navigation for UAVs is therefore becoming increasingly important. Many UAVs use GPS (Global Positioning System) for localization. However, in urban environments, the measured position can be inaccurate or even unavailable, which can compromise mission safety.In this context, the problem of efficient and safe navigation for an autonomous UAV, under uncertain GNSS availability, has been modeled as a POMDP (Partially Observable Markov Decision Process). Nevertheless, planning in such a complex model suffers from high computational cost and yields insufficient results under real-time constraints.Recently, research has focused on integrating offline learning to guide online planning. Inspired by the state-of-the-art CAMP (Context-specific Abstract Markov Decision Process) modeling, we propose a method that involves learning a constraint to be imposed during online planning for this problem. Imposing this constraint allows for an abstraction of the state space by restricting the UAV's navigation to a corridor within the environment.We then generalize this method to all SSP (Stochastic Shortest Path) problems with dead ends. The weight assigned to safety versus path efficiency is learned, a global path is planned based on this weight, and the constraint is derived from this global path. The resolution thus relies on a hybrid approach combining global path planning and online path planning.Afterward, we apply this generalized method to the FrozenLake problem, where an agent seeks a path across a frozen lake to reach a goal while avoiding holes, and to the initial UAV navigation problem. The results of all the experiments demonstrate that using such a method can improve the quality of solutions obtained through online planning, particularly for complex navigation environments and missions
Estilos ABNT, Harvard, Vancouver, APA, etc.
16

Guillame-Bert, Mathieu. "Apprentissage de règles associatives temporelles pour les séquences temporelles de symboles". Thesis, Grenoble, 2012. http://www.theses.fr/2012GRENM081/document.

Texto completo da fonte
Resumo:
L'apprentissage de modèles temporels constitue l'une des grandes problématiques de l'Exploration de Données (Data Mining). Dans cette thèse, nous avons développé un nouveau modèle temporel appelé TITA Rules (Règle associative temporelle basé sur des arbres d'intervalles). Ce modèle permet de décrire des phénomènes ayant un certain degré d'incertitude et/ou d'imprécision. Ce modèle permet entre autres d'exprimer la synchronicité entre évènements, les contraintes temporelles disjonctives et la négation temporelle. De par leur nature, les TITA Rules peuvent êtes utilisées pour effectuer des prédictions avec une grande précision temporel. Nous avons aussi développé un algorithme capable de découvrir et d'extraire de manière efficace des TITA Rules dans de grandes bases de données temporelles. Le cœur de l'algorithme est basé sur des techniques de minimisation d'entropie, de filtrage par Apriori et par des analyses de co-dépendance. Note modèle temporelle et notre algorithme ont été appliqués et évalués sur plusieurs jeux de données issues de phénomènes réels et de phénomènes simulés. La seconde partie de cette thèse à consisté à étudier l'utilisation de notre modèle temporel sur la problématique de la Planification Automatique. Ces travaux ont mené au développement d'un algorithme de planification automatique. L'algorithme prend en entrée un ensemble de TITA Rules décrivant le fonctionnement d'un système quelconque, une description de l'état initial du système, et un but à atteindre. En retour, l'algorithme calcule un plan décrivant la meilleure façon d'atteindre le but donné. Par la nature même des TITA Rules, cet algorithme est capable de gérer l'incertain (probabilités), l'imprécision temporelle, les contraintes temporelles disjonctives, ainsi que les événements exogènes prédictibles mais imprécis
The learning of temporal patterns is a major challenge of Data mining. We introduce a temporal pattern model called Temporal Interval Tree Association Rules (Tita rules or Titar). This pattern model can be used to express both uncertainty and temporal inaccuracy of temporal events. Among other things, Tita rules can express the usual time point operators, synchronicity, order, and chaining,disjunctive time constraints, as well as temporal negation. Tita rules are designed to allow predictions with optimum temporal precision. Using this representation, we present the Titar learner algorithm that can be used to extract Tita rules from large datasets expressed as Symbolic Time Sequences. This algorithm based on entropy minimization, apriori pruning and statistical dependence analysis. We evaluate our technique on simulated and real world datasets. The problem of temporal planning with Tita rules is studied. We use Tita rules as world description models for a Planning and Scheduling task. We present an efficient temporal planning algorithm able to deal with uncertainty, temporal inaccuracy, discontinuous (or disjunctive) time constraints and predictable but imprecisely time located exogenous events. We evaluate our technique by joining a learning algorithm and our planning algorithm into a simple reactive cognitive architecture that we apply to control a robot in a virtual world
Estilos ABNT, Harvard, Vancouver, APA, etc.
17

Guillame-bert, Mathieu. "Apprentissage de règles associatives temporelles pour les séquences temporelles de symboles". Phd thesis, Université de Grenoble, 2012. http://tel.archives-ouvertes.fr/tel-00849087.

Texto completo da fonte
Resumo:
L'apprentissage de modèles temporels constitue l'une des grandes problématiques de l'Exploration de Données (Data Mining). Dans cette thèse, nous avons développé un nouveau modèle temporel appelé TITA Rules (Règle associative temporelle basé sur des arbres d'intervalles). Ce modèle permet de décrire des phénomènes ayant un certain degré d'incertitude et/ou d'imprécision. Ce modèle permet entre autres d'exprimer la synchronicité entre évènements, les contraintes temporelles disjonctives et la négation temporelle. De par leur nature, les TITA Rules peuvent êtes utilisées pour effectuer des prédictions avec une grande précision temporel. Nous avons aussi développé un algorithme capable de découvrir et d'extraire de manière efficace des TITA Rules dans de grandes bases de données temporelles. Le cœur de l'algorithme est basé sur des techniques de minimisation d'entropie, de filtrage par Apriori et par des analyses de co-dépendance. Note modèle temporelle et notre algorithme ont été appliqués et évalués sur plusieurs jeux de données issues de phénomènes réels et de phénomènes simulés. La seconde partie de cette thèse à consisté à étudier l'utilisation de notre modèle temporel sur la problématique de la Planification Automatique. Ces travaux ont mené au développement d'un algorithme de planification automatique. L'algorithme prend en entrée un ensemble de TITA Rules décrivant le fonctionnement d'un système quelconque, une description de l'état initial du système, et un but à atteindre. En retour, l'algorithme calcule un plan décrivant la meilleure façon d'atteindre le but donné. Par la nature même des TITA Rules, cet algorithme est capable de gérer l'incertain (probabilités), l'imprécision temporelle, les contraintes temporelles disjonctives, ainsi que les événements exogènes prédictibles mais imprécis.
Estilos ABNT, Harvard, Vancouver, APA, etc.
18

Defretin, Joseph. "Stratégies de vision active pour la reconnaissance d'objets". Phd thesis, École normale supérieure de Cachan - ENS Cachan, 2011. http://tel.archives-ouvertes.fr/tel-00696044.

Texto completo da fonte
Resumo:
Cette thèse, réalisée en coopération avec l'ONERA, concerne la reconnaissance active d'objets 3D par un agent autonome muni d'une caméra d'observation. Alors qu'en reconnaissance passive les modalités d'acquisitions des observations sont imposées et génèrent parfois des ambiguïtés, la reconnaissance active exploite la possibilité de contrôler en ligne ces modalités d'acquisition au cours d'un processus d'inférence séquentiel dans le but de lever l'ambiguïté. L'objectif des travaux est d'établir des stratégies de planification dans l'acquisition de l'information avec le souci d'une mise en œuvre réaliste de la reconnaissance active. Le cadre de l'apprentissage statistique est pour cela mis à profit. La première partie des travaux se consacre à apprendre à planifier. Deux contraintes réalistes sont prise en compte : d'une part, une modélisation imparfaite des objets susceptible de générer des ambiguïtés supplémentaires - d'autre part, le budget d'apprentissage est coûteux (en temps, en énergie), donc limité. La deuxième partie des travaux s'attache à exploiter au mieux les observations au cours de la reconnaissance. La possibilité d'une reconnaissance active multi-échelles est étudiée pour permettre une interprétation au plus tôt dans le processus séquentiel d'acquisition de l'information. Les observations sont également utilisées pour estimer la pose de l'objet de manière robuste afin d'assurer la cohérence entre les modalités planifiées et celles réellement atteintes par l'agent visuel.
Estilos ABNT, Harvard, Vancouver, APA, etc.
19

Leurent, Edouard. "Apprentissage par renforcement sûr et efficace pour la prise de décision comportementale en conduite autonome". Thesis, Lille 1, 2020. http://www.theses.fr/2020LIL1I049.

Texto completo da fonte
Resumo:
Dans cette thèse de doctorat, nous étudions comment des véhicules autonomes peuvent apprendre à garantir la sûreté et à éviter les accidents, bien qu'ils partagent la route avec des conducteurs humains dont les comportements sont incertains. Pour prendre en compte cette incertitude, nous nous appuyons sur les observations en ligne de l'environnement pour construire une région de confiance autour de la dynamique du système, qui est ensuite propagée au cours du temps pour borner l'ensemble des trajectoires possibles des véhicules à proximité. Pour assurer la sûreté en présence de cette incertitude, nous avons recours à la prise de décision robuste, qui préconise de toujours considérer le pire cas. Cette approche garantit que la performance obtenue pendant la planification sera également atteinte sur le système réel, et nous montrons dans une analyse de bout en bout que la sous-optimalité qui en résulte est bornée. Nous en fournissons une implémentation efficace, basée sur des algorithmes de recherche arborescente. Une seconde contribution est motivée par le constat que cette approche pessimiste tend à produire des comportements excessivement prudents : imaginez vouloir dépasser un véhicule, quelle certitude avez-vous que ce dernier ne changera pas de voie au tout dernier moment, provoquant un accident ? Ce type de raisonnement empêche les robots de conduire aisément parmi d'autres conducteurs, de s'insérer sur une autoroute ou de traverser une intersection, un phénomène connu sous le nom de « robot figé ». Ainsi, la présence d'incertitude induit un compromis entre deux objectifs contradictoires : sûreté et efficacité. Comment arbitrer ce conflit ? La question peut être temporairement contournée en réduisant au maximum l'incertitude. Par exemple, nous proposons une architecture de réseau de neurones basée sur de l'attention, qui tient compte des interactions entre véhicules pour améliorer ses prédictions. Mais pour aborder pleinement ce compromis, nous nous appuyons sur la prise de décision sous contrainte afin de considérer indépendamment les deux objectifs de sûreté et d'efficacité. Au lieu d'une unique politique de conduite, nous entrainons toute une gamme de comportements, variant du plus prudent au plus agressif. Ainsi, le concepteur du système dispose d'un curseur lui permettant d'ajuster en temps réel le niveau de risque assumé par le véhicule
In this Ph.D. thesis, we study how autonomous vehicles can learn to act safely and avoid accidents, despite sharing the road with human drivers whose behaviors are uncertain. To explicitly account for this uncertainty, informed by online observations of the environment, we construct a high-confidence region over the system dynamics, which we propagate through time to bound the possible trajectories of nearby traffic. To ensure safety under such uncertainty, we resort to robust decision-making and act by always considering the worst-case outcomes. This approach guarantees that the performance reached during planning is at least achieved for the true system, and we show by end-to-end analysis that the overall sub-optimality is bounded. Tractability is preserved at all stages, by leveraging sample-efficient tree-based planning algorithms. Another contribution is motivated by the observation that this pessimistic approach tends to produce overly conservative behaviors: imagine you wish to overtake a vehicle, what certainty do you have that they will not change lane at the very last moment, causing an accident? Such reasoning makes it difficult for robots to drive amidst other drivers, merge into a highway, or cross an intersection — an issue colloquially known as the “freezing robot problem”. Thus, the presence of uncertainty induces a trade-off between two contradictory objectives: safety and efficiency. How to arbitrate this conflict? The question can be temporarily circumvented by reducing uncertainty as much as possible. For instance, we propose an attention-based neural network architecture that better accounts for interactions between traffic participants to improve predictions. But to actively embrace this trade-off, we draw on constrained decision-making to consider both the task completion and safety objectives independently. Rather than a unique driving policy, we train a whole continuum of behaviors, ranging from conservative to aggressive. This provides the system designer with a slider allowing them to adjust the level of risk assumed by the vehicle in real-time
Estilos ABNT, Harvard, Vancouver, APA, etc.
20

Madi, wamba Gilles. "Combiner la programmation par contraintes et l’apprentissage machine pour construire un modèle éco-énergétique pour petits et moyens data centers". Thesis, Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire, 2017. http://www.theses.fr/2017IMTA0045/document.

Texto completo da fonte
Resumo:
Au cours de la dernière décennie les technologies de cloud computing ont connu un essor considérable se traduisant par la montée en flèche de la consommation électrique des data center. L’ampleur du problème a motivé de nombreux travaux de recherche s’articulant autour de solutions de réduction statique ou dynamique de l’enveloppe globale de consommation électrique d’un data center. L’objectif de cette thèse est d’intégrer les sources d’énergie renouvelables dans les modèles d’optimisation dynamique d’énergie dans un data center. Pour cela nous utilisons la programmation par contraintes ainsi que des techniques d’apprentissage machine. Dans un premier temps, nous proposons une contrainte globale d’intersection de tâches tenant compte d’une ressource à coûts variables. Dans un second temps, nous proposons deux modèles d’apprentissage pour la prédiction de la charge de travail d’un data center et pour la génération de telles courbes. Enfin, nous formalisons le problème de planification énergiquement écologique (PPEE) et proposons un modèle global à base de PPC ainsi qu’une heuristique de recherche pour le résoudre efficacement. Le modèle proposé intègre les différents aspects inhérents au problème de planification dynamique dans un data center : machines physiques hétérogènes, types d’applications variés (i.e., applications interactives et applications par lots), opérations et coûts énergétiques de mise en route et d’extinction des machines physiques, interruption/reprise des applications par lots, consommation des ressources CPU et RAM des applications, migration des tâches et coûts énergétiques relatifs aux migrations, prédiction de la disponibilité d’énergie verte, consommation énergétique variable des machines physiques
Over the last decade, cloud computing technologies have considerably grown, this translates into a surge in data center power consumption. The magnitude of the problem has motivated numerous research studies around static or dynamic solutions to reduce the overall energy consumption of a data center. The aim of this thesis is to integrate renewable energy sources into dynamic energy optimization models in a data center. For this we use constraint programming as well as machine learning techniques. First, we propose a global constraint for tasks intersection that takes into account a ressource with variable cost. Second, we propose two learning models for the prediction of the work load of a data center and for the generation of such curves. Finally, we formalize the green energy aware scheduling problem (GEASP) and propose a global model based on constraint programming as well as a search heuristic to solve it efficiently. The proposed model integrates the various aspects inherent to the dynamic planning problem in a data center : heterogeneous physical machines, various application types (i.e., ractive applications and batch applications), actions and energetic costs of turning ON/OFF physical machine, interrupting/resuming batch applications, CPU and RAM ressource consumption of applications, migration of tasks and energy costs related to the migrations, prediction of green energy availability, variable energy consumption of physical machines
Estilos ABNT, Harvard, Vancouver, APA, etc.
21

Blanc, Bernard. "L'impact de l'instrumentation de gestion sur les activités : le cas du plan stratégique de patrimoine, un instrument producteur de sens pour les organismes du logement social". Paris 10, 2007. http://www.theses.fr/2007PA100014.

Texto completo da fonte
Resumo:
L'analyse du cas de la conception et de la diffusion d'un nouvel artefact, le «Plan Stratégique de Patrimoine» (PSP), dans le milieu professionnel des organismes du logement social en France, nous permet de mettre en évidence deux grands registres de transformation à l'oeuvre. A un premier niveau de lecture, on observe un projet de transformation stratégique du secteur, initié par les centres de pouvoir que sont la Direction Générale à L'Urbanisme à l'Habitat et à la Construction et l'Union Sociale pour l'Habitat, visant à passer du secteur administratif au secteur industriel, via le PSP. A un deuxième niveau de lecture, on observe que cette transformation se fait sur le mode " top down » et que le PSP y joue un rôle primordial. Mais c'est un relatif échec, car l'observation des organismes montre une diversité des pratiques et l'existence d'un découplage entre outil et pratiques. Dans le cas d'un organisme comme Silène, l'artefact PSP cède la place à l'instrument GPS (Gestion de Projet de Site) qui joue un rôle de déclencheur, référentiel de sens, pour faire que les acteurs se penchent sur leur activité et la transforme. En nous appuyant sur le rôle de cet outil, le PSP, dans la construction du sens de l'activité dans les organismes H. L. M en France, et plus particulièrement dans l'un d'entre eux, nous pouvons étudier une question plus large : quelle est la relation entre l'instrumentation de gestion et la transformation des pratiques ? Pour élargir cette question, nous examinerons quelques-uns un des cadres théoriques disponibles : théorie de l’interprétation, théorie de la structuration et sensemaking ainsi que la théorie de l'activité
The analysis of the case of the design and the diffusion of a new artefact, the «Strategic Plan of Property» (PSP), enables us to highlight two great registers of transformation at work in the professional environment of the organizations of the social housing in France. On a first level of reading one observes a strategic project of transformation of the sector, initiated by the centers of being able which are the Directorate-General with Town planning with the Habitat and Construction and the Social Union for the Habitat aiming at passing from the administrative sector to the industrial sector via the PSP. On a second level of reading one observes that this transformation is made on the mode "top down" and that tool PSP plays a paramount part there. But it is a relative failure because the observation of the organizations shows a diversity of the practices. There is a decoupling between tool and practical. In the case of an organization like Silène, artefact PSP yields the place to instrument GPS (Project Management of Site). The tool plays a part of release, reference frame of direction, to make that the actors consider their activity and transforms it. By supporting us on the role of this tool, the PSP, in the construction of the direction of the activity in organizations HLM in France and more particularly in one of them, we can study a broader question which is the relation between the instrumentation of management and the transformation of the practices ? To widen this question we will examine some one of the theoretical executives available : theory of interpretation, theory of the structuring and sensemaking as well as the theory of the activity
Estilos ABNT, Harvard, Vancouver, APA, etc.
22

Ndour, Cheikh. "Modélisation statistique de la mortalité maternelle et néonatale pour l'aide à la planification et à la gestion des services de santé en Afrique Sub-Saharienne". Phd thesis, Université de Pau et des Pays de l'Adour, 2014. http://tel.archives-ouvertes.fr/tel-00996996.

Texto completo da fonte
Resumo:
L'objectif de cette thèse est de proposer une méthodologie statistique permettant de formuler une règle de classement capable de surmonter les difficultés qui se présentent dans le traitement des données lorsque la distribution a priori de la variable réponse est déséquilibrée. Notre proposition est construite autour d'un ensemble particulier de règles d'association appelées "class association rules". Dans le chapitre II, nous avons exposé les bases théoriques qui sous-tendent la méthode. Nous avons utilisé les indicateurs de performance usuels existant dans la littérature pour évaluer un classifieur. A chaque règle "class association rule" est associée un classifieur faible engendré par l'antécédent de la règle que nous appelons profils. L'idée de la méthode est alors de combiner un nombre réduit de classifieurs faibles pour constituer une règle de classement performante. Dans le chapitre III, nous avons développé les différentes étapes de la procédure d'apprentissage statistique lorsque les observations sont indépendantes et identiquement distribuées. On distingue trois grandes étapes: (1) une étape de génération d'un ensemble initial de profils, (2) une étape d'élagage de profils redondants et (3) une étape de sélection d'un ensemble optimal de profils. Pour la première étape, nous avons utilisé l'algorithme "apriori" reconnu comme l'un des algorithmes de base pour l'exploration des règles d'association. Pour la deuxième étape, nous avons proposé un test stochastique. Et pour la dernière étape un test asymptotique est effectué sur le rapport des valeurs prédictives positives des classifieurs lorsque les profils générateurs respectifs sont emboîtés. Il en résulte un ensemble réduit et optimal de profils dont la combinaison produit une règle de classement performante. Dans le chapitre IV, nous avons proposé une extension de la méthode d'apprentissage statistique lorsque les observations ne sont pas identiquement distribuées. Il s'agit précisément d'adapter la procédure de sélection de l'ensemble optimal lorsque les données ne sont pas identiquement distribuées. L'idée générale consiste à faire une estimation bayésienne de toutes les valeurs prédictives positives des classifieurs faibles. Par la suite, à l'aide du facteur de Bayes, on effectue un test d'hypothèse sur le rapport des valeurs prédictives positives lorsque les profils sont emboîtés. Dans le chapitre V, nous avons appliqué la méthodologie mise en place dans les chapitres précédents aux données du projet QUARITE concernant la mortalité maternelle au Sénégal et au Mali.
Estilos ABNT, Harvard, Vancouver, APA, etc.
23

Aissani, Nassima. "Pilotage adaptatif et réactif pour un système de production à flux continu : application à un système de production pétrochimique". Phd thesis, Valenciennes, 2010. http://tel.archives-ouvertes.fr/tel-00553512.

Texto completo da fonte
Resumo:
Les marchés actuels sont caractérisés par une grande compétitivité. Cette compétitivité a mis les entreprises, notamment celles d'envergure internationale, dans une situation de recherche de compromis entre des objectifs et des contraintes de plus en plus forts et contradictoires. Cet environnement nous a conduit à développer un système de pilotage et de contrôle de production qui ne soit pas seulement capable de réagir efficacement mais qui soit également en évolution permanente pour améliorer ses performances et la qualité des solutions qu'il propose en terme d'ordonnancement. Ce système doit pouvoir exploiter au mieux les ressources de production. Pour ce faire, ces ressources subissent régulièrement des entretiens préventifs ou des corrections suite aux pannes, ce qui les rend indisponibles à ces moments. Les systèmes de pilotage de production doivent prendre en considération ces indisponibilités afin de mieux contrôler et commander le système de production. Par conséquent, production et maintenance doivent être gérées conjointement au sein du système de pilotage. Dans ce cadre, l'objectif de cette thèse est de proposer un système de pilotage qui soit réactif et capable d'améliorer en permanence ses performances. Dans cet objectif, un système basé sur l'approche multi-agent et l'apprentissage par renforcement multi-objectifs a été développé, ces techniques permettent au système d'être réactif et adaptatif à son environnement. Le système développé a été testé sur un cas réel qui est une unité de fabrication des huiles finies. Les expérimentations ont donné des résultats satisfaisants ouvrant la porte à de nouvelles perspectives.
Estilos ABNT, Harvard, Vancouver, APA, etc.
24

Choffin, Benoît. "Algorithmes d’espacement adaptatif de l’apprentissage pour l’optimisation de la maîtrise à long terme de composantes de connaissance". Electronic Thesis or Diss., université Paris-Saclay, 2021. http://www.theses.fr/2021UPASG001.

Texto completo da fonte
Resumo:
Entre acquérir de nouvelles connaissances et revoir les anciennes pour en atténuer l’oubli, les apprenants peuvent avoir du mal à organiser efficacement leur temps d’apprentissage. Les algorithmes d’espacement adaptatif de l’apprentissage, tels SuperMemo, permettent d’aider les apprenants à résoudre cet arbitrage. Ces algorithmes planifient les révisions successives d’une même connaissance de manière optimale et personnalisée en tenant compte des besoins de chaque apprenant. Comparé à un espacement temporel entre les révisions identique pour tous les individus, plusieurs expériences montrent que l’espacement adaptatif maintient un plus haut degré d’ancrage en mémoire à long terme des informations apprises.Jusqu’ici, la recherche sur l’espacement adaptatif de l’apprentissage s’est concentrée sur la mémorisation pure de connaissances simples, représentées souvent par le biais de flashcards. Or, plusieurs études en psychologie cognitive montrent que les bénéfices de l’espacement de l’apprentissage sur la mémorisation à long terme s’étendent aussi à des connaissances plus complexes, telles que l’apprentissage de concepts et de procédures en mathématiques. Dans cette thèse, nous avons donc cherché à développer des algorithmes d’espacement adaptatif et personnalisé de l’apprentissage de composantes de connaissance (CC).Dans un premier temps, nous proposons un nouveau modèle statistique de l’apprentissage et l’oubli de CC, appelé DAS3H, et montrons empiriquement qu’il possède de meilleures performances prédictives que plusieurs modèles de l’apprenant en fouille de données éducatives. Ensuite, nous développons plusieurs heuristiques d’espacement adaptatif pour la maîtrise à long terme de CC et comparons leurs performances sur des données simulées. Deux de ces heuristiques reposent sur le modèle DAS3H pour sélectionner la CC à faire réviser à un instant donné. Nous proposons en outre une nouvelle procédure gloutonne pour sélectionner le sous-ensemble de CC le plus prometteur au lieu de la meilleure CC à faire réviser. Enfin, dans le dernier chapitre de cette thèse, nous développons AC4S, un algorithme d’apprentissage par renforcement profond pour l’espacement adaptatif de l’apprentissage de CC. Nous comparons cette approche fondée sur les données à nos méthodes heuristiques, présentées précédemment
Between acquiring new knowledge and reviewing old knowledge to mitigate forgetting, learners may find it difficult to organize their learning time effectively. Adaptive spacing algorithms, like SuperMemo, can help learners deal with this trade-off. Such algorithms sequentially plan reviews of a given piece of knowledge to adapt to the specific and ongoing needs of each learner. Compared to a fixed and identical temporal spacing between reviews, several experiments have shown that adaptive spacing improves long-term memory retention of the piece of knowledge.To date, research on adaptive spacing algorithms has focused on the pure memorization of simple pieces of knowledge, which are often represented by flashcards. However, several studies in cognitive psychology have shown that the benefits of spacing out learning episodes on long-term retention also extend to more complex knowledge, such as learning concepts and procedures in mathematics. In this thesis, we have therefore sought to develop adaptive and personalized spacing algorithms for optimizing long-term mastery of knowledge components (KCs).First, we develop and present a new statistical model of learning and forgetting of knowledge components, coined DAS3H, and we empirically show that DAS3H has better predictive performance than several learner models in educational data mining. Second, we develop several adaptive spacing heuristics for long-term mastery of KCs and compare their performance on simulated data. Two of these heuristics use the DAS3H model to select which KC should be reviewed by a given learner at a given time. In addition, we propose a new greedy procedure to select the most promising subset of KCs instead of the best KC to review. Finally, in the last chapter of this thesis, we develop AC4S, a deep reinforcement learning algorithm for adaptive spacing for KCs. We compare this data-driven approach to the heuristic methods that we presented previously
Estilos ABNT, Harvard, Vancouver, APA, etc.
25

Lelerre, Mathieu. "Processus Décisionnels de Markov pour l'autonomie ajustable et l'interaction hétérogène entre engins autonomes et pilotés". Thesis, Normandie, 2018. http://www.theses.fr/2018NORMC246/document.

Texto completo da fonte
Resumo:
Les robots vont être de plus en plus utilisés dans les domaines civils, comme dans le domaine militaire. Ces robots, opérant en flottes, peuvent accompagner des soldats au combat, ou accomplir une mission en étant supervisés par un poste de contrôle. Du fait des exigences d'une opération militaire, il est difficile de laisser les robots décider de leurs actions sans accord d'un opérateur ou surveillance, en fonction de la situation. Dans cette thèse, nous nous attardons sur deux problématiques:D'une part, nous cherchons à exploiter l'autonomie ajustable de sorte à ce qu'un robot puisse accomplir sa mission de la manière la plus efficace possible, tout en respectant des restrictions assignées par un opérateur sur son niveau d'autonomie. Pour cela, celui-ci est en mesure de définir pour un ensemble d'états et d'actions donné un niveau de restriction. Ce niveau peut par exemple imposer au robot la télé-opération pour accéder à une zone à risque.D'autre part, comme nous envisageons la possibilité que plusieurs robots soient déployés en même temps, ces robots doivent se coordonner pour accomplir leurs objectifs. Seulement, comme les opérateurs peuvent prendre le contrôle de certains d'entre eux, la question de la coordination se pose. En effet, l'opérateur ayant ses propres préférences, perception de l'environnement, connaissances et étant sujet aux stress, hésitations, il est difficile de prévoir les actions que celui-ci va effectuer, et donc de s'y coordonner. Nous proposerons dans cette thèse une approche visant à estimer la politique exécutée par un robot télé-opéré à partir d'apprentissage basé sur les actions observés de ce robot.La notion de planification est très présente dans ces travaux. Ceux-ci se baseront sur des modèles de planifications comme les Processus Décisionnels de Markov
Robots will be more and more used in both civil and military fields. These robots, operating in fleet, can accompany soldiers in fight, or accomplish a mission while being supervised by a control center. Considering the requirement of a military operation, it is complicated to let robots decide their action without an operator agreement or watch, in function of the situation.In this thesis, we focus on two problematics:First, we try to exploit adjustable autonomy to make a robot accomplishes is mission as efficiency as possible, while he respects restrictions, assigned by an operator, on his autonomy level. For this, it is able to define for given sets of states and actions a restriction level. This restriction can force, for example, the need of being tele-operated to access a dangerous zone.Secondly, we consider that several robots can be deployed at the same time. These robots have to coordinate to accomplish their objectives. However, since operators can take the control of some robots, the coordination is harder. In fact, the operator has preferences, perception, hesitation, stress that are not modeled by the agent. It is then hard to estimate his next actions, so to coordinate with him. We propose in this thesis an approach to estimate the policy executed by a tele-operated robot from learning methods, based on observed actions from this robot.The notion of planning his important in these works. These are based on planning models, such as Markov Decision Processes
Estilos ABNT, Harvard, Vancouver, APA, etc.
26

Allek, Fayssal. "Une approche pour les compétences fondamentales du développement d’une entreprise sur un nouveau marché : cas de compétences technologiques". Caen, 2010. http://www.theses.fr/2010CAEN0662.

Texto completo da fonte
Resumo:
A partir du constat de l'insuffisance de la théorie des ressources et compétences, dans sa formulation actuelle, à fournir une explication satisfaisante sur le phénomène de développement des compétences technologiques, nous avons cherché, par des croisements théoriques et empirique fertiles, à développer une modélisation qui permet de mettre en évidence les différentes phases par lesquelles passe une compétence pour se développer sur un nouveau marché. Deux groupes d'entreprises sont étudiés suivant le design de recherche formulé par Yin (1991). Cette étude empirique a permis de montrer que la compétence technologique suit un processus global constitué de trois phases successives, reliées entre elles de manière séquentielle et chronologique. La modélisation qui en est issue a le mérite de baliser le processus sans toutefois en trahir la complexité. Elle constitue un outil de structuration des problématiques auxquelles toute entreprise désireuse de développer sa compétence technologique se doit d’être attentive
Estilos ABNT, Harvard, Vancouver, APA, etc.
27

Ponzoni, Carvalho Chanel Caroline. "Planification de perception et de mission en environnement incertain : Application à la détection et à la reconnaissance de cibles par un hélicoptère autonome". Thesis, Toulouse, ISAE, 2013. http://www.theses.fr/2013ESAE0011/document.

Texto completo da fonte
Resumo:
Les agents robotiques mobiles ou aériens sont confrontés au besoin de planifier des actions avec information incomplètesur l'état du monde. Dans ce contexte, cette thèse propose un cadre de modélisation et de résolution de problèmes deplanification de perception et de mission pour un drone hélicoptère qui évolue dans un environnement incertain etpartiellement observé afin de détecter et de reconnaître des cibles. Nous avons fondé notre travail sur les ProcessusDécisionnels Markoviens Partiellement Observables (POMDP), car ils proposent un schéma d'optimisation général pour lestâches de perception et de décision à long terme. Une attention particulière est donnée à la modélisation des sortiesincertaines de l'algorithme de traitement d'image en tant que fonction d'observation. Une analyse critique de la mise enoeuvre en pratique du modèle POMDP et du critère d'optimisation associé est proposée. Afin de respecter les contraintes desécurité et de sûreté de nos robots aériens, nous proposons ensuite une approche pour tenir compte des propriétés defaisabilité d'actions dans des domaines partiellement observables : le modèle AC-POMDP, qui sépare l'informationconcernant la vérification des propriétés du modèle, de celle qui renseigne sur la nature des cibles. Enfin, nous proposonsun cadre d'optimisation et d'exécution en parallèle de politiques POMDP en temps contraint. Ce cadre est basé sur uneoptimisation anticipée et probabilisée des états d'exécution futurs du système. Nous avons embarqué ce cadrealgorithmique sur les hélicoptères autonomes de l'Onera, et l'avons testé en vol et en environnement réel sur une missionde détection et reconnaissance de cibles
Mobile and aerial robots are faced to the need of planning actions with incomplete information about the state of theworld. In this context, this thesis proposes a modeling and resolution framework for perception and mission planningproblems where an autonomous helicopter must detect and recognize targets in an uncertain and partially observableenvironment. We founded our work on Partially Observable Markov Decision Processes (POMDPs), because it proposes ageneral optimization framework for perception and decision tasks under long-term horizon. A special attention is given tothe outputs of the image processing algorithm in order to model its uncertain behavior as a probabilistic observationfunction. A critical study on the POMDP model and its optimization criterion is also conducted. In order to respect safetyconstraints of aerial robots, we then propose an approach to properly handle action feasibility constraints in partiallyobservable domains: the AC-POMDP model, which distinguishes between the verification of environmental properties andthe information about targets' nature. Furthermore, we propose a framework to optimize and execute POMDP policies inparallel under time constraints. This framework is based on anticipated and probabilistic optimization of future executionstates of the system. Finally, we embedded this algorithmic framework on-board Onera's autonomous helicopters, andperformed real flight experiments for multi-target detection and recognition missions
Estilos ABNT, Harvard, Vancouver, APA, etc.
28

Krichen, Omar. "Conception d'un système tutoriel intelligent orienté stylet pour l'apprentissage de la géométrie basé sur une interprétation à la volée de la production manuscrite de figures". Thesis, Rennes, INSA, 2020. http://www.theses.fr/2020ISAR0006.

Texto completo da fonte
Resumo:
Cette thèse s’inscrit dans le cadre du projet national « e-Fran » dénommé ACTIF et porte sur la conception du système tutoriel intelligent IntuiGeo pour l’apprentissage de la géométrie au collège sur tablette orientée stylet.Les contributions de cette thèse s'inscrivent dans deux axes.Le premier porte sur la conception d’un moteur de reconnaissance permettant l’interprétation à la volée de figures géométriques. Il est basé sur un formalisme grammatical générique, GMC-PC (Grammaire Multi-ensembles à Contraintes Pilotée par le Contexte). Le deuxième axe adresse l’aspect tutoriel du système. Nous définissons un mode auteur qui permet au tuteur de générer des exercices de construction à partir d'une solution dessinée par l'enseignant. La connaissance spécifique au problème est représentée par un graphe de connaissance. Cette modélisation permet au tuteur de s’affranchir de la procédure suivie par l’enseignant et d’évaluer la production de l'élève, en temps-réel, quel que soit la stratégie suivie. Nous définissons de plus un module expert, basé sur un environnement de planification, capable de synthétiser des stratégies de résolution des problèmes. Le système tutoriel est capable de générer des feedbacks de correction et de guidage adaptés à l'état de l'avancement de l'élève. Les résultats des expérimentations en classe démontrent l’impact pédagogique positif du système sur la performance des élèves, notamment en termes de transfert d’apprentissage entre support numérique et papier
This PhD is in the context of the « e-Fran » national project called ACTIF and deals with the design of the pen-based intelligent tutoring system IntuiGeo, for geometry learning in middle school. The contribution of this work are grouped into two axes.The first axis focused on the design of a recognition engine capable of on the fly interpretation of Han-drawn geometrical figures. It is based on a generic grammatical formalism, CD-CMG (Context Driven Constraints Multiset Grammar). The challenge being to manage the complexity of the real-time analysis process, the first contribution of this work consisted in extending the formalism, without losing its generic aspect. The second axis of this work addresses the tutorial aspect of our system.We define au author mode where the tutor is able to generate construction exercises from a solution example drawn by the teacher.The problem specific knowledge is represented by a knowledge graph. This representation enables the tutor to consider all possible resolution strategies, and to evaluate the pupil’s production in real-time. Furthermore, we define an expert module, based on a dynamic planning environment, capable of synthesizing resolution strategies. The tutoring system is able to generate guidance and corrective feedbacks that are adapted to the pupil’s resolution state. The results of our experiment conducted in class demonstrate the positive pedagogical impact of the system on the pupils performance, especially in terms of learning transferability between the digital and traditional support
Estilos ABNT, Harvard, Vancouver, APA, etc.
29

Lacaze-Labadie, Rémi. "Planification et modèle graphique pour la génération dynamique de scénarios en environnements virtuels". Thesis, Compiègne, 2019. http://www.theses.fr/2019COMP2481/document.

Texto completo da fonte
Resumo:
Nos travaux s’inscrivent dans le cadre de la formation à la gestion de crise en environnements virtuels. La scénarisation joue un rôle essentiel pour l’apprentissage humain en environnement virtuel. Cela permet à la fois de proposer et d’orchestrer des situations d’apprentissage personnalisées et également d’amener l’apprenant vers des scénarios pertinents et formateurs. Les travaux présentés dans cette thèse s’intéressent à la génération dynamique de scénarios et à leur exécution en environnements virtuels. Pour cette scénarisation, nous visons un ensemble d’objectifs qui sont souvent contradictoires : la liberté d’action de l’utilisateur, la génération de scénarios variés et fidèles à l’intention de l’auteur, le contrôle scénaristique et la résilience du système de scénarisation. Les différentes approches de la narration interactive favorisent plus ou moins certains de ces objectifs mais il est difficile de tous les concilier, et c’est là l’enjeu de nos travaux. En plus de ces objectifs, nous cherchons également à faciliter la modélisation du contenu scénaristique qui est encore de nos jours un réel enjeu lorsqu’il s’agit de scénariser des environnements complexes comme celui de la gestion de crise. Nous proposons une approche émergente dont le scénario vécu par l’apprenant va émerger des interactions entre l’apprenant, les personnages virtuels et notre système de scénarisation MENTA. MENTA est chargé du contrôle scénaristique en proposant un ensemble d’ajustements (sur la simulation) répondant à des objectifs scénaristiques choisis par le formateur (p. ex., faire travailler certaines compétences en particulier). Ces ajustements prennent la forme d’un scénario prescrit qui est généré par MENTA via un moteur de planification que nous avons couplé avec des cartes cognitives floues au travers d’un macro-opérateur FRAG. Un FRAG permet de modéliser des fragments de scénarios sous la forme de séquence d’actions/événements scriptés. L’originalité de notre approche repose sur un couplage fort entre planification et modèles graphiques qui permet de conserver les propriétés d’exploration et de puissance générative d’un moteur de planification (ce qui favorise la variabilité et la résilience du système), tout en facilitant la modélisation du contenu scénaristique ainsi que l’intention de l’auteur au travers de morceaux de scénario qui vont être scriptés par l’auteur et réutilisés dans la planification. Nous avons travaillé sur un exemple applicatif concret de scénarios portant sur la gestion d’un afflux massif de blessés, puis nous avons implémenté MENTA et généré des scénarios relatifs à cet exemple. Enfin, nous avons testé et analysé les performances de notre système
Our work is related to the training of crisis management in virtual environments. The specification of possible unfoldings of events in a simulation is essential for human learning in a virtual environment. This allows both to propose and orchestrate personalized learning situations and also to bring the learner toward relevant and educative scenarios. The work presented in this thesis focuses on the dynamic generation of scenarios and their execution in a virtual environment. For that, we aim at a set of objectives that are often contradictory : the freedom of action of the user, the generation of various scenarios that respect the authorial intent, the narrative control and the capacity of the system to adapt to deviations fromthe learner. The different approaches of interactive storytelling tackle more or less some of these objectives, but it is difficult to satisfy them all, and this is the challenge of our work. In addition to these objectives, we also aim at facilitating the modeling of the narrative content, which is still a real issue today when it comes to model complex environments such as the ones related to crisis management. We propose an emergent approachwhere the scenario experienced by the learner will emerge fromthe interactions between the learner, the virtual characters and our narrative system MENTA. MENTA is in charge of the narrative control by proposing a set of adjustments (over the simulation) that satisfies narrative objectives chosen by the trainer (e. g., a list of specific skills). These adjustments take the form of a prescribed scenario that is generated by MENTA via a planning engine that we have coupled with fuzzy cognitive maps through a macro-operator FRAG. A FRAG is used to model FRAGment of scenario in the form of scripted sequences of actions/events. The originality of our approach relies on a strong coupling between planning and graphical models which preserves the exploration capability and the generative power of a planning engine (which contributes to the generation of various and adaptable scenarios), while facilitating the modeling of narrative content as well as the authorial intent thanks to fragments of scenario that are scripted by the author and used during the planning process. We have worked on a concrete application example of scenarios dealing with the management of a massive influx of victims. Then, we have implemented MENTA and generated scenarios related to this example. Finally, we have tested and analyzed the performance of our system
Estilos ABNT, Harvard, Vancouver, APA, etc.
30

Al, Samrout Marwa. "Approches mono et bi-objective pour l'optimisation intégrée des postes d'amarrage et des grues de quai dans les opérations de transbordement". Electronic Thesis or Diss., Normandie, 2024. http://www.theses.fr/2024NORMLH21.

Texto completo da fonte
Resumo:
Le transport maritime international est vital pour le commerce mondial, représentant plus de 85 % des échanges, avec 10,5 milliards de tonnes transportées chaque année. Ce mode de transport est le plus économique et durable, contribuant seulement à 2,6 % des émissions de CO2. En France, le secteur maritime représente 1,5 % du PIB et près de 525 000 emplois. Les ports maritimes, cruciaux pour la chaîne logistique, facilitent le transbordement des marchandises et adoptent de plus en plus des solutions numériques basées sur l'intelligence artificielle pour améliorer leur efficacité. La France compte onze Grands ports maritimes, dont sept en Métropole. La thèse se concentre sur l’optimisation des terminaux à conteneurs pour améliorer l’efficacité et la performance des ports.Ce mémoire aborde la problématique de la planification des postes d’accostage et de l’activation des portiques dans les terminaux à conteneurs des ports maritimes, en réponse aux changements récents dans la logistique maritime, tels que l’arrivée de méga-navires et l’automatisation. Il souligne les lacunes dans la littérature existante et propose une analyse approfondie des défis actuels. Le document se divise en trois chapitres : Le premier chapitre explore l’histoire de la conteneurisation, les types de conteneurs, et les défis de la planification opérationnelle. Il se concentre sur le problème d’attribution des postes d’amarrage (BAP), ses méthodes de résolution et l’intégration de l’intelligence artificielle (IA) pour optimiser les processus logistiques. Le 2ème chapitre introduit le problème d'allocation dynamique avec transbordement ship-to-ship. Il propose un programme linéaire en nombres entiers mixtes (MILP) pour optimiser l’ordonnancement d’accostage et le transbordement entre navires. L’objectif est de réduire les temps de séjour des navires dans le terminal, ainsi que les pénalités dues aux retards des navires, et de décider du mode de transbordement nécessaire. La méthode combine une heuristique de type packing et un algorithme génétique amélioré, démontrant une efficacité dans la réduction des temps de séjour des navires. Nous avons effectué une analyse statistique pour identifier les paramètres de contrôle efficaces du GA, puis nous avons appliqué cet algorithme avec les paramètres de contrôle déterminés pour réaliser des expériences numériques sur des instances générées aléatoirement. De plus, nous avons réalisé une étude comparative afin d’évaluer différents opérateurs de croisement, en utilisant le test d’analyse de variance (ANOVA). Ensuite, nous avons présenté une série d’exemples basés sur des données aléatoires, résolus à l’aide du solveur CPLEX, afin de confirmer la validité du modèle proposé. La méthode proposée est capable de résoudre le problème dans un temps de calcul acceptable pour des instances de taille moyenne et grande. Le dernier chapitre présente un problème intégré d’allocation des postes d’amarrage et des grues, avec un focus sur le transbordement ship-to-ship. Trois approches sont proposées . La première approche utilise l'algorithme génétique NSGA-III, complété par une analyse statistique pour optimiser les paramètres et évaluer différents opérateurs de croisement. En analysant des données de la base AIS, des tests numériques montrent l’efficacité de cette méthode au port du Havre, avec des résultats satisfaisants et un temps de calcul raisonnable.La deuxième approche implique deux modèles de régression, Gradient Boosting Regression (GBR) et Random Forest Regression (RFR), entraînés sur des caractéristiques sélectionnées. La méthodologie inclut des étapes de prétraitement et l'optimisation des hyperparamètres. Bien que NSGA-III offre la meilleure précision, il nécessite un temps d'exécution plus long. En revanche, GBR et RFR, bien que légèrement moins précis, améliorent l’efficacité, soulignant le compromis entre précision et temps d'exécution dans les applications pratiques
International maritime transport is vital for global trade, representing over 85% of exchanges, with 10.5 billion tons transported each year. This mode of transport is the most economical and sustainable, contributing only 2.6% of CO2 emissions. In France, the maritime sector accounts for 1.5% of GDP and nearly 525,000 jobs. Maritime ports, crucial for the logistics chain, facilitate the transshipment of goods and increasingly adopt digital solutions based on artificial intelligence to improve their efficiency. France has eleven major seaports, seven of which are located in mainland France.The thesis focuses on optimizing container terminals to enhance the efficiency and performance of ports. It addresses the issues of berth allocation planning and crane activation in container terminals in response to recent changes in maritime logistics, such as the arrival of mega-ships and automation. It highlights gaps in the existing literature and offers an in-depth analysis of current challenges. The document is divided into three chapters:The first chapter explores the history of containerization, types of containers, and challenges in operational planning. It focuses on the berth allocation problem (BAP), its resolution methods, and the integration of artificial intelligence (AI) to optimize logistical processes. The second chapter introduces the dynamic allocation problem with ship-to-ship transshipment. It proposes a mixed-integer linear program (MILP) to optimize the berthing schedule and transshipment between vessels. The objective is to reduce vessel stay times in the terminal, as well as penalties due to vessel delays, and to determine the necessary transshipment method. The method combines a packing-type heuristic and an improved genetic algorithm, demonstrating effectiveness in reducing vessel stay times. We conducted a statistical analysis to identify effective control parameters for the GA, then applied this algorithm with the determined control parameters to perform numerical experiments on randomly generated instances. Additionally, we conducted a comparative study to evaluate different crossover operators using ANOVA. We then presented a series of examples based on random data, solved using the CPLEX solver, to confirm the validity of the proposed model. The proposed method is capable of solving the problem in an acceptable computation time for medium and large instances. The final chapter presents an integrated berth and crane allocation problem, focusing on ship-to-ship transshipment. Three approaches are proposed. The first approach uses the NSGA-III genetic algorithm, supplemented by a statistical analysis to optimize parameters and evaluate different crossover operators. By analyzing AIS database data, numerical tests demonstrate the effectiveness of this method at the port of Le Havre, yielding satisfactory results within a reasonable computation time. The second approach involves two regression models, Gradient Boosting Regression (GBR) and Random Forest Regression (RFR), trained on selected features. The methodology includes preprocessing steps and hyperparameter optimization. While NSGA-III achieves the highest accuracy, it requires a longer execution time. In contrast, although GBR and RFR are slightly less precise, they significantly improve efficiency, highlighting the trade-off between accuracy and execution time in practical applications
Estilos ABNT, Harvard, Vancouver, APA, etc.
31

Lesner, Boris. "Planification et apprentissage par renforcement avec modèles d'actions compacts". Caen, 2011. http://www.theses.fr/2011CAEN2074.

Texto completo da fonte
Resumo:
Nous étudions les Processus de Décision Markoviens représentés de manière compacte via des langages de définition d'actions basés sur le langage STRIPS Probabiliste. Une première partie de ce travail traite de la résolution de ces processus de manière compacte. Pour cela nous proposons deux algorithmes. Un premier, basé sur la manipulation de formules propositionnelles, permet de résoudre de manière approchée les problèmes dans des fragments propositionnels traitables du type Horn ou 2-CNF. Le second algorithme quant à lui résout efficacement et de manière exacte les problèmes représentés en PDDL probabiliste via l'introduction d'une notion de fonction de valeur d'action étendue. La seconde partie concerne l'apprentissage de ces modèles d'actions. Nous proposons différentes méthodes pour résoudre le problème de l'ambiguïté des observations qui à lieu de lors de l'apprentissage. Une première méthode heuristique basée sur la programmation linéaire donne de bons résultats en pratique, mais sans garanties théoriques. Par la suite nous décrivons une méthode d'apprentissage dans le cadre « Know What It Knows ». Cette approche donne quant à elle des garanties théoriques sur la qualité des modèles d'actions appris ainsi que sur le nombre d'exemples requis pour obtenir un modèle d'actions correct. Ces deux approches sont ensuite incorporées dans un cadre d'apprentissage par renforcement pour une évaluation en pratique de leurs performances
We study Markovian Decision Processes represented with Probabilistic STRIPS action models. A first part of our work is about solving those processes in a compact way. To that end we propose two algorithms. A first one based on propositional formula manipulation allows to obtain approximate solutions in tractable propositional fragments such as Horn and 2-CNF. The second algorithm solves exactly and efficiently problems represented in PPDDL using a new notion of extended value functions. The second part is about learning such action models. We propose different approaches to solve the problem of ambiguous observations occurring while learning. Firstly, a heuristic method based on Linear Programming gives good results in practice yet without theoretical guarantees. We next describe a learning algorithm in the ``Know What It Knows'' framework. This approach gives strong theoretical guarantees on the quality of the learned models as well on the sample complexity. These two approaches are then put into a Reinforcement Learning setting to allow an empirical evaluation of their respective performances
Estilos ABNT, Harvard, Vancouver, APA, etc.
32

Hren, Jean-Francois. "Planification Optimiste pour Systèmes Déterministes". Phd thesis, Université des Sciences et Technologie de Lille - Lille I, 2012. http://tel.archives-ouvertes.fr/tel-00845898.

Texto completo da fonte
Resumo:
Dans le domaine de l'apprentissage par renforcement, la planifi ation dans les processus de décisions markoviens est une approche en ligne utilisée pour contrôler un système dont on possède un modèle génératif. Nous nous proposons d'adresser ce problème dans le cas déterministe avec espace d'action discret ou continu. Cette thèse s'attache au chapitre 2 à présenter succinctement les processus de décision markoviens puis l'apprentissage par renforcement. Nous présentons en particulier trois algorithmes centraux que sont l'itération de la valeur, l'itération de la politique et le Q-Learning. Au chapitre 3, nous expliquons l'approche de la planifi cation dans les processus de décision markoviens pour contrôler des systèmes en ligne. Ainsi, nous supposons posséder un modèle génératif d'un système à contrôler et nous l'utilisons pour décider, à chaque pas de temps du système à contrôler, de l'action à lui appliquer en vue de le faire transiter dans un état maximisant la somme future des récompenses dépréciées. Nous considérons un modèle génératif comme une boite noire, laquelle étant donnée un état et une action, nous retourne un état successeur ainsi qu'une récompense associée. L'approche optimiste est détaillée dans sa philosophie et dans son application à la résolution du dilemme exploration-exploitation au travers de di fférentes techniques présentes dans la littérature. Nous présentons di fférents algorithmes issus de la littérature et s'appliquant dans le cadre de la plani fication dans les processus de décision markoviens. Nous nous concentrons en particulier sur les algorithmes effectuant une recherche avant par construction d'un arbre des possibilités look-ahead tree en anglais. Les algorithmes sont présentés et mis en relation les uns avec les autres. L'algorithme de recherche du plus court chemin dans un graphe A est présenté en vue d'être relié à notre première contribution, l'algorithme de plani fication optimiste. Nous détaillons cette première contribution au chapitre 4. Dans un premier temps, nous présentons en détail le contexte de la planification sous contrainte de ressources computationnelles ainsi que la notion de regret. Dans un second temps, l'algorithme de plani cation uniforme est présenté et son regret est analysé pour obtenir une base comparative avec l'algorithme de plani cation optimiste. Enfi n, celui-ci est présenté et son regret est analysé. L'analyse est étendue à une classe de problèmes dé finie par la proportion de chemins -optimaux, permettant ainsi d'établir une borne supérieure sur le regret de l'algorithme de plani cation optimiste meilleure que celle de l'algorithme de plani cation uniforme dans le pire des cas. Des expérimentations sont menées pour valider la théorie et chi rer les performances de l'algorithme de plani cation optimiste par le biais de problèmes issus de la littérature comme le cart-pole, l'acrobot ou le mountain car et en comparaison à l'algorithme de plani cation uniforme, à l'algorithme UCT ainsi qu'à l'algorithme de recherche aléatoire. Nous verrons que, comme suggéré par la dé nition de la borne supérieure sur son regret, l'algorithme de plani cation optimiste est sensible au facteur de branchement ce qui nous mène à envisager le cas où l'espace d'action est continu. Ceci fait l'objet de nos deux autres contributions au chapitre 5. Notre deuxième contribution est l'algorithme de plani cation lipschitzienne reposant sur une hypothèse de régularité sur les récompenses menant à supposer que la fonction de transition et la fonction récompense du processus de décision markovien modélisant le système à contrôler sont lipschitziennes. De cette hypothèse, nous formulons une borne sur un sous-ensemble de sousespaces de l'espace d'action continu nous permettant de l'explorer par discr étisations successives. L'algorithme demande cependant la connaissance de la constante de Lipschitz associée au système à contrôler. Des expérimentations sont menées pour évaluer l'approche utilisée pour diff érentes constantes de Lipschitz sur des problèmes de la littérature comme le cart-pole, l'acrobot ou la lévitation magnétique d'une boule en acier. Les résultats montrent que l'estimation de la constante de Lipschitz est diffi cile et ne permet pas de prendre en compte le paysage local des récompenses. Notre troisième contribution est l'algorithme de plani cation séquentielle découlant d'une approche intuitive où une séquence d'instances d'un algorithme d'optimisation globale est utilisée pour construire des séquences d'actions issues de l'espace d'action continu. Des expérimentations sont menées pour évaluer cet approche intuitive pour diff érents algorithmes d'optimisation globale sur des problèmes de la littérature comme le cart-pole, le bateau ou le nageur. Les résultats obtenus sont encourageants et valident l'approche intuitive. Finalement, nous concluons en résumant les di érentes contributions et en ouvrant sur de nouvelles perspectives et extensions.
Estilos ABNT, Harvard, Vancouver, APA, etc.
33

Lengagne, Sebastien. "Planification et re-planification de mouvements sûrs pour les robots humanoïdes". Phd thesis, Université Montpellier II - Sciences et Techniques du Languedoc, 2009. http://tel.archives-ouvertes.fr/tel-00431302.

Texto completo da fonte
Resumo:
Ces travaux de thèse traitent de la génération de mouvements optimaux pour les robots humanoïdes. La plupart des méthodes de génération de mouvements sont inspirées de celles utilisées pour les robots manipulateurs. Elles se basent sur l'utilisation d'un algorithme d'optimisation qui nécessite une paramétrisation du mouvement ainsi qu'une discrétisation temporelle des contraintes définissant les limites physiques du robot. Nous montrons qu'une discrétisation faite à partir d'une grille temporelle peut compromettre la sécurité et l'intégrité des robots. De ce fait, nous proposons une nouvelle méthode de discrétisation garantie qui calcule les extrema des contraintes sur des intervalles de temps couvrant toute la durée du mouvement. Cette méthode de discrétisation pour le calcul des contraintes, nécessite un temps de calcul important. Nous avons, donc, développé une méthode hybride qui assure la validité des contraintes pour des temps de calcul comparables à celui des méthodes classiques. Cette méthode nous permet ainsi de générer une base de données de mouvements que nous avons utilisée lors d'une expérimentation de suivi de cible mobile. Nous sommes, donc, en mesure de générer un mouvement optimal parfaitement adapté à une configuration de l'environnement. Cependant, aucune méthode ne dispose d'un temps de calcul qui permette de réagir rapidement à une modification de l'environnement. Par conséquent, nous présentons une méthode de re-planification qui permet de générer un nouveau mouvement à partir d'un mouvement optimal calculé précédemment. Pour cela, nous calculons, hors-ligne, un sous-ensemble faisable autour des paramètres du mouvement qui vérifient les limites du robot. La re-planification consiste, alors, à chercher, en ligne, dans ce sous-ensemble les paramètres qui satisfont la nouvelle configuration de l'environnement. Nous avons testé la méthode de re-planification avec un mouvement de coup de pied où la position de la balle varie et nous obtenons un mouvement adapté en 1.5 s de temps de calcul.
Estilos ABNT, Harvard, Vancouver, APA, etc.
34

Lengagne, Sébastien. "Planification et re-planification de mouvements sûrs pour les robots humanoïdes". Montpellier 2, 2009. http://www.theses.fr/2009MON20104.

Texto completo da fonte
Resumo:
Ces travaux de thèse traitent de la génération de mouvements optimaux pour les robots humanoïdes. La plupart des méthodes de génération de mouvements se basent sur l'utilisation d'un algorithme d'optimisation qui nécessite une paramétrisation du mouvement ainsi qu'une discrétisation temporelle des contraintes. Nous montrons qu'une discrétisation faite à partir d'une grille temporelle compromet la sécurité et l'intégrité du robot et proposons une nouvelle méthode de discrétisation garantie qui calcule les extrema des contraintes sur des intervalles de temps. Malheureusement, elle nécessite un temps de calcul important. Nous avons, donc, développé une méthode hybride assurant la validité des contraintes pour des temps de calcul comparables à celui des méthodes classiques. Et qui nous permet de générer un ensemble de mouvements que nous avons utilisé lors d'une expérimentation de suivi de cible. Nous sommes, donc, capables de générer un mouvement optimal adapté à un environnement. Cependant, aucune méthode ne dispose d'un temps de calcul qui permette de réagir rapidement à une modification de l'environnement. Par conséquent, nous présentons une méthode de re-planification qui génère un nouveau mouvement à partir d'un mouvement optimal déjà existant. Pour cela, nous calculons, hors-ligne, un sous-ensemble faisable autour des paramètres du mouvement qui vérifient les limites du robot. La re-planification consiste, alors, à chercher, en ligne, dans ce sous-ensemble les paramètres qui satisfont le nouvel environnement. Nous avons testé cette méthode pour un mouvement de coup de pied où la position de la balle varie et obtenons un mouvement adapté en 1. 5 s de temps de calcul
These works deal with the computation of optimal motions for the humanoid robots. Most of the motion planning methods come from the motion planning of the manipulator robots. They rely on optimization algorithms which need a motion parametrization and a time-discretization of the constraints that define the physical limits of the robot. We show that a time-grid discretization is hazardous for the safety and the integrity of the robot. That is why, we propose a new method for the guaranteed discretization that computes the extrema of the constraints over time-interval that covers the whole motion duration. This method of discretization is time consuming. Thus, we developped a hybrid method that ensures the constraint validity within the same range of time of the state-of-the-art methods. With this method, we created a database of motions to follow a moving target. Consequently, we can generate an optimal motion that fits to the environment. However, there is no method which is fast enough to compute a new motion adapted to a new environment. Thus, we present a re-planning method that produces a new motion from a previous one. To do it, we compute, offline, a feasable sub-set around the motion that respects the constraint validity. The re-planning process consists in finding, in this sub-set, a new motion that is adapted to the new environment. We tested this re-planning method with a kicking motion where the position of the ball changes and we are able to find and adapted motion within 1. 5s of CPU-time
Estilos ABNT, Harvard, Vancouver, APA, etc.
35

Dalibard, Sébastien. "Planification de mouvement pour systèmes anthropomorphes". Phd thesis, Institut National Polytechnique de Toulouse - INPT, 2011. http://tel.archives-ouvertes.fr/tel-00619439.

Texto completo da fonte
Resumo:
L'objet de cette thèse est le développement et l'étude des algorithmes de planification de mouvement pour les systèmes hautement dimensionnés que sont les robots humanoïdes et les acteurs virtuels. Plusieurs adaptations des méthodes génériques de planification de mouvement randomisées sont proposées et discutées. Une première contribution concerne l'utilisation de techniques de réduction de dimension linéaire pour accélérer les algorithmes d'échantillonnage. Cette méthode permet d'identifier en ligne quand un processus de planification passe par un passage étroit de l'espace des configurations et adapte l'exploration en fonction. Cet algorithme convient particulièrement bien aux problèmes difficiles de la planification de mouvement pour l'animation graphique. La deuxième contribution est le développement d'algorithmes randomisés de planification sous contraintes. Il s'agit d'une intégration d'outils de cinématique inverse hiérarchisée aux algorithmes de planification de mouvement randomisés. On illustre cette méthodes sur différents problèmes de manipulation pour robots humanoïdes. Cette contribution est généralisée à la planification de mouvements corps-complet nécessitant de la marche. La dernière contribution présentée dans cette thèse est l'utilisation des méthodes précédentes pour résoudre des tâches de manipulation complexes par un robot humanoïde. Nous présentons en particulier un formalisme destiné à représenter les informations propres à l'objet manipulé utilisables par un planificateur de mouvement. Ce formalisme est présenté sous le nom d'"objets documentés".
Estilos ABNT, Harvard, Vancouver, APA, etc.
36

Mezouar, Youcef. "Planification de trajectoires pour l'asservissement visuel". Rennes 1, 2001. http://www.theses.fr/2001REN10138.

Texto completo da fonte
Resumo:
Ce travail de thèse s'inscrit dans le domaine de la vision robotique. Plus précisément nous nous sommes intéressés aux problèmes de l'asservissement visuel. L'asservissemnt visuel consiste à contrôler un système en utilisant des informations extraites des images fournies par une ou plusieurs caméras. Les techniques classiques sont basées sur la régulation à zéro de l'erreur entre les mesures courante et désirée. Ces méthodes se heurtent à des difficultés en particulier lorsque la configuration à atteindre est très éloignée de la configuration courante. Pour pallier ces difficultés, nous proposons le couplage d'une phase de planification de trajectoire des primitives visuelles dans l'image et d'une phase de suivi de trajectoires par asservissement visuel basé image. Nous proposons à cette fin, deux schémas de planification de trajectoires. La première méthode repose sur le formalisme de la commande optimale. Le principe du second schéma de planification est basé sur la méthode des fonctions de potentiel
Estilos ABNT, Harvard, Vancouver, APA, etc.
37

Roussel, Olivier. "Planification de mouvement pour tiges élastiques". Thesis, Toulouse 3, 2015. http://www.theses.fr/2015TOU30355/document.

Texto completo da fonte
Resumo:
Le problème de la planification du mouvement a été largement étudié dans le cas de corps rigides articulés mais peu de travaux considèrent les corps déformables. En particulier, les tiges élastiques telles que cables électriques, flexibles hydrauliques et pneumatiques, apparaissent dans de nombreux contextes industriels. Du fait d'une modélisation complexe et d'un grand nombre de degrés de liberté, l'extension des méthodes de planification de mouvement à de tels corps est un problème particulièrement difficile. En se basant sur les propriétés des configurations à l'équilibre statique, cette thèse propose plusieurs approches au problème de planification de mouvement pour des tiges élastiques
The motion planning problem has been broadly studied in the case of articulated rigid body systems but so far few work have considered deformable bodies. In particular, elastic rods such as electric cables, hydraulic or pneumatic hoses, appear in many industrial contexts. Due to complex models and high number of degrees of freedom, the extension of motion planning methods to such bodies is a difficult problem. By taking advantage of the properties of static equilibrium configurations, this thesis presents several approaches to the motion planning problem for elastic rods
Estilos ABNT, Harvard, Vancouver, APA, etc.
38

Vu, Thanh Tung. "Modèles spatiaux pour la planification cellulaire". Thesis, Paris, ENST, 2012. http://www.theses.fr/2012ENST0043/document.

Texto completo da fonte
Resumo:
Dans cette thèse, nous enrichissons et appliquons la théorie des processus de Poisson spatiaux pour résoudre certains problèmes issus de la conception et du déploiement des réseaux cellulaire. Cette thèse comporte deux parties principales. La première partie est consacrée à la résolution de quelques problèmes de dimensionnement et de couverture des réseaux cellulaires. Nous calculons la probabilité de surcharge de systèmes OFDMA grâce aux inégalités de concentration et aux développements d'Edgeworth, pour lesquels nous prouvons des bornes d'erreur explicites, et nous l'appliquons à résoudre un problème de dimensionnement. Nous calculons également la probabilité d'outage et le taux de handover pour un utilisateur typique. La seconde partie est consacrée à l'étude de différents modèles pour la consommation d'énergie dans les réseaux cellulaires. Dans le premier modèle, l'emplacement initial des utilisateurs forme un processus de Poisson ponctuel et à chaque utilisateur est associé un processus d'activité de type ON-OFF. Dans le second modèle, l'arrivée des utilisateurs constitue un processus de Poisson en espace et en temps, une dynamique connue sous le nom de dynamique de Glauber. Nous étudions également l'impact de la mobilité des utilisateurs en supposant que les utilisateurs se déplacent de manière aléatoire pendant leur séjour. Nous nous intéressons dans toutes ces situations, à la distribution de l'énergie consommée par une station de base. Cette énergie est divisée en deux parties: la partie additive et la partie diffusive. Nous obtenons des expressions analytiques pour les moments de la partie additive ainsi que la moyenne et la variance de l'énergie totale consommée. Nous trouvons une borne d'erreur pour l'approximation gaussienne de la partie additive. Nous prouvons que la mobilité des utilisateurs a un impact positif sur la consommation d'énergie. Il n'augmente ni ne réduit l'énergie consommée en moyenne, mais réduit sa variance à $0$ en régime de mobilité élevé. Nous caractérisons aussi le taux de convergence en fonction de la vitesse des utilisateurs
Nowadays, cellular technology is almost everywhere. It has had an explosive success over the last two decades and the volume of traffic will still increase in the near future. For this reason, it is also regarded as one cause of worldwide energy consumption, with high impact on carbon dioxide emission. On the other hand, new mathematical tools have enabled theconception of new models for cellular networks: one of these tools is stochastic geometry, or more particularly spatial Poisson point process. In the last decade, researchers have successfully used stochastic geometry to quantify outage probability, throughput or coverage of cellular networks by treating deployment of mobile stations or (and) base stations as Poisson point processes on a plane. These results also take into account to impact of mobility on the performance of such networks. In this thesis, we apply the theory of Poisson point process to solve some problems of cellular networks, in particular we analyze the energy consumption of cellular networks. This thesis has two main parts. The first part deals with some dimensioning and coverage problems in cellular network. We uses stochastic analysis to provide bounds for theoverload probability of OFDMA systems thanks to concentration inequalities and we apply it to solve a dimensioning problem. We also compute the outage probability and handover probability of a typical user. The second part is dedicated to introduce different models for energy consumption of cellular networks. In the first model, the initial location of users form a \PPP\ and each user is associated with an ON-OFF process of activity. In the second model, arrival of users forms a time-space \PPP. We also study the impact of mobility of users by assuming that users randomly move during its sojourn. We focus on the distribution of consumed energy by a base station. This consumed energy is divided into the additive part and the broadcast part. We obtain analytical expressions for the moments of the additive part as well as the mean and variance of the consumed energy. We are able to find an error bound for Gaussian approximation of the additive part. We prove that the mobility of users has a positive impact on the energy consumption. It does not increase or decrease the consumed energy in average but reduces its variance to zero in high mobility regime. We also characterize the convergent rate in function of user's speed
Estilos ABNT, Harvard, Vancouver, APA, etc.
39

Vu, Thanh Tung. "Modèles spatiaux pour la planification cellulaire". Electronic Thesis or Diss., Paris, ENST, 2012. http://www.theses.fr/2012ENST0043.

Texto completo da fonte
Resumo:
Dans cette thèse, nous enrichissons et appliquons la théorie des processus de Poisson spatiaux pour résoudre certains problèmes issus de la conception et du déploiement des réseaux cellulaire. Cette thèse comporte deux parties principales. La première partie est consacrée à la résolution de quelques problèmes de dimensionnement et de couverture des réseaux cellulaires. Nous calculons la probabilité de surcharge de systèmes OFDMA grâce aux inégalités de concentration et aux développements d'Edgeworth, pour lesquels nous prouvons des bornes d'erreur explicites, et nous l'appliquons à résoudre un problème de dimensionnement. Nous calculons également la probabilité d'outage et le taux de handover pour un utilisateur typique. La seconde partie est consacrée à l'étude de différents modèles pour la consommation d'énergie dans les réseaux cellulaires. Dans le premier modèle, l'emplacement initial des utilisateurs forme un processus de Poisson ponctuel et à chaque utilisateur est associé un processus d'activité de type ON-OFF. Dans le second modèle, l'arrivée des utilisateurs constitue un processus de Poisson en espace et en temps, une dynamique connue sous le nom de dynamique de Glauber. Nous étudions également l'impact de la mobilité des utilisateurs en supposant que les utilisateurs se déplacent de manière aléatoire pendant leur séjour. Nous nous intéressons dans toutes ces situations, à la distribution de l'énergie consommée par une station de base. Cette énergie est divisée en deux parties: la partie additive et la partie diffusive. Nous obtenons des expressions analytiques pour les moments de la partie additive ainsi que la moyenne et la variance de l'énergie totale consommée. Nous trouvons une borne d'erreur pour l'approximation gaussienne de la partie additive. Nous prouvons que la mobilité des utilisateurs a un impact positif sur la consommation d'énergie. Il n'augmente ni ne réduit l'énergie consommée en moyenne, mais réduit sa variance à 0 en régime de mobilité élevé. Nous caractérisons aussi le taux de convergence en fonction de la vitesse des utilisateurs
Nowadays, cellular technology is almost everywhere. It has had an explosive success over the last two decades and the volume of traffic will still increase in the near future. For this reason, it is also regarded as one cause of worldwide energy consumption, with high impact on carbon dioxide emission. On the other hand, new mathematical tools have enabled theconception of new models for cellular networks: one of these tools is stochastic geometry, or more particularly spatial Poisson point process. In the last decade, researchers have successfully used stochastic geometry to quantify outage probability, throughput or coverage of cellular networks by treating deployment of mobile stations or (and) base stations as Poisson point processes on a plane. These results also take into account to impact of mobility on the performance of such networks. In this thesis, we apply the theory of Poisson point process to solve some problems of cellular networks, in particular we analyze the energy consumption of cellular networks. This thesis has two main parts. The first part deals with some dimensioning and coverage problems in cellular network. We uses stochastic analysis to provide bounds for theoverload probability of OFDMA systems thanks to concentration inequalities and we apply it to solve a dimensioning problem. We also compute the outage probability and handover probability of a typical user. The second part is dedicated to introduce different models for energy consumption of cellular networks. In the first model, the initial location of users form a \PPP\ and each user is associated with an ON-OFF process of activity. In the second model, arrival of users forms a time-space \PPP. We also study the impact of mobility of users by assuming that users randomly move during its sojourn. We focus on the distribution of consumed energy by a base station. This consumed energy is divided into the additive part and the broadcast part. We obtain analytical expressions for the moments of the additive part as well as the mean and variance of the consumed energy. We are able to find an error bound for Gaussian approximation of the additive part. We prove that the mobility of users has a positive impact on the energy consumption. It does not increase or decrease the consumed energy in average but reduces its variance to zero in high mobility regime. We also characterize the convergent rate in function of user's speed
Estilos ABNT, Harvard, Vancouver, APA, etc.
40

Van, Grieken Milagros. "Optimisation pour l'apprentissage et apprentissage pour l'optimisation". Phd thesis, Université Paul Sabatier - Toulouse III, 2004. http://tel.archives-ouvertes.fr/tel-00010106.

Texto completo da fonte
Resumo:
Dans de nombreux problèmes industriels, une simple évaluation de la fonction objectif est coûteuse en temps de calcul et son gradient peut ne pas être disponible. Il est alors utile de construire un modèle, rapide à évaluer et facilement dérivable, qui approche le problème étudié. En apportant de nombreuses améliorations à l'apprentissage, nous avons montré que les réseaux de neurones peuvent répondre à ces exigences. En particulier, là où des méthodes neuronales classiques introduisent des oscillations pour approcher une fonction lisse,notre méthode donne un résultat satisfaisant. Mieux encore, notre méthode permet d'approcher des fonctions oscillantes (par exemple le résultat d'un programme entaché d'erreurs numériques), par un modèle lisse. Nous parvenons à ces résultats par le concours de nombreuses méthodes de régularisation : la méthode de Tikhonov, la stratégie d'arrêt de l'apprentissage, la taille du modèle et pour terminer l'utilisation de la méthode de Gauss-Newton (GN). Cette approche de régularisation permet en plus d'éviter les minima locaux (qui posent un serieux problème pour les méthodes classiques), en augmentant la taille du modèle pour assurer l'apprentissage et en la réduisant ensuite pour la régularisation. Pour les problèmes de grande taille, l'application de la méthode de Gauss-Newton est très " gourmande " en place mémoire. Cependant, en combinant les modes adjoint et direct de la différentiation automatique, nous avons proposé une implémentation " zéro-mémoire " qui nous permet d'appliquer cette méthode. Ce procéde, présenté dans le cadre des réseaux neuronaux peuvent, a priori, être adaptés à tout problème inverse. Dans le littérature récente, mais riche sur le sujet, les fonctions définies par un réseau neuronal classique sont optimisées par des techniques globales très coûuteuses. Dans notre cas, nous profitons des qualités du modèle obtenu (régularité, rapidité d'évaluation et disponibilité du gradient pour un coût supplémentaire négligeable) pour utiliser des méthodes d'optimisation efficaces. Nous illustrerons la pertinence de la méthode proposée par différents exemples académiques, reconnus par leur difficulté, et par des exemples issus de l'industrie automobile et l'ingénierie pétrolière.
Estilos ABNT, Harvard, Vancouver, APA, etc.
41

Pasquier, Michel. "Planification de trajectoires pour un robot manipulateur". Phd thesis, Grenoble INPG, 1989. http://tel.archives-ouvertes.fr/tel-00334461.

Texto completo da fonte
Resumo:
Cette thèse traite du problème fondamental que constitue la planification de trajectoires de robots manipulateurs. Une première partie précise le contexte robotique de notre travail et présente le système général de programmation automatique développe au Lifia. Nous analysons ensuite l'importance de la représentation des connaissances nécessaires aux raisonnements géométriques particuliers a la planification de déplacements. Les méthodes de modélisation et les concepts de représentation que nous avons mis en oeuvre sont ensuite présentes. Une deuxième partie traite de la planification de trajectoires pour une structure articulée. Une methode de planification globale par construction de l'espace des configurations est présentée, ainsi qu'une methode de replanification locale par application de champs de potentiels et, enfin, une methode hybride réalisant la synthèse de ces approches complémentaires, pour lesquelles sont décrits algorithmes, résultats d'expérimentation et futurs développements
Estilos ABNT, Harvard, Vancouver, APA, etc.
42

Gaborit, Paul. "Planification distribuée pour la coopération multi-agents". Phd thesis, Université Paul Sabatier - Toulouse III, 1996. http://tel.archives-ouvertes.fr/tel-00142562.

Texto completo da fonte
Resumo:
Permettre à plusieurs agents de planifier et de coordonner leurs activités de manière distribuée tel est l'objectif des travaux présentés dans ce mémoire. L'approche proposée s'appuie sur des opérateurs de composition de plans. Afin de gérer au mieux les interactions entre différents agents, leurs plans sont produits par IxTeT, un système de planification permettant la prise en compte de contraintes temporelles numériques et gérant le parallélisme des tâches ainsi que le partage de ressources. Les deux premiers chapitres décrivent le formalisme logique utilisé par IxTeT ainsi que le fonctionnement du planificateur lui-même et les améliorations qu'il est possible d'y apporter. Le troisième chapitre détaille alors formellement les méthodes et algorithmes permettant de réaliser des opérateurs de composition de plans: union de plans, insertion de nouveaux buts dans un plan existant. On y démontre leurs limites théoriques. Le quatrième chapitre décrit la mise en œuvre de ces opérateurs en exhibant des algorithmes tant pour améliorer les performances de la planification incrémentale mono-agent que pour réaliser un système distribué de planification multi-agents. Dans ce système, un plan global est élaboré par composition successive de plans individuels. Ce plan global reste implicite et n'est donc jamais centralisé. On présente ensuite les problèmes spécifiques rencontrés lorsque planification et exécution sont réalisées simultanément. Ces problèmes ouverts sont cruciaux dans un contexte multi-agents. Le document se termine par une illustration et une évaluation sur des exemples appliqués au domaine multi-robots permettant d'apprécier les avantages mais aussi les limites de l'utilisation de ces opérateurs de composition de plans et par une comparaison avec un autre système de planification distribuée.
Estilos ABNT, Harvard, Vancouver, APA, etc.
43

Maillot, Thibault. "Planification de trajectoire pour drones de combat". Phd thesis, Toulon, 2013. http://tel.archives-ouvertes.fr/tel-00954584.

Texto completo da fonte
Resumo:
L'objectif principal de ce travail est l'étude de la planification de trajectoires pour des drones de type HALE ou MALE. Les modèles cinématiques de ces drones sont étudiés. Les drones HALE sont modélisés par le système de Dubins. Pour les drones MALE, le modèle est construit en étudiant le repère cinématique du drone. Nous considérons les problèmes de planification de trajectoires point-point et point-pattern. Il s'agit, à partir de la position courante du drone, de rejoindre un point ou une figure prédéfinie dans l'espace. La planification point-point est abordée sous forme d'un problème de contrôle optimal. Deux méthodes sont proposées pour résoudre le problème point-pattern. D'abord nous présentons la synthèse en temps minimal pour le système de Dubins. Ensuite, nous développons une méthode basée sur le principe de LaSalle. La première méthode est utilisée au sein d'un algorithme de planification pour des drones HALE. La deuxième permet de stabiliser les deux types de drones considérés vers un pattern. Nous proposons une extension des algorithmes de planification développés, basée sur une discrétisation del'espace grâce aux graphes de Voronoï et une méthode de planification discrète, pour construire des trajectoiresdans des milieux encombrés. Nous étudions également le problème de couplage drone/capteur. Il s'agit de calculer une trajectoire permettant de satisfaire les objectifs du drone et de son capteur (une caméra). L'algorithme proposé est construit à partir de la résolution d'un problème quadratique sous contraintes.Dans une seconde partie, nous analysons un problème de contrôle optimal inverse. Celui-ci permet d'améliorer les résultats des méthodes de planification en s'inspirant du comportement des pilotes. Après avoir posé le problème, les résultats théoriques sont exposés et le cas particulier du système de Dubins est étudié en pratique.
Estilos ABNT, Harvard, Vancouver, APA, etc.
44

Chamaret, Blaise. "Outils de planification pour les réseaux cellulaires". Saint-Etienne, 1999. http://www.theses.fr/1999STET4002.

Texto completo da fonte
Resumo:
Dans le cadre de ma thèse, je me suis intéressé à deux problèmes d'optimisation combinatoire : le placement d'émetteurs / récepteurs pour les réseaux de radio-communication et l'allocation de fréquences pour ces mêmes réseaux. Ces deux problèmes peuvent être traités à l'aide d'outils issus de la théorie des graphes. Pour le placement d'émetteurs / récepteurs, j'ai utilisé une modélisation basée sur un graphe non orienté où les sommets représentent les émetteurs / récepteurs et les arêtes différentes règles d'interdiction. J'ai mis en place une méthode basée sur la recherche du stable maximum. Les algorithmes développés pour la recherche de solutions dites sous-optimales font partie des algorithmes heuristiques. Ce choix se justifie par le fait que le problème de la recherche du stable maximum pour la famille de graphes obtenus avec notre modélisation, est np-complet. Il n'existe donc pas d'algorithme exact permettant de résoudre le problème du stable maximum en temps polynomial. Les algorithmes heuristiques testés sont des algorithmes gloutons et génétiques. Ils utilisent les caractéristiques du problème de placement. Les résultats obtenus montrent que les algorithmes hybrides deviennent plus performants dès que le nombre de sommets dans le graphe initial augmente de façon significative (plusieurs centaines). En ce qui concerne le problème de l'allocation de fréquences, il peut être étudié comme un problème de partage de ressources. A la différence des problèmes de k-coloriage classiques, l'allocation de fréquences dans le cas particulier des réseaux de téléphonie mobile que j'ai étudiés, est un problème de multi-coloriage (plusieurs couleurs par sommet) avec contraintes. Ce problème étant aussi np-complet, je me suis orienté vers trois algorithmes. Le premier découle des résultats obtenus par l'algorithme glouton d'extraction de stables. Il décompose l'ensemble des sommets du graphe en k stables maximaux. Cette décomposition n'étant pas unique, l'algorithme essaie de construire celle qui contient le moins de stables. Le deuxième est un algorithme stochastique randomisé qui, partant d'un coloriage donné, essaie de diminuer le nombre de couleurs utilisées. Le dernier est un algorithme hybride parallèle travaillant avec une population divisée en ilots. Tous ces algorithmes produisent trois résultats : une borne supérieure pour le nombre chromatique, un coloriage et l'empan de l'ensemble des fréquences utilisées. Le nombre chromatique n'est pas suffisant pour juger d'un résultat de multi-coloriage avec contraintes. J'ai confronté les résultats obtenus par optimisations successives des deux problèmes (placement puis allocation) aux résultats issus d'un processus global d'optimisation
Estilos ABNT, Harvard, Vancouver, APA, etc.
45

Jauberthie, Carine. "Méthodologies de planification d'expériences pour systèmes dynamiques". Compiègne, 2002. http://www.theses.fr/2002COMP1434.

Texto completo da fonte
Resumo:
Avant d’estimer les paramètres d’un système dynamique contrôlé, linéaire ou non linéaire à partir de données expérimentales, il faut s’assurer de l’existence et de l’unicité de ces paramètres. Deux chapitres sont consacrés à cette notion. Le premier s’adresse à des systèmes à équations différentielles ordinaires, le second porte sur les systèmes à retards. Nous présentons certaines des définitions de la littérature et les méthodes qui leur sont associées. La recherche d’identifiabilité des systèmes à retards peut s’effectuer en approchant ce système soit par sa forme linéralisée soit en approchant les fonctions à retards. On étudie alors l’identifiabilité du système approché. Nous nous attachons ensuite à l’optimisation d’essais, ce qui consiste à sélectionner les conditions d’expériences les plus sensibilisantes pour améliorer les mesures utilisées en estimation. Pour cela, nous avons crée un logiciel et en expliquons la démarche, fondée dans sa première partie, sur la programmation dynamique puis, dans sa seconde partie sur un algorithme de gradient. Pour finir, nous proposons deux techniques d’estimation de paramètres fondées sur des pondérations d’un critère des moindres carrés. L’une consiste à utiliser la connaissance sur les bruits de mesure, supposés gaussiens de covariance connue, l’autre n’utilise pas les bruits de mesure mais consiste à calculer les matrices de pondération via des inégalités matricielles affines (LMI).
Estilos ABNT, Harvard, Vancouver, APA, etc.
46

Bounab, Belkacem. "Planification de prises pour la manipulation robotisée". Toulouse 3, 2011. http://thesesups.ups-tlse.fr/1532/.

Texto completo da fonte
Resumo:
Cette thèse propose une nouvelle approche pour l'analyse des prises. En se basant sur la théorie de l'axe central du torseur des forces de contact, nous avons développé une nouvelle condition nécessaire et suffisante pour qu'une prise soit en fermeture de force (force-closure). Pour le cas des prises planes à n points de contact, nous avons proposé une nouvelle méthode géométrique pour le test de la force-closure. Cet algorithme graphique est basé sur des calculs géométriques simples qui permettent de réduire d'une manière significative le coût de calcul par rapport aux schémas linéaires. En outre, une nouvelle formulation linéaire est proposée pour le test et la caractérisation d'une prise à n points de contact. Cet algorithme présente l'avantage d'être très simple du point de vue implémentation et rapide du point de vue temps de calcul. Afin de valider l'approche proposée, nous l'avons comparée avec les algorithmes basés sur le calcul de l'enveloppe convexe des torseurs primitifs de contact. Des implémentations de cet algorithme sont effectuées dans le démonstrateur ``Move3d'' du LAAS ainsi que dans le simulateur ``GraspIt''. Nous abordons ensuite la synthèse de prises qui définissent une force-closure. En premier lieu, nous avons proposé la formulation du problème de recherche de la configuration des points de contact assurant un maximum de stabilité de l'objet comme étant un problème d'optimisation sous contraintes. En second lieu, pour les prises robotisées, nous avons présenté une approche pour la recherche des prises stables d'objets 3D. Le planificateur de prises proposé permet de générer des prises faisables sans passer par le calcul de la cinématique inverse de la main mécanique. Cette approche exploite, sans aucune transformation géométrique, les modèles CAO des objets à saisir pour minimiser le temps de recherche des prises. Ce planificateur de prises utilise un algorithme de résolution basé sur la technique d'optimisation stochastique du recuit simulé. Cette méthode nous a permis de synthétiser des prises de bonne qualité d'objets complexes même dans des environnements encombrés d'obstacles. Pour illustrer l'efficacité de la démarche proposée, nous avons présenté des implémentations dans l'environnement de simulation ``GraspIt''
This thesis proposes a new approach for grasp analysis. Based on the theory of central axes of grasp wrench, we developed a new necessary and sufficient condition for n-finger grasps to achieve force-closure property. For n-finger planar grasps, we proposed a new graphical method for testing force-closure of arbitrary planar objects. The proposed geometric algorithm is very simple and requires low computational complexity. Thus, it can be used in real-time implementations and reduce significantly the computational cost compared to linear programming schemes. Further, based on friction-cone linearization, we formalized quantitative test of planar and spatial n-fingered force-closure grasps as a new linear programming problem. The proposed quantitative force-closure test offers a good metric of quality measurement without need to compute the convex hull of the primitive contact wrenches, which efficiently reduces the amount of computational time. Implementations were performed on ``Move3D'' and ``GraspIt'' simulation environments. For grasp synthesis, we formulated the computation of fingertips locations problem as an optimization problem under constraints. Furthermore, we presented an approach for finding appropriate stable grasps for a robotic hand on arbitrary objects. We used simulated annealing technique to synthesize suboptimal grasps of 3D objects. Through numerical simulations on arbitrary shaped objects, we showed that the proposed approach is able to compute good grasps for multifingered hands within reasonable computational time. The proposed grasp planner was implemented on ``GraspIt'' simulator
Estilos ABNT, Harvard, Vancouver, APA, etc.
47

Pasquier, Michel Laugier Christian Fonlupt Jean. "Planification de trajectoires pour un robot manipulateur". S.l. : Université Grenoble 1, 2008. http://tel.archives-ouvertes.fr/tel-00334461.

Texto completo da fonte
Estilos ABNT, Harvard, Vancouver, APA, etc.
48

Menif, Alexandre. "Planification d'actions hiérarchique pour la simulation tactique". Thesis, Paris Sciences et Lettres (ComUE), 2017. http://www.theses.fr/2017PSLED004/document.

Texto completo da fonte
Resumo:
Cette thèse explore l'application de la planification HTN afin d'animer une section d'infanterie dans un simulateur informatique temps réel. Afin de produire des plans en ligne pour près de 40 soldats, on montre qu'il est possible d'optimiser le planificateur pour un domaine HTN en compilant les éléments de planifications en structures statiques et en procédures C++. On montre ensuite que la structure du problème se prête à une combinaison de la planification HTN avec la planification par abstraction, obtenue en modélisant des effets abstraits aux tâches composées. Sous certaines conditions, la recherche de solutions est alors accélérée en détectant les réseaux de tâches pour lesquels aucune solution n'est exécutable. Enfin, on montre que la structure du problème permet aussi de formuler des fonctions d'évaluation exploitables dans un algorithme de recherche heuristique non admissible, capable de retourner rapidement des solutions presque optimales
This thesis explores the application of HTN planning to the animation of an infantry platoon in a real-time simulation software. In order to achieve online planning for nearly 40 soldiers, we show that it is possible to optimize the planner for one HTN domain with a compilation of planning elements into C++ static structures and procedures. Then, we demonstrate that the problem structure lends itself to a combination of HTN planning with abstraction planning, achieved with the modelisation of abstract effects for compound tasks. In some conditions, we can detect those task networks that never lead to any executable solution, and therefore improve the search. Eventually, we show that the problem structure enables to formulate evaluation functions that can be input into a non admissible heuristic search algorithm, and that near optimal solutions can be obtained within a short run-time
Estilos ABNT, Harvard, Vancouver, APA, etc.
49

Hima, Salim. "Planification de trajectoire pour des dirigeables autonomes". Evry-Val d'Essonne, 2005. http://www.theses.fr/2005EVRY0031.

Texto completo da fonte
Resumo:
Les travaux principaux présentés dans cette thèse traitent de la planification de trajectoire pour les dirigeables autonomes. Dans la première partie, nous exposons une synthèse du modèle mathématique régissant le mouvement des dirigeables. La deuxième partie est consacrée au problème de caractérisation de trajectoires admissibles. Le choix est fait sur les trajectoires élémentaires d’équilibre (TEEs), qui occupent une place importante en aviation. Nous avons proposé un algorithme permettant de calculer les TEEs optimales en énergie pour des missions de longue durée. La troisième partie consiste à formuler le problème de planification sous forme d’un automate hybride appelé Automate de mouvement. Les nœuds de cet automate correspondent aux TEEs tandis que les arêtes correspondent aux manœuvres de transition entre les TEEs. Une analyse de la commandabilité de l’automate est possible en exploitant les propriétés des TEEs. Dans ce contexte, la trajectoire nominale est le résultat d’une concaténation d’un nombre fini de primitives
The main work in this thesis deals with the problem of trajectory planning for autonomous airships. In the first part, we exposed a mathematical model governing the motion of the airships. The second part is devoted to characterization of admissible trajectories. The choice is made on the trim trajectories, which occupy a particular place in aviation applications. We proposed an algorithm that allows the calculation of the trim minimizing energy, suitable for long duration missions. The third part consists in formulating the problem of planning in a Hybrid Automata form named Motion automata. Its nodes are represented by trim trajectories, while its edges correspond to transitions maneuvres between trim’s. Analysing controllability of motion automaton is possible by exploiting the properties of trim trajectories. In this context, nominal trajectory is given by concatenating a finite number of primitives
Estilos ABNT, Harvard, Vancouver, APA, etc.
50

Cros, Hervé. "Compilation et apprentissage dans les réseaux de contraintes". Montpellier 2, 2003. http://www.theses.fr/2003MON20171.

Texto completo da fonte
Estilos ABNT, Harvard, Vancouver, APA, etc.
Oferecemos descontos em todos os planos premium para autores cujas obras estão incluídas em seleções literárias temáticas. Contate-nos para obter um código promocional único!

Vá para a bibliografia