Gotowa bibliografia na temat „Environnement non stationnaire”

Utwórz poprawne odniesienie w stylach APA, MLA, Chicago, Harvard i wielu innych

Wybierz rodzaj źródła:

Zobacz listy aktualnych artykułów, książek, rozpraw, streszczeń i innych źródeł naukowych na temat „Environnement non stationnaire”.

Przycisk „Dodaj do bibliografii” jest dostępny obok każdej pracy w bibliografii. Użyj go – a my automatycznie utworzymy odniesienie bibliograficzne do wybranej pracy w stylu cytowania, którego potrzebujesz: APA, MLA, Harvard, Chicago, Vancouver itp.

Możesz również pobrać pełny tekst publikacji naukowej w formacie „.pdf” i przeczytać adnotację do pracy online, jeśli odpowiednie parametry są dostępne w metadanych.

Artykuły w czasopismach na temat "Environnement non stationnaire"

1

SAYED MOUCHAWEH, Moamar. "Apprentissage dynamique dans un environnement non-stationnaire". Technologies logicielles Architectures des systèmes, sierpień 2014. http://dx.doi.org/10.51257/a-v1-h3125.

Pełny tekst źródła
Style APA, Harvard, Vancouver, ISO itp.

Rozprawy doktorskie na temat "Environnement non stationnaire"

1

Honeine, Paul. "Méthodes à noyau pour l'analyse et la décision en environnement non-stationnaire". Troyes, 2007. http://www.theses.fr/2007TROY0018.

Pełny tekst źródła
Streszczenie:
Ce mémoire de thèse propose un nouveau cadre pour l’analyse et la décision en environnement non-stationnaire et en situation de pénurie d’information statistique, par une fertilisation croisée des domaines de l’analyse temps-fréquence, du traitement adaptatif du signal et de la reconnaissance des formes par méthodes à noyau. On introduit un cadre générale pour bénéficier des plus récents développements des méthodes à noyau dans le domaine temps-fréquence, grâce à un choix approprié de noyau reproduisant. On l’illustre par l’analyse en composantes principales dans ce domaine, avant d’étendre le spectre aux méthodes de classification de signaux telles que les Support Vector Machines. On montre que notre approche permet la sélection d’une représentation temps-fréquence adaptée à la résolution d’un problème de classification de signaux, grâce au critère d’alignement noyau-cible. Confronté à un environnement non-stationnaire et dynamique, un apprentissage en-ligne peut s’avérer incontournable. Les méthodes à noyau n’apportant hélas pas de réponse satisfaisante, on présente une méthode reposant sur un critère inspiré de la littérature relative à l’approximation parcimonieuse : la cohérence d’un dictionnaire de fonctions. Au-delà des nombreuses propriétés de cette grandeur que l’on étudie, cette approche permet un contrôle efficace de l’ordre du modèle avec un coût calculatoire extrêmement réduit. On l’applique dans un cadre général de méthodes adaptatives pour l’identification de systèmes non-linéaires et non-stationnaires
This PhD thesis offers a new framework for the analysis and decision-making in a non-stationary environment in the lack of statistical information, on a crossroad of three disciplines : Time-frequency analysis, adaptive signal processing and pattern recognition with kernel machines. We derive a broad framework to take advantage of recent developments in kernel machines for the time-frequency domain, by an appropriate choice of the reproducing kernel. We study the implementation of the principal component analysis on this domain, before extending its scope to signal classification methods such as Fisher discriminant analysis and Support Vector Machines. We carry out with the problem of selecting and turning a representation for a given classification task, which can take advantage of a new criterion initially developed for selecting the reproducing kernel : the kernel-target alignment. Online learning is essential in a non-stationary and dynamic environment. While kernel machines fail in treating such problems, we propose a new method leading to reduced order models based on a criterion inspired from the sparse functional approximation community : the coherence of a dictionary of functions. Beyond the properties of this parameter that we derive for kernel machines, this notion yields efficient models with extremely low computational complexity. We apply it for online kernel algorithms such as principal component analysis. We also consider a broader class of adaptive methods for nonlinear and non-stationary system identification
Style APA, Harvard, Vancouver, ISO itp.
2

He, Xiyan. "Sélection d'espaces de représentation pour la décision en environnement non-stationnaire : application à la segmentation d'images texturées". Troyes, 2009. http://www.theses.fr/2009TROY0027.

Pełny tekst źródła
Streszczenie:
L'objectif de cette thèse est d'améliorer ou de préserver les performances d'un système de décision en présence de bruit our de non stationnarité sur les mesures. L'approche proposée consiste à fragmenter l'espace de représentation initial en un ensemble de sous-espaces, puis à prendre la décision à l'aide des sous-espaces qui ne sont pas affectés par les non stationnarités (on parlera alors d'espaces homogènes). Pour cela, nous avons proposé trois approches pour sélectionner des sous-espaces homogènes issus de l'espace initial. L'une, reposant sur un ensemble de classifieurs des PPV, associée à une heuristique visant à sélectionner les sous-espaces générés aléatoirement à partir de l'espace initial. La seconde est basée sur le même principe que la première, mais le mode de génération des sous-espaces n'est plus aléatoire, il se fait via une version adaptée de LASSO. Enfin, nous avons étudié une méthode de sélection de sous-espaces de représentation homogènes via one-class SVM. La segmentation d'images texturées constitue une application tout à fait appropriée pour illustrer nos méthodes et évaluer leurs performances. Les résultats obtenus attestent de la pertinence des approches que nous avons proposées. Nos travaux se sont limités à l'étude des problèmes à deux classes
The objectif of this thesis is to improve or preserve the performance of a decision système in the presence of noise, loss of information or feature non-stationarity. The proposed method consists in first generating an ensemble of feature subspaces from the initial full-dimensional space, and then making the decision by usins only the subspaces which are supposed to be immune to the non-stationary disturbance (we call these subspaces as homogenous subspaces). Based on this idea, we propose three different approaches to make the system decision by using an ensemble of carefully constructed homogenous subspaces. The first approach uses an ensemble of NN classifiers, combined with a heuristic strategy targeting to select the so-called homogeneous feature subspaces among a large number of subspaces that are randomly generated from the initial space. The second approach follows the same principle; however, the geenration of the subspaces is no longer a random process, but is accomplished by using a modified and adaptive LASSO algorithm. Finally, in the third approach, the homogeneous feature subspace selection and the decision are realized by using one-class SVMs. The textured image segmentation constitutes an appropriate application for the evalution of the proposed approaches. The obtained experimental results demonstrate the effectiveness of the three decision systems that we have developed. Finally, it is worthwhile pointing out that all the work presented in this thesis is limited to the two-class classification problem
Style APA, Harvard, Vancouver, ISO itp.
3

Aklil, Nassim. "Apprentissage actif sous contrainte de budget en robotique et en neurosciences computationnelles. Localisation robotique et modélisation comportementale en environnement non stationnaire". Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066225/document.

Pełny tekst źródła
Streszczenie:
La prise de décision est un domaine très étudié en sciences, que ce soit en neurosciences pour comprendre les processus sous tendant la prise de décision chez les animaux, qu’en robotique pour modéliser des processus de prise de décision efficaces et rapides dans des tâches en environnement réel. En neurosciences, ce problème est résolu online avec des modèles de prises de décision séquentiels basés sur l’apprentissage par renforcement. En robotique, l’objectif premier est l’efficacité, dans le but d’être déployés en environnement réel. Cependant en robotique ce que l’on peut appeler le budget et qui concerne les limitations inhérentes au matériel, comme les temps de calculs, les actions limitées disponibles au robot ou la durée de vie de la batterie du robot, ne sont souvent pas prises en compte à l’heure actuelle. Nous nous proposons dans ce travail de thèse d’introduire la notion de budget comme contrainte explicite dans les processus d’apprentissage robotique appliqués à une tâche de localisation en mettant en place un modèle basé sur des travaux développés en apprentissage statistique qui traitent les données sous contrainte de budget, en limitant l’apport en données ou en posant une contrainte de temps plus explicite. Dans le but d’envisager un fonctionnement online de ce type d’algorithmes d’apprentissage budgétisé, nous discutons aussi certaines inspirations possibles qui pourraient être prises du côté des neurosciences computationnelles. Dans ce cadre, l’alternance entre recherche d’information pour la localisation et la décision de se déplacer pour un robot peuvent être indirectement liés à la notion de compromis exploration-exploitation. Nous présentons notre contribution à la modélisation de ce compromis chez l’animal dans une tâche non stationnaire impliquant différents niveaux d’incertitude, et faisons le lien avec les méthodes de bandits manchot
Decision-making is a highly researched field in science, be it in neuroscience to understand the processes underlying animal decision-making, or in robotics to model efficient and rapid decision-making processes in real environments. In neuroscience, this problem is resolved online with sequential decision-making models based on reinforcement learning. In robotics, the primary objective is efficiency, in order to be deployed in real environments. However, in robotics what can be called the budget and which concerns the limitations inherent to the hardware, such as computation times, limited actions available to the robot or the lifetime of the robot battery, are often not taken into account at the present time. We propose in this thesis to introduce the notion of budget as an explicit constraint in the robotic learning processes applied to a localization task by implementing a model based on work developed in statistical learning that processes data under explicit constraints, limiting the input of data or imposing a more explicit time constraint. In order to discuss an online functioning of this type of budgeted learning algorithms, we also discuss some possible inspirations that could be taken on the side of computational neuroscience. In this context, the alternation between information retrieval for location and the decision to move for a robot may be indirectly linked to the notion of exploration-exploitation compromise. We present our contribution to the modeling of this compromise in animals in a non-stationary task involving different levels of uncertainty, and we make the link with the methods of multi-armed bandits
Style APA, Harvard, Vancouver, ISO itp.
4

Alami, Réda. "Bandits à Mémoire pour la prise de décision en environnement dynamique. Application à l'optimisation des réseaux de télécommunications". Electronic Thesis or Diss., université Paris-Saclay, 2021. http://www.theses.fr/2021UPASG063.

Pełny tekst źródła
Streszczenie:
Dans cette thèse de doctorat, nous étudions le problème du bandit manchot non stationnaire où le comportement de non-stationnarité de l'environnement est caractérisé par plusieurs changements brusques appelés "points de changement". Nous proposons les bandits à mémoire : une combinaison entre un algorithme pour le bandit manchot stochastique et le détecteur Bayésien de point de changement. L'analyse de ce dernier a toujours été un problème ouvert dans la communauté de la théorie statistique et de l'apprentissage séquentiel. Pour cette raison, nous dérivons une variante du détecteur Bayésien de point de changement qui est plus facile à analyser mathématiquement en termes de taux de fausses alarmes et de délai de détection (qui sont les critères les plus courants pour la détection de point de changement). Ensuite, nous introduisons le problème d'exploration décentralisée dans le cadre du bandit manchot où un ensemble de joueurs collaborent pour identifier le meilleur bras en interagissant de manière asynchrone avec le même environnement stochastique. Nous proposons une première solution générique appelée élimination décentralisée qui utilise n'importe quel algorithme d'identification du meilleur bras comme sous-programme avec la garantie que l'algorithme assure la confidentialité, avec un faible coût de communication. Enfin, nous effectuons une évaluation des stratégies de bandit manchot dans deux contextes différents de réseaux de télécommunications. Tout d'abord, dans le contexte LoRaWAN (Long Range Wide Area Network), nous proposons d'utiliser des algorithmes de bandit manchot à la place de l'algorithme par défaut qui porte le nom d’ADR (Adaptive Data Rate) afin de minimiser la consommation d'énergie et les pertes de paquets des terminaux. Ensuite, dans le contexte IEEE 802.15.4-TSCH, nous effectuons une évaluation de 9 algorithmes de bandits manchot afin de sélectionner ceux qui choisissent les canaux les plus performants, en utilisant les données collectées via la plateforme FIT IoT-LAB. L'évaluation des performances suggère que notre proposition peut améliorer considérablement le taux de livraison des paquets par rapport à la procédure TSCH par défaut, augmentant ainsi la fiabilité et l'efficacité énergétique des transmissions
In this PhD thesis, we study the non-stationary multi-armed bandit problem where the non-stationarity behavior of the environment is characterized by several abrupt changes called "change-points". We propose Memory Bandits: a combination between an algorithm for the stochastic multi-armed bandit and the Bayesian Online Change-Point Detector (BOCPD). The analysis of the latter has always been an open problem in the statistical and sequential learning theory community. For this reason, we derive a variant of the Bayesian Online Change-point detector which is easier to mathematically analyze in term of false alarm rateand detection delay (which are the most common criteria for online change-point detection). Then, we introduce the decentralized exploration problem in the multi-armed bandit paradigm where a set of players collaborate to identify the best arm by asynchronously interacting with the same stochastic environment. We propose a first generic solution called decentralized elimination: which uses any best arm identification algorithm as a subroutine with the guar-antee that the algorithm ensures privacy, with a low communication cost. Finally, we perform an evaluation of the multi-armed bandit strategies in two different context of telecommunication networks. First, in LoRaWAN (Long Range Wide Area Network) context, we propose to use multi-armed bandit algorithms instead of the default algorithm ADR (Adaptive Data Rate) in order to minimize the energy consumption and the packet losses of end-devices. Then, in a IEEE 802.15.4-TSCH context, we perform an evaluation of 9 multi-armed bandit algorithms in order to select the ones that choose high-performance channels, using data collected through the FIT IoT-LAB platform. The performance evaluation suggests that our proposal can significantly improve the packet delivery ratio compared to the default TSCH operation, thereby increasing the reliability and the energy efficiency of the transmissions
Style APA, Harvard, Vancouver, ISO itp.
5

Ngo, Ho Anh Khoi. "Méthodes de classifications dynamiques et incrémentales : application à la numérisation cognitive d'images de documents". Thesis, Tours, 2015. http://www.theses.fr/2015TOUR4006/document.

Pełny tekst źródła
Streszczenie:
Cette thèse s’intéresse à la problématique de la classification dynamique en environnements stationnaires et non stationnaires, tolérante aux variations de quantités des données d’apprentissage et capable d’ajuster ses modèles selon la variabilité des données entrantes. Pour cela, nous proposons une solution faisant cohabiter des classificateurs one-class SVM indépendants ayant chacun leur propre procédure d’apprentissage incrémentale et par conséquent, ne subissant pas d’influences croisées pouvant émaner de la configuration des modèles des autres classificateurs. L’originalité de notre proposition repose sur l’exploitation des anciennes connaissances conservées dans les modèles de SVM (historique propre à chaque SVM représenté par l’ensemble des vecteurs supports trouvés) et leur combinaison avec les connaissances apportées par les nouvelles données au moment de leur arrivée. Le modèle de classification proposé (mOC-iSVM) sera exploité à travers trois variations exploitant chacune différemment l’historique des modèles. Notre contribution s’inscrit dans un état de l’art ne proposant pas à ce jour de solutions permettant de traiter à la fois la dérive de concepts, l’ajout ou la suppression de concepts, la fusion ou division de concepts, tout en offrant un cadre privilégié d’interactions avec l’utilisateur. Dans le cadre du projet ANR DIGIDOC, notre approche a été appliquée sur plusieurs scénarios de classification de flux d’images pouvant survenir dans des cas réels lors de campagnes de numérisation. Ces scénarios ont permis de valider une exploitation interactive de notre solution de classification incrémentale pour classifier des images arrivant en flux afin d’améliorer la qualité des images numérisées
This research contributes to the field of dynamic learning and classification in case of stationary and non-stationary environments. The goal of this PhD is to define a new classification framework able to deal with very small learning dataset at the beginning of the process and with abilities to adjust itself according to the variability of the incoming data inside a stream. For that purpose, we propose a solution based on a combination of independent one-class SVM classifiers having each one their own incremental learning procedure. Consequently, each classifier is not sensitive to crossed influences which can emanate from the configuration of the models of the other classifiers. The originality of our proposal comes from the use of the former knowledge kept in the SVM models (represented by all the found support vectors) and its combination with the new data coming incrementally from the stream. The proposed classification model (mOC-iSVM) is exploited through three variations in the way of using the existing models at each step of time. Our contribution states in a state of the art where no solution is proposed today to handle at the same time, the concept drift, the addition or the deletion of concepts, the fusion or division of concepts while offering a privileged solution for interaction with the user. Inside the DIGIDOC project, our approach was applied to several scenarios of classification of images streams which can correspond to real cases in digitalization projects. These different scenarios allow validating an interactive exploitation of our solution of incremental classification to classify images coming in a stream in order to improve the quality of the digitized images
Style APA, Harvard, Vancouver, ISO itp.
6

El, Bouchikhi El Houssin. "Sur l'estimation spectrale paramétrique pour la détection des défauts dans les machines asynchrones en environnements stationnaire et non stationnaire". Phd thesis, Université de Bretagne occidentale - Brest, 2013. http://tel.archives-ouvertes.fr/tel-01019643.

Pełny tekst źródła
Streszczenie:
Ce travail de thèse traite de la détection et du diagnostic des défaillances par analyse du courant statorique dans les entraînements mécaniques à base de machine asynchrone. En se basant sur des travaux ultérieurs un modèle du signal en présence de défaut est présenté. Pour estimer les paramètres du modèle, nous proposons une technique statistique basée sur le Maximum de Vraisemblance et une approche basée sur les sous-espaces signal/bruit. Ces techniques ont été développées pour analyser des courants statoriques dans le cas stationnaire et non-stationnaire. Ces techniques permettent de révéler la présence d'une défaillance et de mesurer sa sévérité. Les résultats de simulation sur des signaux issus d'un modèle de la machine asynchrone, basé sur les circuits électriques magnétiquement couplés, permettent de valider les méthodes de détection proposées et démontre l'intérêt des techniques afin d'extraire de façon automatique un indicateur de défaut. L'étude est complétée par une validation expérimentale sur des signaux issus d'un banc expérimental pour la détection des défauts de roulement.
Style APA, Harvard, Vancouver, ISO itp.
7

Deloux, Estelle. "POLITIQUES DE MAINTENANCE CONDITIONNELLE POUR UN SYSTEME A DEGRADATION CONTINUE SOUMIS A UN ENVIRONNEMENT STRESSANT". Phd thesis, Université de Nantes, 2008. http://tel.archives-ouvertes.fr/tel-00348191.

Pełny tekst źródła
Streszczenie:
L'un des challenges de l'optimisation de la maintenance est la production de modèles décisionnels conjuguant performance au niveau stratégique et au niveau opérationnel. Une hypothèse classique est de considérer que le niveau de dégradation du système peut être modélisé par un processus stochastique particulier caractérisé en régime stationnaire sans tenir compte des effets de l'environnement d'exploitation du système. Cette hypothèse peut être vue comme un des facteurs entraînant des écarts entre les performances attendues et celles mesurées. Par contre, de nombreux travaux sont développés dans le cadre de la fiabilité pour l'intégration de l'impact de l'environnement. L'objectif de ce manuscrit est de développer des outils d'aide à la décision de maintenance pour des systèmes à dégradation graduelle évoluant dans un environnement aléatoire stressant. Nous proposons différentes modélisations de l'environnement et de son impact sachant qu'il peut influencer soit la défaillance du système, soit le processus de dégradation. Nous explicitons les relations mutuelles entre l'environnement et le processus de dégradation et nous construisons différentes politiques de maintenance adaptatives qui se basent sur l'état de dégradation du système mais également sur l'évolution de l'environnement. De plus, les politiques proposées permettent de se baser soit uniquement sur une connaissance a priori du système, soit d'intégrer l'information disponible en ligne concernant l'environnement. Nous chercherons dans ce manuscrit à proposer de nouvelles approches de maintenance combinant performances théoriques attendues d'un côté et réalité et pragmatisme opérationnels d'un autre.
Style APA, Harvard, Vancouver, ISO itp.
8

Hadoux, Emmanuel. "Markovian sequential decision-making in non-stationary environments : application to argumentative debates". Thesis, Paris 6, 2015. http://www.theses.fr/2015PA066489/document.

Pełny tekst źródła
Streszczenie:
Les problèmes de décision séquentielle dans l’incertain requièrent qu’un agent prenne des décisions, les unes après les autres, en fonction de l’état de l’environnement dans lequel il se trouve. Dans la plupart des travaux, l’environnement dans lequel évolue l’agent est supposé stationnaire, c’est-à-dire qu’il n’évolue pas avec le temps. Toute- fois, l’hypothèse de stationnarité peut ne pas être vérifiée quand, par exemple, des évènements exogènes au problème interviennent. Dans cette thèse, nous nous intéressons à la prise de décision séquentielle dans des environnements non-stationnaires. Nous proposons un nouveau modèle appelé HS3MDP permettant de représenter les problèmes non-stationnaires dont les dynamiques évoluent parmi un ensemble fini de contextes. Afin de résoudre efficacement ces problèmes, nous adaptons l’algorithme POMCP aux HS3MDP. Dans le but d’apprendre les dynamiques des problèmes de cette classe, nous présentons RLCD avec SCD, une méthode utilisable sans connaître à priori le nombre de contextes. Nous explorons ensuite le domaine de l’argumentation où peu de travaux se sont intéressés à la décision séquentielle. Nous étudions deux types de problèmes : les débats stochastiques (APS ) et les problèmes de médiation face à des agents non-stationnaires (DMP). Nous présentons dans ce travail un modèle formalisant les APS et permettant de les transformer en MOMDP afin d’optimiser la séquence d’arguments d’un des agents du débat. Nous étendons cette modélisation aux DMP afin de permettre à un médiateur de répartir stratégiquement la parole dans un débat
In sequential decision-making problems under uncertainty, an agent makes decisions, one after another, considering the current state of the environment where she evolves. In most work, the environment the agent evolves in is assumed to be stationary, i.e., its dynamics do not change over time. However, the stationarity hypothesis can be invalid if, for instance, exogenous events can occur. In this document, we are interested in sequential decision-making in non-stationary environments. We propose a new model named HS3MDP, allowing us to represent non-stationary problems whose dynamics evolve among a finite set of contexts. In order to efficiently solve those problems, we adapt the POMCP algorithm to HS3MDPs. We also present RLCD with SCD, a new method to learn the dynamics of the environments, without knowing a priori the number of contexts. We then explore the field of argumentation problems, where few works consider sequential decision-making. We address two types of problems: stochastic debates (APS ) and mediation problems with non-stationary agents (DMP). In this work, we present a model formalizing APS and allowing us to transform them into an MOMDP in order to optimize the sequence of arguments of one agent in the debate. We then extend this model to DMPs to allow a mediator to strategically organize speak-turns in a debate
Style APA, Harvard, Vancouver, ISO itp.
9

Hadoux, Emmanuel. "Markovian sequential decision-making in non-stationary environments : application to argumentative debates". Electronic Thesis or Diss., Paris 6, 2015. http://www.theses.fr/2015PA066489.

Pełny tekst źródła
Streszczenie:
Les problèmes de décision séquentielle dans l’incertain requièrent qu’un agent prenne des décisions, les unes après les autres, en fonction de l’état de l’environnement dans lequel il se trouve. Dans la plupart des travaux, l’environnement dans lequel évolue l’agent est supposé stationnaire, c’est-à-dire qu’il n’évolue pas avec le temps. Toute- fois, l’hypothèse de stationnarité peut ne pas être vérifiée quand, par exemple, des évènements exogènes au problème interviennent. Dans cette thèse, nous nous intéressons à la prise de décision séquentielle dans des environnements non-stationnaires. Nous proposons un nouveau modèle appelé HS3MDP permettant de représenter les problèmes non-stationnaires dont les dynamiques évoluent parmi un ensemble fini de contextes. Afin de résoudre efficacement ces problèmes, nous adaptons l’algorithme POMCP aux HS3MDP. Dans le but d’apprendre les dynamiques des problèmes de cette classe, nous présentons RLCD avec SCD, une méthode utilisable sans connaître à priori le nombre de contextes. Nous explorons ensuite le domaine de l’argumentation où peu de travaux se sont intéressés à la décision séquentielle. Nous étudions deux types de problèmes : les débats stochastiques (APS ) et les problèmes de médiation face à des agents non-stationnaires (DMP). Nous présentons dans ce travail un modèle formalisant les APS et permettant de les transformer en MOMDP afin d’optimiser la séquence d’arguments d’un des agents du débat. Nous étendons cette modélisation aux DMP afin de permettre à un médiateur de répartir stratégiquement la parole dans un débat
In sequential decision-making problems under uncertainty, an agent makes decisions, one after another, considering the current state of the environment where she evolves. In most work, the environment the agent evolves in is assumed to be stationary, i.e., its dynamics do not change over time. However, the stationarity hypothesis can be invalid if, for instance, exogenous events can occur. In this document, we are interested in sequential decision-making in non-stationary environments. We propose a new model named HS3MDP, allowing us to represent non-stationary problems whose dynamics evolve among a finite set of contexts. In order to efficiently solve those problems, we adapt the POMCP algorithm to HS3MDPs. We also present RLCD with SCD, a new method to learn the dynamics of the environments, without knowing a priori the number of contexts. We then explore the field of argumentation problems, where few works consider sequential decision-making. We address two types of problems: stochastic debates (APS ) and mediation problems with non-stationary agents (DMP). In this work, we present a model formalizing APS and allowing us to transform them into an MOMDP in order to optimize the sequence of arguments of one agent in the debate. We then extend this model to DMPs to allow a mediator to strategically organize speak-turns in a debate
Style APA, Harvard, Vancouver, ISO itp.
Oferujemy zniżki na wszystkie plany premium dla autorów, których prace zostały uwzględnione w tematycznych zestawieniach literatury. Skontaktuj się z nami, aby uzyskać unikalny kod promocyjny!

Do bibliografii