Academic literature on the topic 'Transport optimal en champ moyen'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Transport optimal en champ moyen.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Transport optimal en champ moyen"

1

Lasry, Jean-Michel, and Pierre-Louis Lions. "Jeux à champ moyen. II – Horizon fini et contrôle optimal." Comptes Rendus Mathematique 343, no. 10 (November 2006): 679–84. http://dx.doi.org/10.1016/j.crma.2006.09.018.

Full text
APA, Harvard, Vancouver, ISO, and other styles
2

Mounirou, Moustapha Maman. "Effet comparé de la fertilisation à base de biochar, engrais organique et engrais chimique sur les éléments minéraux et la production de l’oignon (Allium cepa L.)." European Scientific Journal, ESJ 18, no. 24 (July 31, 2022): 47. http://dx.doi.org/10.19044/esj.2022.v18n24p47.

Full text
Abstract:
Au cours des dernières décennies, il y a de plus en plus des études universitaires sur l'importance du biochar. Ce dernier constitue un moyen efficace pour la valorisation des déchets agricoles et forestiers. Cette étude qui s’inscrit dans le même contexte a pour objectif principal de déterminer les effets combinés du fumier de chèvre (FC, 5 t ha-1) et de son biochar (BC 10 t ha-1) sur l'efficacité d'utilisation des engrais chimiques (EC) sous différents ratios (100%, 50% et 0%), avec la variété d’oignon Metan 88. Pour ce faire, des essais ont été conduits en plein champ, dans le Centre de Recherche Horticole (CRH Ayas) de l’Université d'Ankara. En effet, le dispositif expérimental est un bloc complet randomisé comportant douze (12) traitements en quatre (4) répétitions, soit quarante-huit (48) parcelles. Les différentes mesures et analyses effectuées ont permis la détermination des paramètres tels que ; le poids frais et sec, le rendement total, la chlorophylle relative, l’acide ascorbique, ainsi que les concentrations des N, P, K, Ca, Mg, Fe, Zn, Cu et Mn. Les résultats obtenus ont montré que le rendement total de l'oignon a augmenté de manière significative avec l'application du biochar, du fumier ainsi que leur combinaison. Tous les traitements d'engrais organiques et inorganiques ont considérablement augmenté les concentrations en N, P et K respectivement 38,8, 2,81 et 42,2 g Kg-1 par rapport aux témoins 33,8, 2,32 et 35,6 g Kg-1. Les concentrations en Ca et Mg respectivement 7,31 et 6,69 g kg-1 ont été augmentées avec l'engrais organique par rapport aux témoins 6,43 et 5,10 g kg-1. Le Biochar et le fumier ont donné la concentration la plus élevée de chlorophylle relative avec 297 et 294 respectivement. En conclusion , la combinaison du BC+FC a permis d’obtenir une croissance optimale de l’oignon. In recent decades, numerous academic studies were carried out in order to determine the importance of biochar. The latter constitutes an effective means for valuing the agricultural and forestry waste. The main objective of the present study was to determine the combined effects of goat manure (GM, 5 t ha-1) and its biochar (BC 10 t ha-1) on use efficiency of chemical fertilizers (CF) in different ratios (100%, 50% and 0%), in the Metan 88 variety of onion. The , trials were carried out in the open field at the Horticultural Research Center at Ankara University. The experimental device is a complete randomized block comprising twelve (12) treatments in four (4) repetitions, forty-eight (48) plots. The various measurements and analyses carried out allowed the determination of parameters such as fresh and dry weight, total yield, relative chlorophyll, ascorbic acid, the concentrations of N, P, K, Ca, Mg, Fe, Zn, Cu and Mn, as well . The obtained results showed that the total yield of onion increased significantly with biochar, manure as well as their combination. All organic and inorganic fertilizer treatments significantly increased N, P and K concentrations 38.8, 2.81 and 42.2 g Kg-1 respectively compared to controls 33.8, 2.32 and 35, 6g Kg-1. As for the concentrations of Ca and Mg 7.31 and 6.69 g kg-1 they were increased with the organic fertilizer compared to the controls 6.43 and 5.10 g kg-1 respectively.. Biochar and manure gave the highest concentration of relative chlorophyll with 297 and 294 respectively. Inconclusion , the combination of BC + CF resulted in optimal onion growth.
APA, Harvard, Vancouver, ISO, and other styles
3

Aziza Sahar, Ben, and Toumi Salwa. "A probabilistic numerical method for a class of mean field games." Stochastics and Dynamics, November 30, 2021. http://dx.doi.org/10.1142/s0219493722500083.

Full text
Abstract:
The Mean Field Games PDEs system is at the heart of the Mean Field Games theory initiated by [J.-M. Lasry and P.-L. Lions, Jeux à champ moyen. I–le cas stationnaire, C. R. Math. 343 (2006) 619–625; J.-M. Lasry and P.-L. Lions, Jeux à champ moyen. II–horizon fini et contrôle optimal, C. R. Math. 343 (2006) 679–684; J.-M. Lasry and P.-L. Lions, Mean field games, Jpn. J. Math. 2 (2007) 229–260] which constitutes a seminal contribution to the modeling and analysis of games with a large number of players. We propose here a numerical method of resolution of such systems based on the construction of a discrete mean field game where the controlled state-variable is a Markov chain approximating the controlled stochastic differential equation [H. Kushner and P. G. Dupuis, Numerical Methods for Stochastic Control Problems in Continuous Time, Stochastic Modeling and Applied Probability, Vol. 24 (Springer Science & Business Media, 2013)]. In particular, existence and uniqueness properties of the discrete MFG are investigated with convergence results under adequate assumptions.
APA, Harvard, Vancouver, ISO, and other styles
4

Zerguini, Seghir, and Michel Savy. "The value of the reliability of hauling time in freight rail transportation." Les Cahiers Scientifiques du Transport - Scientific Papers in Transportation 58 | 2010 (November 30, 2010). http://dx.doi.org/10.46298/cst.12102.

Full text
Abstract:
The efficiency of freight transport is measured as more and more in the respect for the commitments concluded with the customer in terms of "quality". This quality of service we can express it as the respect for the agreed, between the carrier and the shipper, of arrival time of the goods instead of the destination. The objective of this research is to develop indicators that characterize the reliability of travel times, quantified from the available data and develop a methodology to assess the gains from investments in infrastructures and equipments, or management strategies working to improve the reliability of rail transport. The first section of this paper aims to analyze the literature, data collection, definition of concepts and performance analysis of existing rail system. The second section formulates a model of time cost that takes into account the time variability of shipping and the safety margin (that can add the carrier or the shipper to the average time of transport to face the possible chances). The last section determines the optimal theoretical safety margin that minimizes the cost of time and evaluates the impact on the economic calculation of transport projects when taking into account the variability of travel time. Le succès d’un service de transport de marchandises se mesure de plus en plus au respect des engagements conclus avec le client en termes de « qualité ». Cette qualité de service s’exprime comme le bon respect des heures convenues, entre le transporteur et le chargeur, d’arrivée de la marchandise au lieu de sa destination. L’objectif de la recherche est de définir des indicateurs caractérisant la fiabilité des durées de trajet, de les quantifier à partir des données disponibles et de mettre au point une méthodologie permettant d’évaluer les gains engendrés par des actions, des stratégies ou des investissements œuvrant à l’amélioration de la fiabilité du transport ferroviaire. La première phase a pour but l’analyse de la littérature, la collecte de données, la définition des concepts et l’analyse des performances actuelles du système ferroviaire. La seconde phase consiste à formuler un modèle de coût du temps qui prend en compte la variabilité des temps de transport des marchandises et la marge de temps de précaution (temps de sécurité que peut rajouter le transporteur ou le chargeur au temps moyen de transport pour faire face aux éventuels aléas). La dernière phase a pour but de déterminer la marge de précaution optimale qui minimise le coût du temps et d’évaluer les conséquences sur le calcul de la rentabilité économique lorsqu’on prend en compte la variabilité des temps de transport.
APA, Harvard, Vancouver, ISO, and other styles

Dissertations / Theses on the topic "Transport optimal en champ moyen"

1

Bolley, François Villani Cédric. "Applications du transport optimal à des problèmes de limites de champ moyen." [S.l.] : [s.n.], 2005. http://tel.ccsd.cnrs.fr/tel-00011462.

Full text
APA, Harvard, Vancouver, ISO, and other styles
2

Bolley, François. "Applications du transport optimal à des problèmes de limites de champ moyen." Phd thesis, Ecole normale supérieure de lyon - ENS LYON, 2005. http://tel.archives-ouvertes.fr/tel-00011462.

Full text
Abstract:
Nous étudions des méthodes d'approximation particulaire de solutions d'équations aux dérivées partielles décrivant l'état macroscopique de certains systèmes physiques. Elles consistent en l'introduction d'un grand nombre N de particules fictives évoluant selon des équations différentielles couplées, ordinaires ou stochastiques, dans un sens plus simple à résoudre que l'équation macroscopique; l'état de ce système de particules est décrit par une mesure de probabilité, dite mesure empirique. La validité de la méthode est donnée par la convergence, quand N tend vers l'infini, de cette mesure empirique vers la solution macroscopique originale, appelée limite de champ moyen. Nous cherchons principalement à en donner des estimations explicites, quantifiant ainsi la précision de l'approximation.

Dans ce cadre nous étudions l'approximation des équations de transport de Vlasov et d'Euler par des systèmes de particules déterministes en interaction. Le problème de la convergence de la méthode se ramène à un problème de stabilité de solutions que nous traitons par des propriétés de type contraction pour des distances (de Wasserstein) liées à la théorie du transport optimal de mesures. Nous établissons aussi une propriété analogue de contraction pour des lois de conservation scalaires.

Nous étudions également l'approximation d'équations de diffusion de McKean-Vlasov par des systèmes de particules stochastiques. Nous en donnons l'erreur de manière quantitative à l'aide de techniques de couplage, d'estimations de propagation du chaos et d'inégalités de concentration ou de déviation.

De façon plus systématique nous nous intéressons à de telles inégalités de concentration pour des mesures de probabilité et à leurs relations avec des inégalités de transport (liant distances de Wasserstein et entropie) et de Sobolev logarithmiques. En particulier nous établissons de telles inégalités pour certaines classes de lois de variables dépendantes.
APA, Harvard, Vancouver, ISO, and other styles
3

Mészáros, Alpár Richárd. "Density constraints in optimal transport, PDEs and mean field games." Thesis, Paris 11, 2015. http://www.theses.fr/2015PA112155/document.

Full text
Abstract:
Movité par des questions posées par F. Santambrogio, cette thèse est dédiée à l'étude de jeux à champ moyen et des modèles impliquant le transport optimal avec contraintes de densité. A fin d'étudier des modèles de MFG d'ordre deux dans l'esprit des travaux de F. Santambrogio, on introduit en tant que brique élementaire un modèle diffusif de mouvement de foule avec contraintes de densité (en généralisant dans une sense les travaux de Maury et al.). Le modèle est décrit par l'évolutions de la densité de la foule, qui peut être vu comme une courbe dans l'espace de Wasserstein. Du point de vu EDP, ça correspond à une équation de Fokker-Planck modifiée, avec un terme supplémentaire, le gradient d'une pression (seulement dans la zone saturée) dans le drift. En passant par l'équation duale et en utilisant des estimations paraboliques bien connues, on démontre l'unicité du pair densité et pression. Motivé initialement par l'algorithm de splitting (utilisé dans le résultat d'existence ci-dessus), on étudie des propriétés fines de la projection de Wasserstein en dessous d'un seuil donné. Intégrant cette question dans une classe plus grande de problèmes impliquant le transport optimal, on démontre des estimations BV pour les optimiseurs. D'autres applications possibles (en transport partiel, optimisation de forme et problèmes paraboliques dégénérés) de ces estimations BV sont également discutées.En changeant le point de vu, on étudie également des modèles de MFG variationnels avec contraintes de densité. Dans ce sens, les systèmes de MFG sont obtenus comme conditions d'optimalité de premier ordre pour deux problèmes convexes en dualité. Dans ces systèmes un terme additionnel apparaît, interpreté comme un prix à payer quand les agents passent dans des zones saturées. Premièrement, en profitant des résultats de régularité elliptique, on montre l'existence et la caractérisation de solutions des MFG de deuxième ordre stationnaires avec contraintes de densité. Comme résultat additionnel, on caractérise le sous-différentiel d'une fonctionnelle introduite par Benamou-Brenier pour donner une formulation dynamique du problème de transport optimal. Deuxièmement, (basé sur une technique de pénalisation) on montre qu'une classe de systèmes de MFG de premier ordre avec contraintes de densité est bien posée. Une connexion inattendu avec les équations d'Euler incompressible à la Brenier est égalment donnée
Motivated by some questions raised by F. Santambrogio, this thesis is devoted to the study of Mean Field Games and models involving optimal transport with density constraints. To study second order MFG models in the spirit of the work of F. Santambrogio, as a possible first step we introduce and show the well-posedness of a diffusive crowd motion model with density constraints (generalizing in some sense the works by B. Maury et al.). The model is described by the evolution of the people's density, that can be seen as a curve in the Wasserstein space. From the PDE point of view, this corresponds to a modified Fokker-Planck equation, with an additional gradient of a pressure (only living in the saturated zone) in the drift. We provide a uniqueness result for the pair density and pressure by passing through the dual equation and using some well-known parabolic estimates. Initially motivated by the splitting algorithm (used for the above existence result), we study some fine properties of the Wasserstein projection below a given threshold. Embedding this question into a larger class of variational problems involving optimal transport, we show BV estimates for the optimizers. Other possible applications (for partial optimal transport, shape optimization and degenerate parabolic problems) of these BV estimates are also discussed.Changing the point of view, we also study variational Mean Field Game models with density constraints. In this sense, the MFG systems are obtained as first order optimality conditions of two convex problems in duality. In these systems an additional term appears, interpreted as a price to be paid when agents pass through saturated zones. Firstly, profiting from the regularity results of elliptic PDEs, we give the existence and characterization of the solutions of stationary second order MFGs with density constraints. As a byproduct we characterize the subdifferential of a convex functional introduced initially by Benamou-Brenier to give a dynamic formulation of the optimal transport problem. Secondly, (based on a penalization technique) we prove the well-posedness of a class of first order evolutive MFG systems with density constraints. An unexpected connection with the incompressible Euler's equations à la Brenier is also given
APA, Harvard, Vancouver, ISO, and other styles
4

Lachapelle, Aimé. "Quelques problèmes de transport et de contrôle en économie : aspects théoriques et numériques." Phd thesis, Paris 9, 2010. http://www.theses.fr/2010PA090031.

Full text
Abstract:
Dans cette thèse on explore l’utilisation du contrôle optimal et du transport de masse pour la modélisation économique. Nous saisissons ainsi l’occasion de réunir plusieurs travaux faisant intervenir ces deux outils, parfois en interactions l’un avec l’autre. Dans un premier temps nous présentons brièvement la récente théorie des jeux à champ moyen introduite par Lasry et Lions et nous concentrons sur le point de vue du contrôle de l’équation de Fokker-Planck. Nous exploitons cet aspect à la fois pour obtenir des résultats d’existence d’équilibres et pour développer des méthodes numériques de résolution. Nous testons les algorithmes dans deux cas complémentaires à savoir le cadre convexe (aversion à la foule, dynamiques à deux populations) et le cadre concave (attraction, externalités et effets d’échelle dans un modèle stylisé de transition technologique). Dans un second temps, nous étudions un problème de matching mêlant tranport optimal et contrôle optimal. Le planificateur cherche un couplage optimal, fixé pour une période donnée (engagement), étant donné que les marges évoluent (éventuellement aléatoirement) de façon contrôlée. Enfin, nous reformulons un problème de partage de risque entre d agents (pour lequel nous prouvons un résultat d’existence) en un problème de contrôle optimal avec contraintes de comonotonie; ceci nous permet d’obtenir des conditions d’optimalité à l’aide desquelles nous construisons un algorithme simple et convergent
In this thesis we explore some uses of optimal control and mass transport in economic modeling. We thus catch the opportunity to bring together some works involving both tools, sometimes mixing them. First, we briefly present the recent mean field games theory introduced by Lasry & Lions and focus on the optimal control of Fokker-Planck setting. We take advantage of this aspect in order to obtain both existence results and numerical methods to approximate solutions. We test the algorithms on two complementary settings, namely the convex setting (crowd aversion, two populations dynamics) and the concave one (attraction, externalities and scale effect for a stylized technology switch model). Secondly, we study matching problems com- bining optimal transport and optimal control. The planner looks for an optimal coupling, fixed during the considered time period (commitment), knowing that the marginals evolve (possibly randomly) and that she can control the evolution. Finally we reformulate a risk-sharing problem between d agents (for whose we prove an existence result) into an optimal control problem with comonotonic constraints. This enables us to write optimality conditions that we use to build a simple convergent algorithm
APA, Harvard, Vancouver, ISO, and other styles
5

Lachapelle, Aimé. "Quelques problèmes de transport et de contrôle en économie : aspects théoriques et numériques." Phd thesis, Université Paris Dauphine - Paris IX, 2010. http://tel.archives-ouvertes.fr/tel-00512404.

Full text
Abstract:
Dans cette thèse on explore l'utilisation du contrôle optimal et du transport de masse pour la modélisation économique. Nous saisissons ainsi l'occasion de réunir plusieurs travaux faisant intervenir ces deux outils, parfois en interactions l'un avec l'autre. Dans un premier temps nous présentons brièvement la récente théorie des jeux à champ moyen introduite par Lasry et Lions et nous concentrons sur le point de vue du contrôle de l'équation de Fokker-Planck. Nous exploitons cet aspect à la fois pour obtenir des résultats d'existence d'équilibres et pour développer des méthodes numériques de résolution. Nous testons les algorithmes dans deux cas complémentaires à savoir le cadre convexe (aversion à la foule, dynamiques à deux populations) et le cadre concave (attraction, externalités et effets d'échelle dans un modèle stylisé de transition technologique). Dans un second temps, nous étudions un problème de matching mêlant transport optimal et contrôle optimal. Le planificateur cherche un couplage optimal, fixé pour une période donnée (engagement), étant donné que les marges évoluent (éventuellement aléatoirement) de façon contrôlée. Enfin, nous reformulons un problème de partage de risque entre d agents (pour lequel nous prouvons un résultat d'existence) en un problème de contrôle optimal avec contraintes de comonotonie; ceci nous permet d'obtenir des conditions d'optimalité à l'aide desquelles nous construisons un algorithme simple et convergent.
APA, Harvard, Vancouver, ISO, and other styles
6

Frénais, Brieuc. "Modèles stochastiques de branchement-sélection." Electronic Thesis or Diss., Strasbourg, 2024. http://www.theses.fr/2024STRAD033.

Full text
Abstract:
L'objet central de cette thèse est un système de particules se déplaçant sur la droite réelle et soumises à des règles de branchement et de sélection, appelé N-processus de Markov branchant, qui généralise le N-mouvement brownien branchant étudié par Maillard en autorisant des trajectoires plus générales pour les particules. Nos principaux résultats établissent sous certaines hypothèses de régularité l'existence d'une limite hydrodynamique pour ce système de particule, qui est la fonction de répartition de la loi du processus sous-jacent conditionné à ne pas avoir franchi une certaine frontière, caractérisée comme solution d'un problème inverse du premier temps de passage. La démonstration repose sur un couplage avec des processus auxiliaires, construit en exploitant une hypothèse de monotonie stochastique du processus sous-jacent. En parallèle, nous abordons un problème de transport optimal en champ moyen sous un angle numérique. Nous développons trois méthodes d'apprentissage profond pour obtenir des solutions approchées, mises en œuvre sur divers cas tests, illustrant l'efficacité des approches proposées
The central object of this thesis is a system of particles moving on the real line and subject to branching and selection rules, called N-branching Markov process, which generalizes the N-branching Brownian motion studied by Maillard, by allowing more general trajectories for the particles. Our main results establish under certain regularity assumptions the existence of a hydrodynamic limit for this particle system, which is the c.d.f. of the distribution of the underlying process conditioned on not having crossed a certain boundary, characterized as the solution of an inverse first-passage time problem. The proof relies on a coupling with auxiliary processes, constructed by exploiting an assumption of stochastic monotonicity on the underlying process. In parallel, we consider the mean field optimal transport problem with a numerical point of view. We develop three deep learning methods to obtain approximate solutions, implemented on various test cases, illustrating the effectiveness of the proposed approaches
APA, Harvard, Vancouver, ISO, and other styles
7

Bonnet, Benoît. "Optimal control in Wasserstein spaces." Electronic Thesis or Diss., Aix-Marseille, 2019. http://www.theses.fr/2019AIXM0442.

Full text
Abstract:
Une vaste quantité d'outils mathématiques permettant la modélisation et l'analyse des problèmes multi-agents ont récemment été développés dans le cadre de la théorie du transport optimal. Dans cette thèse, nous étendons pour la première fois plusieurs de ces concepts à des problématiques issues de la théorie du contrôle. Nous démontrons plusieurs résultats sur ce sujet, notamment des conditions nécessaires d'optimalité de type Pontryagin dans les espaces de Wasserstein, des conditions assurant la régularité intrinsèque de solutions optimales, des conditions suffisantes pour l'émergence de différents motifs, ainsi qu'un résultat auxiliaire à propos des arrangements de certaines singularités en géométrie sous-Riemannienne
A wealth of mathematical tools allowing to model and analyse multi-agent systems has been brought forth as a consequence of recent developments in optimal transport theory. In this thesis, we extend for the first time several of these concepts to the framework of control theory. We prove several results on this topic, including Pontryagin optimality necessary conditions in Wasserstein spaces, intrinsic regularity properties of optimal solutions, sufficient conditions for different kinds of pattern formation, and an auxiliary result pertaining to singularity arrangements in Sub-Riemannian geometry
APA, Harvard, Vancouver, ISO, and other styles
8

Hadikhanloo, Saeed. "Apprentissage dans les jeux à champ moyen." Thesis, Paris Sciences et Lettres (ComUE), 2018. http://www.theses.fr/2018PSLED001/document.

Full text
Abstract:
Les jeux à champ moyen (MFG) sont une classe de jeux différentiels dans lequel chaque agent est infinitésimal et interagit avec une énorme population d'agents. Dans cette thèse, nous soulevons la question de la formation effective de l'équilibre MFG. En effet, le jeu étant très complexe, il est irréaliste de supposer que les agents peuvent réellement calculer la configuration d'équilibre. Cela semble indiquer que si la configuration d'équilibre se présente, c'est parce que les agents ont appris à jouer au jeu. Donc, la question principale est de trouver des procédures d'apprentissage dans les jeux à champ moyen et d'analyser leurs convergences vers un équilibre. Nous nous sommes inspirés par des schémas d'apprentissage dans les jeux statiques et avons essayé de les appliquer à notre modèle dynamique de MFG. Nous nous concentrons particulièrement sur les applications de fictitious play et online mirror descent sur différents types de jeux de champs moyens : Potentiel, Monotone ou Discret
Mean Field Games (MFG) are a class of differential games in which each agent is infinitesimal and interacts with a huge population of other agents. In this thesis, we raise the question of the actual formation of the MFG equilibrium. Indeed, the game being quite involved, it is unrealistic to assume that the agents can compute the equilibrium configuration. This seems to indicate that, if the equilibrium configuration arises, it is because the agents have learned how to play the game. Hence the main question is to find learning procedures in mean field games and investigating if they converge to an equilibrium. We have inspired from the learning schemes in static games and tried to apply them to our dynamical model of MFG. We especially focus on fictitious play and online mirror descent applications on different types of mean field games; those are either Potential, Monotone or Discrete
APA, Harvard, Vancouver, ISO, and other styles
9

Zorkot, Ahmad. "Approximation de jeux à champ moyen." Electronic Thesis or Diss., Limoges, 2024. http://www.theses.fr/2024LIMO0026.

Full text
Abstract:
L’objectif de la théorie des jeux à champ moyen est d’étudier une classe de jeux différentiels (déterministes ou stochastiques) comportant un grand nombre de joueurs. Étant donné que très peu de jeux à champ moyen admettent des solutions explicites, les méthodes numériques jouent un rôle essentiel dans la description quantitative, mais aussi qualitative, des équilibres de Nash associés. Cette thèse se concentrera sur des techniques numériques utilisées pour résoudre diverses classes de jeux à champ moyen
The purpose of the theory of mean field games is to study a class of differential games (deterministic or stochastic) with a large number of agents. Since very few mean field games admit explicit solutions, numerical methods play an essential role in describing quantitatively, and also qualitatively, the associated Nash equilibria. This thesis is focused on numerical techniques to solve several types of mean field game problems
APA, Harvard, Vancouver, ISO, and other styles
10

Vasileiadis, Athanasios. "Apprentissage par renforcement à champ moyen : une perspective de contrôle optimal." Electronic Thesis or Diss., Université Côte d'Azur, 2024. http://www.theses.fr/2024COAZ5005.

Full text
Abstract:
L'apprentissage par renforcement est un paradigme clé de l'apprentissage machine, dont l'objectif est d'inciter les agents à tirer les leçons de leur propre expérience passée afin qu'ils s'améliorent au fil du temps, voir par exemple la monographie [14]. À cet égard, les systèmes impliquant un grand nombre d'agents sont importants pour les applications, mais restent difficiles à traiter du point de vue numérique, voir par exemple le récent post [12]. Le renforcement de l'apprentissage avec plusieurs agents est généralement appelé "apprentissage de renforcement multi-agents" (MARL). Comme démontré dans la publication antérieure [15], cela peut couvrir diverses situations avec des agents opérant individuellement ou collectivement. L'analyse de l'apprentissage par renforcement s'appuie fortement sur les outils mathématiques de la théorie du contrôle et de la théorie des jeux. Tout comme les MARL, les deux peuvent également être confrontés à des difficultés lorsque la dimension augmente. Cela a incité plusieurs auteurs à mettre en œuvre une approche champ moyen, issue de la physique statistique, afin de réduire la complexité globale, voir entre autres les travaux fondateurs de Lasry and Lions [9] et de Huang, Caines et Malhame [7] et les deux monographies [3, 4] sur les jeux à champ moyen et le contrôle champ moyen. L'objectif du doctorat sera de mettre en œuvre une approche similaire de la gestion des MARL. L'idée a été étudiée, au moins pour les agents individuels, dans plusieurs documents récents, voir [8, 10, 13, 16]. Dans ces derniers, non seulement l'approche champ moyen permet de réduire la complexité de façon significative, mais elle fournit également des solutions distribuées (ou décentralisées), qui sont d'une grande utilité pratique. La mise en œuvre numérique est principalement abordée dans [13, 16]. Le lien avec les notions d'apprentissage dans la théorie des jeux est cité dans [10], sur la base d'idées antérieures, voir [2]. La première partie de la thèse consistera à revisiter les travaux existants. Cela demandera en particulier une analyse soigneuse de la stabilité portant à la fois sur le passage d'un système fini d'agents à un système infini et sur l'utilisation de stratégies approximatives (au lieu de stratégies exactes). À la lumière de [2], on peut s'attendre à ce que la monotonie joue un rôle dans l'analyse globale ; une autre orientation, mais plus prospective, consiste à discuter de l'influence d'un environnement stochastique sur le comportement des algorithmes eux-mêmes. Une autre partie de la thèse sera consacrée au cas de la coopération, voir par exemple [5], dont l'analyse s'appuiera sur la théorie du contrôle en champ moyen. Comme mentionné dans [13], des structures potentielles peuvent permettre de faire le lien entre les cas individuel et coopératif ; comme démontré dans [11], ces liens jouent un rôle dans la construction de politiques incitatives
The goal of the PhD will be to implement a similar mean field approach to handle MARL. This idea was investigated, at least for individual agents, in several recent papers. In all of them, not only Mean field approach to MARL (Multi Agent Reinforcement Learning) does the mean field approach allow for a significant decrease of complexity, but it also provides distributed (or decentralized) solutions, which are of a very convenient use in practice. Numerical implementation using either on-or off-policy learning is discussed in the literature. The first part of the thesis will consist in revisiting the former works from a mathematical point of view. In particular, this will ask for a careful stability analysis addressing both the passage from a finite to an infinite system of agents and the use of approximated (instead of exact) policies. We may expect monotonicity to play a key role in the overall analysis; another, but more prospective, direction is to discuss the influence of a stochastic environment onto the behavior of the algorithms themselves. Another part of the thesis will be dedicated to the cooperative case the analysis of which will rely upon mean field control theory. Potential structures may allow to make the connection between individual and cooperative cases. The connection between the two may indeed play an important role for incentive design or, equivalently, for mimicking a cooperative system with individual agents. In this regard, connection with distributional reinforcement learning, may be an interesting question as well
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography