Um die anderen Arten von Veröffentlichungen zu diesem Thema anzuzeigen, folgen Sie diesem Link: Distances de Wasserstein.

Dissertationen zum Thema „Distances de Wasserstein“

Geben Sie eine Quelle nach APA, MLA, Chicago, Harvard und anderen Zitierweisen an

Wählen Sie eine Art der Quelle aus:

Machen Sie sich mit Top-49 Dissertationen für die Forschung zum Thema "Distances de Wasserstein" bekannt.

Neben jedem Werk im Literaturverzeichnis ist die Option "Zur Bibliographie hinzufügen" verfügbar. Nutzen Sie sie, wird Ihre bibliographische Angabe des gewählten Werkes nach der nötigen Zitierweise (APA, MLA, Harvard, Chicago, Vancouver usw.) automatisch gestaltet.

Sie können auch den vollen Text der wissenschaftlichen Publikation im PDF-Format herunterladen und eine Online-Annotation der Arbeit lesen, wenn die relevanten Parameter in den Metadaten verfügbar sind.

Sehen Sie die Dissertationen für verschiedene Spezialgebieten durch und erstellen Sie Ihre Bibliographie auf korrekte Weise.

1

Boissard, Emmanuel. „Problèmes d'interaction discret-continu et distances de Wasserstein“. Toulouse 3, 2011. http://thesesups.ups-tlse.fr/1389/.

Der volle Inhalt der Quelle
Annotation:
On étudie dans ce manuscrit plusieurs problèmes d'approximation à l'aide des outils de la théorie du transport optimal. Les distances de Wasserstein fournissent des bornes d'erreur pour l'approximation particulaire des solutions de certaines équations aux dérivées partielles. Elles jouent également le rôle de mesures de distorsion naturelles dans les problèmes de quantification et de partitionnement ("clustering"). Un problème associé à ces questions est d'étudier la vitesse de convergence dans la loi des grands nombres empirique pour cette distorsion. La première partie de cette thèse établit des bornes non-asymptotiques, en particulier dans des espaces de Banach de dimension infinie, ainsi que dans les cas où les observations sont non-indépendantes. La seconde partie est consacrée à l'étude de deux modèles issus de la modélisation des déplacements de populations d'animaux. On introduit un nouveau modèle individu-centré de formation de pistes de fourmis, que l'on étudie expérimentalement à travers des simulations numériques et une représentation en terme d'équations cinétiques. On étudie également une variante du modèle de Cucker-Smale de mouvement d'une nuée d'oiseaux : on montre le caractère bien posé de l'équation de transport de type Vlasov associée, et on établit des résultats sur le comportement en temps long de cette équation. Enfin, dans une troisième partie, on étudie certaines applications statistiques de la notion de barycentre dans l'espace des mesures de probabilités muni de la distance de Wasserstein, récemment introduite par M. Agueh et G. Carlier
We study several problems of approximation using tools from Optimal Transportation theory. The family of Wasserstein metrics are used to provide error bounds for particular approximation of some Partial Differential Equations. They also come into play as natural measures of distorsion for quantization and clustering problems. A problem related to these questions is to estimate the speed of convergence in the empirical law of large numbers for these distorsions. The first part of this thesis provides non-asymptotic bounds, notably in infinite-dimensional Banach spaces, as well as in cases where independence is removed. The second part is dedicated to the study of two models from the modelling of animal displacement. A new individual-based model for ant trail formation is introduced, and studied through numerical simulations and kinetic formulation. We also study a variant of the Cucker-Smale model of bird flock motion : we establish well-posedness of the associated Vlasov-type transport equation as well as long-time behaviour results. In a third part, we study some statistical applications of the notion of barycenter in Wasserstein space recently introduced by M. Agueh and G. Carlier
APA, Harvard, Vancouver, ISO und andere Zitierweisen
2

Fernandes, Montesuma Eduardo. „Multi-Source Domain Adaptation through Wasserstein Barycenters“. Electronic Thesis or Diss., université Paris-Saclay, 2024. http://www.theses.fr/2024UPASG045.

Der volle Inhalt der Quelle
Annotation:
Les systèmes d'apprentissage automatique fonctionnent sous l'hypothèse que les conditions d'entraînement et de test ne changent pas. Néanmoins, cette hypothèse est rarement vérifiée en pratique. En conséquence, le système est entraîné avec des données qui ne sont plus représentatives des données sur lesquelles il sera testé : la mesure de probabilité des données évolue entre les périodes d'entraînement et de test. Ce scénario est connu dans la littérature sous le nom de décalage de distribution entre deux domaines : une source et une cible. Une généralisation évidente de ce problème considère que les données d'entraînement présentent elles-mêmes plusieurs décalages intrinsèques. On parle, donc, d'adaptation de domaine à sources multiples (MSDA). Dans ce contexte, le transport optimal est un outil de mathématique utile. En particulier, qui sert pour comparer et manipuler des mesures de probabilité. Cette thèse étudie les contributions du transport optimal à l'adaptation de domaines à sources multiples. Nous le faisons à travers des barycentres de Wasserstein, un objet qui définit une moyenne pondérée, dans l'espace des mesures de probabilité, des multiples domaines en MSDA. Basé sur ce concept, nous proposons : (i) une nouvelle notion de barycentre lorsque les mesures en question sont étiquetées, (ii) un nouveau problème d'apprentissage de dictionnaire sur des mesures de probabilité empiriques et (iii) de nouveaux outils pour l'adaptation de domaines via le transport optimal de modèles de mélanges Gaussiens. Nos méthodes améliorent les performances de l'adaptation de domaines par rapport aux méthodes existantes utilisant le transport optimal sur des benchmarks d'images et de diagnostic de défauts inter-domaines. Notre travail ouvre une perspective de recherche intéressante sur l'apprentissage de l'enveloppe barycentrique de mesures de probabilité
Machine learning systems work under the assumption that training and test conditions are uniform, i.e., they do not change. However, this hypothesis is seldom met in practice. Hence, the system is trained with data that is no longer representative of the data it will be tested on. This case is represented by a shift in the probability measure generating the data. This scenario is known in the literature as distributional shift between two domains: a source, and a target. A straightforward generalization of this problem is when training data itself exhibit shifts on its own. In this case, one consider Multi Source Domain Adaptation (MSDA). In this context, optimal transport is an useful field of mathematics. Especially, optimal transport serves as a toolbox, for comparing and manipulating probability measures. This thesis studies the contributions of optimal transport to multi-source domain adaptation. We do so through Wasserstein barycenters, an object that defines a weighted average, in the space of probability measures, for the multiple domains in MSDA. Based on this concept, we propose: (i) a novel notion of barycenter, when the measures at hand are equipped with labels, (ii) a novel dictionary learning problem over empirical probability measures and (iii) new tools for domain adaptation through the optimal transport of Gaussian mixture models. Through our methods, we are able to improve domain adaptation performance in comparison with previous optimal transport-based methods on image, and cross-domain fault diagnosis benchmarks. Our work opens an interesting research direction, on learning the barycentric hull of probability measures
APA, Harvard, Vancouver, ISO und andere Zitierweisen
3

Schrieber, Jörn [Verfasser], Dominic [Akademischer Betreuer] Schuhmacher, Dominic [Gutachter] Schuhmacher und Anita [Gutachter] Schöbel. „Algorithms for Optimal Transport and Wasserstein Distances / Jörn Schrieber ; Gutachter: Dominic Schuhmacher, Anita Schöbel ; Betreuer: Dominic Schuhmacher“. Göttingen : Niedersächsische Staats- und Universitätsbibliothek Göttingen, 2019. http://d-nb.info/1179449304/34.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
4

SEGUY, Vivien Pierre François. „Measure Transport Approaches for Data Visualization and Learning“. Kyoto University, 2018. http://hdl.handle.net/2433/233857.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
5

Gairing, Jan, Michael Högele, Tetiana Kosenkova und Alexei Kulik. „On the calibration of Lévy driven time series with coupling distances : an application in paleoclimate“. Universität Potsdam, 2014. http://opus.kobv.de/ubp/volltexte/2014/6978/.

Der volle Inhalt der Quelle
Annotation:
This article aims at the statistical assessment of time series with large fluctuations in short time, which are assumed to stem from a continuous process perturbed by a Lévy process exhibiting a heavy tail behavior. We propose an easily implementable procedure to estimate efficiently the statistical difference between the noisy behavior of the data and a given reference jump measure in terms of so-called coupling distances. After a short introduction to Lévy processes and coupling distances we recall basic statistical approximation results and derive rates of convergence. In the sequel the procedure is elaborated in detail in an abstract setting and eventually applied in a case study to simulated and paleoclimate data. It indicates the dominant presence of a non-stable heavy-tailed jump Lévy component for some tail index greater than 2.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
6

Flenghi, Roberta. „Théorème de la limite centrale pour des fonctionnelles non linéaires de la mesure empirique et pour le rééchantillonnage stratifié“. Electronic Thesis or Diss., Marne-la-vallée, ENPC, 2023. http://www.theses.fr/2023ENPC0051.

Der volle Inhalt der Quelle
Annotation:
Cette thèse porte sur le théorème de la limite centrale, l'un des deux théorèmes limites fondamentaux de la théorie des probabilités avec la loi forte des grands nombres. Le théorème de la limite centrale usuel qui porte sur des fonctionnelles linéaires de la mesure empirique de vecteurs aléatoires indépendants et identiquement distribués a récemment été étendu à des fonctionnelles non linéaires par l'utilisation de la dérivée fonctionnelle linéaire sur l'espace de Wasserstein des mesures de probabilité. Nous généralisons cette extension à la mesure empirique de vecteurs aléatoires indépendants mais non identiquement distribués d'une part et à la mesure empirique des états successifs d'une chaîne de Markov ergodique d'autre part. Dans un second temps, nous nous intéressons au rééchantillonnage stratifié qui est couramment utilisé dans les filtres particulaires. Nous prouvons un théorème de la limite centrale pour le premier rééchantillonnage sous l'hypothèse que les positions initiales des particules sont indépendantes et identiquement distribuées et leurs poids sont proportionnels à une fonction positive des positions qui envoie leur loi commune sur une probabilité possédant une composante non nulle absolument continue par rapport à la mesure de Lebesgue. Ce résultat repose sur la convergence en loi de la partie fractionnaire des sommes partielles de poids normalisés vers une variable aléatoire uniforme sur [0,1]. Plus généralement, nous montrons la convergence en loi vers un vecteur aléatoire uniforme sur [dollar][0,1]^q[dollar] de q sommes partielles d'une suite de variables aléatoires i.i.d. de carré intégrable multipliées par une fonction de la moyenne empirique de cette suite. Pour traiter le couplage introduit par ce facteur commun, nous supposons que la loi commune a une composante non nulle absolument continue par rapport à la mesure de Lebesgue, ce qui assure la convergence en variation totale dans le théorème de la limite centrale pour cette suite. Sous l'hypothèse que la convergence en loi de la partie fractionnaire des poids normalisés reste vraie au étapes suivantes d'un filtre particulaire calculé en alternant des étapes de rééchantillonnage suivant le mécanisme stratifié et des mutations suivant des noyaux markoviens, nous obtenons une formule de récurrence pour la variance asymptotique des particules après n étapes. Nous vérifions la validité de cette formule au travers d'expériences numériques
This thesis is dedicated to the central limit theorem which is one of the two fundamental limit theorems in probability theory with the strong law of large numbers.The central limit theorem which is well known for linear functionals of the empirical measure of independent and identically distributed random vectors, has recently been extended to non-linear functionals. The main tool permitting this extension is the linear functional derivative, one of the notions of derivation on the Wasserstein space of probability measures.We generalize this extension by first relaxing the equal distribution assumptionand then the independence property to be able to deal with the successive values of an ergodic Markov chain.In the second place, we focus on the stratified resampling mechanism.This is one of the resampling schemes commonly used in particle filters. We prove a central limit theorem for the first resampling according to this mechanism under the assumption that the initial positions are independent and identically distributed and the weights proportional to a positive function of the positions such that the image of their common distribution by this function has a non zero component absolutely continuous with respect to the Lebesgue measure. This result relies on the convergence in distribution of the fractional part of partial sums of the normalized weights to some random variable uniformly distributed on [0,1]. More generally, we prove the joint convergence in distribution of q variables modulo one obtained as partial sums of a sequence of i.i.d. square integrable random variables multiplied by a common factor given by some function of an empirical mean of the same sequence. The limit is uniformly distributed over [dollar][0,1]^q[dollar]. To deal with the coupling introduced by the common factor, we assume that the common distribution of the random variables has a non zero component absolutely continuous with respect to the Lebesgue measure, so that the convergence in the central limit theorem for this sequence holds in total variation distance.Under the conjecture that the convergence in distribution of fractional parts to some uniform random variable remains valid at the next steps of a particle filter which alternates selections according to the stratified resampling mechanism and mutations according to Markov kernels, we provide an inductive formula for the asymptotic variance of the resampled population after n steps. We perform numerical experiments which support the validity of this formula
APA, Harvard, Vancouver, ISO und andere Zitierweisen
7

Bobbia, Benjamin. „Régression quantile extrême : une approche par couplage et distance de Wasserstein“. Thesis, Bourgogne Franche-Comté, 2020. http://www.theses.fr/2020UBFCD043.

Der volle Inhalt der Quelle
Annotation:
Ces travaux concernent l'estimation de quantiles extrêmes conditionnels. Plus précisément, l'estimation de quantiles d'une distribution réelle en fonction d'une covariable de grande dimension. Pour effectuer une telle estimation, nous présentons un modèle, appelé modèle des queues proportionnelles. Ce modèle est étudié à l'aide de méthodes de couplage. La première est centré sur les processus empiriques, tendis que la seconde est basée sur le transport et le couplage optimal. Ces méthodes nous permettent de fournir et d'étudier les estimateurs des quantiles et des différents paramètres ainsi que de fournir une procédure de validation du modèle. La seconde approche est également développée dans le contexte général des extrêmes univariés
This work is related with the estimation of conditional extreme quantiles. More precisely, we estimate high quantiles of a real distribution conditionally to the value of a covariate, potentially in high dimension. A such estimation is made introducing the proportional tail model. This model is studied with coupling methods. The first is an empirical processes based method whereas the second is focused on transport and optimal coupling. We provide estimators of both quantiles and model parameters, we show their asymptotic normality with our coupling methods. We also provide a validation procedure for proportional tail model. Moreover, we develop the second approach in the general framework of univariate extreme value theory
APA, Harvard, Vancouver, ISO und andere Zitierweisen
8

Nadjahi, Kimia. „Sliced-Wasserstein distance for large-scale machine learning : theory, methodology and extensions“. Electronic Thesis or Diss., Institut polytechnique de Paris, 2021. http://www.theses.fr/2021IPPAT050.

Der volle Inhalt der Quelle
Annotation:
De nombreuses méthodes d'inférence statistique et de modélisation générative ont recours à une divergence pour pouvoir comparer de façon pertinente deux distributions de probabilité. La distance de Wasserstein, qui découle du transport optimal, est un choix intéressant, mais souffre de limites computationnelle et statistique à grande échelle. Plusieurs alternatives ont alors été proposées, notamment la distance de Sliced-Wasserstein (SW), une métrique de plus en plus utilisée en pratique en raison de ses avantages computationnels. Cependant, peu de travaux ont analysé ses propriétés théoriques. Cette thèse examine plus en profondeur l'utilisation de SW pour des problèmes modernes de statistique et d'apprentissage automatique, avec un double objectif : 1) apporter de nouvelles connaissances théoriques permettant une compréhension approfondie des algorithmes basés sur SW, et 2) concevoir de nouveaux outils inspirés de SW afin d'améliorer son application et sa scalabilité. Nous prouvons d'abord un ensemble de propriétés asymptotiques sur les estimateurs obtenus en minimisant SW, ainsi qu'un théorème central limite dont le taux de convergence est indépendant de la dimension. Nous développons également une nouvelle technique d'inférence basée sur SW qui n'utilise pas la vraisemblance, offre des garanties théoriques et s'adapte bien à la taille et à la dimension des données. Etant donné que SW est couramment estimée par une simple méthode de Monte Carlo, nous proposons ensuite deux approches pour atténuer les inefficacités dues à l'erreur d'approximation : d'une part, nous étendons la définition de SW pour introduire les distances de Sliced-Wasserstein généralisées, et illustrons leurs avantages sur des applications de modélisation générative ; d'autre part, nous tirons parti des résultats de concentration de la mesure pour formuler une nouvelle approximation déterministe de SW, qui est plus efficace à calculer que la technique de Monte Carlo et présente des garanties non asymptotiques sous une condition de dépendance faible. Enfin, nous définissons la classe générale de divergences "sliced" et étudions leurs propriétés topologiques et statistiques; en particulier, nous prouvons que l'erreur d'approximation de toute divergence sliced par des échantillons ne dépend pas de la dimension du problème
Many methods for statistical inference and generative modeling rely on a probability divergence to effectively compare two probability distributions. The Wasserstein distance, which emerges from optimal transport, has been an interesting choice, but suffers from computational and statistical limitations on large-scale settings. Several alternatives have then been proposed, including the Sliced-Wasserstein distance (SW), a metric that has been increasingly used in practice due to its computational benefits. However, there is little work regarding its theoretical properties. This thesis further explores the use of SW in modern statistical and machine learning problems, with a twofold objective: 1) provide new theoretical insights to understand in depth SW-based algorithms, and 2) design novel tools inspired by SW to improve its applicability and scalability. We first prove a set of asymptotic properties on the estimators obtained by minimizing SW, as well as a central limit theorem whose convergence rate is dimension-free. We also design a novel likelihood-free approximate inference method based on SW, which is theoretically grounded and scales well with the data size and dimension. Given that SW is commonly estimated with a simple Monte Carlo scheme, we then propose two approaches to alleviate the inefficiencies caused by the induced approximation error: on the one hand, we extend the definition of SW to introduce the Generalized Sliced-Wasserstein distances, and illustrate their advantages on generative modeling applications; on the other hand, we leverage concentration of measure results to formulate a new deterministic approximation for SW, which is computationally more efficient than the usual Monte Carlo technique and has nonasymptotical guarantees under a weak dependence condition. Finally, we define the general class of sliced probability divergences and investigate their topological and statistical properties; in particular, we establish that the sample complexity of any sliced divergence does not depend on the problem dimension
APA, Harvard, Vancouver, ISO und andere Zitierweisen
9

Liu, Lu. „A Risk-Oriented Clustering Approach for Asset Categorization and Risk Measurement“. Thesis, Université d'Ottawa / University of Ottawa, 2019. http://hdl.handle.net/10393/39444.

Der volle Inhalt der Quelle
Annotation:
When faced with market risk for investments and portfolios, people often calculate the risk measure, which is a real number mapping to each random payoff. There are many ways to quantify the potential risk, among which the most important input is the features from future performance. Future distributions are unknown and thus always estimated from historical Profit and Loss (P&L) distributions. However, past data may not be appropriate for estimating the future; risk measures generated from single historical distributions can be subject to error. To overcome these shortcomings, one natural way implemented is to identify and categorize similar assets whose Profit and Loss distributions can be used as alternative scenarios. In practice, one of the most common and intuitive categorizations is sector, based on industry. It is widely agreed that companies in the same sector share the same, or related, business types and operating characteristics. But in the field of risk management, sector-based categorization does not necessarily mean assets are grouped in terms of their risk profiles, and we show that risk measures in the same sector tend to have large variation. Although improved risk measures related to the distribution ambiguity has been discussed at length, we seek to develop a more risk-oriented categorization by providing a new clustering approach. Furthermore, our method can better inform us of the potential risk and the extreme worst-case scenario within the same category.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
10

Lescornel, Hélène. „Covariance estimation and study of models of deformations between distributions with the Wasserstein distance“. Toulouse 3, 2014. http://www.theses.fr/2014TOU30045.

Der volle Inhalt der Quelle
Annotation:
La première partie de cette thèse est consacrée à l'estimation de covariance de processus stochastiques non stationnaires. Le modèle étudié amène à estimer la covariance du processus dans différents espaces vectoriels de matrices. Nous étudions dans le chapitre 3 une méthode de sélection de modèle par minimisation d'un critère pénalisé en utilisant des inégalités de concentration, et le chapitre 4 présente une méthode basée sur l'estimation sans biais du risque. Dans les deux cas des inégalités oracles sont obtenues. La seconde partie de cette thèse concerne l'étude de modèles de déformations entre distributions. On suppose observer une quantité aléatoire epsilon à travers une fonction de déformation. C'est l'importance de la déformation, représentée par un paramètre theta, que l'on cherche à retrouver. Nous présentons plusieurs méthodes d'estimation basées sur la distance de Wasserstein en alignant les lois des observations pour retrouver le paramètre de déformation. Dans le cas où les variables aléatoires sont à valeurs réelles, le chapitre 7 donne des propriétés de consistance pour un M-estimateur et sa distribution asymptotique. On y utilise des techniques de Hadamard différentiabilité pour appliquer une Delta-Méthode fonctionnelle. Le chapitre 8 concerne l'étude d'un estimateur de type Robbins-Monro et présente des propriétés de convergence pour un estimateur à noyau de la densité de la variable epsilon obtenu à l'aide des observations. Le modèle est généralisé à des variables dans des espaces métriques complets dans le chapitre 9, puis, dans l'optique de créer un test d'adéquation, le chapitre 10 donne des résultats sur la distribution asymptotique d'une statistique de test
The first part of this thesis concerns the covariance estimation of non stationary processes. We are estimating the covariance in different vectorial spaces of matrices. In Chapter 3, we give a model selection procedure by minimizing a penalized criterion and using concentration inequalities, and Chapter 4 presents an Unbiased Risk Estimation method. In both cases we give oracle inequalities. The second part deals with the study of models of deformation between distributions. We assume that we observe a random quantity epsilon through a deformation function. The importance of the deformation is represented by a parameter theta that we aim to estimate. We present several methods of estimation based on the Wasserstein distance by aligning the distributions of the observations to recover the deformation parameter. In the case of real random variables, Chapter 7 presents properties of consistency for a M-estimator and its asymptotic distribution. We use Hadamard differentiability techniques to apply a functional Delta method. Chapter 8 concerns a Robbins-Monro estimator for the deformation parameter and presents properties of convergence for a kernel estimator of the density of the variable epsilon obtained with the observations. The model is generalized to random variables in complete metric spaces in Chapter 9. Then, in the aim to build a goodness of fit test, Chapter 10 gives results on the asymptotic distribution of a test statistic
APA, Harvard, Vancouver, ISO und andere Zitierweisen
11

Boistard, Hélène. „Eficacia asintotica tests relacionados con el estadística de Wasserstein“. Toulouse 3, 2007. http://www.theses.fr/2007TOU30155.

Der volle Inhalt der Quelle
Annotation:
Le test d'ajustement basé sur la distance de Wasserstein est un test bien adapté aux familles de localisation et changement d'échelle. La distribution asymptotique sous hypothèse nulle est connue depuis les travaux de del Barrio et al. (1999, 2000). Le thème de cette thèse est l'étude de la puissance asymptotique de ce test et de tests apparentés, grâce à divers critères d'efficacité. Après une introduction qui fait l'objet du premier chapitre et présente le problème et les outils utilisés, le second chapitre est consacré à l'établissement de résultats asymptotiques pour les intégrales multiples par rapport au processus empirique. Ces statistiques sont reliées aux U-statistiques, mais permettent une grande simplification des hypothèses pour établir la distribution asymptotique sous hypothèse nulle, sous alternative contigüe et pour le bootstrap. Dans le troisième chapitre, nous prouvons l'équivalence du test de Wasserstein avec un test basé sur une intégrale double par rapport au processus empirique. Cela nous permet d'appliquer à ce test les résultats du chapitre antérieur, et d'obtenir des renseignements sur son efficacité asymptotique dans le cadre des expériences gaussiennes de déplacement (Gaussian shifts). Le quatrième chapitre est dédié à l'efficacité au sens de Bahadur. Ce critère d'efficacité est basé sur la théorie des grandes déviations. Nous établissons un principe de grandes déviations fonctionnel pour les L-statistiques, sous des hypothèses sur les extrêmes de la distribution sous-jacente. Nous obtenons également un résultat pour les L-statistiques normalisées, famille à laquelle appartient la statistique de test de Wasserstein
The goodness of fit test based on the Wasserstein distance is a test which is well adapted to location-scale families. The asymptotic distribution under the null hypothesis has been known since the works by del Barrio et al. (1999, 2000). The subject of this thesis is the study of the asymptotic power of this test and of some related tests, owing to several efficiency criteria. In the first chapter, a short introduction presents the problem and the tools to be used. The second chapter is devoted to the the proof of some asymptotic results for multiple integrals with respect to the empirical process. These statistics are strongly related to U-statistics, but they permit an important simplification of the classical hypotheses to establish the asymptotic distribution under the null hypothesis, under contiguous alternative and for the bootstrap. In the third chapter, we prove that the Wasserstein test statistic is equivalent to a test based on the double integral with respect to the empirical process. This allows us to apply to this test the results of the previous chapter, and to obtain some information about its asymptotic efficiency in the framework of Gaussian shift experiments. .
APA, Harvard, Vancouver, ISO und andere Zitierweisen
12

Vidal, Jules. „Progressivité en analyse topologique de données“. Electronic Thesis or Diss., Sorbonne université, 2021. http://www.theses.fr/2021SORUS398.

Der volle Inhalt der Quelle
Annotation:
L’analyse topologique de donnés permet l’extraction générique et efficace de caractéristiques structurelles dans les données. Cependant, bien que ces techniques aient des complexités asymptotiques connues et raisonnables elles sont rarement interactives en pratique sur des jeux de données réels. Dans cette thèse, nous avons cherché à développer des méthodes progressives pour l’analyse topologique de données scalaires scientifiques, qui peuvent être interrompues pour fournir rapidement un résultat approché exploitable, et sont capables de l’affiner ensuite. Nous introduisons deux algorithmes progressifs pour le calcul des points critiques et du diagramme de persistance d’un champ scalaire. Ensuite, nous revisitons ce cadre progressif pour introduire un algorithme pour le calcul approché du diagramme de persistance d’un champ scalaire, avec des garanties sur l’erreur d’approximation associée. Enfin, afin d’effectuer une analyse visuelle de données d’ensemble, nous présentons un nouvel algorithme progressif pour le calcul du barycentre de Wasserstein d’un ensemble de diagrammes de persistance, une tâche notoirement coûteuse en calcul. Notre approche progressive permet d’approcher le barycentre de manière interactive. Nous étendons cette méthode à un algorithme de classification topologique de données d’ensemble, qui est progressif et capable de respecter une contrainte de temps
Topological Data Analysis (TDA) forms a collection of tools that enable the generic and efficient extraction of features in data. However, although most TDA algorithms have practicable asymptotic complexities, these methods are rarely interactive on real-life datasets, which limits their usability for interactive data analysis and visualization. In this thesis, we aimed at developing progressive methods for the TDA of scientific scalar data, that can be interrupted to swiftly provide a meaningful approximate output and that are able to refine it otherwise. First, we introduce two progressive algorithms for the computation of the critical points and the extremum-saddle persistence diagram of a scalar field. Next, we revisit this progressive framework to introduce an approximation algorithm for the persistence diagram of a scalar field, with strong guarantees on the related approximation error. Finally, in a effort to perform visual analysis of ensemble data, we present a novel progressive algorithm for the computation of the discrete Wasserstein barycenter of a set of persistence diagrams, a notoriously computationally intensive task. Our progressive approach enables the approximation of the barycenter within interactive times. We extend this method to a progressive, time-constraint, topological ensemble clustering algorithm
APA, Harvard, Vancouver, ISO und andere Zitierweisen
13

Lebrat, Léo. „Projection au sens de Wasserstein 2 sur des espaces structurés de mesures“. Thesis, Toulouse, INSA, 2019. http://www.theses.fr/2019ISAT0035.

Der volle Inhalt der Quelle
Annotation:
Cette thèse s’intéresse à l’approximation pour la métrique de 2-Wasserstein de mesures de probabilité par une mesure structurée. Les mesures structurées étudiées sont des discrétisations consistantes de mesures portées par des courbes continues à vitesse et à accélération bornées. Nous comparons deux types d’approximations pour ces courbes continues : l’approximation constante par morceaux et linéaire par morceaux. Pour chaque méthode, des algorithmes rapides et fonctionnant pour une discrétisation fine ont été développés. Le problème d’approximation se divise en deux étapes avec leurs propres défis théoriques et algorithmiques : le calcul de la distance de Wasserstein 2 et son optimisation par rapport aux paramètres de structure. Ce travail est initialement motivé par la génération de trajectoires d’IRM en acquisition compressée, toutefois nous donnons de nouvelles applications potentielles pour ces méthodes
This thesis focuses on the approximation for the 2-Wasserstein metric of probability measures by structured measures. The set of structured measures under consideration is made of consistent discretizations of measures carried by a smooth curve with a bounded speed and acceleration. We compare two different types of approximations of the curve: piecewise constant and piecewise linear. For each of these methods, we develop fast and scalable algorithms to compute the 2-Wasserstein distance between a given measure and the structured measure. The optimization procedure reveals new theoretical and numerical challenges, it consists of two steps: first the computation of the 2-Wasserstein distance, second the optimization of the parameters of structure. This work is initially motivated by the design of trajectories in MRI acquisition, however we provide new applications of these methods
APA, Harvard, Vancouver, ISO und andere Zitierweisen
14

Sommerfeld, Max [Verfasser], Axel [Akademischer Betreuer] Munk, Axel [Gutachter] Munk und Stephan [Gutachter] Huckemann. „Wasserstein Distance on Finite Spaces: Statistical Inference and Algorithms / Max Sommerfeld ; Gutachter: Axel Munk, Stephan Huckemann ; Betreuer: Axel Munk“. Göttingen : Niedersächsische Staats- und Universitätsbibliothek Göttingen, 2017. http://d-nb.info/1149959223/34.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
15

Buzun, Nazar. „Bootstrap in high dimensional spaces“. Doctoral thesis, Humboldt-Universität zu Berlin, 2021. http://dx.doi.org/10.18452/22285.

Der volle Inhalt der Quelle
Annotation:
Ziel dieser Arbeit ist theoretische Eigenschaften verschiedener Bootstrap Methoden zu untersuchen. Als Ergebnis führen wir die Konvergenzraten des Bootstrap-Verfahrens ein, die sich auf die Differenz zwischen der tatsächlichen Verteilung einer Statistik und der Resampling-Näherung beziehen. In dieser Arbeit analysieren wir die Verteilung der l2-Norm der Summe unabhängiger Vektoren, des Summen Maximums in hoher Dimension, des Wasserstein-Abstands zwischen empirischen Messungen und Wassestein-Barycenters. Um die Bootstrap-Konvergenz zu beweisen, verwenden wir die Gaussche Approximations technik. Das bedeutet dass man in der betrachteten Statistik eine Summe unabhängiger Vektoren finden muss, so dass Bootstrap eine erneute Abtastung dieser Summe ergibt. Ferner kann diese Summe durch Gaussche Verteilung angenähert und mit der Neuabtastung Verteilung als Differenz zwischen Kovarianzmatrizen verglichen werden. Im Allgemeinen scheint es sehr schwierig zu sein, eine solche Summe unabhängiger Vektoren aufzudecken, da einige Statistiken (zum Beispiel MLE) keine explizite Gleichung haben und möglicherweise unendlich dimensional sind. Um mit dieser Schwierigkeit fertig zu werden, verwenden wir einige neuartige Ergebnisse aus der statistischen Lerntheorie. Darüber hinaus wenden wir Bootstrap bei Methoden zur Erkennung von Änderungspunkten an. Im parametrischen Fall analysieren wir den statischen Likelihood Ratio Test (LRT). Seine hohen Werte zeigen Änderungen der Parameter Verteilung in der Datensequenz an. Das Maximum von LRT hat eine unbekannte Verteilung und kann mit Bootstrap kalibriert werden. Wir zeigen die Konvergenzraten zur realen maximalen LRT-Verteilung. In nicht parametrischen Fällen verwenden wir anstelle von LRT den Wasserstein-Abstand zwischen empirischen Messungen. Wir testen die Genauigkeit von Methoden zur Erkennung von Änderungspunkten anhand von synthetischen Zeitreihen und Elektrokardiographiedaten. Letzteres zeigt einige Vorteile des nicht parametrischen Ansatzes gegenüber komplexen Modellen und LRT.
The objective of this thesis is to explore theoretical properties of various bootstrap methods. We introduce the convergence rates of the bootstrap procedure which corresponds to the difference between real distribution of some statistic and its resampling approximation. In this work we analyze the distribution of Euclidean norm of independent vectors sum, maximum of sum in high dimension, Wasserstein distance between empirical measures, Wassestein barycenters. In order to prove bootstrap convergence we involve Gaussian approximation technique which means that one has to find a sum of independent vectors in the considered statistic such that bootstrap yields a resampling of this sum. Further this sum may be approximated by Gaussian distribution and compared with the resampling distribution as a difference between variance matrices. In general it appears to be very difficult to reveal such a sum of independent vectors because some statistics (for example, MLE) don't have an explicit equation and may be infinite-dimensional. In order to handle this difficulty we involve some novel results from statistical learning theory, which provide a finite sample quadratic approximation of the Likelihood and suitable MLE representation. In the last chapter we consider the MLE of Wasserstein barycenters model. The regularised barycenters model has bounded derivatives and satisfies the necessary conditions of quadratic approximation. Furthermore, we apply bootstrap in change point detection methods. In the parametric case we analyse the Likelihood Ratio Test (LRT) statistic. Its high values indicate changes of parametric distribution in the data sequence. The maximum of LRT has a complex distribution but its quantiles may be calibrated by means of bootstrap. We show the convergence rates of the bootstrap quantiles to the real quantiles of LRT distribution. In non-parametric case instead of LRT we use Wasserstein distance between empirical measures. We test the accuracy of change point detection methods on synthetic time series and electrocardiography (ECG) data. Experiments with ECG illustrate advantages of the non-parametric approach versus complex parametric models and LRT.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
16

Durmus, Alain. „High dimensional Markov chain Monte Carlo methods : theory, methods and applications“. Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLT001/document.

Der volle Inhalt der Quelle
Annotation:
L'objet de cette thèse est l'analyse fine de méthodes de Monte Carlopar chaînes de Markov (MCMC) et la proposition de méthodologies nouvelles pour échantillonner une mesure de probabilité en grande dimension. Nos travaux s'articulent autour de trois grands sujets.Le premier thème que nous abordons est la convergence de chaînes de Markov en distance de Wasserstein. Nous établissons des bornes explicites de convergence géométrique et sous-géométrique. Nous appliquons ensuite ces résultats à l'étude d'algorithmes MCMC. Nous nous intéressons à une variante de l'algorithme de Metropolis-Langevin ajusté (MALA) pour lequel nous donnons des bornes explicites de convergence. Le deuxième algorithme MCMC que nous analysons est l'algorithme de Crank-Nicolson pré-conditionné, pour lequel nous montrerons une convergence sous-géométrique.Le second objet de cette thèse est l'étude de l'algorithme de Langevin unajusté (ULA). Nous nous intéressons tout d'abord à des bornes explicites en variation totale suivant différentes hypothèses sur le potentiel associé à la distribution cible. Notre étude traite le cas où le pas de discrétisation est maintenu constant mais aussi du cas d'une suite de pas tendant vers 0. Nous prêtons dans cette étude une attention toute particulière à la dépendance de l'algorithme en la dimension de l'espace d'état. Dans le cas où la densité est fortement convexe, nous établissons des bornes de convergence en distance de Wasserstein. Ces bornes nous permettent ensuite de déduire des bornes de convergence en variation totale qui sont plus précises que celles reportées précédemment sous des conditions plus faibles sur le potentiel. Le dernier sujet de cette thèse est l'étude des algorithmes de type Metropolis-Hastings par échelonnage optimal. Tout d'abord, nous étendons le résultat pionnier sur l'échelonnage optimal de l'algorithme de Metropolis à marche aléatoire aux densités cibles dérivables en moyenne Lp pour p ≥ 2. Ensuite, nous proposons de nouveaux algorithmes de type Metropolis-Hastings qui présentent un échelonnage optimal plus avantageux que celui de l'algorithme MALA. Enfin, nous analysons la stabilité et la convergence en variation totale de ces nouveaux algorithmes
The subject of this thesis is the analysis of Markov Chain Monte Carlo (MCMC) methods and the development of new methodologies to sample from a high dimensional distribution. Our work is divided into three main topics. The first problem addressed in this manuscript is the convergence of Markov chains in Wasserstein distance. Geometric and sub-geometric convergence with explicit constants, are derived under appropriate conditions. These results are then applied to thestudy of MCMC algorithms. The first analyzed algorithm is an alternative scheme to the Metropolis Adjusted Langevin algorithm for which explicit geometric convergence bounds are established. The second method is the pre-Conditioned Crank-Nicolson algorithm. It is shown that under mild assumption, the Markov chain associated with thisalgorithm is sub-geometrically ergodic in an appropriated Wasserstein distance. The second topic of this thesis is the study of the Unadjusted Langevin algorithm (ULA). We are first interested in explicit convergence bounds in total variation under different kinds of assumption on the potential associated with the target distribution. In particular, we pay attention to the dependence of the algorithm on the dimension of the state space. The case of fixed step sizes as well as the case of nonincreasing sequences of step sizes are dealt with. When the target density is strongly log-concave, explicit bounds in Wasserstein distance are established. These results are then used to derived new bounds in the total variation distance which improve the one previously derived under weaker conditions on the target density.The last part tackles new optimal scaling results for Metropolis-Hastings type algorithms. First, we extend the pioneer result on the optimal scaling of the random walk Metropolis algorithm to target densities which are differentiable in Lp mean for p ≥ 2. Then, we derive new Metropolis-Hastings type algorithms which have a better optimal scaling compared the MALA algorithm. Finally, the stability and the convergence in total variation of these new algorithms are studied
APA, Harvard, Vancouver, ISO und andere Zitierweisen
17

Feyeux, Nelson. „Transport optimal pour l'assimilation de données images“. Thesis, Université Grenoble Alpes (ComUE), 2016. http://www.theses.fr/2016GREAM076/document.

Der volle Inhalt der Quelle
Annotation:
Pour prédire l'évolution d'un système physique, nous avons besoin d'initialiser le modèle mathématique le représentant, donc d'estimer la valeur de l'état du système au temps initial. Cet état n'est généralement pas directement mesurable car souvent trop complexe. En revanche, nous disposons d'informations du système, prises à des temps différents, incomplètes, mais aussi entachées d'erreurs, telles des observations, de précédentes estimations, etc. Combiner ces différentes informations partielles et imparfaites pour estimer la valeur de l'état fait appel à des méthodes d'assimilation de données dont l'idée est de trouver un état initial proche de toutes les informations. Ces méthodes sont très utilisées en météorologie. Nous nous intéressons dans cette thèse à l'assimilation d'images, images qui sont de plus en plus utilisées en tant qu'observations. La spécificité de ces images est leur cohérence spatiale, l'oeil humain peut en effet percevoir des structures dans les images que les méthodes classiques d'assimilation ne considèrent généralement pas. Elles ne tiennent compte que des valeurs de chaque pixel, ce qui résulte dans certains cas à des problèmes d'amplitude dans l'état initial estimé. Pour résoudre ce problème, nous proposons de changer d'espace de représentation des données : nous plaçons les données dans un espace de Wasserstein où la position des différentes structures compte. Cet espace, équipé d'une distance de Wasserstein, est issue de la théorie du transport optimal et trouve beaucoup d'applications en imagerie notamment.Dans ce travail nous proposons une méthode d'assimilation variationnelle de données basée sur cette distance de Wasserstein. Nous la présentons ici, ainsi que les algorithmes numériques liés et des expériences montrant ses spécificités. Nous verrons dans les résultats comment elle permet de corriger ce qu'on appelle erreurs de position
Forecasting of a physical system is computed by the help of a mathematical model. This model needs to be initialized by the state of the system at initial time. But this state is not directly measurable and data assimilation techniques are generally used to estimate it. They combine all sources of information such as observations (that may be sparse in time and space and potentially include errors), previous forecasts, the model equations and error statistics. The main idea of data assimilation techniques is to find an initial state accounting for the different sources of informations. Such techniques are widely used in meteorology, where data and particularly images are more and more numerous due to the increasing number of satellites and other sources of measurements. This, coupled with developments of meteorological models, have led to an ever-increasing quality of the forecast.Spatial consistency is one specificity of images. For example, human eyes are able to notice structures in an image. However, classical methods of data assimilation do not handle such structures because they take only into account the values of each pixel separately. In some cases it leads to a bad initial condition. To tackle this problem, we proposed to change the representation of an image: images are considered here as elements of the Wasserstein space endowed with the Wasserstein distance coming from the optimal transport theory. In this space, what matters is the positions of the different structures.This thesis presents a data assimilation technique based on this Wasserstein distance. This technique and its numerical procedure are first described, then experiments are carried out and results shown. In particularly, it appears that this technique was able to give an analysis of corrected position
APA, Harvard, Vancouver, ISO und andere Zitierweisen
18

Cloez, Bertrand. „Comportement asymptotique de processus avec sauts et applications pour des modèles avec branchement“. Phd thesis, Université Paris-Est, 2013. http://tel.archives-ouvertes.fr/tel-00862913.

Der volle Inhalt der Quelle
Annotation:
L'objectif de ce travail est d'étudier le comportement en temps long d'un modèle de particules avec une interaction de type branchement. Plus précisément, les particules se déplacent indépendamment suivant une dynamique markovienne jusqu'au temps de branchement, où elles donnent naissance à de nouvelles particules dont la position dépend de celle de leur mère et de son nombre d'enfants. Dans la première partie de ce mémoire nous omettons le branchement et nous étudions le comportement d'une seule lignée. Celle-ci est modélisée via un processus de Markov qui peut admettre des sauts, des parties diffusives ou déterministes par morceaux. Nous quantifions la convergence de ce processus hybride à l'aide de la courbure de Wasserstein, aussi nommée courbure grossière de Ricci. Cette notion de courbure, introduite récemment par Joulin, Ollivier, et Sammer correspond mieux à l'étude des processus avec sauts. Nous établissons une expression du gradient du semigroupe des processus de Markov stochastiquement monotone, qui nous permet d'expliciter facilement leur courbure. D'autres bornes fines de convergence en distance de Wasserstein et en variation totale sont aussi établies. Dans le même contexte, nous démontrons qu'un processus de Markov, qui change de dynamique suivant un processus discret, converge rapidement vers un équilibre, lorsque la moyenne des courbures des dynamiques sous-jacentes est strictement positive. Dans la deuxième partie de ce mémoire, nous étudions le comportement de toute la population de particules. Celui-ci se déduit du comportement d'une seule lignée grâce à une formule many-to-one, c'est-à-dire un changement de mesure de type Girsanov. Via cette transformation, nous démontrons une loi des grands nombres et établissons une limite macroscopique, pour comparer nos résultats aux résultats déjà connus en théorie des équations aux dérivées partielles. Nos résultats sont appliqués sur divers modèles ayant des applications en biologie et en informatique. Parmi ces modèles, nous étudierons le comportement en temps long de la plus grande particule dans un modèle simple de population structurée en taille
APA, Harvard, Vancouver, ISO und andere Zitierweisen
19

Laborde, Maxime. „Systèmes de particules en interaction, approche par flot de gradient dans l'espace de Wasserstein“. Thesis, Paris Sciences et Lettres (ComUE), 2016. http://www.theses.fr/2016PSLED014/document.

Der volle Inhalt der Quelle
Annotation:
Depuis l’article fondateur de Jordan, Kinderlehrer et Otto en 1998, il est bien connu qu’une large classe d’équations paraboliques peuvent être vues comme des flots de gradient dans l’espace de Wasserstein. Le but de cette thèse est d’étendre cette théorie à certaines équations et systèmes qui n’ont pas exactement une structure de flot de gradient. Les interactions étudiées sont de différentes natures. Le premier chapitre traite des systèmes avec des interactions non locales dans la dérive. Nous étudions ensuite des systèmes de diffusions croisées s’appliquant aux modèles de congestion pour plusieurs populations. Un autre modèle étudié est celui où le couplage se trouve dans le terme de réaction comme les systèmes proie-prédateur avec diffusion ou encore les modèles de croissance tumorale. Nous étudierons enfin des systèmes de type nouveau où l’interaction est donnée par un problème de transport multi-marges. Une grande partie de ces problèmes est illustrée de simulations numériques
Since 1998 and the seminal work of Jordan, Kinderlehrer and Otto, it is well known that a large class of parabolic equations can be seen as gradient flows in the Wasserstein space. This thesis is devoted to extensions of this theory to equations and systems which do not have exactly a gradient flow structure. We study different kind of couplings. First, we treat the case of nonlocal interactions in the drift. Then, we study cross diffusion systems which model congestion for several species. We are also interested in reaction-diffusion systems as diffusive prey-predator systems or tumor growth models. Finally, we introduce a new class of systems where the interaction is given by a multi-marginal transport problem. In many cases, we give numerical simulations to illustrate our theorical results
APA, Harvard, Vancouver, ISO und andere Zitierweisen
20

Christen, Alejandra. „Comportamiento asintótico de los procesos de Markov deterministas por pedazos“. Tesis, Universidad de Chile, 2012. http://www.repositorio.uchile.cl/handle/2250/111925.

Der volle Inhalt der Quelle
Annotation:
Doctor en Ciencias de la Ingeniería, Mención Modelación Matemática
En esta tesis doctoral se abordan dos problemas relacionados con el comportamiento en tiempo largo de los procesos de Markov deterministas por pedazos (PDMP). En primer lugar se estudia el comportamiento asintótico de un PDMP general en relación con el comportamiento y propiedades de una cadena de Markov a tiempo discreto embuída. Este problema se desarrolla en el Capítulo 1. En segundo lugar, se considera un PDMP específico llamado Proceso del tamaño de ventana del TCP (sigla en inglés del protocolo de control de transmisión usado en internet). El objetivo en este caso es encontrar tasas de convergencia explícitas al equilibrio. Este problema se estudia en el Capítulo 2. Con respecto al primer problema, en el Cap´ıtulo 1 se relacionan las propiedades de recurrencia positiva y las medidas de probabilidad invariantes de un proceso PDMP general con las de una cadena espacio-tiempo discreta, formada por las posiciones post-salto del proceso y las longitudes de tiempo entre saltos. Esta cadena discreta se obtiene de manera simple a partir de las características locales que definen el proceso a tiempo continuo y contiene más información que la cadena discreta post-salto que ha sido habitualmente considerada. Utilizando esta cadena espacio-tiempo se puede definir un nuevo proceso a tiempo continuo asociado, formado por tres coordenadas: el proceso continuo propiamente dicho, la longitud de tiempo trancurrido desde el último tiempo de salto y la longitud de tiempo que falta para el siguiente tiempo de salto, en analogía con los procesos edad y vida residual de teoría de renovación. En este capítulo se describe completamente el equilibrio de este proceso asociado y se establece un resultado análogo de la waiting time paradox de teoría de renovación en el contexto de los PDMP. Para el segundo problema, en el Capítulo 2 se obtienen tasas de convergencia exponencial al equilibrio en distancia Wasserstein y en la norma en variación total. Estos resultados se basan en algunos argumentos de acoplamiento nuevos y dan una respuesta a una pregunta importante sobre el protocolo de transmisión de internet TCP, que es el entender cómo la congestión del tamaño de ventana del TCP alcanza equilibrio en tiempo largo.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
21

Kampschulte, Malte [Verfasser], Christof Erich [Akademischer Betreuer] Melcher, Michael [Akademischer Betreuer] Westdickenberg und Robert L. [Akademischer Betreuer] Jerrard. „Gradient flows and a generalized Wasserstein distance in the space of Cartesian currents / Malte Kampschulte ; Christof Erich Melcher, Michael Westdickenberg, Robert L. Jerrard“. Aachen : Universitätsbibliothek der RWTH Aachen, 2017. http://d-nb.info/1187346314/34.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
22

Tinarrage, Raphaël. „Inférence topologique à partir de mesures et de fibrés vectoriels“. Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASM001.

Der volle Inhalt der Quelle
Annotation:
Nous contribuons à l'inférence topologique, basée sur la théorie de l'homologie persistante, en proposant trois familles de filtrations.Nous établissons pour chacune d'elles des résultats de consistance---c'est-à-dire de qualité d'approximation d'un objet géométrique sous-jacent---, et de stabilité---c'est-à-dire que robustesse face à des erreurs de mesures initiales.Nous proposons des algorithmes concrets afin de pouvoir utiliser ces méthodes en pratique.La première famille, les filtrations-DTM, est une alternative robuste à la classique filtration de Cech lorsque le nuage de points est bruité ou contient des points aberrants.Elle repose sur la notion de distance à la mesure qui permet d'obtenir une stabilité au sens de la distance de Wasserstein.Deuxièmement, nous proposons les filtrations relevées, qui permettent d'estimer l'homologie des variétés immergées, même quand leur portée est nulle.Nous introduisons la notion de portée normale, et montrons qu'elle conduit à un contrôle quantitatif de la variété.Nous étudions l'estimation des espaces tangents par les matrices de covariance locale.En troisième lieu, nous développons un cadre pour les filtrations de fibrés vectoriels, et définissons les classes de Stiefel-Whitney persistantes.Nous montrons que les classes persistantes associées aux filtrations de fibrés de Cech sont consistantes et stables en distance de Hausdorff.Pour permettre leur mise en œuvre algorithmique, nous introduisons la notion de condition étoile faible
We contribute to the theory of topological inference, based on the theory of persistent homology, by proposing three families of filtrations.For each of them, we prove consistency results---that is, the quality of approximation of an underlying geometric object---, and stability results---that is, robustness against initial measurement errors.We propose concrete algorithms in order to use these methods in practice.The first family, the DTM-filtration, is a robust alternative to the classical Cech filtration when the point cloud is noisy or contains outliers.It is based on the notion of distance to measure, which allows to obtain stability in the sense of the Wasserstein distance.Secondly, we propose the lifted filtrations, which make it possible to estimate the homology of immersed manifolds, even when their reach is zero.We introduce the notion of normal reach, and show that it leads to a quantitative control of the manifold.We study the estimation of tangent spaces by local covariance matrices.Thirdly, we develop a framework for vector bundle filtrations, and define the persistent Stiefel-Whitney classes.We show that the persistent classes associated to the Cech bundle filtrations are Hausdorff-stable and consistent.To allow their algorithmic implementation, we introduce the notion of weak star condition
APA, Harvard, Vancouver, ISO und andere Zitierweisen
23

Durmus, Alain. „High dimensional Markov chain Monte Carlo methods : theory, methods and applications“. Electronic Thesis or Diss., Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLT001.

Der volle Inhalt der Quelle
Annotation:
L'objet de cette thèse est l'analyse fine de méthodes de Monte Carlopar chaînes de Markov (MCMC) et la proposition de méthodologies nouvelles pour échantillonner une mesure de probabilité en grande dimension. Nos travaux s'articulent autour de trois grands sujets.Le premier thème que nous abordons est la convergence de chaînes de Markov en distance de Wasserstein. Nous établissons des bornes explicites de convergence géométrique et sous-géométrique. Nous appliquons ensuite ces résultats à l'étude d'algorithmes MCMC. Nous nous intéressons à une variante de l'algorithme de Metropolis-Langevin ajusté (MALA) pour lequel nous donnons des bornes explicites de convergence. Le deuxième algorithme MCMC que nous analysons est l'algorithme de Crank-Nicolson pré-conditionné, pour lequel nous montrerons une convergence sous-géométrique.Le second objet de cette thèse est l'étude de l'algorithme de Langevin unajusté (ULA). Nous nous intéressons tout d'abord à des bornes explicites en variation totale suivant différentes hypothèses sur le potentiel associé à la distribution cible. Notre étude traite le cas où le pas de discrétisation est maintenu constant mais aussi du cas d'une suite de pas tendant vers 0. Nous prêtons dans cette étude une attention toute particulière à la dépendance de l'algorithme en la dimension de l'espace d'état. Dans le cas où la densité est fortement convexe, nous établissons des bornes de convergence en distance de Wasserstein. Ces bornes nous permettent ensuite de déduire des bornes de convergence en variation totale qui sont plus précises que celles reportées précédemment sous des conditions plus faibles sur le potentiel. Le dernier sujet de cette thèse est l'étude des algorithmes de type Metropolis-Hastings par échelonnage optimal. Tout d'abord, nous étendons le résultat pionnier sur l'échelonnage optimal de l'algorithme de Metropolis à marche aléatoire aux densités cibles dérivables en moyenne Lp pour p ≥ 2. Ensuite, nous proposons de nouveaux algorithmes de type Metropolis-Hastings qui présentent un échelonnage optimal plus avantageux que celui de l'algorithme MALA. Enfin, nous analysons la stabilité et la convergence en variation totale de ces nouveaux algorithmes
The subject of this thesis is the analysis of Markov Chain Monte Carlo (MCMC) methods and the development of new methodologies to sample from a high dimensional distribution. Our work is divided into three main topics. The first problem addressed in this manuscript is the convergence of Markov chains in Wasserstein distance. Geometric and sub-geometric convergence with explicit constants, are derived under appropriate conditions. These results are then applied to thestudy of MCMC algorithms. The first analyzed algorithm is an alternative scheme to the Metropolis Adjusted Langevin algorithm for which explicit geometric convergence bounds are established. The second method is the pre-Conditioned Crank-Nicolson algorithm. It is shown that under mild assumption, the Markov chain associated with thisalgorithm is sub-geometrically ergodic in an appropriated Wasserstein distance. The second topic of this thesis is the study of the Unadjusted Langevin algorithm (ULA). We are first interested in explicit convergence bounds in total variation under different kinds of assumption on the potential associated with the target distribution. In particular, we pay attention to the dependence of the algorithm on the dimension of the state space. The case of fixed step sizes as well as the case of nonincreasing sequences of step sizes are dealt with. When the target density is strongly log-concave, explicit bounds in Wasserstein distance are established. These results are then used to derived new bounds in the total variation distance which improve the one previously derived under weaker conditions on the target density.The last part tackles new optimal scaling results for Metropolis-Hastings type algorithms. First, we extend the pioneer result on the optimal scaling of the random walk Metropolis algorithm to target densities which are differentiable in Lp mean for p ≥ 2. Then, we derive new Metropolis-Hastings type algorithms which have a better optimal scaling compared the MALA algorithm. Finally, the stability and the convergence in total variation of these new algorithms are studied
APA, Harvard, Vancouver, ISO und andere Zitierweisen
24

Guittet, Kévin. „Contributions à la résolution numérique de problèmes de transport optimal de masse“. Paris 6, 2003. http://www.theses.fr/2003PA066380.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
25

Salem, Samir. „Limite de champ moyen et propagation du chaos pour des systèmes de particules avec interaction discontinue“. Thesis, Aix-Marseille, 2017. http://www.theses.fr/2017AIXM0387/document.

Der volle Inhalt der Quelle
Annotation:
Dans cette thèse, on étudie des problèmes de propagation du chaos et de limite de champ moyen pour des modèles relatant le comportement collectif d'individus ou de particules. Particulièrement, on se place dans des cas où l'interaction entre ces individus/particules est discontinue. Le premier travail établit la propagation du chaos pour l'équation de Vlasov-Poisson-Fokker-Planck 1d. Plus précisément, on montre que la distribution des particules évoluant sur la droite des réels interagissant via la fonction signe, converge vers la solution de l'équation de VPFP 1d, en probabilité par des techniques de type grandes déviations, et en espérance par des techniques de loi des grands nombre. Dans le second travail, on étudie une variante du modèle de Cucker-Smale, où le noyau de communication est l'indicatrice d'un cône dont l'orientation dépend de la vitesse de l'individu. Une estimation de stabilité fort-faible en distance de M.K.W. est obtenue, qui implique la limite de champ moyen. Le troisième travail a consisté à introduire de la diffusion en vitesse dans le modèle précédemment cité. Cependant, il faut ajouter une diffusion tronquée afin de préserver un système dans lequel les vitesses restent uniformément bornées. Finalement, on étudie une variante de l'équation d'agrégation où l'interaction entre individus est donnée par un cône dont l'orientation dépend de la position de l'individu. Dans ce cas on peut seulement donner une estimation de stabilité fort-faible en distance $W_\infty$, et le modèle doit être posé dans un domaine borné dans le cas avec diffusion
In this thesis, we study some propagation of chaos and mean field limit problems arising in modelisation of collective behavior of individuals or particles. Particularly, we set ourselves in the case where the interaction between the individuals/particles is discontinuous. The first work establihes the propagation of chaos for the 1d Vlasov-Poisson-Fokker-Planck equation. More precisely, we show that the distribution of particles evolving on the real line and interacting through the sign function converges to the solution of the 1d VPFP equation, in probability by large deviations-like techniques, and in expectation by law of large numbers-like techniques. In the second work, we study a variant of the Cucker-Smale, where the communication weight is the indicatrix function of a cone which orientation depends on the velocity of the individual. Some weak-strong stability estimate in M.K.W. distance is obtained for the limit equation, which implies the mean field limit. The third work consists in adding some diffusion in velocity to the model previously quoted. However one must add some truncated diffusion in order to preserve a system in which velocities remain unifomrly bounded. Finally we study a variant of the aggregation equation where the interaction between individuals is also given by a cone which orientation depends on the position of the individual. In this case we are only able to provide some weak-strong stability estimate in $W_\infty$ distance, and the problem must be set in a bounded domain for the case with diffusion
APA, Harvard, Vancouver, ISO und andere Zitierweisen
26

Margheriti, William. „Sur la stabilité du problème de transport optimal martingale“. Thesis, Paris Est, 2020. http://www.theses.fr/2020PESC1036.

Der volle Inhalt der Quelle
Annotation:
Cette thèse est motivée par l'étude de la stabilité du problème de transport optimal martingale, et s'articule naturellement autour de deux parties. Dans la première partie, nous exhibons une nouvelle famille de couplages martingale entre deux mesures de probabilités unidimensionnelles μ et ν comparables dans l'ordre convexe. Cette famille contient en particulier le couplage martingale transformée inverse, qui est explicite en termes des fonctions quantiles des marginales. L'intégrale M_1(μ,ν) de |x-y| contre chacun de ces couplages est majorée par le double de la distance de Wasserstein W_1(μ,ν) entre μ et ν. Nous montrons une inégalité similaire lorsque |x-y| et W_1 sont respectivement remplacés par |x-y|^ρ et le produit de W_ρ par le moment centré d'ordre ρ de la seconde marginale élevé à l'exposant ρ-1, pour ρ∈[1,+∞[ quelconque. Nous étudions ensuite la généralisation de cette nouvelle inégalité de stabilité à la dimension supérieure. Enfin, nous établissons une forte connexion entre notre nouvelle famille de couplages martingale et la projection d'un couplage entre deux marginales données comparables dans l'ordre convexe sur l'ensemble des couplages martingale entre ces mêmes marginales. Cette dernière projection est prise par rapport à la distance de Wasserstein adaptée, qui majore la distance de Wasserstein usuelle et induit donc une topologie plus fine et mieux adaptée pour la modélisation financière, puisqu'elle prend en compte la structure temporelle des martingales. Dans la seconde partie, nous prouvons que tout couplage martingale dont les marginales sont approchées par des mesures de probabilité comparables dans l'ordre convexe peut être lui-même approché par des couplages martingale au sens de la distance de Wasserstein adaptée. Nous traitons ensuite d'applications variées de ce résultat. En particulier, nous renforçons un résultat de stabilité portant sur le problème de transport faible optimal et établissons un résultat de stabilité pour le problème de transport faible optimal martingale. Nous en déduisons la stabilité par rapport aux marginales du prix de sur-réplication de contrats à termes sur le VIX
This thesis is motivated by the study of the stability of the Martingale Optimal Transport problem, and is naturally structured around two parts. In the first part, we exhibit a new family of martingale couplings between two one-dimensional probability measures μ and ν in the convex order. This family contains in particular the inverse transform martingale coupling which is explicit in terms of the quantile functions of these marginal densities. The integral M_1(μ,ν) of |x-y| with respect to each of these couplings is smaller than or equal to twice the Wasserstein distance W_1(μ,ν) between μ and ν. We show that a similar inequality holds when replacing |x-y| and W_1 respectively with |x-y|^ρ and the product of W_ρ times the centered ρ-th moment of the second marginal to the power ρ-1, for any ρ∈[1,+∞). We then study the generalisation of this new stability inequality to higher dimensions. Last, we establish a strong connection between our new family of martingale couplings and the projection of a coupling between two given marginals in the convex order onto the set of martingale couplings between the same marginals. The latter projection is taken with respect to the adapted Wasserstein distance, which is greater than or equal to the usual Wasserstein distance and therefore induces a finer topology, which is more suitable to financial modelisation since it takes into account the temporal structure of martingales. In the second part, we prove that any martingale coupling whose marginals are approximated by probability measures in the convex order can be approximated by martingale couplings with respected to the adapted Wasserstein distance. We then discuss various applications of this result. In particular, we strengthen a stability result on the Optimal Weak Transport problem and establish a stability result on the Martingale Optimal Weak Transport problem. We deduce the stability with respect to the marginals of the superreplication price of VIX futures
APA, Harvard, Vancouver, ISO und andere Zitierweisen
27

Arsenteva, Polina. „Statistical modeling and analysis of radio-induced adverse effects based on in vitro and in vivo data“. Electronic Thesis or Diss., Bourgogne Franche-Comté, 2023. http://www.theses.fr/2023UBFCK074.

Der volle Inhalt der Quelle
Annotation:
Dans ce travail nous abordons le problème des effets indésirables induits par la radiothérapie sur les tissus sains. L'objectif est de proposer un cadre mathématique pour comparer les effets de différentes modalités d'irradiation, afin de pouvoir éventuellement choisir les traitements qui produisent le moins d'effets indésirables pour l’utilisation potentielle en clinique. Les effets secondaires sont étudiés dans le cadre de deux types de données : en termes de réponse omique in vitro des cellules endothéliales humaines, et en termes d'effets indésirables observés sur des souris dans le cadre d'expérimentations in vivo. Dans le cadre in vitro, nous rencontrons le problème de l'extraction d'informations clés à partir de données temporelles complexes qui ne peuvent pas être traitées avec les méthodes disponibles dans la littérature. Nous modélisons le fold change radio-induit, l'objet qui code la différence d'effet de deux conditions expérimentales, d’une manière qui permet de prendre en compte les incertitudes des mesures ainsi que les corrélations entre les entités observées. Nous construisons une distance, avec une généralisation ultérieure à une mesure de dissimilarité, permettant de comparer les fold changes en termes de toutes leurs propriétés statistiques importantes. Enfin, nous proposons un algorithme computationnellement efficace effectuant le clustering joint avec l'alignement temporel des fold changes. Les caractéristiques clés extraites de ces dernières sont visualisées à l'aide de deux types de représentations de réseau, dans le but de faciliter l'interprétation biologique. Dans le cadre in vivo, l’enjeu statistique est d’établir un lien prédictif entre des variables qui, en raison des spécificités du design expérimental, ne pourront jamais être observées sur les mêmes animaux. Dans le contexte de ne pas avoir accès aux lois jointes, nous exploitons les informations supplémentaires sur les groupes observés pour déduire le modèle de régression linéaire. Nous proposons deux estimateurs des paramètres de régression, l'un basé sur la méthode des moments et l'autre basé sur le transport optimal, ainsi que des estimateurs des intervalles de confiance basés sur le bootstrap stratifié
In this work we address the problem of adverse effects induced by radiotherapy on healthy tissues. The goal is to propose a mathematical framework to compare the effects of different irradiation modalities, to be able to ultimately choose those treatments that produce the minimal amounts of adverse effects for potential use in the clinical setting. The adverse effects are studied in the context of two types of data: in terms of the in vitro omic response of human endothelial cells, and in terms of the adverse effects observed on mice in the framework of in vivo experiments. In the in vitro setting, we encounter the problem of extracting key information from complex temporal data that cannot be treated with the methods available in literature. We model the radio-induced fold change, the object that encodes the difference in the effect of two experimental conditions, in the way that allows to take into account the uncertainties of measurements as well as the correlations between the observed entities. We construct a distance, with a further generalization to a dissimilarity measure, allowing to compare the fold changes in terms of all the important statistical properties. Finally, we propose a computationally efficient algorithm performing clustering jointly with temporal alignment of the fold changes. The key features extracted through the latter are visualized using two types of network representations, for the purpose of facilitating biological interpretation. In the in vivo setting, the statistical challenge is to establish a predictive link between variables that, due to the specificities of the experimental design, can never be observed on the same animals. In the context of not having access to joint distributions, we leverage the additional information on the observed groups to infer the linear regression model. We propose two estimators of the regression parameters, one based on the method of moments and the other based on optimal transport, as well as the estimators for the confidence intervals based on the stratified bootstrap procedure
APA, Harvard, Vancouver, ISO und andere Zitierweisen
28

Gordaliza, Pastor Paula. „Fair learning : une approche basée sur le transport optimale“. Thesis, Toulouse 3, 2020. http://www.theses.fr/2020TOU30084.

Der volle Inhalt der Quelle
Annotation:
L'objectif de cette thèse est double. D'une part, les méthodes de transport optimal sont étudiées pour l'inférence statistique. D'autre part, le récent problème de l'apprentissage équitable est considéré avec des contributions à travers le prisme de la théorie du transport optimal. L'utilisation généralisée des applications basées sur les modèles d'apprentissage automatique dans la vie quotidienne et le monde professionnel s'est accompagnée de préoccupations quant aux questions éthiques qui peuvent découler de l'adoption de ces technologies. Dans la première partie de cette thèse, nous motivons le problème de l'équité en présentant quelques résultats statistiques complets en étudiant le critère statistical parity par l'analyse de l'indice disparate impact sur l'ensemble de données réel Adult income. Il est important de noter que nous montrons qu'il peut être particulièrement difficile de créer des modèles d'apprentissage machine équitables, surtout lorsque les observations de formation contiennent des biais. Ensuite, une revue des mathématiques pour l'équité dans l'apprentissage machine est donné dans un cadre général, avec également quelques contributions nouvelles dans l'analyse du prix pour l'équité dans la régression et la classification. Dans cette dernière, nous terminons cette première partie en reformulant les liens entre l'équité et la prévisibilité en termes de mesures de probabilité. Nous analysons les méthodes de réparation basées sur le transport de distributions conditionnelles vers le barycentre de Wasserstein. Enfin, nous proposons le random repair qui permet de trouver un compromis entre une perte minimale d'information et un certain degré d'équité. La deuxième partie est dédiée à la théorie asymptotique du coût de transport empirique. Nous fournissons un Théorème de Limite Centrale pour la distance de Monge-Kantorovich entre deux distributions empiriques de tailles différentes n et m, Wp(Pn,Qm), p > = 1, avec observations sur R. Dans le cas de p > 1, nos hypothèses sont nettes en termes de moments et de régularité. Nous prouvons des résultats portant sur le choix des constantes de centrage. Nous fournissons une estimation consistente de la variance asymptotique qui permet de construire tests à deux échantillons et des intervalles de confiance pour certifier la similarité entre deux distributions. Ceux-ci sont ensuite utilisés pour évaluer un nouveau critère d'équité de l'ensemble des données dans la classification. En outre, nous fournissons un principe de déviations modérées pour le coût de transport empirique dans la dimension générale. Enfin, les barycentres de Wasserstein et le critère de variance en termes de la distance de Wasserstein sont utilisés dans de nombreux problèmes pour analyser l'homogénéité des ensembles de distributions et les relations structurelles entre les observations. Nous proposons l'estimation des quantiles du processus empirique de la variation de Wasserstein en utilisant une procédure bootstrap. Ensuite, nous utilisons ces résultats pour l'inférence statistique sur un modèle d'enregistrement de distribution avec des fonctions de déformation générale. Les tests sont basés sur la variance des distributions par rapport à leurs barycentres de Wasserstein pour lesquels nous prouvons les théorèmes de limite centrale, y compris les versions bootstrap
The aim of this thesis is two-fold. On the one hand, optimal transportation methods are studied for statistical inference purposes. On the other hand, the recent problem of fair learning is addressed through the prism of optimal transport theory. The generalization of applications based on machine learning models in the everyday life and the professional world has been accompanied by concerns about the ethical issues that may arise from the adoption of these technologies. In the first part of the thesis, we motivate the fairness problem by presenting some comprehensive results from the study of the statistical parity criterion through the analysis of the disparate impact index on the real and well-known Adult Income dataset. Importantly, we show that trying to make fair machine learning models may be a particularly challenging task, especially when the training observations contain bias. Then a review of Mathematics for fairness in machine learning is given in a general setting, with some novel contributions in the analysis of the price for fairness in regression and classification. In the latter, we finish this first part by recasting the links between fairness and predictability in terms of probability metrics. We analyze repair methods based on mapping conditional distributions to the Wasserstein barycenter. Finally, we propose a random repair which yields a tradeoff between minimal information loss and a certain amount of fairness. The second part is devoted to the asymptotic theory of the empirical transportation cost. We provide a Central Limit Theorem for the Monge-Kantorovich distance between two empirical distributions with different sizes n and m, Wp(Pn,Qm), p > = 1, for observations on R. In the case p > 1 our assumptions are sharp in terms of moments and smoothness. We prove results dealing with the choice of centering constants. We provide a consistent estimate of the asymptotic variance which enables to build two sample tests and confidence intervals to certify the similarity between two distributions. These are then used to assess a new criterion of data set fairness in classification. Additionally, we provide a moderate deviation principle for the empirical transportation cost in general dimension. Finally, Wasserstein barycenters and variance-like criterion using Wasserstein distance are used in many problems to analyze the homogeneity of collections of distributions and structural relationships between the observations. We propose the estimation of the quantiles of the empirical process of the Wasserstein's variation using a bootstrap procedure. Then we use these results for statistical inference on a distribution registration model for general deformation functions. The tests are based on the variance of the distributions with respect to their Wasserstein's barycenters for which we prove central limit theorems, including bootstrap versions
APA, Harvard, Vancouver, ISO und andere Zitierweisen
29

Gigli, Nicola. „Proprietes geometriques et analytiques de certaines structures non lisses“. Habilitation à diriger des recherches, Université de Nice Sophia-Antipolis, 2011. http://tel.archives-ouvertes.fr/tel-00769381.

Der volle Inhalt der Quelle
Annotation:
This work is to give an overview over the research that I've done up to now. The overall idea behind my interests has been that of understanding analytical and geometrical properties of non smooth spaces both from both a theoretical and a practical point of view. The two main classes of spaces on which I focussed are: the Wasserstein space (P2(M),W2) built over a Riemannian manifold, and abstract metric and metric-measure spaces, in particular those with Ricci curvature bounded below.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
30

Giorgi, Pierre-Antoine. „Analyse mathématique de modèles cinétiques en physique des plasmas“. Electronic Thesis or Diss., Aix-Marseille, 2019. http://www.theses.fr/2019AIXM0609.

Der volle Inhalt der Quelle
Annotation:
Cette thèse porte sur l'étude de quelques modèles cinétiques utilisés en physique des plasmas.Le premier modèle considéré est un système de Vlasov-Poisson 1D à deux espèces de particules (ions et électrons), dans un domaine d'espace borné, x∈(0,1), avec condition de réflexion directe au bord. Dans le cas linéaire, des caractéristiques généralisées sont définies, en s'assurant qu'on atteint le temps s=0 en un nombre fini de rebonds, le cas problématique étant celui où le champ électrique est sortant du domaine. Puis, pour des données initiales paires en vitesse, une solution globale continue est construite à l'aide des caractéristiques généralisées et d'un argument de point fixe. L'unicité locale d'une solution continue est démontrée, dans un cadre où il ne peut arriver deux rebonds successifs sur le même bord. Le second modèle étudié a été obtenu comme limite d'un système de Vlasov-Poisson à une espèce de particules en régime de rayon de Larmor fini. Pour des solutions vérifiant une condition de décroissance, une estimation de stabilité au sens de Wasserstein est prouvée, et une nouvelle preuve de l'existence de telles solutions est donnée. Le champ d'advection est alors lipschitzien. Enfin, des simulations numériques pour un système de Vlasov-Poisson à une dimension d'espace et de vitesse soumis à une onde extérieure sont réalisées pour étudier la réponse électronique. Un phénomène de battement entre deux ondes, l'une à la fréquence extérieure, l'autre à la fréquence de Landau, est mis en évidence
This thesis deals with the study of some kinetic models encountered in plasma physics.The first model considered is a 1D Vlasov-Poisson system representing the dynamics of two species of particles (ions and electrons) in a bounded set, x ∈ (0,1), with direct reflection boundary conditions. In the linear case, generalized characteristics are defined, ensuring the time s=0 to be reached after a finite number of bounces, the problematic case being when the electric field points outward of the boundary. Then, for initial conditions even in the velocity variable, a global continuous solution is built by means of generalized characteristics and a fixed point argument. Local uniqueness of a continuous solution is shown, in a frame where two successive bounces at the same boundary cannot occur. The second model was obtained as the limit of a Vlasov-Poisson system in the finite Larmor radius regime.For solutions satisfying a decay assumption, a Wasserstein stability estimate is proven, and a new proof of the existence of such solutions is given. The advection field is then Lipschitz continuous. Finally, numerical simulations are performed to investigate the kinetic response of electrons to an external drive. A beating between two waves, one at the external frequency, the other at the Landau frequency, is revealed
APA, Harvard, Vancouver, ISO und andere Zitierweisen
31

Zhang, Chaoen. „Long time behaviour of kinetic equations“. Thesis, Université Clermont Auvergne‎ (2017-2020), 2019. http://www.theses.fr/2019CLFAC056.

Der volle Inhalt der Quelle
Annotation:
Cette thèse est consacrée au comportement à long terme de l'équation cinétique de Fokker-Planck et de l'équation de McKean-Vlasov. Le manuscrit est composé d'une introduction et de six chapitres. L'équation cinétique de Fokker-Planck est un exemple de base de la théorie de l'hypocoercivité de Villani qui affirme la décroissance exponentielle dans le temps en l'absence de coercivité. Dans son mémoire AMS, Villani a prouvé l'hypocoercivité de l'équation cinétique de Fokker-Planck en H^1(\mu), L^2(\mu) ou entropie. Cependant, une condition sur la bornitude de l'Hessien de l'hamiltonien a été imposée dans le cas entropique. Nous montrons au chapitre 2 comment nous pouvons affaiblir cette hypothèse par des multiplicateurs bien choisis à l'aide d'une inégalité de Sobolev logarithmique pondérée. Nous montrons que nos conditions sont satisfaites sous certaines conditions pratiques de fonction de Lyapunov.Dans le chapitre 4, nous appliquons les idées de Villani et certaines conditions de Lyapunov pour prouver l'hypocoercivité en H^1 pondéré dans le cas d'une interaction de champ moyen avec un taux de convergence exponentielle indépendant du nombre de particules. Pour cet objectif nous devons établir l'inégalité de Poincaré uniforme (sur le nombre de particules) et rendre une estimation connue de Villani qui était dimension-dépendante, dimension-indépendante.Au chapitre 6, nous étudions la contraction hypocoercive de la distance L^2-Wasserstein et nous retrouvons le taux optimal dans le cas du potentiel quadratique. La méthode est basée sur la dérivée en temps de la distance de Wasserstein. Au chapitre 7, le théorème d'hypoercivité de Villani dans l'espace H^1 pondéré est généralisé aux espaces H^k pondérés par une norm auxiliaire avec des termes mélangés bien choisis.L'équation de McKean-Vlasov est une équation diffusive non linéaire non locale. Il est bien connu qu'il a une structure de gradient-flot. Cependant, les résultats connus dépendent fortement des hypothèses de convexité. De telles hypothèses sont notamment assouplies dans les chapitres 3 et 5 où nous prouvons la convergence exponentielle vers l'équilibre respectivement en énergie libre et la distance L^1-Wasserstain, sous la condition de Dobrushin-Zegarlinski de l'absence de phase de transition. Notre approche est basée sur la théorie de la limite de champ moyen. Autrement dit, nous étudions le système d'un grand nombre de particules avec une interaction du type champ-moyen, puis passons à la limite par la propagation de chaos
This dissertation is devoted to the long time behaviour of the kinetic Fokker-Planck equation and of the McKean-Vlasov equation. The manuscript is composed of an introduction and six chapters.The kinetic Fokker-Planck equation is a basic example for Villani's hypocoercivity theory which asserts the exponential decay in large time in the absence of coercivity. In his memoir, Villani proved the hypocoercivity for the kinetic Fokker-Planck equation in either weighted H^1, weighted L^2 or entropy.However, a boundedness condition of the Hessian of the Hamiltonian was imposed in the entropic case. We show in Chapter 2 how we can get rid of this assumption by well-chosen multipliers with the help of a weighted logarithmic Sobolev inequality. Such a functional inequality can be obtained by some tractable Lyapunov condition.In Chapter 4, we apply Villani's ideas and some Lyapunov conditions to prove hypocoercivity in weighted H^1 in the case of mean-field interaction with a rate of exponential convergence independent of the number N of particles. For proving this we should prove the Poincaré inequality with a constant independent of N, and rends a dimension dependent boundeness estimate of Villani dimension-free by means of the stronger uniform log-Sobolev inequality and Lyapunov function method. In Chapter 6, we study the hypocoercive contraction in L^2-Wasserstein distance and we recover the optimal rate in the quadratic potential case. The method is based on the temporal derivative of the Wasserstein distance.In Chapter 7, Villani's hypoercivity theorem in weighted H^1 space is extended to weighted H^k spaces by choosing carefully some appropriate mixed terms in the definition of norm of H^k.The McKean-Vlasov equation is a nonlinear nonlocal diffusive equation. It is well-Known that it has a gradient flow structure. However, the known results strongly depend on convexity assumptions. Such assumptions are notably relaxed in Chapter 3 and Chapter 5 where we prove the exponential convergence to equilibrium respectively in free energy and the L^1-Wasserstain distance. Our approach is based on the mean field limit theory. That is, we study the associated system of a large numer of paricles with mean-field interaction and then pass to the limit by propagation of chaos
APA, Harvard, Vancouver, ISO und andere Zitierweisen
32

Bui, Thi Thien Trang. „Modèle de régression pour des données non-Euclidiennes en grande dimension. Application à la classification de taxons en anatomie computationnelle“. Thesis, Toulouse, INSA, 2019. http://www.theses.fr/2019ISAT0021.

Der volle Inhalt der Quelle
Annotation:
Dans cette thèse, nous étudions un modèle de régression avec des entrées de type distribution et le problème de test d'hypothèse pour la détection de signaux dans un modèle de régression. Nos modèles ont été appliqués aux données de sensibilité auditive mesurées par otoémissions acoustiques, cette mesure biologique contenant potentiellement des informations annexes sur l'individu (age, sexe, population/espèce).Dans la première partie, un nouveau modèle de régression de distribution pour les distributions de probabilité est introduit. Ce modèle est basé sur un cadre de régression RKHS, dans lequel les noyaux universels sont construits à l'aide de distances de Wasserstein pour les distributions appartenant à l'espace Wasserstein de \Omega, où \Omega est un sous-espace compact de l'espace réel. Nous prouvons la propriété de noyau universel de ces noyaux et utilisons ce cadre pour effectuer des régressions sur des fonctions. Différents modèles de régression sont d'abord comparés à celui proposé sur des données fonctionnelles simulées. Nous appliquons ensuite notre modèle de régression aux réponses de distribution des émissions otoascoutiques évoquées transitoires (TEOAE) et aux prédicteurs réels de l'âge. Dans la deuxième partie, en considérant un modèle de régression, nous abordons la question du test de la nullité de la fonction de régression. Nous proposons tout d'abord une nouvelle procédure de test unique basée sur un noyau symétrique général et une estimation de la variance des observations. Les valeurs critiques correspondantes sont construites pour obtenir des tests non-asymptotiques de niveau \alpha. Nous introduisons ensuite une procédure d'agrégation afin d'éviter le choix complexe du noyau et des paramètres de celui-ci. Les tests multiples vérifient les propriétés non asymptotiques et adaptatives au sens minimax sur plusieurs classes d'alternatives régulières
In this thesis, we study a regression model with distribution entries and the testing hypothesis problem for signal detection in a regression model. We aim to apply these models in hearing sensitivity measured by the transient evoked otoacoustic emissions (TEOAEs) data to improve our knowledge in the auditory investigation. In the first part, a new distribution regression model for probability distributions is introduced. This model is based on a Reproducing Kernel Hilbert Space (RKHS) regression framework, where universal kernels are built using Wasserstein distances for distributions belonging to \Omega) and \Omega is a compact subspace of the real space. We prove the universal kernel property of such kernels and use this setting to perform regressions on functions. Different regression models are first compared with the proposed one on simulated functional data. We then apply our regression model to transient evoked otoascoutic emission (TEOAE) distribution responses and real predictors of the age. This part is a joint work with Loubes, J-M., Risser, L. and Balaresque, P..In the second part, considering a regression model, we address the question of testing the nullity of the regression function. The testing procedure is available when the variance of the observations is unknown and does not depend on any prior information on the alternative. We first propose a single testing procedure based on a general symmetric kernel and an estimation of the variance of the observations. The corresponding critical values are constructed to obtain non asymptotic level \alpha tests. We then introduce an aggregation procedure to avoid the difficult choice of the kernel and of the parameters of the kernel. The multiple tests satisfy non-asymptotic properties and are adaptive in the minimax sense over several classes of regular alternatives
APA, Harvard, Vancouver, ISO und andere Zitierweisen
33

Bonnotte, Nicolas. „Unidimensional and Evolution Methods for Optimal Transportation“. Phd thesis, Université Paris Sud - Paris XI, 2013. http://tel.archives-ouvertes.fr/tel-00946781.

Der volle Inhalt der Quelle
Annotation:
In dimension one, optimal transportation is rather straightforward. The easiness with which a solution can be obtained in that setting has recently been used to tackle more general situations, each time thanks to the same method. First, disintegrate your problem to go back to the unidimensional case, and apply the available 1D methods to get a first result; then, improve it gradually using some evolution process.This dissertation explores that direction more thoroughly. Looking back at two problems only partially solved this way, I show how this viewpoint in fact allows to go even further.The first of these two problems concerns the computation of Yann Brenier's optimal map. Guillaume Carlier, Alfred Galichon, and Filippo Santambrogio found a new way to obtain it, thanks to an differential equation for which an initial condition is given by the Knothe--Rosenblatt rearrangement. (The latter is precisely defined by a series of unidimensional transformations.) However, they only dealt with discrete target measures; I~generalize their approach to a continuous setting. By differentiation, the Monge--Ampère equation readily gives a PDE satisfied by the Kantorovich potential; but to get a proper initial condition, it is necessary to use the Nash--Moser version of the implicit function theorem.The basics of optimal transport are recalled in the first chapter, and the Nash--Moser theory is exposed in chapter 2. My results are presented in chapter 3, and numerical experiments in chapter 4.The last chapter deals with the IDT algorithm, devised by François Pitié, Anil C. Kokaram, and Rozenn Dahyot. It builds a transport map that seems close enough to the optimal map for most applications. A complete mathematical understanding of the procedure is, however, still lacking. An interpretation as a gradient flow in the space of probability measures is proposed, with the sliced Wasserstein distance as the functional. I also prove the equivalence between the sliced and usual Wasserstein distances.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
34

Malrieu, Florent. „Inégalités fonctionnelles et comportement en temps long de quelques processus de Markov“. Habilitation à diriger des recherches, Université Rennes 1, 2010. http://tel.archives-ouvertes.fr/tel-00542278.

Der volle Inhalt der Quelle
Annotation:
Les travaux présentés concernent trois thématiques connexes~: Interprétation et étude probabiliste d'équations de McKean-Vlasov - propagation du chaos, - estimation quantitative de la convergence à l'équilibre, - modèles cinétiques. Inégalités fonctionnelles - inégalités fonctionnelles et concentration de la mesure pour les schémas d'Euler, - comportement en temps long de diffusions inhomogènes, - inégalités fonctionnelles et concentration de la mesure pour un mélange. Processus de Markov déterministes par morceaux - modélisation markovienne (télécomunications, biologie, chimie), - construction de couplage explicites et convergence en temps long, - propriétés de la mesure invariante. Le fil rouge de ce travail est la recherche de bornes quantitatives pour l'étude de processus de Markov issus de la modélisation (physique, biologie, etc). Souvent, ces processus possèdent des propriétés de symétrie, de régularité ou de monotonie qu'il est possible d'exploiter pour étudier finement leurs comportements. L'idée est donc ici non pas de chercher à établir des propriétés génériques et qualitatives valables pour la classe la plus large de processus mais bien d'utiliser la dynamique spécifique des processus étudiés pour décrire leur convergence à l'équilibre.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
35

Liero, Matthias. „Variational methods for evolution“. Doctoral thesis, Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät II, 2013. http://dx.doi.org/10.18452/16685.

Der volle Inhalt der Quelle
Annotation:
Das Thema dieser Dissertation ist die Anwendung von Variationsmethoden auf Evolutionsgleichungen parabolischen und hyperbolischen Typs. Im ersten Teil der Arbeit beschäftigen wir uns mit Reaktions-Diffusions-Systemen, die sich als Gradientensysteme schreiben lassen. Hierbei verstehen wir unter einem Gradientensystem ein Tripel bestehend aus einem Zustandsraum, einem Entropiefunktional und einer Dissipationsmetrik. Wir geben Bedingungen an, die die geodätische Konvexität des Entropiefunktionals sichern. Geodätische Konvexität ist eine wertvolle aber auch starke strukturelle Eigenschaft und schwer zu zeigen. Wir zeigen anhand zahlreicher Beispiele, darunter ein Drift-Diffusions-System, dass dennoch interessante Systeme existieren, die diese Eigenschaft besitzen. Einen weiteren Punkt dieser Arbeit stellt die Anwendung von Gamma-Konvergenz auf Gradientensysteme dar. Wir betrachten hierbei zwei Modellsysteme aus dem Bereich der Mehrskalenprobleme: Erstens, die rigorose Herleitung einer Allen-Cahn-Gleichung mit dynamischen Randbedingungen und zweitens, einer Interface-Bedingung für eine eindimensionale Diffusionsgleichung jeweils aus einem reinen Bulk-System. Im zweiten Teil der Arbeit beschäftigen wir uns mit dem sog. Weighted-Inertia-Dissipation-Energy-Prinzip für Evolutionsgleichungen. Hierbei werden Trajektorien eines Systems als (Grenzwerte von) Minimierer(n) einer parametrisierten Familie von Funktionalen charakterisiert. Dies erlaubt es, Werkzeuge aus der Theorie der Variationsrechung auf Evolutionsprobleme anzuwenden. Wir zeigen, dass Minimierer der WIDE-Funktionale gegen Lösungen des Ausgangsproblems konvergieren. Hierbei betrachten wir getrennt voneinander den Fall des beschränkten und des unbeschränkten Zeitintervalls, die jeweils mit verschiedenen Methoden behandelt werden.
This thesis deals with the application of variational methods to evolution problems governed by partial differential equations. The first part of this work is devoted to systems of reaction-diffusion equations that can be formulated as gradient systems with respect to an entropy functional and a dissipation metric. We provide methods for establishing geodesic convexity of the entropy functional by purely differential methods. Geodesic convexity is beneficial, however, it is a strong structural property of a gradient system that is rather difficult to achieve. Several examples, including a drift-diffusion system, provide a survey on the applicability of the theory. Next, we demonstrate the application of Gamma-convergence, to derive effective limit models for multiscale problems. The crucial point in this investigation is that we rely only on the gradient structure of the systems. We consider two model problems: The rigorous derivation of an Allen-Cahn system with bulk/surface coupling and of an interface condition for a one-dimensional diffusion equation. The second part of this thesis is devoted to the so-called Weighted-Inertia-Dissipation-Energy principle. The WIDE principle is a global-in-time variational principle for evolution equations either of conservative or dissipative type. It relies on the minimization of a specific parameter-dependent family of functionals (WIDE functionals) with minimizers characterizing entire trajectories of the system. We prove that minimizers of the WIDE functional converge, up to subsequences, to weak solutions of the limiting PDE when the parameter tends to zero. The interest for this perspective is that of moving the successful machinery of the Calculus of Variations.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
36

Riou-Durand, Lionel. „Theoretical contributions to Monte Carlo methods, and applications to Statistics“. Thesis, Université Paris-Saclay (ComUE), 2019. http://www.theses.fr/2019SACLG006/document.

Der volle Inhalt der Quelle
Annotation:
La première partie de cette thèse concerne l'inférence de modèles statistiques non normalisés. Nous étudions deux méthodes d'inférence basées sur de l'échantillonnage aléatoire : Monte-Carlo MLE (Geyer, 1994), et Noise Contrastive Estimation (Gutmann et Hyvarinen, 2010). Cette dernière méthode fut soutenue par une justification numérique d'une meilleure stabilité, mais aucun résultat théorique n'avait encore été prouvé. Nous prouvons que Noise Contrastive Estimation est plus robuste au choix de la distribution d'échantillonnage. Nous évaluons le gain de précision en fonction du budget computationnel. La deuxième partie de cette thèse concerne l'échantillonnage aléatoire approché pour les distributions de grande dimension. La performance de la plupart des méthodes d’échantillonnage se détériore rapidement lorsque la dimension augmente, mais plusieurs méthodes ont prouvé leur efficacité (e.g. Hamiltonian Monte Carlo, Langevin Monte Carlo). Dans la continuité de certains travaux récents (Eberle et al., 2017 ; Cheng et al., 2018), nous étudions certaines discrétisations d’un processus connu sous le nom de kinetic Langevin diffusion. Nous établissons des vitesses de convergence explicites vers la distribution d'échantillonnage, qui ont une dépendance polynomiale en la dimension. Notre travail améliore et étend les résultats de Cheng et al. pour les densités log-concaves
The first part of this thesis concerns the inference of un-normalized statistical models. We study two methods of inference based on sampling, known as Monte-Carlo MLE (Geyer, 1994), and Noise Contrastive Estimation (Gutmann and Hyvarinen, 2010). The latter method was supported by numerical evidence of improved stability, but no theoretical results had yet been proven. We prove that Noise Contrastive Estimation is more robust to the choice of the sampling distribution. We assess the gain of accuracy depending on the computational budget. The second part of this thesis concerns approximate sampling for high dimensional distributions. The performance of most samplers deteriorates fast when the dimension increases, but several methods have proven their effectiveness (e.g. Hamiltonian Monte Carlo, Langevin Monte Carlo). In the continuity of some recent works (Eberle et al., 2017; Cheng et al., 2018), we study some discretizations of the kinetic Langevin diffusion process and establish explicit rates of convergence towards the sampling distribution, that scales polynomially fast when the dimension increases. Our work improves and extends the results established by Cheng et al. for log-concave densities
APA, Harvard, Vancouver, ISO und andere Zitierweisen
37

Reygner, Julien. „Comportements en temps long et à grande échelle de quelques dynamiques de collision“. Thesis, Paris 6, 2014. http://www.theses.fr/2014PA066471/document.

Der volle Inhalt der Quelle
Annotation:
Cette thèse comporte trois parties essentiellement indépendantes, dont chacune est consacrée à l'étude d'un système de particules, suivant une dynamique déterministe ou aléatoire, et à l'intérieur duquel les interactions se font uniquement aux collisions entre les particules.La Partie I propose une étude numérique et théorique des états stationnaires hors de l'équilibre du Modèle d'Échange Complet, introduit en physique pour comprendre le transport de la chaleur dans certains matériaux poreux.La Partie II est consacrée à un système de particules browniennes évoluant sur la droite réelle et interagissant à travers leur rang. Le comportement limite de ce système, en temps long et à grand nombre de particules, est décrit, puis les résultats sont appliqués à l'étude d'un modèle de marché financier dit modèle d'Atlas en champ moyen.La Partie III introduit une version multitype du système de particules étudié dans la partie précédente, qui permet d'approcher des systèmes paraboliques d'équations aux dérivées partielles non-linéaires. La limite petit bruit de ce système est appelée dynamique des particules collantes multitype et approche cette fois des systèmes hyperboliques. Une étude détaillée de cette dynamique donne des estimations de stabilité en distance de Wasserstein sur les solutions de ces systèmes
This thesis contains three independent parts, each one of which is dedicated to the study of a particle system, following either a deterministic or a stochastic dynamics, and in which interactions only occur at collisions. Part I contains a numerical and theoretical study of nonequilibrium steady states of the Complete Exchange Model, which was introduced by physicists in order to understand heat transfer in some porous materials. Part II is dedicated to a system of Brownian particles evolving on the real line and interacting through their ranks. The long time and mean-field behaviour of this system is described, then the results are applied to the study of a model of equity market called the mean-field Atlas model. Part III introduces a multitype version of the particle system studied in the previous part, which allows to approximate parabolic systems of nonlinear partial differential equations. The small noise limit of of this system is called multitype sticky particle dynamics and now approximates hyperbolic systems. A detailed study of this dynamics provides stability estimates in Wasserstein distance for the solutions of these systems
APA, Harvard, Vancouver, ISO und andere Zitierweisen
38

Kashlak, Adam B. „A concentration inequality based statistical methodology for inference on covariance matrices and operators“. Thesis, University of Cambridge, 2017. https://www.repository.cam.ac.uk/handle/1810/267833.

Der volle Inhalt der Quelle
Annotation:
In the modern era of high and infinite dimensional data, classical statistical methodology is often rendered inefficient and ineffective when confronted with such big data problems as arise in genomics, medical imaging, speech analysis, and many other areas of research. Many problems manifest when the practitioner is required to take into account the covariance structure of the data during his or her analysis, which takes on the form of either a high dimensional low rank matrix or a finite dimensional representation of an infinite dimensional operator acting on some underlying function space. Thus, novel methodology is required to estimate, analyze, and make inferences concerning such covariances. In this manuscript, we propose using tools from the concentration of measure literature–a theory that arose in the latter half of the 20th century from connections between geometry, probability, and functional analysis–to construct rigorous descriptive and inferential statistical methodology for covariance matrices and operators. A variety of concentration inequalities are considered, which allow for the construction of nonasymptotic dimension-free confidence sets for the unknown matrices and operators. Given such confidence sets a wide range of estimation and inferential procedures can be and are subsequently developed. For high dimensional data, we propose a method to search a concentration in- equality based confidence set using a binary search algorithm for the estimation of large sparse covariance matrices. Both sub-Gaussian and sub-exponential concentration inequalities are considered and applied to both simulated data and to a set of gene expression data from a study of small round blue-cell tumours. For infinite dimensional data, which is also referred to as functional data, we use a celebrated result, Talagrand’s concentration inequality, in the Banach space setting to construct confidence sets for covariance operators. From these confidence sets, three different inferential techniques emerge: the first is a k-sample test for equality of covariance operator; the second is a functional data classifier, which makes its decisions based on the covariance structure of the data; the third is a functional data clustering algorithm, which incorporates the concentration inequality based confidence sets into the framework of an expectation-maximization algorithm. These techniques are applied to simulated data and to speech samples from a set of spoken phoneme data. Lastly, we take a closer look at a key tool used in the construction of concentration based confidence sets: Rademacher symmetrization. The symmetrization inequality, which arises in the probability in Banach spaces literature, is shown to be connected with optimal transport theory and specifically the Wasserstein distance. This insight is used to improve the symmetrization inequality resulting in tighter concentration bounds to be used in the construction of nonasymptotic confidence sets. A variety of other applications are considered including tests for data symmetry and tightening inequalities in Banach spaces. An R package for inference on covariance operators is briefly discussed in an appendix chapter.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
39

Riou-Durand, Lionel. „Theoretical contributions to Monte Carlo methods, and applications to Statistics“. Electronic Thesis or Diss., Université Paris-Saclay (ComUE), 2019. http://www.theses.fr/2019SACLG006.

Der volle Inhalt der Quelle
Annotation:
La première partie de cette thèse concerne l'inférence de modèles statistiques non normalisés. Nous étudions deux méthodes d'inférence basées sur de l'échantillonnage aléatoire : Monte-Carlo MLE (Geyer, 1994), et Noise Contrastive Estimation (Gutmann et Hyvarinen, 2010). Cette dernière méthode fut soutenue par une justification numérique d'une meilleure stabilité, mais aucun résultat théorique n'avait encore été prouvé. Nous prouvons que Noise Contrastive Estimation est plus robuste au choix de la distribution d'échantillonnage. Nous évaluons le gain de précision en fonction du budget computationnel. La deuxième partie de cette thèse concerne l'échantillonnage aléatoire approché pour les distributions de grande dimension. La performance de la plupart des méthodes d’échantillonnage se détériore rapidement lorsque la dimension augmente, mais plusieurs méthodes ont prouvé leur efficacité (e.g. Hamiltonian Monte Carlo, Langevin Monte Carlo). Dans la continuité de certains travaux récents (Eberle et al., 2017 ; Cheng et al., 2018), nous étudions certaines discrétisations d’un processus connu sous le nom de kinetic Langevin diffusion. Nous établissons des vitesses de convergence explicites vers la distribution d'échantillonnage, qui ont une dépendance polynomiale en la dimension. Notre travail améliore et étend les résultats de Cheng et al. pour les densités log-concaves
The first part of this thesis concerns the inference of un-normalized statistical models. We study two methods of inference based on sampling, known as Monte-Carlo MLE (Geyer, 1994), and Noise Contrastive Estimation (Gutmann and Hyvarinen, 2010). The latter method was supported by numerical evidence of improved stability, but no theoretical results had yet been proven. We prove that Noise Contrastive Estimation is more robust to the choice of the sampling distribution. We assess the gain of accuracy depending on the computational budget. The second part of this thesis concerns approximate sampling for high dimensional distributions. The performance of most samplers deteriorates fast when the dimension increases, but several methods have proven their effectiveness (e.g. Hamiltonian Monte Carlo, Langevin Monte Carlo). In the continuity of some recent works (Eberle et al., 2017; Cheng et al., 2018), we study some discretizations of the kinetic Langevin diffusion process and establish explicit rates of convergence towards the sampling distribution, that scales polynomially fast when the dimension increases. Our work improves and extends the results established by Cheng et al. for log-concave densities
APA, Harvard, Vancouver, ISO und andere Zitierweisen
40

Godinho, David. „Contribution à l'étude des équations de Boltzmann, Kac et Keller-Segel à l'aide d'équations différentielles stochastiques non linéaires“. Phd thesis, Université Paris-Est, 2013. http://tel.archives-ouvertes.fr/tel-00931392.

Der volle Inhalt der Quelle
Annotation:
L'objet de cette thèse est l'étude de l'asymptotique des collisions rasantes pour les équations de Kac et de Boltzmann ainsi que l'étude de la propagation du chaos pour l'équation de Keller-Segel dans un cadre sous-critique à l'aide d'équations différentielles stochastiques non linéaires. Le premier chapitre est consacré à l'équation de Kac avec un potentiel Maxwellien. Nous commençons par donner une vitesse de convergence explicite (que l'on pense être optimale) dans le cadre de l'asymptotique des collisions rasantes. Puis nous approchons la solution de l'équation de Kac dans le cadre général, ce qui nous permet de montrer la propagation du chaos pour un système de particules vers cette dernière de manière quantitative. Dans le deuxième chapitre, nous étudions l'asymptotique des collisions rasantes pour l'équation de Boltzmann avec des potentiels mous et de Coulomb. Nous donnons là encore des vitesses de convergence explicites (mais non optimales). Enfin dans le troisième et dernier chapitre, nous montrons la propagation du chaos pour l'équation de Keller-Segel dans un cadre sous-critique. Pour cela, nous utilisons des arguments de compacité (tension du système de particules).
APA, Harvard, Vancouver, ISO und andere Zitierweisen
41

Schrieber, Jörn. „Algorithms for Optimal Transport and Wasserstein Distances“. Doctoral thesis, 2019. http://hdl.handle.net/11858/00-1735-0000-002E-E5B2-B.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
42

Sommerfeld, Max. „Wasserstein Distance on Finite Spaces: Statistical Inference and Algorithms“. Doctoral thesis, 2017. http://hdl.handle.net/11858/00-1735-0000-0023-3FA1-C.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
43

LUINI, EDOARDO GLAUCO. „Nonparametric density estimation with Wasserstein distance for actuarial applications“. Doctoral thesis, 2020. http://hdl.handle.net/11573/1365683.

Der volle Inhalt der Quelle
Annotation:
Density estimation is a central topic in statistics and a fundamental task of actuarial sciences. In this work, we present an algorithm for approximating multivariate empirical densities with a piecewise constant distribution defined on a hyperrectangular-shaped partition of the domain. The piecewise constant distribution is constructed through a hierarchical bisection scheme, such that locally, the sample cannot be statistically distinguished from a uniform distribution. The Wasserstein distance represents the basic element of the bisection technique, and has been used to measure the uniformity of the sample data points lying in each partition element. Since the resulting density estimator can be efficiently and concisely represented%requires significantly less to be stored, it can be used whenever the information contained in a multivariate sample needs to be preserved, transferred or analysed. Also, the proposed methodology is peculiar because Wasserstein distance makes it possible to establish an upper bound on the absolute deviation, in terms of tail value at risk, between original sample and estimator marginals. For these features, our algorithm can play an important role in nowadays insurance and financial environments characterised by greater complexity, increasingly interconnections and advanced quantitative approaches. Its applications range from pricing, to capital modelling and, in general, to all those contexts where multivariate problems arise.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
44

HSU, WEI-CHE, und 許維哲. „A Generative Adversarial Network in Domain Adaptation by Utilizing the Wasserstein distance“. Thesis, 2019. http://ndltd.ncl.edu.tw/handle/nuv37w.

Der volle Inhalt der Quelle
Annotation:
碩士
國立中正大學
電機工程研究所
107
Transfer learning is an important branch of machine learning, mainly used with unsupervised learning or semi-unsupervised learning, these two traditional machine learning methods. Learning important features of prior knowledge domain and generalizing them into different domains is the main subject. Domain adaptation is an important field of transfer learning and its the main goal is to measure the distribution of source domain as input and target domain output to increase the classification accuracy in unlabeled data. The powerful adversarial ability of generating GAN (Generative Adversarial Nets, GAN) makes the generated pictures more similar to real pictures, and derives a variety of GAN variants. In order to reduce training cost and rapidly transfer data in the domain adaptation, the main contribution in our research is applying MLP (Multi-layer perceptron) as the main component architecture, and using Wasserstein distance to evaluate the distribution of the probability between source and the target data in domain adaptation. We improve some disadvantages of GAN by using Consistency Term to modify the penalty function. Another contribution in our research is to apply our architecture in handwritten recognition dataset (MNIST, USPS) and object recognition dataset (Office-Caltech10) with two different features (SURF, DeCAF), and compare different deep transfer learning methods with 12 tasks between the source and target.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
45

„Transportation Techniques for Geometric Clustering“. Doctoral diss., 2020. http://hdl.handle.net/2286/R.I.57239.

Der volle Inhalt der Quelle
Annotation:
abstract: This thesis introduces new techniques for clustering distributional data according to their geometric similarities. This work builds upon the optimal transportation (OT) problem that seeks global minimum cost for matching distributional data and leverages the connection between OT and power diagrams to solve different clustering problems. The OT formulation is based on the variational principle to differentiate hard cluster assignments, which was missing in the literature. This thesis shows multiple techniques to regularize and generalize OT to cope with various tasks including clustering, aligning, and interpolating distributional data. It also discusses the connections of the new formulation to other OT and clustering formulations to better understand their gaps and the means to close them. Finally, this thesis demonstrates the advantages of the proposed OT techniques in solving machine learning problems and their downstream applications in computer graphics, computer vision, and image processing.
Dissertation/Thesis
Doctoral Dissertation Computer Engineering 2020
APA, Harvard, Vancouver, ISO und andere Zitierweisen
46

Tameling, Carla. „Empirical Optimal Transport on Discrete Spaces: Limit Theorems, Distributional Bounds and Applications“. Doctoral thesis, 2018. http://hdl.handle.net/11858/00-1735-0000-002E-E552-1.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
47

Jabłoński, Jędrzej. „Structured population models for predator-prey interactions. The case of Daphnia and size selective planktivorous fish“. Doctoral thesis, 2014.

Den vollen Inhalt der Quelle finden
Annotation:
In this thesis a model of the dynamics of size-structured population subject to selective predation is built and analyzed. The study is motivated by biological phenomena concerning limnology and oceanography, and in particular diversity of first consumers in aquatic ecosystems. An individual-based model of size-selective visual predator-harvester based on the concept of optimal foraging is proposed. Farther, a simplification of the model, described in terms of operators on the space of measures, is derived based on Holling II-type functional response to eliminate inherent difficulties of individual-based approach. The results are compared against experimental evidence. Considerations involving populations dynamics, namely growth, birth and mortality, are examined in the framework of measure-valued solutions to transport equation and various distances arising from optimal transportation theory. To this end, efficient algorithms for solving transportation problem on a real line are found and finally, numerical schemes based on particle methods for structured population models are improved. Moreover, approximation theory for Radon measures is developed.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
48

IACOMINI, ELISA. „Mathematical models and methods for traffic flow and stop & go waves“. Doctoral thesis, 2020. http://hdl.handle.net/11573/1387448.

Der volle Inhalt der Quelle
Annotation:
In this thesis we are concerned with mathematical methods and models for traffic flow, with special emphasis to second-order effects like Stop & Go waves. To begin with, we investigate the sensitivity of the celebrated Lighthill-Whitham-Richards model on network to its parameters and to the network itself. The quantification of sensitivity is obtained by measuring the Wasserstein distance between two LWR solutions corresponding to different inputs. To this end, we propose a numerical method to approximate the Wasserstein distance between two density distributions defined on a network. After that, we present a new multi-scale method for reproducing traffic flow, which couples a first order macroscopic model with a second-order microscopic model, avoiding any interface or boundary conditions between them. The new multi-scale model is characterized by the fact that microscopic and macroscopic descriptions are not spatially or temporally separated. Furthermore, a delayed LWR model on networks is proposed in order to allow simple first-order models to describe complex second-order effects caused by bounded accelerations. A time delay term is introduced in the flux term and its impact is studied from the numerical point of view. Lastly, we focus on Stop & Go waves, a typical phenomenon of congested traffic flow. Real data are used to point out the main features of this phenomenon, then we investigate the possibility to reproduce it using new traffic models specifically conceived for this purpose
APA, Harvard, Vancouver, ISO und andere Zitierweisen
49

CAPONERA, ALESSIA. „Statistical inference for spherical functional autoregressions“. Doctoral thesis, 2020. http://hdl.handle.net/11573/1363165.

Der volle Inhalt der Quelle
Annotation:
The main purpose of this thesis is to address some foundational questions regarding time-dependent spherical random fields and, then, to investigate some new estimation procedures for the class of spherical functional autoregressions.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
Wir bieten Rabatte auf alle Premium-Pläne für Autoren, deren Werke in thematische Literatursammlungen aufgenommen wurden. Kontaktieren Sie uns, um einen einzigartigen Promo-Code zu erhalten!

Zur Bibliographie