To see the other types of publications on this topic, follow the link: Modèles paramétriques (statistique).

Dissertations / Theses on the topic 'Modèles paramétriques (statistique)'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Modèles paramétriques (statistique).'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Liquet, Benoit. "Sélection de modèles semi-paramétriques." Bordeaux 2, 2002. http://www.theses.fr/2002BOR20958.

Full text
Abstract:
Cette thèse développe des méthodes de sélection de modèles pour l'application en Bio-stastistique. Dans la première partie, nous proposons une méthode et un programme de correction du niveau de signification d'un test lorsque plusieurs codages d'une variable explicative sont essayés. La deuxième partie de la thèse est consacrée au développement d'un critère d'information général permettant de sélectionner un estimateur parmi une famille d'estimateurs semi-paramétriques. Le critère que nous proposons est basé sur l'estimation par bootstrap de l'information de Kullback-Leibler. Enfin, la troisième partie présente un critère de sélection en présence des données incomplètes. Ce critère, construit sur l'espérance de la log-vraisemblance observée, permet en particulier de sélectionner le paramètre de lissage dans l'estimation lisse de la fonction de risque et de choisir entre des modèles stratifiés et des modèles à risques proportionnels.
APA, Harvard, Vancouver, ISO, and other styles
2

Tadj, Amel. "Sur les modèles non paramétriques conditionnels en statistique fonctionnelle." Toulouse 3, 2011. http://thesesups.ups-tlse.fr/1219/.

Full text
Abstract:
La problématique abordée dans cette thèse est l'estimation non paramétrique des modèles conditionnels à variable explicative fonctionnelle en traitant deux cas : le cas où la variable réponse est réelle et le cas d'une variable réponse fonctionnelle. On établit la convergence uniforme presque complète d'estimateurs non paramétriques pour certains modèles conditionnels. Dans un premier temps, nous considérons une suite d'observation si. I. D. Et nous construisons des estimateurs par la méthode du noyau pour la fonction de régression généralisée, la fonction de répartition conditionnelle, la densité conditionnelle, la fonction de hasard conditionnelle et le mode conditionnel. Nous étudions la convergence uniforme presque complète de ces estimateurs en précisant leurs vitesses. A titre illustratif, nous donnons des exemples d'applications sur des données simulées. Dans un second temps, on généralise nos résultats au cas d'une variable réponse fonctionnelle (appartenant à un espace de Banach) et on estime la régression classique. Cette généralisation a été étudiée dans les deux cas : les observations i. I. D. Ainsi que le cas dépendant. Dans ce dernier, nous avons fixé comme objectif la convergence presque complète ponctuelle lorsque les observations sont Béta-mélangeantes. Nos résultats asymptotiques exploitent bien la structure topologique de l'espace fonctionnel de nos observations et le caractère fonctionnel de nos modèles. En effet, toutes nos vitesses de convergence sont quantifiées en fonction de la concentration de la mesure de probabilité de la variable fonctionnelle, de l'entropie de Kolmogorov et du degré de régularité des modèles. Notons également que dans le cas où la variable réponse est aussi fonctionnelle, nos vitesses de convergence contiennent un terme additionnel qui dépend du type de l'espace de Banach de la variable réponse
In this thesis, we consider the problem of the nonparametric estimation in the conditional models when the regressor takes its values in infinite dimension space. More precisely, we treated two cases when the response variable is real and functional. One establishes almost complete uniform convergence of nonparametric estimators for certain conditional models. Firstly, we consider a sequence of i. I. D. Observations. In this context, we build kernel estimators of the conditional cumulative distribution, the conditional density, the conditional hazard function and the conditional mode. We give the uniform consistency rate of these estimators. We illustrate our results by giving an application on simulated samples. Secondly, we generalize our results when the response variable is in a Banach space. We estimate the regression function. In this context, we treat both cases : i. I. D and dependent observations. In the last case, we consider that the observations are Béta-mixing and we establishes almost complete pointwise convergence. Our asymptotic results exploit the topological structure of functional space for the observations. Let us note that all the rates of convergence are based on an hypothesis of concentration of the measure of probability of the functional variable on the small balls and also on the Kolmogorov’s entropy which measures the number of the balls necessary to cover some set. Moreover, when the response variable is functional the rate of convergence contains a new term which depends on type of Banach space
APA, Harvard, Vancouver, ISO, and other styles
3

Ngatchou, Wandji Joseph. "Etude de tests paramétriques et non-paramétriques asymptotiquement puissants pour les modèles autorégressifs bilinéaires." Paris 13, 1995. http://www.theses.fr/1995PA132009.

Full text
Abstract:
Le test du multiplicateur de Lagrange apparait comme un bon outil pour tester les modèles bilinéaires diagonaux d'ordre un. Nous l'utilisons pour discriminer entre modèles autorégressifs linéaires d'ordre un, et certains modèles bilinéaires sous-diagonaux d'ordre deux, pour lesquels nous donnons une condition nécessaire et suffisante d'inversibilité. Nous prouvons la contigüité de l'hypothèse nulle et d'une suite d'alternatives locales, ce qui nous permet, grâce au troisième lemme de le Cam, d'obtenir une expression explicite de la puissance théorique locale du test. Des simulations numériques de Monte Carlo montrent que cette puissance est bien estimée par la puissance expérimentale. Nous constatons d'autre part que ce test s'avère bon pour tester les types d'hypothèses considérées. Les tests paramétriques comme celui du multiplicateur de Lagrange, du fait qu'ils sont construits pour des modèles paramétriques spécifiques, peuvent manquer de robustesse ; d'ou l'intérêt des tests non-paramétriques. Les tests non-paramétriques pour tester la linéarité des modèles autorégressifs sont peu nombreux. Pour préparer des extensions à des modèles autorégressifs plus généraux, nous construisons sur un compact de l'ensemble des réels, deux tests non-paramétriques pour tester les modèles bilinéaires diagonaux d'ordre un, stationnaires, géométriquement alpha-mélangeant, et ayant des bruits a loi de densité fixée, inconnue et bornée. L'étude de la loi asymptotique des statistiques de test, sous l'hypothèse nulle, se fait au moyen de principes d'invariance faibles. Pour chacun de ces tests, en utilisant des inégalités maximales, nous exhibons un minorant de la puissance qui converge vers 1. Nous montrons que sous des alternatives locales, le risque de l'erreur de deuxième espèce peut être très proche de un. Lorsque le bruit est gaussien, des essais confirment ces résultats, et prouvent en même temps que sur l'exemple du modèle bilinéaire diagonal d'ordre un, le test du multiplicateur de Lagrange est meilleur que les deux tests non-paramétriques
APA, Harvard, Vancouver, ISO, and other styles
4

Bordes, Laurent. "Inférence statistique pour des modèles paramétriques et semi-paramétriques : modèles de l'exponentielle multiple, test du Chi-deux, modèles de vie accélérée." Bordeaux 1, 1996. http://www.theses.fr/1996BOR10649.

Full text
Abstract:
Cette these s'articule autour de trois parties. Dans la premiere partie on applique les procedes classiques de l'estimation sans biais avec variance minimale a une loi parametrique exponentielle multidimensionnelle. On s'interesse plus particulierement aux estimateurs des fonctions de repartition dans diverses situations comme par exemple la censure de type ii. Dans la deuxieme partie on aborde la construction de tests d'ajustement du chi-deux. On propose une statistique de test pour le modele exponentiel evoque ci-dessus ; des simulations illustrent le comportement du test suivant que l'on privilegie les estimateurs du maximum de vraisemblance ou les estimateurs sans biais du minimum de variance. On construit une nouvelle statistique de type chi-deux pour des donnees groupees definies comme etant mal observees. Apres avoir obtenu le comportement asymptotique de la statistique dans le cadre d'une hypothese simple, on en donne une illustration par des simulations et on generalise ces resultats au cas d'hypotheses composites. Cette partie s'acheve par une remarque sur la correction de continuite. Dans la derniere partie de cette these, apres avoir decrit plusieurs modeles semi-parametriques de vie acceleree permettant la prise en compte de variables explicatives et generalisant les modeles classiques de l'analyse de survie, on montre comment obtenir des estimateurs des fonctions de survie associees a un modele dit additif ; enfin, par les techniques mathematiques liees aux processus de comptage on obtient des resultats asymptotiques quant aux comportements des estimateurs, dans le cadre de durees de vie censurees a droite et stratifiees
APA, Harvard, Vancouver, ISO, and other styles
5

Boissières, Henri-Pierre. "Modèles de représentation non paramétriques des fonctions de corrélation des champs stochastiques." Châtenay-Malabry, Ecole centrale de Paris, 1992. http://www.theses.fr/1992ECAP0256.

Full text
Abstract:
Une prise de conscience grandissante, par l'opinion publique, et le besoin pour une meilleure compréhension des problèmes touchant à l'environnement constituent une motivation pour concevoir des techniques d'estimation pour les champs aléatoires spatiaux concernés. Cette dissertation est consacrée à l'estimation de l'une de leurs caractéristiques principales, la structure de corrélation. Pour des problèmes faisant intervenir la nature et l'environnement, les hypothèses simplificatrices d'homogénéité et d'isotropie des champs étudiés, ne sont généralement pas vérifiées sur tout le domaine de définition. Par conséquent, la procédure proposée, appelée MCM, est non-paramétrique et ne nécessite aucune hypothèse, ou définition d'un modèle postule à priori, pour la structure de corrélation à estimer. A partir de séries chronologiques synchronisées, enregistrées aux points d'échantillonnage situes dans l'espace géographique G, l'idée principale de MCM est de construire un espace, appelé espace de corrélation C, et une application F de G dans C, tels que les distances, dans C, entre images par F de points d'échantillonnage soient fonctionnellement liées aux coefficients de corrélation des échantillons. Les deux techniques principales utilisées par MCM sont la construction d'échelles multidimensionnelles (MDS) et l'interpolation à l'aide de surfaces-spline. Trois types de résultats différents peuvent être obtenus par MCM: des coefficients de corrélation, des covariances ou des dispersions spatiales. La procédure proposée est appliquée à une série d'études de cas mettant en jeu plusieurs configurations de points d'échantillonnage, et plusieurs structures de corrélation, pas nécessairement homogènes et isotropes. Les résultats des tests sont très satisfaisants et démontrent l'adaptabilité de la méthode. MCM est utilisée dans le cadre d'une étude d'enregistrements de mouvements sismiques du sol. Dans ce contexte, une procédure d'estimation des retards est également développée, pour supprimer l'effet de la propagation et obtenir des mouvements alignés. Pour la simulation, les deux méthodes peuvent être combinées, en commençant par générer des séries chronologiques satisfaisant une structure de corrélation estimée par MCM, et en appliquant ensuite des retards a ces mouvements pour tenir compte de la propagation des ondes
APA, Harvard, Vancouver, ISO, and other styles
6

Nguyen, ThiMongNgoc. "Estimation récursive pour des modèles semi-paramétriques." Thesis, Bordeaux 1, 2010. http://www.theses.fr/2010BOR14107/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
7

El, Waled Khalil. "Estimations paramétriques et non-paramétriques pour des modèles de diffusions périodiques." Thesis, Rennes 2, 2015. http://www.theses.fr/2015REN20042/document.

Full text
Abstract:
Cette thèse est consacrée au problème d'estimation de la fonction de dérive de certains modèles de processus stochastiques périodiques lorsque la durée d'observation tend vers l'infini. Aucune hypothèse de récurrence n'est posée a priori.Dans un premier temps nous considérons le modèle du type signal plus bruit dζt = f (t, θ)dt + σ(t)dWt,; et puis nous étudions l'estimation du paramètre θ à partir d'une observation continue et puis d'une observation discrète du processus {ζt} sur l'intervalle [0; T]. Les fonctions f (·, ·) et σ(·) sont continues et périodiques en t de même période P > 0, σ(·) > 0 et θ ∈ Θ ⊂R. Nous établissons la convergence en probabilité d'un estimateur du maximum de vraisemblance θˆT , sa normalité asymptotique et son efficacité asymptotique minimax. Lorsque f (t, θ) = θf (t), l'expression de θˆT est explicite et nous obtenons la convergence en moyenne quadratique aussi bien pour le cas d'une observation continue que pour le cas d'une observation discrète. De plus, nous déduisons la convergence presque sûre dans le cas d'une observation continue.Dans la seconde partie nous traitons l'estimation non-paramétrique de la fonction f(_) pour les modèles périodiques du type signal plus bruit et du type Ornstein-Uhlenbeck donnés par dζt = f (t)dt + σ(t)dWt, dξt = f (t)ξtdt + dWt. Pour le premier modèle, un estimateur à noyau périodique est construit, la convergence en moyenne quadratique uniformément sur [0; P] et presque sûre de cet estimateur est établie ainsi que sa normalité asymptotique. Dans le cas du modèle d'Ornstein-Uhlenbeck, la convergence du biais ainsi que la convergence en moyenne quadratique uniformément sur [0; P] sont prouvées, et leurs vitesses de convergence sont étudiées
In this thesis, we consider a drift estimation problem of a certain class of stochastic periodic processes when the length of observation goes to infinity. Firstly, we deal with the linear periodic signal plus noise model dζt = f (t, θ)dt + σ(t)dWt, ;and we study the parametric estimation from a continuous and discrete observation of the process f_tg throughout the interval [0; T]. Using the maximum likelihood method we show the existence of an estimator θˆT which is consistent, asymptotically normal and asymptotically efficient in the sens minimax. When f(t; _) = _f(t), the expression of ^_T is explicit and we obtain the mean square convergence in the both continuous and discrete observation cases. In addition, we deduce the strong consistency in the case of continuous observation.Secondly, we consider the nonparametric estimation problem of the function f(_) for the next two periodic models of type signal plus noise and Ornstein-Uhlenbeckd_t = f(t)dt + _(t)dWt; d_t = f(t)_tdt + dWt:For the signal plus noise model, we build a kernel estimator, the convergence in mean square uniformly over [0; P] and almost sure convergence are established, as well as the asymptotic normality. For the Ornstein-Uhlenbeck model, we prove the convergence uniformly over [0; P] of the bias and the mean square convergence. Moreover, we study the speed of these convergences
APA, Harvard, Vancouver, ISO, and other styles
8

Lehéricy, Luc. "Estimation adaptative pour les modèles de Markov cachés non paramétriques." Thesis, Université Paris-Saclay (ComUE), 2018. http://www.theses.fr/2018SACLS550/document.

Full text
Abstract:
Dans cette thèse, j'étudie les propriétés théoriques des modèles de Markov cachés non paramétriques. Le choix de modèles non paramétriques permet d'éviter les pertes de performance liées à un mauvais choix de paramétrisation, d'où un récent intérêt dans les applications. Dans une première partie, je m'intéresse à l'estimation du nombre d'états cachés. J'y introduis deux estimateurs consistants : le premier fondé sur un critère des moindres carrés pénalisés, le second sur une méthode spectrale. Une fois l'ordre connu, il est possible d'estimer les autres paramètres. Dans une deuxième partie, je considère deux estimateurs adaptatifs des lois d'émission, c'est-à-dire capables de s'adapter à leur régularité. Contrairement aux méthodes existantes, ces estimateurs s'adaptent à la régularité de chaque loi au lieu de s'adapter seulement à la pire régularité. Dans une troisième partie, je me place dans le cadre mal spécifié, c'est-à-dire lorsque les observations sont générées par une loi qui peut ne pas être un modèle de Markov caché. J'établis un contrôle de l'erreur de prédiction de l'estimateur du maximum de vraisemblance sous des conditions générales d'oubli et de mélange de la vraie loi. Enfin, j'introduis une variante non homogène des modèles de Markov cachés : les modèles de Markov cachés avec tendances, et montre la consistance de l'estimateur du maximum de vraisemblance
During my PhD, I have been interested in theoretical properties of nonparametric hidden Markov models. Nonparametric models avoid the loss of performance coming from an inappropriate choice of parametrization, hence a recent interest in applications. In a first part, I have been interested in estimating the number of hidden states. I introduce two consistent estimators: the first one is based on a penalized least squares criterion, and the second one on a spectral method. Once the order is known, it is possible to estimate the other parameters. In a second part, I consider two adaptive estimators of the emission distributions. Adaptivity means that their rate of convergence adapts to the regularity of the target distribution. Contrary to existing methods, these estimators adapt to the regularity of each distribution instead of only the worst regularity. The third part is focussed on the misspecified setting, that is when the observations may not come from a hidden Markov model. I control of the prediction error of the maximum likelihood estimator when the true distribution satisfies general forgetting and mixing assumptions. Finally, I introduce a nonhomogeneous variant of hidden Markov models : hidden Markov models with trends, and show that the maximum likelihood estimators of such models is consistent
APA, Harvard, Vancouver, ISO, and other styles
9

Laksaci, Ali. "Contribution aux modèles non paramétriques conditionnels pour variables explicatives fonctionnelles." Toulouse 3, 2005. http://www.theses.fr/2005TOU30158.

Full text
Abstract:
Dans cette thèse, nous nous proposons d'étudier le problème de la modélisation non paramétrique lorsque les données statistiques sont des courbes. Plus précisément, nous nous intéressons à des problèmes de prévision à partir d'une variable explicative à valeurs dans un espace de dimension infinie, et nous cherchons à développer des alternatives à la méthode de régression. En effet, on suppose qu'on dispose d'une variable aléatoire réelle (réponse), notée Y, et d'une variable fonctionnelle (explicative), notée $$X$$. Le modèle non paramétrique utilisé pour étudier le lien entre X et Y concerne la distribution conditionnelle dont la fonction de répartition (resp. Densité), notée F (resp. F), est supposée appartenir à un espace fonctionnel approprié. Dans un premier temps, on considère une suite d'observations i. I. D. Dans ce contexte, nous construisons des estimateurs par la méthode du noyau pour la fonction de répartition conditionnelle, la densité conditionnelle et ses dérivées. On établit la vitesse de convergence presque complète de ces estimateurs. On déduit des estimateurs précédents ceux pour estimer le mode conditionnel et les quantiles conditionnels, pour lesquels, on donne la vitesse de convergence presque complète. Dans un second temps, nous supposons que les observations sont fortement mélangeantes et nous nous fixons comme objectif l'estimation du mode conditionnel. Nous étudions les propriétés asymptotiques de cet estimateur, en donnant l'expression de sa vitesse de convergence. Ce résultat peut être utilisé pour le problème de la prévision en série chronologique. Notre étude met en évidence le phénomène de concentration de la mesure de probabilité de la variable fonctionnelle sur des petites boules. Plus précisément, des hypothèses portant sur les probabilités de petites boules nous permettent de proposer une solution originale au problème du fléau de la dimension et ainsi de généraliser à la dimension infinie de nombreux résultats asymptotiques existant dans le cas multivarié. De plus, en utilisant les nombreux résultats récents en théorie des probabilités sur les petites boules, on précise nos résultats pour de nombreux processus à temps continu. L'originalité de cette thèse est qu'elle aborde et développe aussi bien des aspects pratiques que théoriques. Nos méthodes sont appliquées à des données réelles de type spectrométrique ou de pollution
In this thesis, we study the problem of a nonparametric modelization when the data are curves. Indeed, we consider real random variable (named response variable) noted Y, and a functional variable (explanatory variable) noted X. The nonparametric model used to study the relation between X and Y is the conditional distribution function noted F which has a density f. Both F and f are supposed to belong to some suitable functional spaces. Firstly, we consider a sequence of i. I. D observations. In this context, we build kernel estimators of the conditional distribution function, the conditional density and its sucessive derivatives. We establish the almost complete convergence rate of these estimators. We use these results in order to study the conditional mode and the conditional quantiles and we give also the almost complete convergence rate of their estimators. Secondly , we suppose that the observations are strongly mixing and we focus on the estimate of the conditional mode. We quantify the asymptotic properties of this estimator, by giving the convergence rate. This result can be used to the prediction problem in functional time series. Our study highlights the phenomenon of concentration properties on small balls of the probability measure of the functional variable. More precisely, these ideas are used to give a statistical solution to curse of dimension and to generalize to infinite dimension many asymptotic results existing in the multivariate case. Moreover, by using recent results in the probability theory of small balls we can see that our results include many time continuous processes. .
APA, Harvard, Vancouver, ISO, and other styles
10

Vimond, Myriam. "Inférence statistique par des transformées de Fourier pour des modèles de régression semi-paramétriques." Phd thesis, Université Paul Sabatier - Toulouse III, 2007. http://tel.archives-ouvertes.fr/tel-00185102.

Full text
Abstract:
Dans cette thèse, nous étudions des modèles semi-paramétriques dits de forme invariante. Ces modèles consistent en l'observation d'un nombre fixés de fonctions de régression identiques à un opérateur de déformation paramétriques près. Ce type de modèles trouve des applications dans les problèmes d'alignement de signaux continus (images 2D, rythmes biologiques, ...) ou discrets (electroencéphalogramme, ...). Pour différents groupes de déformations, nous proposons des M-estimateurs pour les paramètres caractérisant les opérateurs associés aux fonctions de régression. Ces estimateurs minimisent ou maximisent des fonctions de contraste, construites à partir de la moyenne synchronisée des transformées de Fourier des données. De plus, pour l'un des modèles étudiés, nous prouvons l'efficacité semi-paramétrique de cet estimateur ainsi défini, et nous proposons un test d'adéquation du modèle de forme invariante construit à partir d'une des fonctions de contraste.
APA, Harvard, Vancouver, ISO, and other styles
11

Vernet, Elodie Edith. "Modèles de mélange et de Markov caché non-paramétriques : propriétés asymptotiques de la loi a posteriori et efficacité." Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLS418/document.

Full text
Abstract:
Les modèles latents sont très utilisés en pratique, comme en génomique, économétrie, reconnaissance de parole... Comme la modélisation paramétrique des densités d’émission, c’est-à-dire les lois d’une observation sachant l’état latent, peut conduire à de mauvais résultats en pratique, un récent intérêt pour les modèles latents non paramétriques est apparu dans les applications. Or ces modèles ont peu été étudiés en théorie. Dans cette thèse je me suis intéressée aux propriétés asymptotiques des estimateurs (dans le cas fréquentiste) et de la loi a posteriori (dans le cadre Bayésien) dans deux modèles latents particuliers : les modèles de Markov caché et les modèles de mélange. J’ai tout d’abord étudié la concentration de la loi a posteriori dans les modèles non paramétriques de Markov caché. Plus précisément, j’ai étudié la consistance puis la vitesse de concentration de la loi a posteriori. Enfin je me suis intéressée à l’estimation efficace du paramètre de mélange dans les modèles semi paramétriques de mélange
Latent models have been widely used in diverse fields such as speech recognition, genomics, econometrics. Because parametric modeling of emission distributions, that is the distributions of an observation given the latent state, may lead to poor results in practice, in particular for clustering purposes, recent interest in using non parametric latent models appeared in applications. Yet little thoughts have been given to theory in this framework. During my PhD I have been interested in the asymptotic behaviour of estimators (in the frequentist case) and the posterior distribution (in the Bayesian case) in two particuliar non parametric latent models: hidden Markov models and mixture models. I have first studied the concentration of the posterior distribution in non parametric hidden Markov models. More precisely, I have considered posterior consistency and posterior concentration rates. Finally, I have been interested in efficient estimation of the mixture parameter in semi parametric mixture models
APA, Harvard, Vancouver, ISO, and other styles
12

Lefieux, Vincent. "Modèles semi-paramétriques appliqués à la prévision des séries temporelles : cas de la consommation d’électricité." Phd thesis, Rennes 2, 2007. https://theses.hal.science/tel-00179866/fr/.

Full text
Abstract:
Une prévision correcte de la consommation d’électricité est fondamentale pour le bon fonctionnement du réseau électrique français, dont Réseau de Transport d’Electricité a la charge. Les prévisions utilisées quotidiennement par RTE sont issues d’un modèle alliant une régression paramétrique non linéaire et un modèle SARIMA. Dans l’idée d’obtenir un modèle de prévision adaptatif, des méthodes de prévision non-paramétriques ont déjà été testées sans succès véritable. On sait notamment que la qualité d’un prédicteur nonparamétrique résiste mal à un grand nombre de variables explicatives, ce qu’on appelle communément le fléau de la dimension. On a proposé récemment des méthodes semi-paramétriques d’estimation d’une régression qui améliorent l’approche non-paramétrique pure. L’une d’elles, basée sur la notion de ”directions révélatrices” appellée MAVE (Moving Average -conditional- Variance Estimation), peut s’appliquer aux séries temporelles. Nous étudions empiriquement son efficacité pour prédire les valeurs futures d’une série temporelle autorégressive. Nous adaptons ensuite cette méthode, d’un point de vue pratique, pour prédire la consommation électrique. Nous proposons un modèle semi-paramétrique semi-linéaire, basé partiellement sur la méthode MAVE, qui permet de prendre en compte simultanément l’aspect autorégressif du problème, et l’introduction de variables exogènes. La procédure d’estimation proposée se révèle efficace en pratique
Réseau de Transport d’Electricité (RTE), in charge of operating the French electric transportation grid, needs an accurate forecast of the power consumption in order to operate it correctly. The forecasts used everyday result from a model combining a nonlinear parametric regression and a SARIMA model. In order to obtain an adaptive forecasting model, nonparametric forecasting methods have already been tested without real success. In particular, it is known that a nonparametric predictor behaves badly with a great number of explanatory variables, what is commonly called the curse of dimensionality. Recently, semiparametric methods which improve the pure nonparametric approach have been proposed to estimate a regression function. Based on the concept of ”dimension reduction”, one those methods (called MAVE : Moving Average -conditional- Variance Estimate) can apply to time series. We study empirically its effectiveness to predict the future values of an autoregressive time series. We then adapt this method, from a practical point of view, to forecast power consumption. We propose a partially linear semiparametric model, based on the MAVE method, which allows to take into account simultaneously the autoregressive aspect of the problem and the exogenous variables. The proposed estimation procedure is practicaly efficient
APA, Harvard, Vancouver, ISO, and other styles
13

Amegble, Koami Dzigbodi. "Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret." Master's thesis, Université Laval, 2015. http://hdl.handle.net/20.500.11794/25773.

Full text
Abstract:
Tableau d'honneur de la Faculté des études supérieures et postdorales, 2014-2015
Dans ce travail, nous étudions la performance statistique (taille et puissance) en échantillon fini de deux tests non paramétriques de spécification pour densité conditionnelle proposés par Fan et al. (2006) et Li et Racine (2013). Ces tests permettent de vérifier si les probabilités conditionnelles postulées dans les modèles de choix discret (logit/probit multinomial à effets fixes ou aléatoires, estimateur de Klein et Spady (1993), etc) représentent correctement les choix observés. Par rapport aux tests existants, cette approche a l’avantage d’offrir une forme fonctionnelle flexible alternative au modèle paramétrique lorsque ce dernier se révèle mal spécifié. Ce modèle alternatif est directement issu de la procédure de test et il correspond au modèle non contraint obtenu par des produits de noyaux continus et discrets. Les deux tests explorés ont une puissance en échantillon fini supérieure aux tests existants. Cette performance accrue s’obtient en combinant une procédure bootstrap et l’utilisation de paramètres de lissage des fonctions noyaux par validation croisée par les moindres carrés. Dans notre application, nous parallélisons les calculs de taille et de puissance, ainsi que l’estimation des fenêtres de lissage, sur un serveur multi-processeurs (Colosse, de Calcul Québec). Nous utilisons des routines "Open MPI" pré-implémentées dans R. Par rapport aux simulations effectuées dans les articles originaux, nous postulons des modèles plus proches de ceux habituellement utilisés dans la recherche appliquée (logit et probit à variance unitaire notamment). Les résultats des simulations confirment les bonnes taille et puissance des tests en échantillon fini. Par contre, les gains additionnels de puissance de la statistique lissée proposée par Li et Racine (2013) se révèlent négligeables dans nos simulations. Mots clés : Bootstrap, choix discret, densité conditionnelle, Monte Carlo, produit de noyaux, puissance, taille.
APA, Harvard, Vancouver, ISO, and other styles
14

Hernandez, Quintero Angelica. "Inférence statistique basée sur les processus empiriques dans des modèles semi-paramétriques de durées de vie." Toulouse 3, 2010. http://thesesups.ups-tlse.fr/1201/.

Full text
Abstract:
L'analyse statistique de durées de vie censurées intervient dans de nombreuses disciplines, comme la médecine, la fiabilité, la criminologie, la finance, l'ingénierie. Chacun de ces domaines fournit des exemples de situations où: i) l'évènement observé est dû à une cause parmi plusieurs causes en compétition, ii) l'évènement ne peut être observé que pour une fraction, inconnue de l'analyste, de sujets "susceptibles". On parle respectivement de durées de vie en présence de risques concurrents, et de durées de vie en présence d'une fraction immune. Les problèmes posés pour l'analyse statistique de modèles de durées en présence de ces deux types de données incluent la construction d'estimateurs, l'étude de leurs propriétés asymptotiques (consistance, normalité asymptotique, efficacité, estimation de la variance asymptotique), et leur implémentation. Dans ce travail, nous nous intéressons à ce type de problèmes pour deux modèles de régression semi-paramétriques de durées de vie. Nous considérons successivement un modèle de mélange semi-paramétrique basé sur le modèle à risques proportionnels de Cox, puis le modèle de régression semi-paramétrique de transformation linéaire pour l'étude de durées de vie en présence d'une fraction immune. Nous construisons des estimateurs et établissons leurs propriétés asymptotiques, en utilisant des outils issus de la théorie des processus empiriques. Des études de simulation sont également menées
Survival data arise from disciplines such as medicine, criminology, finance and engineering amongst others. In many circumstances the event of interest can be classified in several causes of death or failure and in some others the event can only be observed for a proportion of "susceptibles". Data for these two cases are known as competing risks and long-term survivors, respectively. Issues relevant to the analysis of these two types of data include basic properties such as the parameters estimation, existence, consistency and asymptotic normality of the estimators, and their efficiency when they follow a semiparametric structure. The present thesis investigates these properties in well established semiparametric formulations for the analysis of both competing risks and long-term survivors. It presents an overview of mathematical tools that allow for the study of these basic properties and describes how the modern theory of empirical processes and the theory of semiparametric efficiency facilitate relevant proofs. Also, consistent variance estimate for both the parametric and semiparametric components for the two models are presented. The findings of this research provide the theoretical basis for obtaining inferences with large samples, the calculation of confidence bands and hypothesis testing. The methods are illustrated with data bases generated through simulations
APA, Harvard, Vancouver, ISO, and other styles
15

Rakotomarolahy, Patrick. "Méthodes non paramétriques : estimation, analyse et applications aux cycles économiques." Paris 1, 2011. http://www.theses.fr/2011PA010045.

Full text
Abstract:
Cette thèse se concentre sur l'étude des propriétés de la fonction régression par des méthodes non paramétriques pour des processus dépendants et l'application de ces méthodes dans l'analyse des cycles économiques. On résume ci-dessous les résultats théoriques et les résultats empiriques obtenus dans ce cadre. Le premier résultat théorique concerne la biais, la variance, l'erreur quatratique et la normalité asymptotique de deux estimateurs non-paramétriques: plus proche voisin et fonction radiale de base. L'autre résultat théorique était l'extension des tests d'enveloppements dans le cas de processus dépendant permettant de comparer différentes méthodes paramétriques et non paramétriques. On a établi la normalité asymptotique des statistiques associées à ces tests. Les travaux empiriques ont été de proposer ces méthodes non paramétriques dans la prévision des activités économiques réelles à partir des indicateurs économiques et des variables financières, pour palier quelques hypothèses jugeant très fortes dans l'approche paramétrique. On a trouvé l'intérêt des méthodes non paramétriques dans la prévision de produit intérieur brut (PIB) de la zone euro. On a revu le rôle ds variables financières dans le choix de modèles et dans la sélection des variables.
APA, Harvard, Vancouver, ISO, and other styles
16

Lhéritier, Hugo. "Comportement asymptotique de certains estimateurs sur des modèles paramétriques et sous des conditions non standard." Orléans, 2003. http://www.theses.fr/2003ORLE2005.

Full text
Abstract:
Le travail présenté dans cette thèse concerne l'étude du comportement asymptotique de trois estimateurs classiques sur des modèles paramétriques et sous des conditions non standards. Dans la première partie, nous introduisons la notion de modèle Gâteaux-Différentiable en Moyenne Quadratique et montrons que certains résultats issus des travaux de L. Le Cam et J. Hájek restent valables dans ce cadre. Nous obtenons notamment que ces modèles sont LAN et qu'il existe pour tout paramétrage, une borne inférieure du risque asymptotiquement minimax. Dans la deuxième partie nous introduisons de nouvelles conditions de régularité, utilisant des arguments d'absolue continuité et de Gâteaux-différentiabilité. Dans ce cadre, nous étudions l'optimalité asymptotique de différents estimateurs et proposons une démarche nouvelle montrant notamment que l'estimateur par maximum de vraisemblance possède des propriétés asymptotiques remarquables sur des modèles à paramètre(s) de localisation et/ou d'échelle.
APA, Harvard, Vancouver, ISO, and other styles
17

Nguyen, Van Hanh. "Modèles de mélange semi-paramétriques et applications aux tests multiples." Phd thesis, Université Paris Sud - Paris XI, 2013. http://tel.archives-ouvertes.fr/tel-00987035.

Full text
Abstract:
Dans un contexte de test multiple, nous considérons un modèle de mélange semi-paramétrique avec deux composantes. Une composante est supposée connue et correspond à la distribution des p-valeurs sous hypothèse nulle avec probabilité a priori p. L'autre composante f est nonparamétrique et représente la distribution des p-valeurs sous l'hypothèse alternative. Le problème d'estimer les paramètres p et f du modèle apparaît dans les procédures de contrôle du taux de faux positifs (''false discovery rate'' ou FDR). Dans la première partie de cette dissertation, nous étudions l'estimation de la proportion p. Nous discutons de résultats d'efficacité asymptotique et établissons que deux cas différents arrivent suivant que f s'annule ou non surtout un intervalle non-vide. Dans le premier cas (annulation surtout un intervalle), nous présentons des estimateurs qui convergent \' la vitesse paramétrique, calculons la variance asymptotique optimale et conjecturons qu'aucun estimateur n'est asymptotiquement efficace (i.e atteint la variance asymptotique optimale). Dans le deuxième cas, nous prouvons que le risque quadratique de n'importe quel estimateur ne converge pas à la vitesse paramétrique. Dans la deuxième partie de la dissertation, nous nous concentrons sur l'estimation de la composante inconnue nonparamétrique f dans le mélange, en comptant sur un estimateur préliminaire de p. Nous proposons et étudions les propriétés asymptotiques de deux estimateurs différents pour cette composante inconnue. Le premier estimateur est un estimateur à noyau avec poids aléatoires. Nous établissons une borne supérieure pour son risque quadratique ponctuel, en montrant une vitesse de convergence nonparamétrique classique sur une classe de Holder. Le deuxième estimateur est un estimateur du maximum de vraisemblance régularisée. Il est calculé par un algorithme itératif, pour lequel nous établissons une propriété de décroissance d'un critère. De plus, ces estimateurs sont utilisés dans une procédure de test multiple pour estimer le taux local de faux positifs (''local false discovery rate'' ou lfdr).
APA, Harvard, Vancouver, ISO, and other styles
18

Ducasse, Alain. "Estimation de sous-harmoniques à l'aide de méthodes paramétriques." Toulouse, INPT, 1997. http://www.theses.fr/1997INPT016H.

Full text
Abstract:
Le sujet de cette these est l'estimation de sous-harmoniques de faibles puissances a l'aide de methodes parametriques, appliquees a des signaux issus de machines electriques (courants, vitesse). Compte tenu des caracteristiques des signaux physiques, nous avons travaille sur un modele de signal compose de sinusoides non amorties perturbees par un bruit blanc. De plus, l'estimation de sous-harmoniques tres basses frequences nous a amene a considerer le probleme de l'echantillonnage. Le premier chapitre rappelle le contexte de l'etude et le probleme pose. Dans le second chapitre, nous presentons les methodes d'estimation parametrique des frequences d'une somme de sinusoides ainsi que les estimateurs du nombre de composantes sinusoidales. Nous donnons un tableau comparatif qui resume les avantages et les inconvenients des principales methodes. Le troisieme chapitre est dedie a la modelisation de prony. Nous demontrons l'existence d'un nombre optimal d'equations de vandermonde. Une technique de deflation est presentee. Les quatrieme et cinquieme chapitres sont consacres a l'etude de l'influence de l'echantillonnage sur l'estimation des poles et des amplitudes complexes d'une somme de sinusoides bruitees. Nous demontrons que les methodes autoregressives ont un maximum d'efficacite lorsque la frequence barycentre des frequences du signal est autour de 0. 25. Les methodes haute resolution sont plus performantes lorsque l'echantillonnage est a la limite imposee par le theoreme de shannon. Le dernier chapitre concerne l'application des methodes d'estimation parametrique aux signaux physiques et presente le logiciel d'analyse spectrale que nous avons realise sous matlab.
APA, Harvard, Vancouver, ISO, and other styles
19

Löser, Kevin. "Apprentissage non-supervisé de la morphologie des langues à l’aide de modèles bayésiens non-paramétriques." Thesis, Université Paris-Saclay (ComUE), 2019. http://www.theses.fr/2019SACLS203/document.

Full text
Abstract:
Un problème central contribuant à la grande difficulté du traitement du langage naturel par des méthodes statistiques est celui de la parcimonie des données, à savoir le fait que dans un corpus d'apprentissage donné, la plupart des évènements linguistiques n'ont qu'un nombre d'occurrences assez faible, et que par ailleurs un nombre infini d'évènements permis par une langue n'apparaitront nulle part dans le corpus. Les modèles neuronaux ont déjà contribué à partiellement résoudre le problème de la parcimonie en inférant des représentations continues de mots. Ces représentations continues permettent de structurer le lexique en induisant une notion de similarité sémantique ou syntaxique entre les mots. Toutefois, les modèles neuronaux actuellement les plus répandus n'offrent qu'une solution partielle au problème de la parcimonie, notamment par le fait que ceux-ci nécessitent une représentation distribuée pour chaque mot du vocabulaire, mais sont incapables d'attribuer une représentation à des mots hors vocabulaire. Ce problème est particulièrement marqué dans des langues morphologiquement riches, ou des processus de formation de mots complexes mènent à une prolifération des formes de mots possibles, et à une faible coïncidence entre le lexique observé lors de l’entrainement d’un modèle, et le lexique observé lors de son déploiement. Aujourd'hui, l'anglais n'est plus la langue majoritairement utilisée sur le Web, et concevoir des systèmes de traduction automatique pouvant appréhender des langues dont la morphologie est très éloignée des langues ouest-européennes est un enjeu important. L’objectif de cette thèse est de développer de nouveaux modèles capables d’inférer de manière non-supervisée les processus de formation de mots sous-jacents au lexique observé, afin de pouvoir de pouvoir produire des analyses morphologiques de nouvelles formes de mots non observées lors de l’entraînement
A crucial issue in statistical natural language processing is the issue of sparsity, namely the fact that in a given learning corpus, most linguistic events have low occurrence frequencies, and that an infinite number of structures allowed by a language will not be observed in the corpus. Neural models have already contributed to solving this issue by inferring continuous word representations. These continuous representations allow to structure the lexicon by inducing semantic or syntactic similarity between words. However, current neural models only partially solve the sparsity issue, due to the fact that they require a vectorial representation for every word in the lexicon, but are unable to infer sensible representations for unseen words. This issue is especially present in morphologically rich languages, where word formation processes yield a proliferation of possible word forms, and little overlap between the lexicon observed during model training, and the lexicon encountered during its use. Today, several languages are used on the Web besides English, and engineering translation systems that can handle morphologies that are very different from western European languages has become a major stake. The goal of this thesis is to develop new statistical models that are able to infer in an unsupervised fashion the word formation processes underlying an observed lexicon, in order to produce morphological analyses of new unseen word forms
APA, Harvard, Vancouver, ISO, and other styles
20

Top, Alioune. "Estimation paramétriques et tests d'hypothèses pour des modèles avec plusieurs ruptures d'un processus de poisson." Thesis, Le Mans, 2016. http://www.theses.fr/2016LEMA1014/document.

Full text
Abstract:
Ce travail est consacré aux problèmes d’estimation paramétriques, aux tests d’hypothèses et aux tests d’ajustement pour les processus de Poisson non homogènes.Tout d’abord on a étudié deux modèles ayant chacun deux sauts localisés par un paramètre inconnu. Pour le premier modèle la somme des sauts est positive. Tandis que le second a un changement de régime et constant par morceaux. La somme de ses deux sauts est nulle. Ainsi pour chacun de ces modèles nous avons étudié les propriétés asymptotiques de l’estimateur bayésien (EB) et celui du maximum de vraisemblance(EMV). Nous avons montré la consistance, la convergence en distribution et la convergence des moments. En particulier l’estimateur bayésien est asymptotiquement efficace. Pour le second modèle nous avons aussi considéré le test d’une hypothèse simple contre une alternative unilatérale et nous avons décrit les propriétés asymptotiques (choix du seuil et puissance ) du test de Wald (WT)et du test du rapport de vraisemblance généralisé (GRLT).Les démonstrations sont basées sur la méthode d’Ibragimov et Khasminskii. Cette dernière repose sur la convergence faible du rapport de vraisemblance normalisé dans l’espace de Skorohod sous certains critères de tension des familles demesure correspondantes.Par des simulations numériques, les variances limites nous ont permis de conclure que l’EB est meilleur que celui du EMV. Lorsque la somme des sauts est nulle, nous avons développé une approche numérique pour le EMV.Ensuite on a considéré le problème de construction d’un test d’ajustement pour un modèle avec un paramètre d’échelle. On a montré que dans ce cas, le test de Cramer-von Mises est asymptotiquement ”parameter-free” et est consistent
This work is devoted to the parametric estimation, hypothesis testing and goodnessof-fit test problems for non homogenous Poisson processes. First we consider two models having two jumps located by an unknown parameter.For the first model the sum of jumps is positive. The second is a model of switching intensity, piecewise constant and the sum of jumps is zero. Thus, for each model, we studied the asymptotic properties of the Bayesian estimator (BE) andthe likelihood estimator (MLE). The consistency, the convergence in distribution and the convergence of moments are shown. In particular we show that the BE is asymptotically efficient. For the second model we also consider the problem of asimple hypothesis testing against a one- sided alternative. The asymptotic properties (choice of the threshold and power) of Wald test (WT) and the generalized likelihood ratio test (GRLT) are described.For the proofs we use the method of Ibragimov and Khasminskii. This method is based on the weak convergence of the normalized likelihood ratio in the Skorohod space under some tightness criterion of the corresponding families of measure.By numerical simulations, the limiting variances of estimators allows us to conclude that the BE outperforms the MLE. In the situation where the sum of jumps is zero, we developed a numerical approach to obtain the MLE.Then we consider the problem of construction of goodness-of-test for a model with scale parameter. We show that the Cram´er-von Mises type test is asymptotically parameter-free. It is also consistent
APA, Harvard, Vancouver, ISO, and other styles
21

Decurninge, Alexis. "Quantiles univariés et multivariés, approches probabilistes et statistiques : applications radar." Thesis, Paris 6, 2015. http://www.theses.fr/2015PA066028/document.

Full text
Abstract:
La description et l’estimation des modèles aussi bien univariés que multivariés impliquantdes distributions à queue lourde est un enjeu applicatif majeur. Les L-moments sontdevenus des outils classiques alternatifs aux moments centraux pour décrire les comportementsen dispersion, asymétrie, kurtosis d’une distribution univariée à queue lourde. Eneffet, contrairement aux moments centraux correspondants, ils sont bien définis dès quel’espérance de la distribution d’intérêt est finie. Les L-moments peuvent être vus comme laprojection de la fonction quantile sur une famille orthogonale de polynômes, récupérant lalinéarité inhérente aux quantiles. Nous estimerons dans un premier temps les paramètresde modèles semi paramétriques définis par des contraintes sur ces L-moments par des méthodesde minimisation de divergences.Nous proposons dans un second temps une généralisation des L-moments aux distributionsmultivariées qui passe par la définition d’un quantile multivarié défini comme untransport entre la distribution uniforme sur [0; 1]d et la distribution d’intérêt. Cela nouspermet de proposer des descripteurs pour des distributions multivariées adaptés à l’étudedes queues lourdes. Nous détaillons leurs expressions dans le cadre de modèles possédantdes paramètres de rotation.Enfin, nous proposons des M-estimateurs de la matrice de dispersion des distributions complexeselliptiques. Ces dernières forment un modèle multivarié semi-paramétrique contenantnotamment des distributions à queue lourde. Des M-estimateurs spécifiques adaptésaux distributions elliptiques avec une hypothèse supplémentaire de stationnarité sont égalementproposés. Les performances et la robustesse des estimateurs sont étudiées.Les signaux radar provenant de fouillis tels les fouillis de mer ou les fouillis de sol sontsouvent modélisés par des distributions elliptiques. Nous illustrerons les performances dedétecteurs construits à partir de l’estimation de la matrice de dispersion par les méthodesproposées pour différents scénarios radar pour lesquels la robustesse de la procédure d’estimationest cruciale
The description and the estimation of univariate and multivariate models whose underlyingdistribution is heavy-tailed is a strategic challenge. L-moments have becomeclassical tools alternative to central moments for the description of dispersion, skewnessand kurtosis of a univariate heavy-tailed distribution. Indeed, contrary to correspondingcentral moments, they are well defined since the expectation of the distribution of interestis finite. L-moments can be seen as projections of the quantile function on a family oforthogonal polynomials. First, we will estimate parameters of semi-parametric modelsdefined by constraints on L-moments through divergence methods.We will then propose a generalization of L-moments for multivariate distributions using amultivariate quantile function defined as a transport of the uniform distribution on [0; 1]dand the distribution of interest. As their univariate versions, these multivariate L-momentsare adapted for the study of heavy-tailed distributions. We explicitly give their formulationsfor models with rotational parameters.Finally, we propose M-estimators of the scatter matrix of complex elliptical distributions.The family of these distributions form a multivariate semi-parametric model especiallycontaining heavy-tailed distributions. Specific M-estimators adapted to complex ellipticaldistribution with an additional assumption of stationarity are proposed. Performancesand robustness of introduced estimators are studied.Ground and sea clutters are often modelized by complex elliptical distributions in the fieldof radar processing. We illustrate performances of detectors built from estimators of thescatter matrix through proposed methods for different radar scenarios
APA, Harvard, Vancouver, ISO, and other styles
22

Naulet, Zacharie. "Développement d'un modèle particulaire pour la régression indirecte non paramétrique." Thesis, Paris Sciences et Lettres (ComUE), 2016. http://www.theses.fr/2016PSLED057/document.

Full text
Abstract:
Cette thèse porte sur les statistiques bayésiennes non paramétriques. La thèse est divisée en une introduction générale et trois parties traitant des aspects relativement différents des approches par mélanges (échantillonage, asymptotique, problème inverse). Dans les modèles de mélanges, le paramètre à inférer depuis les données est une fonction. On définit une distribution a priori sur un espace fonctionnel abstrait au travers d'une intégrale stochastique d'un noyau par rapport à une mesure aléatoire. Habituellement, les modèles de mélanges sont surtout utilisés dans les problèmes d'estimation de densités de probabilité. Une des contributions de ce manuscrit est d'élargir leur usage aux problèmes de régressions.Dans ce contexte, on est essentiellement concernés par les problèmes suivants:- Echantillonage de la distribution a posteriori- Propriétés asymptotiques de la distribution a posteriori- Problèmes inverses, et particulièrement l'estimation de la distribution de Wigner à partir de mesures de Tomographie Quantique Homodyne
This dissertation deals with Bayesian nonparametric statistics, in particular nonparametric mixture models. The manuscript is divided into a general introduction and three parts on rather different aspects of mixtures approaches (sampling, asymptotic, inverse problem). In mixture models, the parameter to infer from the data is a function. We set a prior distribution on an abstract space of functions through a stochastic integral of a kernel with respect to a random measure. Usually, mixture models were used primilary in probability density function estimation problems. One of the contributions of the present manuscript is to use them in regression problems.In this context, we are essentially concerned with the following problems :- Sampling of the posterior distribution- Asymptotic properties of the posterior distribution- Inverse problems, in particular the estimation of the Wigner distribution from Quantum Homodyne Tomography measurements
APA, Harvard, Vancouver, ISO, and other styles
23

Fraysse, Philippe. "Estimation récursive dans certains modèles de déformation." Phd thesis, Université Sciences et Technologies - Bordeaux I, 2013. http://tel.archives-ouvertes.fr/tel-00844393.

Full text
Abstract:
Cette thèse est consacrée à l'étude de certains modèles de déformation semi-paramétriques. Notre objectif est de proposer des méthodes récursives, issues d'algorithmes stochastiques, pour estimer les paramètres de ces modèles. Dans la première partie, on présente les outils théoriques existants qui nous seront utiles dans la deuxième partie. Dans un premier temps, on présente un panorama général sur les méthodes d'approximation stochastique, en se focalisant en particulier sur les algorithmes de Robbins-Monro et de Kiefer-Wolfowitz. Dans un second temps, on présente les méthodes à noyaux pour l'estimation de fonction de densité ou de régression. On s'intéresse plus particulièrement aux deux estimateurs à noyaux les plus courants qui sont l'estimateur de Parzen-Rosenblatt et l'estimateur de Nadaraya-Watson, en présentant les versions récursives de ces deux estimateurs.Dans la seconde partie, on présente tout d'abord une procédure d'estimation récursive semi-paramétrique du paramètre de translation et de la fonction de régression pour le modèle de translation dans la situation où la fonction de lien est périodique. On généralise ensuite ces techniques au modèle vectoriel de déformation à forme commune en estimant les paramètres de moyenne, de translation et d'échelle, ainsi que la fonction de régression. On s'intéresse finalement au modèle de déformation paramétrique de variables aléatoires dans le cadre où la déformation est connue à un paramètre réel près. Pour ces trois modèles, on établit la convergence presque sûre ainsi que la normalité asymptotique des estimateurs paramétriques et non paramétriques proposés. Enfin, on illustre numériquement le comportement de nos estimateurs sur des données simulées et des données réelles.
APA, Harvard, Vancouver, ISO, and other styles
24

Haultfoeuille, Xavier d'. "Essai sur quelques problèmes d'identification en économie." Paris 1, 2009. https://pastel.archives-ouvertes.fr/tel-00402960.

Full text
Abstract:
Cette thèse présente trois sujets de recherche indépendants, liés néanmoins par la question de l'identification de modèles économiques. Le premier chapitre est consacré aux modèles non-paramétriques instrumentaux. J'étudie tout d'abord la condition de complétude, utilisée récemment pour identifier les régressions non-paramétriques instrumentales par exemple. Cet essai considère un modèle non-paramétrique additivement séparable avec une condition de large support. Dans ce cadre, différentes versions de la condition de complétude sont obtenues. Je considère ensuite une nouvelle méthode pour traiter la sélection endogène, basée sur l'indépendance entre instruments et variable de sélection, et la condition de complétude. Outre l'identification, une méthode d'estimation et une application sont proposées. Le deuxième chapitre se concentre sur deux modèles d'économie industrielle. Le premier essai considère l'identification non-paramétrique du modèle d'enchères à valeur commune. L'hypothèse identifiante est que le support de la distribution des signaux conditionnellement à la valeur du bien varie avec cette valeur. L'intérêt de cette approche est qu'hormis cette condition, elle ne repose pas sur des restrictions fonctionnelles. Le deuxième essai étudie le modèle de sélection adverse. Il montre qu'en l'absence de changements exogènes de contrats, l'identification du modèle nécessite la connaissance d'au moins un des paramètres du modèle. Cependant, en présence de tels changements, le modèle est partiellement voire complètement identifié. Une méthode d'estimation et une application sont également proposées. Le troisième chapitre, enfin, se focalise sur les modèles d'effets de pairs. Alors que ceux-ci sont considérés comme non-identifiés, une légère modification du modèle linéaire standard permet de retrouver les paramètres structurels grâce aux variations de taille de groupe. Ces résultats sont étendus à un modèle binaire d'interactions.
APA, Harvard, Vancouver, ISO, and other styles
25

Gneyou, Kossi Essona. "Inférence statistique non paramétrique pour l'analyse du taux de panne en fiabilité : Théorèmes limites fonctionnels pour les processus produit-limite et les estimateurs non paramétriques du taux de panne dans les modèles de variables aléatoires arbitrairement censurées." Paris 6, 1991. http://www.theses.fr/1991PA066504.

Full text
Abstract:
Depuis les trente cinq dernieres annees, les travaux sur les estimateurs produit-limite dans le modele des variables aleatoires arbitraitement censurees ont connu un developpement remarquable. Nous en inferons une loi du logarithme itere pour le processus produit-limite de quantile et introduisons un estimateur du type noyau (base sur des observations incompletes) du taux de panne utilise par exemple en fiabilite. Des theoremes limites et approximations presque sures sont etablis. Nous en deduisons des applications dont une loi fonctionnelle du logarithme itere pour le processus du taux de panne
APA, Harvard, Vancouver, ISO, and other styles
26

Sow, Mohamedou. "Développement de modèles non paramétriques et robustes : application à l’analyse du comportement de bivalves et à l’analyse de liaison génétique." Thesis, Bordeaux 1, 2011. http://www.theses.fr/2011BOR14257/document.

Full text
Abstract:
Le développement des approches robustes et non paramétriques pour l’analyse et le traitement statistique de gros volumes de données présentant une forte variabilité,comme dans les domaines de l’environnement et de la génétique, est fondamental.Nous modélisons ici des données complexes de biologie appliquées à l’étude du comportement de bivalves et à l’analyse de liaison génétique. L’application des mathématiques à l’analyse du comportement de mollusques bivalves nous a permis d’aller vers une quantification et une traduction mathématique de comportements d’animaux in-situ, en milieu proche ou lointain. Nous avons proposé un modèle de régression non paramétrique et comparé 3 estimateurs non paramétriques, récursifs ou non,de la fonction de régression pour optimiser le meilleur estimateur. Nous avons ensuite caractérisé des rythmes biologiques, formalisé l’évolution d’états d’ouvertures,proposé des méthodes de discrimination de comportements, utilisé la méthode des shot-noises pour caractériser différents états d’ouverture-fermetures transitoires et développé une méthode originale de mesure de croissance en ligne.En génétique, nous avons abordé un cadre plus général de statistiques robustes pour l’analyse de liaison génétique. Nous avons développé des estimateurs robustes aux hypothèses de normalités et à la présence de valeurs aberrantes, nous avons aussi utilisé une approche statistique, où nous avons abordé la dépendance entre variables aléatoires via la théorie des copules. Nos principaux résultats ont montré l’intérêt pratique de ces estimateurs sur des données réelles de QTL et eQTL
The development of robust and nonparametric approaches for the analysis and statistical treatment of high-dimensional data sets exhibiting high variability, as seen in the environmental and genetic fields, is instrumental. Here, we model complex biological data with application to the analysis of bivalves’ behavior and to linkage analysis. The application of mathematics to the analysis of mollusk bivalves’behavior gave us the possibility to quantify and translate mathematically the animals’behavior in situ, in close or far field. We proposed a nonparametric regression model and compared three nonparametric estimators (recursive or not) of the regressionfunction to optimize the best estimator. We then characterized the biological rhythms, formalized the states of opening, proposed methods able to discriminate the behaviors, used shot-noise analysis to characterize various opening/closing transitory states and developed an original approach for measuring online growth.In genetics, we proposed a more general framework of robust statistics for linkage analysis. We developed estimators robust to distribution assumptions and the presence of outlier observations. We also used a statistical approach where the dependence between random variables is specified through copula theory. Our main results showed the practical interest of these estimators on real data for QTL and eQTL analysis
APA, Harvard, Vancouver, ISO, and other styles
27

Gannaz, Irène. "Estimation par ondelettes dans les modèles partiellement linéaires." Phd thesis, Université Joseph Fourier (Grenoble), 2007. http://tel.archives-ouvertes.fr/tel-00197146.

Full text
Abstract:
L'objet de cette thèse est d'apporter une contribution à l'inférence dans les modèles partiellement linéaires en appliquant des méthodes d'estimation adaptative par ondelettes. Ces modèles de régression semi-paramétriques distinguent des relations linéaires et des relations fonctionnelles, non paramétriques. L'inférence statistique consiste à estimer conjointement les deux types de prédicteurs, en prenant en compte leur possible corrélation. Une procédure des moindres carrés pénalisés permet d'introduire une estimation par ondelettes avec seuillage des coefficients de la partie fonctionnelle. Un parallèle est établi avec une estimation du paramètre de régression par des M-estimateurs usuels dans un modèle linéaire, les coefficients d'ondelettes de la partie fonctionnelle étant considérés comme des valeurs aberrantes. Une procédure d'estimation de la variance du bruit est aussi proposée. Des résultats relatifs aux propriétés asymptotiques des estimateurs de la partie linéaire et de la partie non paramétrique sont démontrés lorsque les observations de la partie fonctionnelle sont réalisées en des points équidistants. Sous des restrictions usuelles de corrélation entre les variables explicatives, les résultats sont presque optimaux (à un logarithme près). Des simulations permettent d'illustrer les comportements des estimateurs et de les comparer avec d'autres méthodes existantes. Une application sur des données d'IRM fonctionnelle a aussi été réalisée. Une dernière partie envisage le cadre d'un plan d'observation aléatoire de la partie fonctionnelle.
APA, Harvard, Vancouver, ISO, and other styles
28

Guin, Ophélie. "Méthodes bayésiennes semi-paramétriques d'extraction et de sélection de variables dans le cadre de la dendroclimatologie." Phd thesis, Université Paris Sud - Paris XI, 2011. http://tel.archives-ouvertes.fr/tel-00636704.

Full text
Abstract:
Selon le Groupe Intergouvernemental d'experts sur l'Évolution du Climat (GIEC), il est important de connaitre le climat passé afin de replacer le changement climatique actuel dans son contexte. Ainsi, de nombreux chercheurs ont travaillé à l'établissement de procédures permettant de reconstituer les températures ou les précipitations passées à l'aide d'indicateurs climatiques indirects. Ces procédures sont généralement basées sur des méthodes statistiques mais l'estimation des incertitudes associées à ces reconstructions reste une difficulté majeure. L'objectif principal de cette thèse est donc de proposer de nouvelles méthodes statistiques permettant une estimation précise des erreurs commises, en particulier dans le cadre de reconstructions à partir de données sur les cernes d'arbres.De manière générale, les reconstructions climatiques à partir de mesures de cernes d'arbres se déroulent en deux étapes : l'estimation d'une variable cachée, commune à un ensemble de séries de mesures de cernes, et supposée climatique puis l'estimation de la relation existante entre cette variable cachée et certaines variables climatiques. Dans les deux cas, nous avons développé une nouvelle procédure basée sur des modèles bayésiens semi- paramétriques. Tout d'abord, concernant l'extraction du signal commun, nous proposons un modèle hiérarchique semi-paramétrique qui offre la possibilité de capturer les hautes et les basses fréquences contenues dans les cernes d'arbres, ce qui était difficile dans les études dendroclimatologiques passées. Ensuite, nous avons développé un modèle additif généralisé afin de modéliser le lien entre le signal extrait et certaines variables climatiques, permettant ainsi l'existence de relations non-linéaires contrairement aux méthodes classiques de la dendrochronologie. Ces nouvelles méthodes sont à chaque fois comparées aux méthodes utilisées traditionnellement par les dendrochronologues afin de comprendre ce qu'elles peuvent apporter à ces derniers.
APA, Harvard, Vancouver, ISO, and other styles
29

Lopez, Olivier. "Réduction de dimension en présence de données censurées." Phd thesis, Rennes 1, 2007. http://tel.archives-ouvertes.fr/tel-00195261.

Full text
Abstract:
Nous considérons des modèles de régression où la variable expliquée est censurée à droite aléatoirement. Nous proposons de nouveaux estimateurs de la fonction de régression dans des modèles paramétriques, et nous proposons une procédure de test non paramétrique d'adéquation à ces modèles. Nous prolongeons ces méthodes à l'étude du modèle semi-paramétrique "single-index", généralisant ainsi des techniques de réduction de dimension utilisées en l'absence de censure. Nous nous penchons tout d'abord sur le cas d'un modèle où la variable de censure est indépendante de la variable expliquée ainsi que des variables explicatives. Nous travaillons dans un second temps dans un cadre moins restrictif où la variable expliquée et la censure sont indépendantes conditionnellement aux variables explicatives. Une difficulté spécifique à ce dernier type de modèle tient en l'impossibilité des techniques actuelles à estimer une espérance conditionnelle (de façon paramétrique ou non) en présence de plus d'une
variable explicative. Nous développons une nouvelle approche de réduction de la dimension afin de résoudre ce problème.
APA, Harvard, Vancouver, ISO, and other styles
30

Arkoun, Ouerdia. "Estimation non paramétrique pour les modèles autorégressifs." Phd thesis, Université de Rouen, 2009. http://tel.archives-ouvertes.fr/tel-00464024.

Full text
Abstract:
Cette thèse se consacre à l'estimation non paramétrique pour les modèles autorégressifs. Nous considérons le problème de l'estimation d'une fonction inconnue en un point fixe à l'aide de données régies par des modèles autorégressifs. Pour définir le risque associé à l'emploi d'un estimateur et ainsi mesurer la qualité de celui-ci, nous utilisons la fonction de perte liée à l'erreur absolue. Le travail de cette thèse suit l'approche minimax dont l'objectif est de trouver une borne inférieure asymptotique du risque minimax puis de construire un estimateur, dit asymptotiquement efficace, dont le risque maximal atteint asymptotiquement cette borne. Pour un modèle autorégressif non paramétrique où la fonction autorégressive est supposée appartenir à une classe H\"{o}ldérienne faible de régularité connue, nous montrons qu'un estimateur à noyau est asymptotiquement efficace. Lorsque la régularité de la fonction autorégressive est inconnue, nous obtenons la vitesse de convergence minimax adaptative des estimateurs sur une famille de classes H\"{o}ldériennes.\\
APA, Harvard, Vancouver, ISO, and other styles
31

Nguyen, Thi Mong Ngoc. "Estimation récursive pour les modèles semi-paramétriques." Phd thesis, Université Sciences et Technologies - Bordeaux I, 2010. http://tel.archives-ouvertes.fr/tel-00938607.

Full text
Abstract:
Dans cette th ese, nous nous int eressons au mod ele semi-param etrique de r egression de la forme y = f( \theta'x; \epsilon), lorsque x \in R^p et y\in R. Notre objectif est d' etudier des probl emes d'estimation des param etres \theta et f de ce mod ele avec des m ethodes r ecursives. Dans la premi ere partie, l'approche que nous d eveloppons est fond ee sur une m ethode introduite par Li (1991), appel ee Sliced Inverse Regression (SIR). Nous proposons des m ethodes SIR r ecursives pour estimer le param etre . Dans le cas particulier o u l'on consid ere le nombre de tranches egal a 2, il est possible d'obtenir une expression analytique de l'estimateur de la direction de . Nous proposons une forme r ecursive pour cet estimateur, ainsi qu'une forme r ecursive de l'estimateur de la matrice d'int er^et. Ensuite, nous proposons une nouvelle approche appell ee \SIRoneslice" (r ecursive ou non r ecursive) de la m ethode SIR bas ee sur l'utilisation de l'information contenue dans une seule tranche optimale (qu'il faudra choisir parmi un nombre quelconque de tranches). Nous proposons egalement un crit ere \bootstrap na f" pour le choix du nombre de tranches. Des r esultats asymptotiques sont donn es et une etude sur des simulations d emontre le bon comportement num erique des approches r ecursives propos ees et l'avantage principal de l'utilisation la version r ecursive de SIR et de SIRoneslice du point de vue des temps de calcul. Dans la second partie, nous travaillons sur des donn ees de valvom etrie mesur ees sur des bivalves. Sur ces donn ees, nous comparons le comportement num erique de trois estimateurs non param etrique de la fonction de r egression : celui de Nadaraya-Watson, celui de Nadaraya-Watson r ecursif et celui de R ev esz qui est lui aussi r ecursif. Dans la derni ere partie de cette th ese, nous proposons une m ethode permettant de combiner l'estimation r ecursive de la fonction de lien f par l'estimateur de Nadaraya- Watson r ecursif et l'estimation du param etre via l'estimateur SIR r ecursif. Nous etablissons une loi des grands nombres ainsi qu'un th eor eme de limite centrale. Nous illustrons ces r esultats th eoriques par des simulations montrant le bon comportement num erique de la m ethode d'estimation propos ee.
APA, Harvard, Vancouver, ISO, and other styles
32

Tran, Xuan Quang. "Les modèles de régression dynamique et leurs applications en analyse de survie et fiabilité." Thesis, Bordeaux, 2014. http://www.theses.fr/2014BORD0147/document.

Full text
Abstract:
Cette thèse a été conçu pour explorer les modèles dynamiques de régression, d’évaluer les inférences statistiques pour l’analyse des données de survie et de fiabilité. Ces modèles de régression dynamiques que nous avons considérés, y compris le modèle des hasards proportionnels paramétriques et celui de la vie accélérée avec les variables qui peut-être dépendent du temps. Nous avons discuté des problèmes suivants dans cette thèse.Nous avons présenté tout d’abord une statistique de test du chi-deux généraliséeY2nquiest adaptative pour les données de survie et fiabilité en présence de trois cas, complètes,censurées à droite et censurées à droite avec les covariables. Nous avons présenté en détailla forme pratique deY2nstatistique en analyse des données de survie. Ensuite, nous avons considéré deux modèles paramétriques très flexibles, d’évaluer les significations statistiques pour ces modèles proposées en utilisantY2nstatistique. Ces modèles incluent du modèle de vie accélérés (AFT) et celui de hasards proportionnels (PH) basés sur la distribution de Hypertabastic. Ces deux modèles sont proposés pour étudier la distribution de l’analyse de la duré de survie en comparaison avec d’autre modèles paramétriques. Nous avons validé ces modèles paramétriques en utilisantY2n. Les études de simulation ont été conçus.Dans le dernier chapitre, nous avons proposé les applications de ces modèles paramétriques à trois données de bio-médicale. Le premier a été fait les données étendues des temps de rémission des patients de leucémie aiguë qui ont été proposées par Freireich et al. sur la comparaison de deux groupes de traitement avec des informations supplémentaires sur les log du blanc du nombre de globules. Elle a montré que le modèle Hypertabastic AFT est un modèle précis pour ces données. Le second a été fait sur l’étude de tumeur cérébrale avec les patients de gliome malin, ont été proposées par Sauerbrei & Schumacher. Elle a montré que le meilleur modèle est Hypertabastic PH à l’ajout de cinq variables de signification. La troisième demande a été faite sur les données de Semenova & Bitukov, à concernant les patients de myélome multiple. Nous n’avons pas proposé un modèle exactement pour ces données. En raison de cela était les intersections de temps de survie.Par conséquent, nous vous conseillons d’utiliser un autre modèle dynamique que le modèle de la Simple Cross-Effect à installer ces données
This thesis was designed to explore the dynamic regression models, assessing the sta-tistical inference for the survival and reliability data analysis. These dynamic regressionmodels that we have been considered including the parametric proportional hazards andaccelerated failure time models contain the possibly time-dependent covariates. We dis-cussed the following problems in this thesis.At first, we presented a generalized chi-squared test statisticsY2nthat is a convenient tofit the survival and reliability data analysis in presence of three cases: complete, censoredand censored with covariates. We described in detail the theory and the mechanism to usedofY2ntest statistic in the survival and reliability data analysis. Next, we considered theflexible parametric models, evaluating the statistical significance of them by usingY2nandlog-likelihood test statistics. These parametric models include the accelerated failure time(AFT) and a proportional hazards (PH) models based on the Hypertabastic distribution.These two models are proposed to investigate the distribution of the survival and reliabilitydata in comparison with some other parametric models. The simulation studies were de-signed, to demonstrate the asymptotically normally distributed of the maximum likelihood estimators of Hypertabastic’s parameter, to validate of the asymptotically property of Y2n test statistic for Hypertabastic distribution when the right censoring probability equal 0% and 20%.n the last chapter, we applied those two parametric models above to three scenes ofthe real-life data. The first one was done the data set given by Freireich et al. on thecomparison of two treatment groups with additional information about log white blood cellcount, to test the ability of a therapy to prolong the remission times of the acute leukemiapatients. It showed that Hypertabastic AFT model is an accurate model for this dataset.The second one was done on the brain tumour study with malignant glioma patients, givenby Sauerbrei & Schumacher. It showed that the best model is Hypertabastic PH onadding five significance covariates. The third application was done on the data set given by Semenova & Bitukov on the survival times of the multiple myeloma patients. We did not propose an exactly model for this dataset. Because of that was an existing oneintersection of survival times. We, therefore, suggest fitting other dynamic model as SimpleCross-Effect model for this dataset
APA, Harvard, Vancouver, ISO, and other styles
33

Khadraoui, Lobna. "Sélection de copules archimédiennes dans un modèle semi-paramétrique." Master's thesis, Université Laval, 2018. http://hdl.handle.net/20.500.11794/30251.

Full text
Abstract:
Ce travail considère un modèle linéaire semi-paramétrique dont les erreurs sont modélisées par une copule choisie parmi la famille archimédienne ou bien la copule normale. La modélisation des erreurs par une copule apporte une flexibilité et permet de caractériser la structure de dépendance d’une manière simple et efficace. La simplicité réside dans le fait qu’un seul paramètre α contrôle le degré de dépendance présent dans les données. L’efficacité réside dans le fait que ce modèle semi-paramétrique permet de lever des hypothèses standards souvent rencontrées en statistique appliquée à savoir la normalité et l’indépendance. Après une mise en œuvre du modèle basée sur une copule nous avons proposé une étude théorique du comportement asymptotique de l’estimateur du paramètre de dépendance α en montrant sa convergence et sa normalité asymptotique sous des hypothèses classiques de régularité. L’estimation des paramètres du modèle a été réalisée en maximisant une pseudo-vraisemblance. La sélection de la meilleure copule pour un jeu de données a été faite à l’aide du critère d’Akaike. Une comparaison avec le critère de la validation croisée a été proposée également. Enfin, une étude numérique sur des jeux de données simulés et réels a été proposée dans la sélection.
This work considers a semi-parametric linear model with error terms modeled by a copula chosen from the Archimedean family or the normal copula. The modeling of errors by a copula provides flexibility and makes it possible to characterize the dependency structure in a simple and effective manner. The simplicity lies in the fact that a single parameter α controls the degree of dependency present in the data. The efficiency is in the fact that this semi-parametric model weakens standard assumptions often encountered in applied statistics namely normality and independence. After an implementation of the model based on a copula we proposed a theoretical study on the asymptotic behavior of the estimator of the dependence parameter α by showing its consistency and its asymptotic normality under classical assumptions of regularity. Estimation of the model parameters is performed by maximizing a pseudo-likelihood. The selection of the best copula that fits the data for each case is based on the Akaike selection criterion. A comparison with the criterion of cross-validation is presented as well. Finally, a numerical study on simulated and real data sets is proposed.
APA, Harvard, Vancouver, ISO, and other styles
34

Loubaton, Rodolphe. "Modélisation des effets d’une intervention dans un programme génique temporel." Electronic Thesis or Diss., Université de Lorraine, 2023. http://www.theses.fr/2023LORR0322.

Full text
Abstract:
Les cellules cancéreuses peuvent présenter des anomalies de l'expression de certains gènes qui altèrent le fonctionnement normal des programmes de fonctionnement cellulaire, provoquant une prolifération incontrôlée de ces cellules. Ces programmes cellulaires sont constitués de l'expression de milliers de gènes qui s'activent et interagissent de façon concertée. Ces interactions peuvent être représentées sous forme d'un réseau de régulation de gènes. L'objectif général de cette thèse, qui s'inscrit dans la continuité des travaux de Vallat et al (2021) consiste à modéliser un programme cellulaire à partir de données temporelles d'expression de gènes. Le modèle construit permettra d'identifier des gènes cibles dont la diminution d'expression pourrait diminuer la prolifération cellulaire dans un but thérapeutique. Dans le premier chapitre, nous faisons une revue des modèles de réseaux de gènes existant afin de justifier le choix de notre modèle qui est détaillé dans le deuxième chapitre. Ce modèle (appelé modèle LiRE) est un modèle statistique paramétrique gaussien qui permet de prendre en compte la dynamique d'expression de gènes à l'aide de paramètres décrivant, entre autres, les interactions entre les gènes. Les différentes propriétés théoriques de notre modèle nous ont permis de développer un algorithme itératif pour inférer les paramètres en combinant des étapes de régressions linéaires pénalisées lasso et régressions avec contraintes de positivité et contraintes sur la somme des coefficients. Nous menons également dans ce chapitre une étude numérique de ce modèle pour étudier sa performance sur des données simulées. Dans le troisième chapitre, nous décrivons des méthodes qui permettent de modéliser et prédire les résultats d'expériences d'interventions biologiques modifiant l'expression de certains gènes, afin de prédire les meilleurs gènes cibles dont il faudrait diminuer l'expression dans le programme cellulaire pour diminuer la prolifération des cellules cancéreuses. Nous donnons des résultats théoriques sur différents modèles y compris notre modèle LiRE. Dans le dernier chapitre, nous détaillons notre package R MultiRNAflow qui nous a permis de réaliser des analyses statistiques de données dynamiques et complexes d'expressions de gènes afin de caractériser les gènes retenus pour l'inférence de notre modèle LiRE
Cancer cells can exhibit abnormalities in the expression of certain genes that alter the normal functioning of cellular programs, causing them to proliferate uncontrollably. These cellular programs are made up of the expression of thousands of genes that activate and interact in a concerted fashion. These interactions can be represented as a gene regulatory network. The general objective of this thesis, which follows on from the work of Vallat et al (2021), is to model a cellular program using temporal gene expression data. The model constructed will make it possible to identify target genes whose reduced expression could reduce cell proliferation for therapeutic purposes. In the first chapter, we review existing gene network models in order to justify the choice of our model, which is detailed in the second chapter. This model (called the LiRE model) is a Gaussian parametric statistical model that allows us to take into account gene expression dynamics using parameters describing, among other things, the interactions between genes. The various theoretical properties of our model have enabled us to develop an iterative algorithm for inferring parameters, combining steps of penalized linear regressions lasso and regressions with positivity constraints and constraints on the sum of coefficients. In this chapter, we also carry out a numerical study of this model to investigate its performance on simulated data. In the third chapter, we describe methods for modeling and predicting the results of biological intervention experiments modifying the expression of certain genes, in order to predict the best target genes whose expression should be decreased in the cellular program to reduce cancer cell proliferation. We give theoretical results on different models including our LiRE model. In the final chapter, we detail our R package MultiRNAflow, which enabled us to perform statistical analyses of dynamic and complex gene expression data in order to characterize the genes selected for inference in our model LiRE
APA, Harvard, Vancouver, ISO, and other styles
35

Arlot, Sylvain. "Rééchantillonnage et Sélection de modèles." Phd thesis, Université Paris Sud - Paris XI, 2007. http://tel.archives-ouvertes.fr/tel-00198803.

Full text
Abstract:
Cette thèse s'inscrit dans les domaines de la statistique non-paramétrique et de la théorie statistique de l'apprentissage. Son objet est la compréhension fine de certaines méthodes de rééchantillonnage ou de sélection de modèles, du point de vue non-asymptotique.

La majeure partie de ce travail de thèse consiste dans la calibration précise de méthodes de sélection de modèles optimales en pratique, pour le problème de la prédiction. Nous étudions la validation croisée V-fold (très couramment utilisée, mais mal comprise en théorie, notamment pour ce qui est de choisir V) et plusieurs méthodes de pénalisation. Nous proposons des méthodes de calibration précise de pénalités, aussi bien pour ce qui est de leur forme générale que des constantes multiplicatives. L'utilisation du rééchantillonnage permet de résoudre des problèmes difficiles, notamment celui de la régression avec un niveau de bruit variable. Nous validons théoriquement ces méthodes du point de vue non-asymptotique, en prouvant des inégalités oracle et des propriétés d'adaptation. Ces résultats reposent entre autres sur des inégalités de concentration.

Un second problème que nous abordons est celui des régions de confiance et des tests multiples, lorsque l'on dispose d'observations de grande dimension, présentant des corrélations générales et inconnues. L'utilisation de méthodes de rééchantillonnage permet de s'affranchir du fléau de la dimension, et d'"apprendre" ces corrélations. Nous proposons principalement deux méthodes, et prouvons pour chacune un contrôle non-asymptotique de leur niveau.
APA, Harvard, Vancouver, ISO, and other styles
36

Roget-Vial, Céline. "deux contributions à l'étude semi-paramétrique d'un modèle de régression." Phd thesis, Université Rennes 1, 2003. http://tel.archives-ouvertes.fr/tel-00008730.

Full text
Abstract:
Cette thèse s'intéresse à deux modèles de régression semi-paramétrique permettant de contourner le problème classique du "fléau de la dimension" inhérent aux approches non-paramétriques usuelles. La première partie du travail concerne l'étude d'un modèle de régression dit partiellement linéaire ; le but est d'identifier les régresseurs qui composent la partie non-linéaire de la fonction de régression ainsi que d'estimer tous les paramètres du modèle. Pour ce faire nous définissons des quantités caractéristiques du modèle qui mesurent la linéarité des régresseurs puis nous développons un test du nombre de composantes non-linéaires basé sur cette mesure. La seconde partie porte sur l'étude d'un modèle dit à direction révélatrice unique et consiste à estimer, via des propriétés géométriques, l'axe du modèle et d'en déduire un test convergent et puissant sous une suite d'alternatives locales.
APA, Harvard, Vancouver, ISO, and other styles
37

Ruggiero, Michèle. "Analyse semi-paramétrique des modèles de durées : l'apport des méthodes bayésiennes." Aix-Marseille 2, 1989. http://www.theses.fr/1989AIX24008.

Full text
Abstract:
Nous proposons une analyse semi-paramétrique des modèles de durée. Dans ces modèles de régression particuliers, la variable expliquée est le temps qu'un individu passe dans un état donné - par exemple le temps passé au chômage - et les variables explicatives sont les caractéristiques personnelles de cet individu. L'analyse semi-paramétrique de ces modèles consiste à paramétrer la relation entre la durée et les variables qui la déterminent (la durée est supposée être une fonction des variables explicatives, entièrement spécifiée et dépendant de paramètres inconnus) tout en laissant indéterminée la distribution des durées. Les paramètres intervenant dans la relation entre les variables ont alors le statut de paramètres d'intérêt, et la distribution des durées est considérée comme un paramètre nuisible. La thèse commence par une revue des méthodes employées par la statistique classique; il apparait que ces méthodes ne permettent pas d'éliminer le paramètre nuisible qu'est la distribution des durées. Nous proposons alors une approche baye- sienne, dont le principe est de munir le paramètre de nuisance - la distribution des durées - d'une distribution a priori. Nous obtenons ainsi des estimateurs semi- paramétriques pour les paramètres d'intérêt du modèle, en calculant leur distribution a posteriori, conditionnelle aux observations et marginalisée par rapport au paramètre nuisible. La thèse se termine par une simulation, où sont vérifiées les qualités de robustesse des estimateurs que nous proposons
We propose a semiparametric analysis of duration models. In this special class of regression models, the dependant variable is the time spent by a person in a particular state - the duration of an unemployment spell for instance - and the explanatory variables are the personal characteristics of this person. The semiparametric analysis of these models consists in specifying the relation between the duration and the explanatory variables (duration is supposed to be a specified function of the explanatory variables, depending on a finite number of unknown parameters) without specifying the data distribution. The parameters involved in this relation are then considered as parameters of interest, and the data distribution is a nuisance parameter. The thesis begins with a survey of nonbayesian semiparametric methods of estimation; it seems that these methods fail in discarding the nuisance data distribution. We then suggest a bayesian method, the principle of which is to give a prior distribution on the nuisance parameter - the data distribution. We then get semiparametric estimators for the parameters of interest, by computing their posterior distribution, conditional on the data and integrated with respect to the nuisance parameter. The thesis ends with a simulation, to check the robustness of the estimators we propose
APA, Harvard, Vancouver, ISO, and other styles
38

Pchelintsev, Evgeny. "Estimation paramétrique améliorée pour des modèles régressifs observés sous un bruit avec sauts." Rouen, 2012. http://www.theses.fr/2012ROUES041.

Full text
Abstract:
Cette thèse est consacrée à l'estimation paramétrique des paramètres inconnus des modèles régressifs en temps discret et continu qui sont conditionnellement gaussiens par rapport au processus de bruit non observé. Sur la base d'observations de ces modèles, nous développons des méthodes améliorées par rapport aux estimateurs des moindres carrés classiques pour l'estimation de ces paramètres. Pour les modèles de régression avec les bruits de Lévy et d'Ornstein -- Uhlenbeck, nous obtenons des formules explicites pour le gain minimal dans la précision en moyenne quadratique lors de l'utilisation des estimateurs de shrinkage au lieu des estimateur des moindres carrés. Pour des modèles continus, sont construits les estimateurs améliorés des paramètres en se basant sur données discrètes. Pour un modèle avec le bruit et avec des sauts, nous montrons une minimaxité asymptotique des estimateurs des moindres carrés et des estimateurs de shrinkage proposés au sens du risque robuste. Nous avons aussi effectué une simulation numérique des estimateurs proposés
This thesis is devoted to parametric estimation for discret and continuous time regression models which are conditionally Gaussian with respect to a non-observable process. We consider the problem of estimating the unknown parameter using data governed by regression models. We develop improved methods for parameter estimation of regression models compared to least squares estimates. For regression models with Levy noise and Ornstein -- Uhlenbeck noise, we obtain explicit formulas for the minimal gain in mean square accuracy when using shrinkage estimates instead of the least squares estimates. For continuous models, are built improved estimates of the parameters on discrete data. For the model with noise and with jumps, we establish the asymptotic minimaxity of the least squares estimates and of the proposed shrinkage estimates in the sense of robust risk. We also carry on a simulation study of the proposed estimation procedures
APA, Harvard, Vancouver, ISO, and other styles
39

Kiessé, Tristan Senga. "Approche non-paramétrique par noyaux associés discrets des données de dénombrement." Pau, 2008. https://tel.archives-ouvertes.fr/tel-00372180.

Full text
Abstract:
Nous introduisons une nouvelle approche non-paramétrique, par noyaux associés discrets, pour les données de dénombrement. Pour cela, nous définissons la notion de noyaux associés discrets à partir d’une loi de probabilité discrète donnée et nous étudions leurs propriétés. De là, nous construisons l’estimateur à noyau discret lequel est l’analogue de certains estimateurs à noyau continu de cette dernière décennie. Nous examinons ses propriétés fondamentales ; en particulier, nous montrons la convergence ponctuelle en moyenne quadratique de l’estimateur. Le choix de fenêtre du lissage discret s’effectue essentiellement par validation croisée et excès de zéros. Nous étudions également le comportement des lois classiques de dénombrement comme noyau associé, par exemple, Poisson, binomiale et binomiale négative. Ainsi, il s’est révélé nécessaire de construire une nouvelle famille de lois discrètes dites triangulaires pour servir de noyaux associés symétriques. Cette méthode des noyaux associés discrets est utilisée dans l’estimation semi-paramétrique des distributions de données de dénombrement, ainsi que pour la régression non-paramétrique sur une variable explicative de dénombrement. Tout au long de ce travail, nous illustrons les résultats à travers des simulations et des jeux de données réelles. Dans le cas d’échantillons de tailles petites et modérées, l’importance et les très bonnes performances des noyaux associés discrets sont mises en évidence, en comparaison avec le noyau du type Dirac et parfois les noyaux continus. Mots clés : Biais de bordure, différence finie, estimation non-paramétrique, noyau variable, loi discrète, loi triangulaire discrète, noyau asymétrique, proportion de zéros, régression non-paramétrique, risque quadratique intégré, validation croisée
This work introduces a new nonparametric approach by discrete associatedkernels for count data. First, we define the discrete kernel associated to a discrete probability distribution and we examine its basical properties. Furthermore, we construct the discrete associated-kernel estimator which is the analog of some one in the continuous case of the last decade. We investigate their properties ; in particular, we show the pointwise convergence of the estimator in the sense of mean squared error. The choice of bandwidth is mainly done through cross-validation and excess of zeros. For illustrating, we study some discrete probability distributions such that Poisson, binomial, negative binomial, that we consider as associated-kernels. Thus, we need to improve it by introducing a new discrete probability distribution, called triangular, in order to serve as symmetric associated-kernel. The discrete associated-kernel method is then used for a semiparametric estimation of count distributions and, also, for nonparametric regression on a count explanatory variable. This discrete associated-kernel method is illustrated through simulations and real examples of count data. For a sample size not so large, the importance and the performance of discrete associated-kernels are pointed out compared with the Dirac type kernel and, sometimes, the continuous ones
APA, Harvard, Vancouver, ISO, and other styles
40

Guilloux, Agathe. "Inférence non paramétrique en statistique des durées de vie sous biais de sélection." Rennes 1, 2004. http://www.theses.fr/2004REN10058.

Full text
APA, Harvard, Vancouver, ISO, and other styles
41

Morsli, Nadia. "Inférence non paramétrique pour les modèles Gibbsiens de processus ponctuels spatiaux." Thesis, Grenoble, 2014. http://www.theses.fr/2014GRENM055/document.

Full text
Abstract:
Parmi les modèles permettant d'introduire de l'interaction entre les points, nous trouvons très large famille des modèles gibbsiens de processus ponctuels spatiaux issus de la physique statistique, permettant de modéliser à la fois des motifs répulsifs ou attractifs. Dans cette thèse, nous nous intéressons à l'inférence semi-paramétrique de ces modèles caractérisés par l'intensité conditionnelle de Papangelou. Deux contextes sont étudiés. Dans le premier thème, nous décrivons une procédure d'estimation du terme d'interaction du premier ordre (qui peut être aussi appelé l'intensité de Poisson) de l'intensité conditionnelle de Papangelou. L'idée sur laquelle l'estimation est basée permet, sous l'hypothèse d'une portée finie, de négliger les termes d'interaction d'ordre supérieur quelle que soit leur nature. La consistance forte et la normalité asymptotique de l'estimateur sont prouvées. Une étude par simulations illustre la performance de l'estimateur sur une fenêtre d'observation finie. Dans le second thème, nous nous focalisons sur la classe la plus connue et utilisée; le processus ponctuel à interaction par paires. Nous construisons une nouvelle méthode d'estimation de la fonction d'interaction de paires dans l'esprit des estimations non paramétriques par lissage à partir d'une réalisation du processus ponctuel spatial à interaction par paires. Deux cas sont étudiées: le cas stationnaire et le cas isotrope. Ces estimateurs exploitent à nouveau la propriété de portée finie des processus ponctuels et intégrent l'estimation du paramètre de l'intensité de Poisson vue dans le premier thème. Nous présentons les propriétés asymptotiques telles que la consistance forte ponctuelle, la consistance forte globale avec différentes vitesses de consistance, le comportement de l'erreur quadratique moyenne et la normalité asymptotique de ces estimateurs
Among models allowing to introduce interaction between points, we find the large class of Gibbs models coming from statistical physics. Such models can produce repulsive as well as attractive point pattern. In this thesis, we are interested in the semi-parametric inference of such models characterized by the Papangelou conditional intensity. Two frameworks are considered. First, we describe a procédure which intends to estimate the first-order interaction term (also called Poisson intensity) of the Papangelou conditional intensity. Under the assumption of finite range of the process, the idea upon which the procedure is based allows us to neglect higher-order interaction terms. We study the stong consistency and the asymptotic normality and conduct a simulation study which highlights the efficiency of the method for finite observation window. Second, we focus on the main class of Gibbs models which is the class of pairwise interaction point processes. We construct a kernel-based estimator of the pairwise interaction function. Two cases are studied: the stationary case and the isotropic case.The estimators, we propose, exploit the finite range property and the estimator of the Poisson intensity defined in the first part. We present asymptotic properties, namely the strong consistency, the behavior of the mean squared error and the asymptotic normality
APA, Harvard, Vancouver, ISO, and other styles
42

Olivier, Adelaïde. "Analyse statistique des modèles de croissance-fragmentation." Thesis, Paris 9, 2015. http://www.theses.fr/2015PA090047/document.

Full text
Abstract:
Cette étude théorique est pensée en lien étroit avec un champ d'application : il s'agit de modéliser la croissance d'une population de cellules qui se divisent selon un taux de division inconnu, fonction d’une variable dite structurante – l’âge et la taille des cellules étant les deux exemples paradigmatiques étudiés. Le champ mathématique afférent se situe à l'interface de la statistique des processus, de l’estimation non-paramétrique et de l’analyse des équations aux dérivées partielles. Les trois objectifs de ce travail sont les suivants : reconstruire le taux de division (fonction de l’âge ou de la taille) pour différents schémas d’observation (en temps généalogique ou en temps continu) ; étudier la transmission d'un trait biologique général d'une cellule à une autre et étudier le trait d’une cellule typique ; comparer la croissance de différentes populations de cellules à travers le paramètre de Malthus (après introduction de variabilité dans le taux de croissance par exemple)
This work is concerned with growth-fragmentation models, implemented for investigating the growth of a population of cells which divide according to an unknown splitting rate, depending on a structuring variable – age and size being the two paradigmatic examples. The mathematical framework includes statistics of processes, nonparametric estimations and analysis of partial differential equations. The three objectives of this work are the following : get a nonparametric estimate of the division rate (as a function of age or size) for different observation schemes (genealogical or continuous) ; to study the transmission of a biological feature from one cell to an other and study the feature of one typical cell ; to compare different populations of cells through their Malthus parameter, which governs the global growth (when introducing variability in the growth rate among cells for instance)
APA, Harvard, Vancouver, ISO, and other styles
43

Mohdeb, Zaher. "Tests d'hypothèses linéaires dans un modèle de régression non paramétrique." Versailles-St Quentin en Yvelines, 1999. http://www.theses.fr/1999VERS0003.

Full text
Abstract:
Cette thèse est consacrée à la construction de tests d'hypothèses sur la fonction de régression f, d'un modèle de régression non paramétrique. Dans une première partie, on construit des tests d'hypothèses sur les coefficients de Fourier de f. De tels tests peuvent être utilisés pour comparer deux signaux bruites dans une bande donnée de fréquences. Les statistiques de test que nous utilisons, s'expriment en fonction des coefficients de Fourier empiriques de f. La deuxième partie porte sur le test de l'hypothèse f est un élément de e ou e est un espace vectoriel de dimension finie. Nous proposons deux statistiques de test $$r2 n et $$m 2 n basées sur deux approximations différentes de la distance dans l 2. La première est obtenue en estimant cette distance par la distance empirique des observations à l'espace e. La seconde est construite à l'aide des observations convenablement corrigées. Dans cette partie, nous supposons que les fonctions considérées sont holderiennes d'ordre strictement plus grand que 1/2 et nous obtenons le comportement asymptotique en loi de chacune des deux statistiques proposées. La troisième partie est une extension de la deuxième au cas où les fonctions sont Riemann-intégrables ; le comportement en loi de la statistique $$r2 n est alors sensiblement différent de celui obtenu dans la partie précédente, puisque l'on constate, dans le résultat limite, L'apparition d'un terme non négligeable. Cependant, ce terme supplémentaire est explicite et permet donc la construction de différents tests
APA, Harvard, Vancouver, ISO, and other styles
44

Lerasle, Matthieu. "Rééchantillonnage et sélection de modèles optimale pour l'estimation de la densité." Toulouse, INSA, 2009. http://eprint.insa-toulouse.fr/archive/00000290/.

Full text
Abstract:
Le principal objectif de cette thèse est d’étudier deux méthodes de calibration automatique de la pénalité pour la sélection de modèle. L’avantage de ces méthodes est double, d’une part, elles sont toujours implémentables, elles ont mˆeme souvent été utilisées dans des problèmes pratiques avec succès, d’autre part, elles sont optimales puisqu’elles permettent de sélectionner asymptotiquement le meilleur modèle. Il existe d’autres méthodes de pénalisation calculables en pratique, quand les données sont indépendantes. Néanmoins, en dehors des collections de modèles très réguliers, ces pénalités sont très pessimistes, voire dépendent de constantes inconnues comme la norme sup de la densité. De plus, quand on veut utiliser les preuves classiques pour des données mélangeantes, les pénalités que l’on obtient dépendent toujours de constantes inconnues de l’utilisateur (voir le chapitre 3). Le chapitre 2 étudie l’heuristique de pente et les pénalités par rééchantillonnage dans le cas de données indépendantes. On donne une condition suffisante pour que l’heuristique de la pente soit optimale, en utilisant l’inégalité de concentration de Talagrand pour le supremum du processus empirique. On étudie aussi l’approximation du processus empirique par sa version rééchantillonnée et on en déduit que la même condition suffit à garantir l’optimalité des méthodes par rééchantillonnage. Le chapitre 3 est consacré à l’étude de pénalités classiques quand les observations sont mélangeantes. On montre des inégalités oracles et l’adaptativité de l’estimateur sélectionné à la régularité de la densité. La pénalité dépend des coefficients de mélange qui peuvent parfois être évalués. Le chapitre 4 étend les résultats du chapitre 2 au cas de données mélangeantes. On montre ainsi que les méthodes de la pente et bootstrap sont également optimales dans ce cas, sous le même type de conditions. Ces nouvelles pénalités sont toujours calculables en pratique et le modèle sélectionné est asymptotiquement un oracle, ce qui améliore beaucoup les résultats du chapitre 3. Le chapitre 5 traite du problème des régions de confiance adaptatives. Contrairement au cas de l’estimation, cette adaptation n’est que très rarement possible. Quand elle l’est, nous construisons des régions adaptatives. En particulier, on améliore quelques résultats de concentration du chapitre 2 lorsque les données sont à valeurs réelles, notamment ceux des U-statistiques.
APA, Harvard, Vancouver, ISO, and other styles
45

Ezzahrioui, M'hamed. "Prévision dans les modèles conditionels en dimension finie." Littoral, 2007. http://www.theses.fr/2007DUNK0187.

Full text
Abstract:
Cette thèse est consacrée à l’étude des propriétés asymptotiques de paramètres fonctionnels en statistiques non paramétriques, quand la variable explicative prend ses valeurs dans un espace de dimension infinie. Dans ce cadre non paramétrique, on considère les estimateurs des paramètres fonctionnels usuels, tels la loi conditionnelle, la densité de probabilité conditionnelle, le quantile conditionnel, la fonction de hasard conditionnelle, ainsi que le mode conditionnel, lorsque la variable explicative est fonctionnelle. Nous nous intéressons essentiellement au problème de prévision dans les modèles non paramétriques conditionnels. Nous proposons une alternative à la méthode de la régression en utilisant le mode conditionnel ou la médiane conditionnelle. Notre étude porte sur des données identiquement distribuées ainsi que sur des données fortement mélangeantes. Nous généralisons également les résultats classiques existants dans le cas de dimension finie. La prévision en statistique paramétrique ou non paramétrique est l’une des questions les plus cruciales auxquelles les statisticiens ne cessent de proposer des solutions dans différents contextes. Dans le contexte non paramétrique, il est à noter que le modèle de régression usuel ne répond pas dans certaines situations aux problèmes de prévision. Le mode conditionnel ou le quantile conditionnel sont des alternatives pour répondre au problème mentionné. Cette thèse s’inscrit dans la continuité des travaux existants en dimension infinie et développe aussi bien les aspects pratiques que théoriques. Nos résultats sont appliqués à des données réelles de type climatique ainsi qu’à des données simulées
This thesis is dedicated to the survey of the asymptotic properties of conditional functional parameters in nonparametric statistics, when the explanatory variable takes values in an infinite dimension space. In this nonparametric setting, we consider the estimators of the usual functional parameters, as the conditional law, the conditional probability density, the conditional quantile, the conditional mode and the conditional hazard function, when the explanatory variable is functional. We are mainly interested in the problem of forecasting in non parametric conditional models, when the data are functional random variables. We propose an alternative to the method of regression while using the conditional mode or the conditional median. The survey of our functional estimators deals with i. I. D. As well as strong mixing data for which we generalize the classical finite-dimension results. Forecasting in parametric or nonparametric statistics is one of the most crucial questions to which the statisticians try to give answers for different frameworks. It is worth to note that the usual regression model does not answer to the problem of forecasting in some situations such as asymmetri densities or in the case where the density admits several peaks among which one is sufficiently large. The conditionnal mode/quantile are then alternatives to answer the mentioned problem. This thesis traces itself in the continuity of the existing works in infinite dimension. It develops a lot of aspects of both practical and theorical points of view. Our results are applied to real data (taken from climatology) and to simulated data
APA, Harvard, Vancouver, ISO, and other styles
46

Kaid, Zoulikha. "Sur l'estimation non paramétrique des modèles conditionnels pour variables fonctionnelles spatialement dépendantes." Thesis, Lille 3, 2012. http://www.theses.fr/2012LIL30061/document.

Full text
Abstract:
Dans cette thèse, nous nous intéressons au problème de la prévision spatiale en considérant des modèles non paramétriques conditionnels dont la variable explicative est fonctionnelle. Plus précisément, les points étudiés pour décrire la co-variation spatiale entre une variable réponse réelle et une variable fonctionnelle sont le mode conditionnel et les quantiles conditionnels.En ce qui concerne le mode conditionnel, nous établissons la convergence presque complète, la convergence en norme Lp et la normalité asymptotique d'un estimateur à noyau. Ces propriétés asymptotiques sont obtenues sous des conditions assez générales telles, l'hypothèse de mélange forte et l'hypothèse de concentration de la mesure de probabilité de la variable explicative fonctionnelle. L'implémentation de l'estimateur construit en pratique est illustrée par une application sur des données météorologiques.Le modèle des quantiles conditionnels est abordé dans la deuxième partie de la thèse. Il est traité comme fonction inverse de la fonction de répartition conditionnelle qui est estimée par un estimateur à double noyaux. Sous les mêmes conditions que celles du modèle précédent, nous donnons l'expression de la vitesse de convergence en norme Lp et nous démontrons la normalité asymptotique de l'estimateur construit.Notre étude généralise au cas spatial de nombreux résultats déjà existant en série chronologique fonctionnelle. De plus, l'estimation de nos modèles repose sur une estimation préalable de la densité et de la fonction de répartition conditionnelles et permet de construire des régions prédictives, montrant ainsi l'apport de ce genre de modèles par rapport à la régression classique
The main purpose of this thesis concerns the problem of spatial prediction using some nonparametric conditional models where the covariate variable is a functional one. More precisely, we treat the nonparametric estimation of the conditional mode and that of the conditional quantiles as spatial prediction tools alternative to the classical spatial regression of real response variable given a functional variable.Concerning the first model, that is the conditional mode, it is estimated by maximizing the spatial version of the kernel estimate of the conditional density. Under a general mixing condition and the concentration properties of the probability measure of the functional variable, we establish the almost complete convergence (with rate), the Lp consistency (with rate) and the asymptotic normality of the considered estimator. The usefulness of this estimation is illustrated by an application on real meteorological data.The model of the conditional quantiles is considered in the second part of this thesis and is treated as the inverse function of the conditional cumulative distribution function which is estimated by a double kernel estimator. Under the same general conditions as in the first model, we give the convergence rate in the Lp- norm and we show the asymptotic normality of the constructed estimator. These asymptotic results are closely related to the concentration properties on small balls of the probability measure of the underlying explanatory variable and the regularity of the conditional cumulative distribution function.Our study generalizes to spatial case some existing results in functional times series case. Finally, we highlight what our models brings compared to classical regression, discussing the use of our results as preliminary works to construct predictive regions
APA, Harvard, Vancouver, ISO, and other styles
47

Khardani, Salah. "Prévision non paramétrique dans les modèles de censure via l'estimation du mode conditionnel." Littoral, 2010. http://www.theses.fr/2010DUNK0277.

Full text
Abstract:
Dans ce travail, nous étudions quelques aspects de l’estimation fonctionnelle pour des données incomplètes (censurées). Plus précisément, nous nous intéressons à la fonction mode et à la fonction mode conditionnel pour lesquelles nous construisons des estimateurs et étudions le comportement asymptotique. Les estimateurs proposés se positionnent comme alternatives à la prévision par la fonction de régression. Dans un premier travail, nous considérons une suite de v. A. {T_i , i [supérieur ou =]1} indépendante et identiquement distribuée (iid), de densité f , censurée à droite par une suite aléatoire {Ci , i [supérieur ou = à]1} supposée iid et indépendante de {T_i , i [supérieur ou = à]1}. Nous nous intéressons à un problème de régression de T par une covariable multi-dimensionnelle X. Nous établissons la convergence et la normalité asymptotique des estimateurs à noyau de la fonction mode conditionnel et de la densité conditionnelle. Nous obtenons des intervalles de confiance en utilisant la méthode du "plug-in" pour les paramètres inconnus. Une étude sur des données simulées de taille finie illustre la qualité de nos estimateurs. Dans un second travail, nous traitons le cas du mode simple défini par θ = arg max_{t. IR} f (t). Dans ce cas, la suite {T_i , i [supérieur ou = à]1} est supposée stationnaire et fortement mélangeante, alors que les {C_i , i [supérieur ou = à]1} sont iid. Nous construisons un estimateur du mode (basé sur un estimateur à noyau de la densité) dont nous établissons la convergence presque sûre. Le dernier travail de cette thèse généralise les résultats de convergence du mode conditionnel au cas où les {T_i , i [supérieur ou = à]1} sont fortement mélangeant
In this work, we address the problem of estimating the mode and conditional mode functions, for independent and dependent data, under random censorship. Firstly, we consider an independent and identically distributed (iid) sequence random variables (rvs) {T_i , i [equal to or higher than]1}, with density f. This sequence is right-censored by another iid sequence of rvs {Ci , i[equal to or higher than]1} which is supposed to be independent of {T_i , i [equal to or higher than]1}. We are interested in the regression problem of T given a covariable X. We state convergence and asymptomatic normality of Kernel-based estimators of conditional density and mode. Using the “plug-in” method for the unknown parameters, confidence intervals are gicen. Also simulations are drawn. In a second step we deal with the simple mode, given by par θ = arg max_{t. IR} f (t). Here, the sequence {T_i , i [equal to or higher than]1} is supposed to be stationary and strongly mixing whereas the {Ci , i[equal to or higher than]1} are iid. We build a mode estimator (based on a density kernel estimator) for which we state the almost sure consistency. Finally, we extend the conditional mode consistency results to the case where the {T_i , i [equal to or higher than]1} are strongly mixing
APA, Harvard, Vancouver, ISO, and other styles
48

Canaud, Matthieu. "Estimation de paramètres et planification d’expériences adaptée aux problèmes de cinétique - Application à la dépollution des fumées en sortie des moteurs." Thesis, Saint-Etienne, EMSE, 2011. http://www.theses.fr/2011EMSE0619/document.

Full text
Abstract:
Les modèles physico-chimiques destinés à représenter la réalité expérimentale peuvent se révéler inadéquats. C'est le cas du piège à oxyde d'azote, utilisé comme support applicatif de notre thèse, qui est un système catalytique traitant les émissions polluantes du moteur Diesel. Les sorties sont des courbes de concentrations des polluants, qui sont des données fonctionnelles, dépendant de concentrations initiales scalaires.L'objectif initial de cette thèse est de proposer des plans d'expériences ayant un sens pour l'utilisateur. Cependant les plans d'expérience s'appuyant sur des modèles, l'essentiel du travail a conduit à proposer une représentation statistique tenant compte des connaissances des experts, et qui permette de construire ce plan.Trois axes de recherches ont été explorés. Nous avons d'abord considéré une modélisation non fonctionnelle avec le recours à la théorie du krigeage. Puis, nous avons pris en compte la dimension fonctionnelle des réponses, avec l'application et l'extension des modèles à coefficients variables. Enfin en repartant du modèle initial, nous avons fait dépendre les paramètres cinétiques des entrées (scalaires) à l'aide d'une représentation non paramétrique.Afin de comparer les méthodes, il a été nécessaire de mener une campagne expérimentale, et nous proposons une démarche de plan exploratoire, basée sur l’entropie maximale
Physico-chemical models designed to represent experimental reality may prove to be inadequate. This is the case of nitrogen oxide trap, used as an application support of our thesis, which is a catalyst system treating the emissions of the diesel engine. The outputs are the curves of concentrations of pollutants, which are functional data, depending on scalar initial concentrations.The initial objective of this thesis is to propose experiental design that are meaningful to the user. However, the experimental design relying on models, most of the work has led us to propose a statistical representation taking into account the expert knowledge, and allows to build this plan.Three lines of research were explored. We first considered a non-functional modeling with the use of kriging theory. Then, we took into account the functional dimension of the responses, with the application and extension of varying coefficent models. Finally, starting again from the original model, we developped a model depending on the kinetic parameters of the inputs (scalar) using a nonparametric representation.To compare the methods, it was necessary to conduct an experimental campaign, and we propose an exploratory design approach, based on maximum entropy
APA, Harvard, Vancouver, ISO, and other styles
49

Avalos, Marta. "Modèles additifs parcimonieux." Phd thesis, Université de Technologie de Compiègne, 2004. http://tel.archives-ouvertes.fr/tel-00008802.

Full text
Abstract:
De nombreux algorithmes d'estimation fonctionnelle existent pour l'apprentissage statistique supervisé. Cependant, ils ont pour la plupart été développés dans le but de fournir des estimateurs précis, sans considérer l'interprétabilité de la solution. Les modèles additifs permettent d'expliquer les prédictions simplement, en ne faisant intervenir qu'une variable explicative à la fois, mais ils sont difficiles à mettre en ouvre. Cette thèse est consacrée au développement d'un algorithme d'estimation des modèles additifs. D'une part, leur utilisation y est simplifiée, car le réglage de la complexité est en grande partie intégré dans la phase d'estimation des paramètres. D'autre part, l'interprétabilité est favorisée par une tendance à éliminer automatiquement les variables les moins pertinentes. Des stratégies d'accélération des calculs sont également proposées. Une approximation du nombre effectif de paramètres permet l'utilisation de critères analytiques de sélection de modèle. Sa validité est testée par des simulations et sur des données réelles.
APA, Harvard, Vancouver, ISO, and other styles
50

Chimard, Florencia. "Mélanges de processus ponctuels spatio-temporels et approche bayésienne semi-paramétrique." Antilles-Guyane, 2010. http://www.theses.fr/2010AGUY0392.

Full text
Abstract:
Dans cette thèse, nous développons la statistique bayésienne de processus ponctuels spatio-temporels. Nous proposons deux contextes d'étude. Tout d'abord, nous considérons des occurrences constituant la réalisation d'un processus de Cox spatio-temporel dont l'intensité est associée à un processus shot noise généralisé. Le modèle correspond à une mesure d'intensité liée à des contributions générées par un processus caché de Poisson et qui suivent un processus de Dirichlet centré sur la loi Gamma. A partir des positions spatiales des occurrences observées entre plusieurs paires de dates d'observations consécutives, nous proposons d'inférer su les paramètres d'intérêt à l'aide de méthodes MCMC dans le cadre d'un modèle bayésien hiérarchique. Un algorithme avec augmentation des données est proposé et testé sur des jeux de données artificielles. D'autre part, nous analysons la situation où l'ensemble d'étude est un ensemble discret de positions possibles pour chaque occurrence du phénomène. La présence\absence d'une unique occurrence en une position donnée implique que nous aurons des données binaires. Nous développons un modèle de mélange de lois de Bernoulli avec un paramètre d'intensité d'arrière plan suivant un processus autorégressif d'ordre 1 log-gaussien. Nous utilisons une approche bayésienne hiérarchique pour mener à bien l'inférence statistique de notre modèle. Nous développons un algorithme Metropolis-within Gibbs pour calculer la loi a posteriori des paramètres. Des tests sont effectués sur des données artificielles et des données sur un virus attaquant la canne à sucre
Point processes are often used as tools for describing spatial or spatio- temporal point patterns. In this Phd dissertation, we give an overview of bayesian statistical analysis for point processes and recent tools Iike the Dirichlet process and its diverse extensions. We focus on situations where the available data are maps of the studied point process at different observations dates. Two contexts are considered. Firstly, we consider occurrences of events in a studied area forming the realization of a spatio-temporal Cox process directed by a generalized shot noise intensity measure. A hidden Poisson process generates contributions to the intensity measure which are distributed according to a Dirichlet process centered on the Gamma distribution. For data consisting of spatial locations of occurrences between several pairs of consecutive observation dates, we develop statistical inference about the parameters of interest by means of MCMC methods within the framework of hierarchical bayesian modeling. A data augmentation algorithm is introduced and tested on artificial data. Secondly, we analyse the case where the point process support is discrete with at most one occurrence for a given element of the support. For such binary data, we present and discuss models based on Bernoulli distribution mixture with a background intensity following a log-gaussian. The statistical inference for these models is developped by using a hierarchical bayesian approach. Tests are carried out on artificial data and data from Yellow Leaf Sugarcane Virus observations
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography