Auswahl der wissenschaftlichen Literatur zum Thema „Modèle bayésien non paramétrique“

Geben Sie eine Quelle nach APA, MLA, Chicago, Harvard und anderen Zitierweisen an

Wählen Sie eine Art der Quelle aus:

Machen Sie sich mit den Listen der aktuellen Artikel, Bücher, Dissertationen, Berichten und anderer wissenschaftlichen Quellen zum Thema "Modèle bayésien non paramétrique" bekannt.

Neben jedem Werk im Literaturverzeichnis ist die Option "Zur Bibliographie hinzufügen" verfügbar. Nutzen Sie sie, wird Ihre bibliographische Angabe des gewählten Werkes nach der nötigen Zitierweise (APA, MLA, Harvard, Chicago, Vancouver usw.) automatisch gestaltet.

Sie können auch den vollen Text der wissenschaftlichen Publikation im PDF-Format herunterladen und eine Online-Annotation der Arbeit lesen, wenn die relevanten Parameter in den Metadaten verfügbar sind.

Zeitschriftenartikel zum Thema "Modèle bayésien non paramétrique"

1

Lubrano, Michel. „Modélisation bayésienne non linéaire du taux d’intérêt de court terme américain : l’aide des outils non paramétriques“. Articles 80, Nr. 2-3 (24.10.2005): 465–99. http://dx.doi.org/10.7202/011396ar.

Der volle Inhalt der Quelle
Annotation:
Résumé Cet article a pour objet l’investigation des modèles empiriques de taux d’intérêt de court terme sur données américaines. Il utilise une combinaison de méthodes classiques non paramétriques et de méthodes bayésiennes paramétriques. La forme des fonctions de dérive et de volatilité du modèle discrétisé est tout d’abord examinée au moyen d’une analyse non paramétrique préliminaire. Le texte développe ensuite une méthode bayésienne de choix de modèles qui est basée sur la capacité d’un modèle à minimiser la distance de Hellinger entre la densité prédictive a posteriori du modèle discrétisé et la densité de l’échantillon observé. Une discrétisation du modèle en temps continu est estimée en utilisant différentes variantes paramétriques allant du modèle à variance constante jusqu’à différents types de modèles de switching suggérés par l’analyse non paramétrique préliminaire.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
2

Angers, Jean-François, Denise Desjardins und Georges Dionne. „Modèle Bayésien de tarification de l’assurance des flottes de véhicules“. Articles 80, Nr. 2-3 (24.10.2005): 253–303. http://dx.doi.org/10.7202/011388ar.

Der volle Inhalt der Quelle
Annotation:
Résumé Nous proposons un modèle paramétrique de tarification de l’assurance de véhicules routiers appartenant à une flotte. Les tables de primes qui y sont présentées tiennent compte des accidents passés des véhicules, des caractéristiques observables des véhicules et des flottes et des infractions au Code de la sécurité routière des conducteurs et des transporteurs. De plus, les primes sont ajustées en fonction des accidents accumulés par les flottes dans le temps. Il s’agit d’un modèle qui prend directement en compte des changements explicites des différentes composantes des probabilités d’accidents. Il représente une extension aux modèles d’assurance automobile de type bonus-malus pour les primes individuelles (Lemaire, 1985 ; Dionne et Vanasse, 1989 et 1992 ; Pinquet, 1997 et 1998 ; Frangos et Vrontos, 2001 ; Purcaru et Denuit, 2003). L’extension ajoute un effet flotte à l’effet véhicule pour tenir compte des caractéristiques ou des actions non observables des transporteurs sur les taux d’accidents des camions. Cette forme de tarification comporte plusieurs avantages. Elle permet de visualiser l’impact des comportements des propriétaires des flottes et des conducteurs des véhicules sur les taux d’accidents prédits et, par conséquent, sur les primes. Elle mesure l’influence des infractions et des accidents accumulés sur les primes d’assurance mais d’une façon différente. En effet, les effets des infractions sont obtenus via la composante de régression, alors que les effets des accidents proviennent des résidus non expliqués de la régression sur les accidents des camions via un modèle bayésien de tarification.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
3

Hilgert, Nadine, und Bruno Portier. „Estimation non paramétrique dans un modèle autorégressif fonctionnel non directement observé“. Comptes Rendus de l'Académie des Sciences - Series I - Mathematics 327, Nr. 6 (September 1998): 597–600. http://dx.doi.org/10.1016/s0764-4442(98)89171-4.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
4

Chebli, Hamid, und Christian Soize. „Analyse vibratoire par sous-structuration avec modèle non paramétrique d'incertitudes aléatoires non homogènes“. Revue Européenne des Éléments Finis 11, Nr. 2-4 (Januar 2002): 233–46. http://dx.doi.org/10.3166/reef.11.233-246.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
5

Broniatowski, Michel, und Gérard Kebabdjian. „Inflation et dynamique des prix — Un traitement non paramétrique des données françaises“. Économie appliquée 39, Nr. 2 (1986): 337–68. http://dx.doi.org/10.3406/ecoap.1986.4076.

Der volle Inhalt der Quelle
Annotation:
L’article détermine la structure dynamique des prix des branches industrielles en France sur la période 1963-1980 en données trimestrielles à partir des méthodes nouvelles d’estimation des fonctions non-paramétriques. Les résultats statistiques établissent l’existence de fonctions auto-régressives faisant apparaître des comportement inflationnistes différenciés. Les résultats corroborent le modèle théorique présenté qui dynamise le comportement de mark-up par endogénéisation de la demande.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
6

Fortin, Nicole M. „L’impact des règles de prêts hypothécaires sur l’offre de travail des femmes au Canada : évidence paramétrique et non paramétrique“. L’économétrie du travail et des ressources humaines 73, Nr. 1-2-3 (09.02.2009): 129–59. http://dx.doi.org/10.7202/602225ar.

Der volle Inhalt der Quelle
Annotation:
RÉSUMÉ Cet article utilise des statistiques descriptives, des régressions flexibles de type noyau et des modèles à formes réduites pour montrer que des variables reliées aux conditions hypothécaires, en particulier une variable qui capture les exigences de revenu relatives aux prêts hypothécaires, ont un impact important sur l’offre de travail des femmes au Canada. Dans un modèle à formes réduites du nombre de semaines travaillées par l’épouse, l’impact positif de cette contrainte à l’emprunt excède l’effet négatif de la variable enfants d’âge préscolaire. Ce résultat ne peut être attribué à un problème d’endogénéité des variables hypothécaires. En effet, on ne peut rejeter l’exogénéité faible de la variable qui capture le test du revenu de la procédure d’accès au prêt hypothécaire, lorsqu’on utilise une procédure à deux étapes qui se sert des résidus généralisés pour effectuer un test de spécification à la Hausman.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
7

Vieu, Philippe. „Régression non paramétrique: une approche générale du problème de sélection automatique de modèle“. Comptes Rendus de l'Académie des Sciences - Series I - Mathematics 328, Nr. 1 (Januar 1999): 63–66. http://dx.doi.org/10.1016/s0764-4442(99)80013-5.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
8

Aneiros, Germán, und Philippe Vieu. „Modèle non paramétrique parcimonieux pour la détection des points d'impact d'une variable fonctionnelle“. Comptes Rendus Mathematique 354, Nr. 5 (Mai 2016): 538–42. http://dx.doi.org/10.1016/j.crma.2016.01.019.

Der volle Inhalt der Quelle
APA, Harvard, Vancouver, ISO und andere Zitierweisen
9

Balafrej, Mohammed, Abdelatif Sahnoun und Mohamed Sadik. „Comparaison des modèles mathématiques non linéaires et détermination du modèle qui décrit au mieux la croissance de la race Sardi“. Revue d’élevage et de médecine vétérinaire des pays tropicaux 73, Nr. 4 (25.11.2020): 255–61. http://dx.doi.org/10.19182/remvt.31945.

Der volle Inhalt der Quelle
Annotation:
L’objectif de cette étude a été d’identifier le modèle mathématique non linéaire le plus approprié pour décrire la courbe de croissance de la race Sardi. Cette étude a été menée sur un troupeau d’ovins élevé dans la station de sélection de Krakra située à El Borouj au Maroc. Les effectifs comprenaient 763 mâles et 649 femelles correspondant respectivement à 3814 et 3240 observations pour les âges types : naissance, 10 jours, 30 jours, 90 jours et poids adulte. Pour modéliser la relation entre le poids et l’âge, cinq modèles ont été ajustés aux données de croissance, à savoir Brody, Logistic, Gompertz, Von Bertalanffy et Richards. Les modèles de croissance ont été ajustés aux données par la méthode du maximum de vraisemblance. Le critère d’information d’Akaike (AIC), le critère d’information bayésien (BIC) et la déviance ont été utilisés pour comparer la pertinence statistique des différents modèles de croissance. Parmi ces modèles, celui de von Bertalanffy a eu les plus petites valeurs d’AIC, du BIC et de la déviance, indiquant que ce modèle permettait la représentation des données la meilleure pour les deux sexes de cette race. Les paramètres de cette fonction peuvent être utilisés pour définir de nouveaux critères de sélection et améliorer les prévisionsde production par une meilleure gestion de l’alimentation.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
10

Fortin, V., T. B. M. J. Ouarda, P. F. Rasmussen und B. Bobée. „Revue bibliographique des méthodes de prévision des débits“. Revue des sciences de l'eau 10, Nr. 4 (12.04.2005): 461–87. http://dx.doi.org/10.7202/705289ar.

Der volle Inhalt der Quelle
Annotation:
Dans le domaine de la prévision des débits, une grande variété de méthodes sont disponibles: des modèles stochastiques et conceptuels mais aussi des approches plus novatrices telles que les réseaux de neurones artificiels, les modèles à base de règles floues, la méthode des k plus proches voisins, la régression floue et les splines de régression. Après avoir effectué une revue détaillée de ces méthodes et de leurs applications récentes, nous proposons une classification qui permet de mettre en lumière les différences mais aussi les ressemblances entre ces approches. Elles sont ensuite comparées pour les problèmes différents de la prévision à court, moyen et long terme. Les recommandations que nous effectuons varient aussi avec le niveau d'information a priori. Par exemple, lorsque l'on dispose de séries chronologiques stationnaires de longue durée, nous recommandons l'emploi de la méthode non paramétrique des k plus proches voisins pour les prévisions à court et moyen terme. Au contraire, pour la prévision à plus long terme à partir d'un nombre restreint d'observations, nous suggérons l'emploi d'un modèle conceptuel couplé à un modèle météorologique basé sur l'historique. Bien que l'emphase soit mise sur le problème de la prévision des débits, une grande partie de cette revue, principalement celle traitant des modèles empiriques, est aussi pertinente pour la prévision d'autres variables.
APA, Harvard, Vancouver, ISO und andere Zitierweisen

Dissertationen zum Thema "Modèle bayésien non paramétrique"

1

Rivoirard, Vincent. „Estimation bayésienne non paramétrique“. Phd thesis, Université Paris-Diderot - Paris VII, 2002. http://tel.archives-ouvertes.fr/tel-00002149.

Der volle Inhalt der Quelle
Annotation:
Dans le cadre d'une analyse par ondelettes, nous nous intéressons à l'étude statistique d'une classe particulière d'espaces de Lorentz : les espaces de Besov faibles qui apparaissent naturellement dans le contexte de la théorie maxiset. Avec des hypothèses de type "bruit blanc gaussien", nous montrons, grâce à des techniques bayésiennes, que les vitesses minimax des espaces de Besov forts ou faibles sont les mêmes. Les distributions les plus défavorables que nous exhibons pour chaque espace de Besov faible sont construites à partir des lois de Pareto et diffèrent en cela de celles des espaces de Besov forts. Grâce aux simulations de ces distributions, nous construisons des représentations visuelles des "ennemis typiques". Enfin, nous exploitons ces distributions pour bâtir une procédure d'estimation minimax, de type "seuillage" appelée ParetoThresh, que nous étudions d'un point de vue pratique. Dans un deuxième temps, nous nous plaçons sous le modèle hétéroscédastique de bruit blanc gaussien et sous l'approche maxiset, nous établissons la sous-optimalité des estimateurs linéaires par rapport aux procédures adaptatives de type "seuillage". Puis, nous nous interrogeons sur la meilleure façon de modéliser le caractère "sparse" d'une suite à travers une approche bayésienne. À cet effet, nous étudions les maxisets des estimateurs bayésiens classiques - médiane, moyenne - associés à une modélisation construite sur des densités à queues lourdes. Les espaces maximaux pour ces estimateurs sont des espaces de Lorentz, et coïncident avec ceux associés aux estimateurs de type "seuillage". Nous prolongeons de manière naturelle ce résultat en obtenant une condition nécessaire et suffisante sur les paramètres du modèle pour que la loi a priori se concentre presque sûrement sur un espace de Lorentz précis.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
2

Sodjo, Jessica. „Modèle bayésien non paramétrique pour la segmentation jointe d'un ensemble d'images avec des classes partagées“. Thesis, Bordeaux, 2018. http://www.theses.fr/2018BORD0152/document.

Der volle Inhalt der Quelle
Annotation:
Ce travail porte sur la segmentation jointe d’un ensemble d’images dans un cadre bayésien.Le modèle proposé combine le processus de Dirichlet hiérarchique (HDP) et le champ de Potts.Ainsi, pour un groupe d’images, chacune est divisée en régions homogènes et les régions similaires entre images sont regroupées en classes. D’une part, grâce au HDP, il n’est pas nécessaire de définir a priori le nombre de régions par image et le nombre de classes, communes ou non.D’autre part, le champ de Potts assure une homogénéité spatiale. Les lois a priori et a posteriori en découlant sont complexes rendant impossible le calcul analytique d’estimateurs. Un algorithme de Gibbs est alors proposé pour générer des échantillons de la loi a posteriori. De plus,un algorithme de Swendsen-Wang généralisé est développé pour une meilleure exploration dela loi a posteriori. Enfin, un algorithme de Monte Carlo séquentiel a été défini pour l’estimation des hyperparamètres du modèle.Ces méthodes ont été évaluées sur des images-test et sur des images naturelles. Le choix de la meilleure partition se fait par minimisation d’un critère indépendant de la numérotation. Les performances de l’algorithme sont évaluées via des métriques connues en statistiques mais peu utilisées en segmentation d’image
This work concerns the joint segmentation of a set images in a Bayesian framework. The proposed model combines the hierarchical Dirichlet process (HDP) and the Potts random field. Hence, for a set of images, each is divided into homogeneous regions and similar regions between images are grouped into classes. On the one hand, thanks to the HDP, it is not necessary to define a priori the number of regions per image and the number of classes, common or not.On the other hand, the Potts field ensures a spatial consistency. The arising a priori and a posteriori distributions are complex and makes it impossible to compute analytically estimators. A Gibbs algorithm is then proposed to generate samples of the distribution a posteriori. Moreover,a generalized Swendsen-Wang algorithm is developed for a better exploration of the a posteriori distribution. Finally, a sequential Monte Carlo sampler is defined for the estimation of the hyperparameters of the model.These methods have been evaluated on toy examples and natural images. The choice of the best partition is done by minimization of a numbering free criterion. The performance are assessed by metrics well-known in statistics but unused in image segmentation
APA, Harvard, Vancouver, ISO und andere Zitierweisen
3

Elvira, Clément. „Modèles bayésiens pour l’identification de représentations antiparcimonieuses et l’analyse en composantes principales bayésienne non paramétrique“. Thesis, Ecole centrale de Lille, 2017. http://www.theses.fr/2017ECLI0016/document.

Der volle Inhalt der Quelle
Annotation:
Cette thèse étudie deux modèles paramétriques et non paramétriques pour le changement de représentation. L'objectif des deux modèles diffère. Le premier cherche une représentation en plus grande dimension pour gagner en robustesse. L'objectif est de répartir uniformément l’information d’un signal sur toutes les composantes de sa représentation en plus grande dimension. La recherche d'un tel code s'exprime comme un problème inverse impliquant une régularisation de type norme infinie. Nous proposons une formulation bayésienne du problème impliquant une nouvelle loi de probabilité baptisée démocratique, qui pénalise les fortes amplitudes. Deux algorithmes MCMC proximaux sont présentés pour approcher des estimateurs bayésiens. La méthode non supervisée présentée est appelée BAC-1. Des expériences numériques illustrent les performances de l’approche pour la réduction de facteur de crête. Le second modèle identifie un sous-espace pertinent de dimension réduite à des fins de modélisation. Mais les méthodes probabilistes proposées nécessitent généralement de fixer à l'avance la dimension du sous-espace. Ce travail introduit BNP-PCA, une version bayésienne non paramétrique de l'analyse en composantes principales. La méthode couple une loi uniforme sur les bases orthonormales à un a priori non paramétrique de type buffet indien pour favoriser une utilisation parcimonieuse des composantes principales et aucun réglage n'est nécessaire. L'inférence est réalisée à l'aide des méthodes MCMC. L'estimation de la dimension du sous-espace et le comportement numérique de BNP-PCA sont étudiés. Nous montrons la flexibilité de BNP-PCA sur deux applications
This thesis proposes Bayesian parametric and nonparametric models for signal representation. The first model infers a higher dimensional representation of a signal for sake of robustness by enforcing the information to be spread uniformly. These so called anti-sparse representations are obtained by solving a linear inverse problem with an infinite-norm penalty. We propose in this thesis a Bayesian formulation of anti-sparse coding involving a new probability distribution, referred to as the democratic prior. A Gibbs and two proximal samplers are proposed to approximate Bayesian estimators. The algorithm is called BAC-1. Simulations on synthetic data illustrate the performances of the two proposed samplers and the results are compared with state-of-the art methods. The second model identifies a lower dimensional representation of a signal for modelisation and model selection. Principal component analysis is very popular to perform dimension reduction. The selection of the number of significant components is essential but often based on some practical heuristics depending on the application. Few works have proposed a probabilistic approach to infer the number of significant components. We propose a Bayesian nonparametric principal component analysis called BNP-PCA. The proposed model involves an Indian buffet process to promote a parsimonious use of principal components, which is assigned a prior distribution defined on the manifold of orthonormal basis. Inference is done using MCMC methods. The estimators of the latent dimension are theoretically and empirically studied. The relevance of the approach is assessed on two applications
APA, Harvard, Vancouver, ISO und andere Zitierweisen
4

Autin, Florent. „Point de vue maxiset en estimation non paramétrique“. Phd thesis, Université Paris-Diderot - Paris VII, 2004. http://tel.archives-ouvertes.fr/tel-00008542.

Der volle Inhalt der Quelle
Annotation:
Dans le cadre d'une analyse par ondelettes, nous étudions les propriétés statistiques de diverses classes de procédures. Plus précisément, nous cherchons à déterminer les espaces maximaux (maxisets) sur lesquels ces procédures atteignent une vitesse de convergence donnée. L'approche maxiset nous permet alors de donner une explication théorique à certains phénomènes observés en pratique et non expliqués par l'approche minimax. Nous montrons en effet que les estimateurs de seuillage aléatoire sont plus performants que ceux de seuillage déterministe. Ensuite, nous prouvons que les procédures de seuillage par groupes, comme certaines procédures d'arbre (proches de la procédure de Lepski) ou de seuillage par blocs, ont de meilleures performances au sens maxiset que les procédures de seuillage individuel. Par ailleurs, si les maxisets des estimateurs Bayésiens usuels construits sur des densités à queues lourdes sont de même nature que ceux des estimateurs de seuillage dur, nous montrons qu'il en est de même pour ceux des estimateurs Bayésiens construits à partir de densités Gaussiennes à grande variance et dont les performances numériques sont très bonnes.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
5

Naulet, Zacharie. „Développement d'un modèle particulaire pour la régression indirecte non paramétrique“. Thesis, Paris Sciences et Lettres (ComUE), 2016. http://www.theses.fr/2016PSLED057/document.

Der volle Inhalt der Quelle
Annotation:
Cette thèse porte sur les statistiques bayésiennes non paramétriques. La thèse est divisée en une introduction générale et trois parties traitant des aspects relativement différents des approches par mélanges (échantillonage, asymptotique, problème inverse). Dans les modèles de mélanges, le paramètre à inférer depuis les données est une fonction. On définit une distribution a priori sur un espace fonctionnel abstrait au travers d'une intégrale stochastique d'un noyau par rapport à une mesure aléatoire. Habituellement, les modèles de mélanges sont surtout utilisés dans les problèmes d'estimation de densités de probabilité. Une des contributions de ce manuscrit est d'élargir leur usage aux problèmes de régressions.Dans ce contexte, on est essentiellement concernés par les problèmes suivants:- Echantillonage de la distribution a posteriori- Propriétés asymptotiques de la distribution a posteriori- Problèmes inverses, et particulièrement l'estimation de la distribution de Wigner à partir de mesures de Tomographie Quantique Homodyne
This dissertation deals with Bayesian nonparametric statistics, in particular nonparametric mixture models. The manuscript is divided into a general introduction and three parts on rather different aspects of mixtures approaches (sampling, asymptotic, inverse problem). In mixture models, the parameter to infer from the data is a function. We set a prior distribution on an abstract space of functions through a stochastic integral of a kernel with respect to a random measure. Usually, mixture models were used primilary in probability density function estimation problems. One of the contributions of the present manuscript is to use them in regression problems.In this context, we are essentially concerned with the following problems :- Sampling of the posterior distribution- Asymptotic properties of the posterior distribution- Inverse problems, in particular the estimation of the Wigner distribution from Quantum Homodyne Tomography measurements
APA, Harvard, Vancouver, ISO und andere Zitierweisen
6

Gayraud, Ghislaine. „Vitesses et procédures statistiques minimax dans des problèmes d'estimation et des tests d'hypothèses“. Habilitation à diriger des recherches, Université de Rouen, 2007. http://tel.archives-ouvertes.fr/tel-00207687.

Der volle Inhalt der Quelle
Annotation:
Mes travaux s'articulent autour de trois thématiques.
La première thèmatique porte sur la résolution via l'approche minimax de divers problèmes d'estimation et de tests d'hypothèses dans un cadre non-paramétrique.
En statistique Bayésienne non-paramétrique, je me suis intéressée à un problème d'estimation d'ensembles à niveau. Les résultats obtenus résultent de l'étude des propriétés asymptotiques d'estimation Bayésienne d'ensembles à niveau. Ce sont des résultats généraux au sens où la consistance et la vitesse de convergence de l'estimateur Bayésien sont établies pour une large classe de lois a priori.
La troisième thématique concerne un problème d'estimation paramétrique dans un modèle de déconvolution aveugle bruitée : il s'agit de restituer la loi du signal entrant. La consistance ainsi que la distribution asymptotique d'une nouvelle procédure d'estimation sont établies.
APA, Harvard, Vancouver, ISO und andere Zitierweisen
7

Okabe, Shu. „Modèles faiblement supervisés pour la documentation automatique des langues“. Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG091.

Der volle Inhalt der Quelle
Annotation:
Face à la menace d'extinction de la moitié des langues parlées aujourd'hui d'ici la fin du siècle, la documentation des langues est un domaine de la linguistique notamment consacré à la collecte, annotation et archivage de données. Dans ce contexte, la documentation automatique des langues vise à outiller les linguistes pour faciliter différentes étapes de la documentation, à travers des approches de traitement automatique du langage.Dans le cadre du projet de documentation automatique CLD2025, cette thèse s'intéresse principalement à deux tâches : la segmentation en mots, identifiant les frontières des mots dans une transcription non segmentée d'une phrase enregistrée, ainsi que la génération de gloses interlinéaires, prédisant des annotations linguistiques pour chaque unité de la phrase. Pour la première, nous améliorons les performances des modèles bayésiens non paramétriques utilisés jusque là à travers une supervision faible, en nous appuyant sur des ressources disponibles de manière réaliste lors de la documentation, comme des phrases déjà segmentées ou des lexiques. Comme nous observons toujours une tendance de sur-segmentation dans nos modèles, nous introduisons un second niveau de segmentation : les morphèmes. Nos expériences avec divers types de modèles de segmentation à deux niveaux indiquent une qualité de segmentation sensiblement meilleure ; nous constatons, par ailleurs, les limites des approches uniquement statistiques pour différencier les mots des morphèmes.La seconde tâche concerne la génération de gloses, soit grammaticales, soit lexicales. Comme ces dernières ne peuvent pas être prédites en se basant seulement sur les données d'entraînement, notre modèle statistique d'étiquetage de séquences fait moduler, pour chaque phrase, les étiquettes possibles et propose une approche compétitive avec les modèles neuronaux les plus récents
In the wake of the threat of extinction of half of the languages spoken today by the end of the century, language documentation is a field of linguistics notably dedicated to the recording, annotation, and archiving of data. In this context, computational language documentation aims to devise tools for linguists to ease several documentation steps through natural language processing approaches.As part of the CLD2025 computational language documentation project, this thesis focuses mainly on two tasks: word segmentation to identify word boundaries in an unsegmented transcription of a recorded sentence and automatic interlinear glossing to predict linguistic annotations for each sentence unit.For the first task, we improve the performance of the Bayesian non-parametric models used until now through weak supervision. For this purpose, we leverage realistically available resources during documentation, such as already-segmented sentences or dictionaries. Since we still observe an over-segmenting tendency in our models, we introduce a second segmentation level: the morphemes. Our experiments with various types of two-level segmentation models indicate a slight improvement in the segmentation quality. However, we also face limitations in differentiating words from morphemes, using statistical cues only. The second task concerns the generation of either grammatical or lexical glosses. As the latter cannot be predicted using training data solely, our statistical sequence-labelling model adapts the set of possible labels for each sentence and provides a competitive alternative to the most recent neural models
APA, Harvard, Vancouver, ISO und andere Zitierweisen
8

Vernet, Elodie Edith. „Modèles de mélange et de Markov caché non-paramétriques : propriétés asymptotiques de la loi a posteriori et efficacité“. Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLS418/document.

Der volle Inhalt der Quelle
Annotation:
Les modèles latents sont très utilisés en pratique, comme en génomique, économétrie, reconnaissance de parole... Comme la modélisation paramétrique des densités d’émission, c’est-à-dire les lois d’une observation sachant l’état latent, peut conduire à de mauvais résultats en pratique, un récent intérêt pour les modèles latents non paramétriques est apparu dans les applications. Or ces modèles ont peu été étudiés en théorie. Dans cette thèse je me suis intéressée aux propriétés asymptotiques des estimateurs (dans le cas fréquentiste) et de la loi a posteriori (dans le cadre Bayésien) dans deux modèles latents particuliers : les modèles de Markov caché et les modèles de mélange. J’ai tout d’abord étudié la concentration de la loi a posteriori dans les modèles non paramétriques de Markov caché. Plus précisément, j’ai étudié la consistance puis la vitesse de concentration de la loi a posteriori. Enfin je me suis intéressée à l’estimation efficace du paramètre de mélange dans les modèles semi paramétriques de mélange
Latent models have been widely used in diverse fields such as speech recognition, genomics, econometrics. Because parametric modeling of emission distributions, that is the distributions of an observation given the latent state, may lead to poor results in practice, in particular for clustering purposes, recent interest in using non parametric latent models appeared in applications. Yet little thoughts have been given to theory in this framework. During my PhD I have been interested in the asymptotic behaviour of estimators (in the frequentist case) and the posterior distribution (in the Bayesian case) in two particuliar non parametric latent models: hidden Markov models and mixture models. I have first studied the concentration of the posterior distribution in non parametric hidden Markov models. More precisely, I have considered posterior consistency and posterior concentration rates. Finally, I have been interested in efficient estimation of the mixture parameter in semi parametric mixture models
APA, Harvard, Vancouver, ISO und andere Zitierweisen
9

Mismer, Romain. „Convergence et spike and Slab Bayesian posterior distributions in some high dimensional models“. Thesis, Sorbonne Paris Cité, 2019. http://www.theses.fr/2019USPCC064.

Der volle Inhalt der Quelle
Annotation:
On s'intéresse d'abord au modèle de suite gaussienne parcimonieuse. Une approche bayésienne empirique sur l'a priori Spike and Slab permet d'obtenir la convergence à vitesse minimax du moment d'ordre 2 a posteriori pour des Slabs Cauchy et on prouve un résultat de sous-optimalité pour un Slab Laplace. Un meilleur choix de Slab permet d'obtenir la constante exacte. Dans le modèle d'estimation de densité, un a priori arbre de Polya tel que les variables de l'arbre ont une distribution de type Spike and Slab donne la convergence à vitesse minimax et adaptative pour la norme sup de la loi a posteriori et un théorème Bernstein-von Mises non paramétrique
The first main focus is the sparse Gaussian sequence model. An Empirical Bayes approach is used on the Spike and Slab prior to derive minimax convergence of the posterior second moment for Cauchy Slabs and a suboptimality result for the Laplace Slab is proved. Next, with a special choice of Slab convergence with the sharp minimax constant is derived. The second main focus is the density estimation model using a special Polya tree prior where the variables in the tree construction follow a Spike and Slab type distribution. Adaptive minimax convergence in the supremum norm of the posterior distribution as well as a nonparametric Bernstein-von Mises theorem are obtained
APA, Harvard, Vancouver, ISO und andere Zitierweisen
10

Li, Shuxian. „Modélisation spatio-temporelle pour l'esca de la vigne à l'échelle de la parcelle“. Thesis, Bordeaux, 2015. http://www.theses.fr/2015BORD0313/document.

Der volle Inhalt der Quelle
Annotation:
L'esca de la vigne fait partie des maladies de dépérissement incurables dont l'étiologie n'est pas complément élucidée. Elle représente un des problèmes majeurs en viticulture. L'objectif général de cette thèse est d'améliorer la compréhension des processus épidémiques et des facteurs de risque. Pour ce faire, nous avons mené une étude quantitative du développement spatio-temporel de l'esca à l'échelle de la parcelle. Dans un premier temps, pour détecter d'éventuelles corrélations spatiales entre les cas de maladie, des tests statistiques non paramétriques sont appliqués aux données spatio-temporelles d'expression foliaires de l'esca pour 15 parcelles du bordelais. Une diversité de profils spatiaux, allant d'une distribution aléatoire à fortement structurée est trouvée. Dans le cas de structures très agrégées, les tests n'ont pas montré d'augmentation significative de la taille des foyers, ni de propagation secondaire locale à partir de ceps symptomatiques, suggérant un effet de l'environnement dans l'explication de cette agrégation. Dans le but de modéliser l'occurrence des symptômes foliaires, nous avons développé des modèles logistiques hiérarchiques intégrant à la fois des covariables exogènes liées à l'environnement et des covariables de voisinage de ceps déjà malades mais aussi un processus latent pour l'auto-corrélation spatio-temporelle. Les inférences bayésiennes sont réalisées en utilisant la méthode INLA (Inverse Nested Laplace Approximation). Les résultats permettent de conforter l'hypothèse du rôle significatif des facteurs environnementaux dans l'augmentation du risque d'occurrence des symptômes. L'effet de propagation de l'esca à petite échelle à partir de ceps déjà atteints situés sur le rang ou hors rang n'est pas montré. Un modèle autologistique de régression, deux fois centré, qui prend en compte de façon plus explicite la structure spatio-temporelle de voisinage, est également développé. Enfin, une méthode géostatistique d'interpolation de données de nature anisotropique atypique est proposée. Elle permet d'interpoler la variable auxiliaire de résistivité électrique du sol pour estimer à l'échelle de chaque plante de la parcelle, la réserve en eau du sol disponible pour la vigne. Les méthodes géostatistique et spatio-temporelles développées dans cette thèse ouvrent des perspectives pour identifier les facteurs de risques et prédire le développement de l'esca de la vigne dans des contextes agronomiques variés
Esca grapevine disease is one of the incurable dieback disease with the etiology not completely elucidated. It represents one of the major threats for viticulture around the world. To better understand the underlying process of esca spread and the risk factors of this disease, we carried out quantitative analyses of the spatio-temporal development of esca at vineyard scale. In order to detect the spatial correlation among the diseased vines, the non-parametric statistical tests were applied to the spatio-temporal data of esca foliar symptom expression for 15 vineyards in Bordeaux region. Among vineyards, a large range of spatial patterns, from random to strongly structured, were found. In the vineyards with strongly aggregated patterns, no significant increase in the size of cluster and local spread from symptomatic vines was shown, suggesting an effect of the environment in the explanation of this aggregation. To model the foliar symptom occurrence, we developed hierarchical logistic regression models by integrating exogenous covariates, covariates of neighboring symptomatic vines already diseased, and also a latent process with spatio-temporal auto-correlation. The Bayesian inferences of these models were performed by INLA (Inverse Nested Laplace Approximation) approach. The results confirmed the effect of environmental factors on the occurrence risk of esca symptom. The secondary locally spread of esca from symptomatic vines located on the same row or out of row was not shown. A two-step centered auto-logistic regression model, which explicitly integrated the spatio-temporal neighboring structure, was also developed. At last, a geostatistical method was proposed to interpolate data with a particular anisotropic structure. It allowed interpolating the ancillary variable, electrical resistivity of soil, which were used to estimate the available soil water content at vine-scale. These geostatistical methods and spatio-temporal statistical methods developed in this thesis offered outlook to identify risk factors, and thereafter to predict the development of esca grapevine disease in different agronomical contexts
APA, Harvard, Vancouver, ISO und andere Zitierweisen
Wir bieten Rabatte auf alle Premium-Pläne für Autoren, deren Werke in thematische Literatursammlungen aufgenommen wurden. Kontaktieren Sie uns, um einen einzigartigen Promo-Code zu erhalten!

Zur Bibliographie