Дисертації: "Classification probabiliste"

1

Ambroise, Christophe. "Approche probabiliste en classification automatique et contraintes de voisinage." Compiègne, 1996. http://www.theses.fr/1996COMPD917.

Повний текст джерела

Анотація:

Ce travail propose de nouveaux algorithmes de classification pour résoudre des problèmes d'analyse de données où des contraintes naturelles apparaissent : respect d'une topologie (cartes de Kohonen), données spatiales. Les mélanges finis de lois gaussiennes et l'estimation de paramètres par l'algorithme EM constituent le cadre de ce mémoire. Le modèle des cartes topologiques de Kohonen introduisant la notion de contrainte, nous nous sommes intéressés à montrer les liens qui existent entre cette approche et les modèles de mélanges. Cette recherche a abouti au développement de variantes de l'algorithme EM ayant des comportements identiques à l'algorithme de Kohonen et possédant de bonnes propriétés de convergence. Dans le cas des données spatiales, l'a priori suivant est considéré : deux individus géographiquement proches ont plus de chance d'appartenir à une même classe que deux individus éloignés. Des algorithmes originaux, basés sur l'algorithme EM, sont proposés pour prendre en compte l'aspect spatial des données. Ces algorithmes peuvent être utilisés pour trouver une partition d'un ensemble d'individus localisés géographiquement, ce qui englobe la problématique de la segmentation d'image. Un parallèle entre les méthodes développées dans ce mémoire et les techniques markoviennes de segmentation bayésienne non supervisée d'image a été établi. Enfin, les méthodes présentées sont illustrées et comparées à l'aide d'applications concrètes
This thesis proposes new clustering algorithms well suited for data analysis problems where natural constraints appear: preservation of a topology, spatial data. Gaussian mixture models and the estimation of parameters by the EM algorithm constitute the background of the work. The Kohonen Map algorithm introduces the idea of constraint in clustering. We show the relationship between this neural approach and Gaussian mixture models. This leads us to propose a variant of the EM algorithm which has similar behaviour as the Kohonen algorithm and whose convergence is proven. When dealing with spatial data, we consider the following constraint: two objects which are neighbours are more likely to belong to the same class than two objects which are spatially far away. Original algorithms based on the EM algorithm are proposed for taking into account this spatial constraint. These algorithms may be used for seeking a partition of objects which have a geographical location. This encompasses the problem of unsupervised image segmentation. A theoretical link between our approach and Markov random field models is established. The proposed methods are compared and illustrated by means of applications based on real data