Dissertations / Theses on the topic 'Réseaux de neurones bayésiens'

To see the other types of publications on this topic, follow the link: Réseaux de neurones bayésiens.

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Réseaux de neurones bayésiens.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Abid, Ilyes. "Modélisation de la prévision de défaillance des entreprises par des approches statiques et dynamiques : réseaux de neurones, réseaux bayésiens, modèles de durée et dichotomiques." Thesis, Paris 10, 2011. http://www.theses.fr/2011PA100151.

Full text
Abstract:
L'objectif de cette thèse est d’étudier différentes méthodes de prévision de la défaillance d'entreprises aussi bien en statique qu'en dynamique. Plus précisément, dans l'approche statique, nous avons recouru aux méthodes de sélection des variables discriminantes en utilisant les réseaux de neurones. Nous avons ainsi proposé deux nouvelles procédures relevant de ces méthodes.La première, fondée sur le critère HVS, intitulée HVS-AUC, nous a permis i) de construire un modèle plus parcimonieux par rapport à l’ADL ; ii) de dégager un ensemble de variables stables à la fois non conjoncturelles et avec un fort pouvoir explicatif. A l'inverse, la seconde technique est basée sur la procédure forward ou plus exactement sur forward-AUC. Cette méthode fait apparaître des résultats comparables à l'ADL mais avec moins de variables explicatives. Elle permet notamment de détecter les ratios jugés les plus pertinents selon ADL et HVS-AUC.Nous avons de plus utilisé des méthodes d'apprentissage de structure de réseaux bayésiens pour essayer d'améliorer la performance de classification des entreprises. Nous avons mobilisé une technique intitulée "Max-Min Hill-Climbing" ou MMHC. Nous avons analysé les performances de classification d'un algorithme combiné entre MMHC et le modèle de base d'un réseau bayésien naïf (BN). Cette nouvelle méthode a été nommée BN-MMHC (Bayes naïf augmentée par MMHC). Les résultats obtenus confirment néanmoins l'opinion dominante : pour ce qui est du pouvoir discriminant, aucune structure ne semble à même de concurrencer BN de manière significative.Dans la deuxième approche dynamique, nous avons mis plus l'accent sur les facteurs non mesurables a priori et sur des facteurs explicatifs impossibles à appréhender dans un cadre statique. Nous avons mobilisé dans un premier volet les variables macroéconomiques pour mieux estimer le risque de défaut. Dans un second volet, nous avons utilisé une modélisation alternative permettant d'appréhender correctement les chocs que peuvent subir les entreprises au cours du temps. De ce fait, nous avons évalué ainsi l'effet de la propagation de ces chocs
The objective of this thesis is to study bankruptcy prediction models from both static and dynamic viewpoints. More precisely, in the static approach, we used the methods of selecting discriminating variables using the neural networks. We thus proposed two new procedures relating to these methods. The first one is based on the criterion HVS called HVS-AUC and allowed to 1) build a more parsimonious model compared to the LDA, 2) identify a set of variables both static and non-cyclical with a strong explanatory power. Conversely, the second technique is based on the forward procedure, more precisely on forward-AUC. This method shows results comparable to the LDA but with fewer variables. It allows the detection of ratios considered as the most relevant according to LDA and HVS-AUC. We have also used methods of structure learning of Bayesian networks to improve the performance of classification of firms. We have mobilized a technique called "Max-Min Hill-Climbing" or MMHC. Specifically, we plan to analyze the performance of classification of an algorithm that mixes both MMHC and the canonical model of a naive Bayes network (NB). This new method could be called NB-MMHC (naive Bayes augmented by MMH C). The results confirm the prevailing view: as for the discriminatory power, no structure seems to be able to significantly compete with NB. In the second dynamic approach, we put more emphasis on factors not measurable a priori and also on explanatory factors impossible to capture within a static framework. In the first phase, we used the macroeconomic variables to better estimate the risk of default. In the second part, we used an alternative model to better estimate the shocks that firms could undergo over time. We therefore evaluate the propagation effects of theses shocks
APA, Harvard, Vancouver, ISO, and other styles
2

Bourgeois, Yoann. "Les réseaux de neurones artificiels pour mesurer les risques économiques et financiers." Paris, EHESS, 2003. http://www.theses.fr/2003EHES0118.

Full text
Abstract:
L'objectif de cette thèse est de fournir des méthodologies complètes pour résoudre des problèmes de prédiction et de classification en économie et en finance en utilisant les réseaux de neurones artificiels. Notre travail contribue à établir une méthodologie statistique des réseaux de neurones à plusieurs niveaux, comme le montre l'organisation de la thèse. Nous avons procédé en quatre chapitres. Le premier chapitre décrit la méthodologie de la modélisation des variables quantitatives ou qualitatives avec des réseaux neuronaux supervisés et non-supervisés. Dans le second chapitre, nous nous intéressons d'abord à l'interprétation bayésienne des réseaux supervisés puis nous construisons un test de spécification sans alternative spécifique pour les modèles de choix binaires. Dans le chapitre 3, nous montrons que les réseaux de neurones multivariés peuvent prendre en compte les changements structurels et permettent d'estimer des probabilités de crises de change. Dans le chapitre 4, nous développons un modèle complet de gestion de portefeuille avec un processus neuronal-GARCH en introduisant les notions de rendement conditionnel et de risque conditionnel. Nous appliquons enfin les réseaux de neurones de Kohonen bayésiens pour estimer la distribution du taux de change DM/USD
The objective of this thesis is to provide complete methodologies to solve prediction and classification problems in economy and finance by using Artificial Neural networks. The plan of work shows that the thesisplays a great part in establishing in several ways a statistic methodology for neural networks. We proceed in four chapters. The first chapter describes supervised and unsupervised neural network methodology to modelize quantitative or qualitative variables. In the second chapter, we are interested by the bayesian approach for supervised neural networks and the developpement of a set of misspecification statistic tests for binary choice models. In chapter three, we show that multivariate supervised neural networks enable to take into account structural changes and the neural networks methodology is able to estimate some probabilities of exchange crisis. In chapter four, we develope a complete based neural network-GARCH model to manage a stocks portfolio. We introduce some terms as conditional returns or conditional risk for a stock or a portfolio. Next, we apply bayesian Self-Organizing Map in order to estimate the univariate probability density function of the DM/USD exchange rate
APA, Harvard, Vancouver, ISO, and other styles
3

Mallet, Grégory. "Méthodes statistiques pour la prédiction de température dans les composants hyperfréquences." Phd thesis, INSA de Rouen, 2010. http://tel.archives-ouvertes.fr/tel-00586089.

Full text
Abstract:
Cette thèse s'intéresse à l'application des méthodes d'apprentissage statistique pour la prédiction de température d'un composant électronique présent dans un radar. On étudie un cas simplifié des systèmes réels, le système étudié se limitant à un seul composant monté sur un système de refroidissement réduit. Le premier chapitre est consacré à la modélisation thermique. Après avoir présenté les principaux modes de transmission de l'agitation thermique, les modèles analytiques et numériques qui en découlent sont étudiés. En utilisant cette connaissance,le deuxième chapitre propose de choisir dans les méthodes de mesures les plus adaptées aux spécifications et aux contraintes de l'application choisie. Une fois que les bases de données ont été établies, nous pouvons utiliser dans le troisième chapitre les techniques de l'apprentissage statistique pour construire un modèle dynamique. Après un bref rappel sur les tenants et les aboutissants de la modélisation statistique, quatre familles de méthodes seront présentées : les modèles linéaires, les réseaux de neurones, les réseaux bayésiens dynamiques et les machines à vecteur support (SVM). Enfin, le quatrième chapitre est l'occasion de présenter une méthode de modélisation originale.En effet, après avoir détaillé la mise en oeuvre des méthodes d'identification de représentation d'état, nous verrons comment prendre en compte des a priori théoriques au cours de l'apprentissage de ce type de modèle, à savoir une contrainte de stabilité.
APA, Harvard, Vancouver, ISO, and other styles
4

Liu, Haoran. "Statistical and intelligent methods for default diagnosis and loacalization in a continuous tubular reactor." Phd thesis, INSA de Rouen, 2009. http://tel.archives-ouvertes.fr/tel-00560886.

Full text
Abstract:
The aim is to study a continuous chemical process, and then analyze the hold process of the reactor and build the models which could be trained to realize the fault diagnosis and localization in the process. An experimental system has been built to be the research base. That includes experiment part and record system. To the diagnosis and localization methods, the work presented the methods with the data-based approach, mainly the Bayesian network and RBF network based on GAAPA (Genetic Algorithm with Auto-adapted of Partial Adjustment). The data collected from the experimental system are used to train and test the models.
APA, Harvard, Vancouver, ISO, and other styles
5

Tchoumatchenko, Irina. "Extraction des règles logiques dans des réseaux de neurones formels : application a la prédiction de la structure secondaire des protéines." Paris 6, 1994. http://www.theses.fr/1994PA066448.

Full text
Abstract:
Cette thèse traite le problème d'extraction des règles logiques des réseaux de neurones formels. Les algorithmes développés se basent sur des contraintes dynamiques appliquées au cours de l'apprentissage aux poids synaptiques du réseau de telle façon que le réseau soit forcé d'apprendre des règles logiques. En exprimant les contraintes sur les paramètres du réseau comme des à priori bayesiens nous avons proposé un cadre formel pour concevoir et réaliser un système d'apprentissage des règles logiques à partir des réseaux. Les méthodes préconisées ont été validées sur le problème de la prédiction de la structure secondaire des protéines. Le perceptron multi-chouches prédisant la structure a été converti, en fin d'apprentissage, en un système de votes majoritaires. Ce système de votes englobe de nombreuses informations biologiques
APA, Harvard, Vancouver, ISO, and other styles
6

Kozyrskiy, Bogdan. "Exploring the Intersection of Bayesian Deep Learning and Gaussian Processes." Electronic Thesis or Diss., Sorbonne université, 2023. https://accesdistant.sorbonne-universite.fr/login?url=https://theses-intra.sorbonne-universite.fr/2023SORUS064archi.pdf.

Full text
Abstract:
L'apprentissage profond a joué un rôle significatif dans l'établissement de l'apprentissage automatique comme un instrument indispensable dans plusieurs domaines. L'utilisation de l'apprentissage profond pose plusieurs défis. L'apprentissage profond nécessite beaucoup de puissance de calcul pour entraîner et appliquer des modèles. Un autre problème de l'apprentissage profond est son incapacité à estimer l'incertitude des prédictions, ce qui crée des obstacles dans les applications sensibles aux risques. Cette thèse présente quatre projets pour résoudre ces problèmes: Nous proposons une approche faisant appel à des unités de traitement optique pour réduire la consommation d'énergie et accélérer l'inférence des modèles profonds. Nous abordons le problème des estimations d'incertitude pour la classification avec l'inférence bayésienne. Nous introduisons des techniques pour les modèles profonds qui réduisent le coût de l'inférence bayésienne. Nous avons développé un nouveau cadre pour accélérer la régression des processus gaussiens. Nous proposons une technique pour imposer des priorités fonctionnelles significatives pour les modèles profonds à travers des processus gaussiens
Deep learning played a significant role in establishing machine learning as a must-have instrument in multiple areas. The use of deep learning poses several challenges. Deep learning requires a lot of computational power for training and applying models. Another problem with deep learning is its inability to estimate the uncertainty of the predictions, which creates obstacles in risk-sensitive applications. This thesis presents four projects to address these problems: We propose an approach making use of Optical Processing Units to reduce energy consumption and speed up the inference of deep models. We address the problem of uncertainty estimates for classification with Bayesian inference. We introduce techniques for deep models that decreases the cost of Bayesian inference. We developed a novel framework to accelerate Gaussian Process regression. We propose a technique to impose meaningful functional priors for deep models through Gaussian Processes
APA, Harvard, Vancouver, ISO, and other styles
7

Kacimi, Sahra. "Contribution à la restitution des précipitations tropicales par radiométrie micro-ondes : préparation à la mission Megha-Tropiques." Versailles-St Quentin en Yvelines, 2012. http://www.theses.fr/2012VERS0064.

Full text
Abstract:
Dans le contexte actuel de réchauffement climatique, l’étude du cycle de l’eau et de l’énergie dans l’atmosphère est devenue primordiale. Dans le contexte de la mission Megha-Tropiques dédiée l’analyse de l’atmosphère tropicale, l’estimation du taux précipitant à la surface est une problématique essentielle. L’utilisation des données radiométriques MO pour l’estimation du taux précipitant à la surface terrestre, nécessite la mise en œuvre de méthodologies complexes qui reposent sur le problème inverse. Les travaux présentés dans cette thèse s’intéressent à l’algorithme de restitution des précipitations instantanées BRAIN de la mission MT. Son principe de fonctionnement repose sur une approche probabiliste baysienne qui nécessite la construction préalable d’une base de données dite d’inversion et à partir de laquelle le taux précipitant le plus probable pour un vecteur de températures de brillance donnée est estimé. L’objectif de cette étude était d’aporter des améliorations à cet algorithme en intervenant sur deux aspects fondamentaux qui sont : la détection des régions a priori pluvieuses en amont de l’estimation et de l’influence de la base de données et des paramètres d’inversions sur les produits restitués. Afin d’améliorer ces deux aspects, une nouvelle approche de discrimination des zones de pluie utilisant des réseaux de neurones a été mise en place au cours de cette thèse et sera implémentée dans la prochaine version opérationnelle de BRAIN. Une méthode de réduction de la base d’investigation a également été mise en œuvre afin de contraindre sa représentativité et donc la qualité des estimations réalisées
Within the framework of the global warming, the analysis of water and energy budget is of major importance. Considering the Megha-Tropiques (MT) mission whose one of the scientific objectives is to improve the knowledge of water and energy cycle in the intertropical region, the estimation of instantaneous surface rainfall is of the great importance. My PhD work focuses on the optimization of a multi-region, the estimation of instantaneous surface rainfall is of great importance. My PhD work focuses on the optimization of a multi-plateform Bayesian retrieval algorithm called BRAIN (Bayesian Retrieval Algorithm Including Neural Networks) (Viltard et al. , 2006) used for MT. This algorithm uses passive microwave data from satellites such as TRMM, SSM/I and AQUA. It uses a Bayesian Monte Carlo approach to retrieve several atmospheric parameters such as the instantaneous rainfall rate. In order to get a more accurate rainfall restitution, two research axes were investigated : the detection of a priori rainy areas that takes place before the rainfall estimation itself, and the impact of the database and inversion parameters. First, the database on which the algorithm relies needs to be more representative especially as far as high rain rates are concerned. To improve the representativeness of the inversion database, we need first to eliminate repetitive profiles, that is to say extract prototypes from it. To be made, we use Self Organizing Maps SO%s developed by T. Kohonen (2001). Second, the improvement of the rainy-non-rainy pixels classification before the inversion was made using neural networks
APA, Harvard, Vancouver, ISO, and other styles
8

Tran, Gia-Lac. "Advances in Deep Gaussian Processes : calibration and sparsification." Electronic Thesis or Diss., Sorbonne université, 2020. https://accesdistant.sorbonne-universite.fr/login?url=https://theses-intra.sorbonne-universite.fr/2020SORUS410.pdf.

Full text
Abstract:
L'intégration des Convolutional Neural Networks (CNNs) et des GPs est une solution prometteuse pour améliorer le pouvoir de représentation des méthodes contemporaines. Dans notre première étude, nous utilisons des diagrammes de fiabilité pour montrer que les combinaisons actuelles de cnns et GPs sont mal calibrées, ce qui donne lieu à des prédictions trop confiantes. En utilisant des Random Feature et la technique d'inférence variationnelle, nous proposons une nouvelle solution correctement calibrée pour combinaisons des CNNs et des GPs. Nous proposons également une extension intuitive de cette solution, utilisant des Structured Random Features afin d'améliorer la précision du modèle et réduire la complexité des calculs. En termes de coût de calcul, la complexité du GPs exact est cubique en la taille de l'ensemble d'entrainement, ce qui le rend inutilisable lorsque celle-ci dépasse quelques milliers d'éléments. Afin de faciliter l'extension des GPs à des quantités massives de données, nous sélectionnons un petit ensemble de points actifs ou points d'induction par une distillation globale à partir de toutes les observations. Nous utilisons ensuite ces points actifs pour faire des prédictions. Plusieurs travaux similaires se basent sur l'étude Titsias et al en 2009 [5] and Hensman et al en 2015 [6]. Cependant, il est encore difficile de traiter le cas général, et il est toujours possible que le nombre de points actifs requis dépasse un budget de calcul donné. Dans notre deuxième étude, nous proposons Sparse-within-Sparse Gaussian Processes (SWSGP) qui permet l'approximation avec un grand nombre de points inducteurs sans cout de calcul prohibitif
Gaussian Processes (GPs) are an attractive specific way of doing non-parametric Bayesian modeling in a supervised learning problem. It is well-known that GPs are able to make inferences as well as predictive uncertainties with a firm mathematical background. However, GPs are often unfavorable by the practitioners due to their kernel's expressiveness and the computational requirements. Integration of (convolutional) neural networks and GPs are a promising solution to enhance the representational power. As our first contribution, we empirically show that these combinations are miscalibrated, which leads to over-confident predictions. We also propose a novel well-calibrated solution to merge neural structures and GPs by using random features and variational inference techniques. In addition, these frameworks can be intuitively extended to reduce the computational cost by using structural random features. In terms of computational cost, the exact Gaussian Processes require the cubic complexity to training size. Inducing point-based Gaussian Processes are a common choice to mitigate the bottleneck by selecting a small set of active points through a global distillation from available observations. However, the general case remains elusive and it is still possible that the required number of active points may exceed a certain computational budget. In our second study, we propose Sparse-within-Sparse Gaussian Processes which enable the approximation with a large number of inducing points without suffering a prohibitive computational cost
APA, Harvard, Vancouver, ISO, and other styles
9

Wolinski, Pierre. "Structural Learning of Neural Networks." Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASS026.

Full text
Abstract:
La structure d'un réseau de neurones détermine dans une large mesure son coût d'entraînement et d'utilisation, ainsi que sa capacité à apprendre. Ces deux aspects sont habituellement en compétition : plus un réseau de neurones est grand, mieux il remplira la tâche qui lui a été assignée, mais plus son entraînement nécessitera des ressources en mémoire et en temps de calcul. L'automatisation de la recherche des structures de réseaux efficaces - de taille raisonnable, mais performantes dans l'accomplissement de la tâche - est donc une question très étudiée dans ce domaine. Dans ce contexte, des réseaux de neurones aux structures variées doivent être entraînés, ce qui nécessite un nouveau jeu d'hyperparamètres d'entraînement à chaque nouvelle structure testée. L'objectif de la thèse est de traiter différents aspects de ce problème. La première contribution est une méthode d'entraînement de réseau qui fonctionne dans un vaste périmètre de structures de réseaux et de tâches à accomplir, sans nécessité de régler le taux d'apprentissage. La deuxième contribution est une technique d'entraînement et d'élagage de réseau, conçue pour être insensible à la largeur initiale de celui-ci. La dernière contribution est principalement un théorème qui permet de traduire une pénalité d'entraînement empirique en a priori bayésien, théoriquement bien fondé. Ce travail résulte d'une recherche des propriétés que doivent théoriquement vérifier les algorithmes d'entraînement et d'élagage pour être valables sur un vaste ensemble de réseaux de neurones et d'objectifs
The structure of a neural network determines to a large extent its cost of training and use, as well as its ability to learn. These two aspects are usually in competition: the larger a neural network is, the better it will perform the task assigned to it, but the more it will require memory and computing time resources for training. Automating the search of efficient network structures -of reasonable size and performing well- is then a very studied question in this area. Within this context, neural networks with various structures are trained, which requires a new set of training hyperparameters for each new structure tested. The aim of the thesis is to address different aspects of this problem. The first contribution is a training method that operates within a large perimeter of network structures and tasks, without needing to adjust the learning rate. The second contribution is a network training and pruning technique, designed to be insensitive to the initial width of the network. The last contribution is mainly a theorem that makes possible to translate an empirical training penalty into a Bayesian prior, theoretically well founded. This work results from a search for properties that theoretically must be verified by training and pruning algorithms to be valid over a wide range of neural networks and objectives
APA, Harvard, Vancouver, ISO, and other styles
10

Fond, Antoine. "Localisation par l'image en milieu urbain : application à la réalité augmentée." Thesis, Université de Lorraine, 2018. http://www.theses.fr/2018LORR0028/document.

Full text
Abstract:
Dans cette thèse on aborde le problème de la localisation en milieux urbains. Inférer un positionnement précis en ville est important dans nombre d’applications comme la réalité augmentée ou la robotique mobile. Or les systèmes basés sur des capteurs inertiels (IMU) sont sujets à des dérives importantes et les données GPS peuvent souffrir d’un effet de vallée qui limite leur précision. Une solution naturelle est de s’appuyer le calcul de pose de caméra en vision par ordinateur. On remarque que les bâtiments sont les repères visuels principaux de l’humain mais aussi des objets d’intérêt pour les applications de réalité augmentée. On cherche donc à partir d’une seule image à calculer la pose de la caméra par rapport à une base de données de bâtiments références connus. On décompose le problème en deux parties : trouver les références visibles dans l’image courante (reconnaissance de lieux) et calculer la pose de la caméra par rapport à eux. Les approches classiques de ces deux sous-problèmes sont mises en difficultés dans les environnements urbains à cause des forts effets perspectives, des répétitions fréquentes et de la similarité visuelle entre façades. Si des approches spécifiques à ces environnements ont été développés qui exploitent la grande régularité structurelle de tels milieux, elles souffrent encore d’un certain nombre de limitations autant pour la détection et la reconnaissance de façades que pour le calcul de pose par recalage de modèle. La méthode originale développée dans cette thèse s’inscrit dans ces approches spécifiques et vise à dépasser ces limitations en terme d’efficacité et de robustesse aux occultations, aux changements de points de vue et d’illumination. Pour cela, l’idée principale est de profiter des progrès récents de l’apprentissage profond par réseaux de neurones convolutionnels pour extraire de l’information de haut-niveau sur laquelle on peut baser des modèles géométriques. Notre approche est donc mixte Bottom-Up/Top-Down et se décompose en trois étapes clés. Nous proposons tout d’abord une méthode d’estimation de la rotation de la pose de caméra. Les 3 points de fuite principaux des images en milieux urbains, dits points de fuite de Manhattan sont détectés grâce à un réseau de neurones convolutionnels (CNN) qui fait à la fois une estimation de ces points de fuite mais aussi une segmentation de l’image relativement à eux. Une second étape de raffinement utilise ces informations et les segments de l’image dans une formulation bayésienne pour estimer efficacement et plus précisément ces points. L’estimation de la rotation de la caméra permet de rectifier les images et ainsi s’affranchir des effets de perspectives pour la recherche de la translation. Dans une seconde contribution, nous visons ainsi à détecter les façades dans ces images rectifiées et à les reconnaître parmi une base de bâtiments connus afin d’estimer une translation grossière. Dans un soucis d’efficacité, on a proposé une série d’indices basés sur des caractéristiques spécifiques aux façades (répétitions, symétrie, sémantique) qui permettent de sélectionner rapidement des candidats façades potentiels. Ensuite ceux-ci sont classifiés en façade ou non selon un nouveau descripteur CNN contextuel. Enfin la mise en correspondance des façades détectées avec les références est opérée par un recherche au plus proche voisin relativement à une métrique apprise sur ces descripteurs [...]
This thesis addresses the problem of localization in urban areas. Inferring accurate positioning in the city is important in many applications such as augmented reality or mobile robotics. However, systems based on inertial sensors (IMUs) are subject to significant drifts and GPS data can suffer from a valley effect that limits their accuracy. A natural solution is to rely on the camera pose estimation in computer vision. We notice that buildings are the main visual landmarks of human beings but also objects of interest for augmented reality applications. We therefore aim to compute the camera pose relatively to a database of known reference buildings from a single image. The problem is twofold : find the visible references in the current image (place recognition) and compute the camera pose relatively to them. Conventional approaches to these two sub-problems are challenged in urban environments due to strong perspective effects, frequent repetitions and visual similarity between facades. While specific approaches to these environments have been developed that exploit the high structural regularity of such environments, they still suffer from a number of limitations in terms of detection and recognition of facades as well as pose computation through model registration. The original method developed in this thesis is part of these specific approaches and aims to overcome these limitations in terms of effectiveness and robustness to clutter and changes of viewpoints and illumination. For do so, the main idea is to take advantage of recent advances in deep learning by convolutional neural networks to extract high-level information on which geometric models can be based. Our approach is thus mixed Bottom- Up/Top-Down and is divided into three key stages. We first propose a method to estimate the rotation of the camera pose. The 3 main vanishing points of the image of urban environnement, known as Manhattan vanishing points, are detected by a convolutional neural network (CNN) that estimates both these vanishing points and the image segmentation relative to them. A second refinement step uses this information and image segmentation in a Bayesian model to estimate these points effectively and more accurately. By estimating the camera’s rotation, the images can be rectified and thus free from perspective effects to find the translation. In a second contribution, we aim to detect the facades in these rectified images to recognize them among a database of known buildings and estimate a rough translation. For the sake of efficiency, a series of cues based on facade specific characteristics (repetitions, symmetry, semantics) have been proposed to enable the fast selection of facade proposals. Then they are classified as facade or non-facade according to a new contextual CNN descriptor. Finally, the matching of the detected facades to the references is done by a nearest neighbor search using a metric learned on these descriptors. Eventually we propose a method to refine the estimation of the translation relying on the semantic segmentation inferred by a CNN for its robustness to changes of illumination ans small deformations. If we can already estimate a rough translation from these detected facades, we choose to refine this result by relying on the se- mantic segmentation of the image inferred from a CNN for its robustness to changes of illuminations and small deformations. Since the facade is identified in the previous step, we adopt a model-based approach by registration. Since the problems of registration and segmentation are linked, a Bayesian model is proposed which enables both problems to be jointly solved. This joint processing improves the results of registration and segmentation while remaining efficient in terms of computation time. These three parts have been validated on consistent community data sets. The results show that our approach is fast and more robust to changes in shooting conditions than previous methods
APA, Harvard, Vancouver, ISO, and other styles
11

Rio, Maxime. "Modèles bayésiens pour la détection de synchronisations au sein de signaux électro-corticaux." Phd thesis, Université de Lorraine, 2013. http://tel.archives-ouvertes.fr/tel-00859307.

Full text
Abstract:
Cette thèse propose de nouvelles méthodes d'analyse d'enregistrements cérébraux intra-crâniens (potentiels de champs locaux), qui pallie les lacunes de la méthode temps-fréquence standard d'analyse des perturbations spectrales événementielles : le calcul d'une moyenne sur les enregistrements et l'emploi de l'activité dans la période pré-stimulus. La première méthode proposée repose sur la détection de sous-ensembles d'électrodes dont l'activité présente des synchronisations cooccurrentes en un même point du plan temps-fréquence, à l'aide de modèles bayésiens de mélange gaussiens. Les sous-ensembles d'électrodes pertinents sont validés par une mesure de stabilité calculée entre les résultats obtenus sur les différents enregistrements. Pour la seconde méthode proposée, le constat qu'un bruit blanc dans le domaine temporel se transforme en bruit ricien dans le domaine de l'amplitude d'une transformée temps-fréquence a permis de mettre au point une segmentation du signal de chaque enregistrement dans chaque bande de fréquence en deux niveaux possibles, haut ou bas, à l'aide de modèles bayésiens de mélange ricien à deux composantes. À partir de ces deux niveaux, une analyse statistique permet de détecter des régions temps-fréquence plus ou moins actives. Pour développer le modèle bayésien de mélange ricien, de nouveaux algorithmes d'inférence bayésienne variationnelle ont été créés pour les distributions de Rice et de mélange ricien. Les performances des nouvelles méthodes ont été évaluées sur des données artificielles et sur des données expérimentales enregistrées sur des singes. Il ressort que les nouvelles méthodes génèrent moins de faux-positifs et sont plus robustes à l'absence de données dans la période pré-stimulus.
APA, Harvard, Vancouver, ISO, and other styles
12

Jauffret, Adrien. "De l'auto-évaluation aux émotions : approche neuromimétique et bayésienne de l'apprentissage de comportements complexes impliquant des informations multimodales." Thesis, Paris 11, 2014. http://www.theses.fr/2014PA112120/document.

Full text
Abstract:
Cette thèse a pour objectif la conception d’une architecture de contrôle bio-inspirée permettant à un robot autonome de naviguer sur de grandes distances. Le modèle développé permet également d’améliorer la compréhension des mécanismes biologiques impliqués. De précédents travaux ont montré qu’un modèle de cellules de lieu, enregistrées chez le rat, permettait à un robot mobile d’apprendre des comportements de navigation robustes, tels qu’une ronde ou un retour au nid, à partir d’associations entre lieu et action. La reconnaissance d’un lieu ne reposait alors que sur des informations visuelles. L’ambiguïté de certaines situations (e.g. un long couloir) ne permettait pas de naviguer dans de grands environnements. L’ajout d’autres modalités constitue une solution efficace pour augmenter la robustesse dans des environnements complexes. Cette solution nous a permis d’identifier les briques minimales nécessaires à la fusion d’informations multimodales, d’abord par le biais d’un conditionnement simple entre 2 modalités sensorielles, puis par la formalisation d’un modèle, plus générique, de prédictions inter-modales. C’est un mécanisme bas niveau qui permet de générer une cohérence perceptive : l’ensemble des modalités sensorielles s’entraident pour ne renvoyer qu’une perception claire et cohérente aux mécanismes décisionnels de plus haut niveau. Les modalités les plus corrélées sont ainsi capables de combler les informations manquantes d’une modalité défaillante (cas pathologique). Ce modèle implique la mise en place d’un système de prédiction et donc une capacité à détecter de la nouveauté dans ses perceptions. Ainsi, le modèle est également capable de détecter une situation inattendue ou anormale et possède donc une capacité d’auto-évaluation : l’évaluation de ses propres perceptions. Nous nous sommes ensuite mis à la recherche des propriétés fondamentales à tout système d'auto-évaluation.La première propriété essentielle a été de constater qu’évaluer un comportement sensorimoteur revient à reconnaître une dynamique entre sensation et action, plutôt que la simple reconnaissance d’une forme sensorielle. La première brique encapsule donc un modèle interne minimaliste des interactions du robot avec son environnement, qui est la base sur laquelle le système fera des prédictions.La seconde propriété essentielle est la capacité à extraire l’information pertinente par le biais de calculs statistiques. Il est nécessaire que le robot apprenne à capturer les invariants statistiques en supprimant l’information incohérente. Nous avons donc montré qu’il était possible d’estimer une densité de probabilité par le biais d’un simple conditionnement. Cet apprentissage permet de réaliser l’équivalent d’une inférence bayésienne. Le système estime la probabilité de reconnaître un comportement à partir de la reconnaissance d’informations statistiques apprises. C’est donc par la mise en cascade de simples conditionnements que le système peut apprendre à estimer les moments statistiques d’une dynamique (moyenne, variance, asymétrie, etc...). La non-reconnaissance de cette dynamique lui permet de détecter qu’une situation est anormale.Mais détecter un comportement inhabituel ne nous renseigne pas pour autant sur son inefficacité. Le système doit également surveiller l’évolution de cette anomalie dans le temps pour pouvoir juger de la pertinence du comportement. Nous montrons comment un contrôleur émotionnel peut faire usage de cette détection de nouveauté pour réguler le comportement et ainsi permettre au robot d’utiliser la stratégie la plus adaptée à la situation rencontrée. Pour finir, nous avons mis en place une procédure de frustration permettant au robot de lancer un appel à l’aide lorsqu’il détecte qu’il se retrouve dans une impasse. Ce réseau de neurones permet au robot d’identifier les situations qu’il ne maîtrise pas dans le but d’affiner son apprentissage, à l’instar de certains processus développementaux
The goal of this thesis is to build a bio-inspired architecture allowing a robot to autonomouslynavigate over large distances. In a cognitive science point of view, the model also aim at improv-ing the understanding of the underlying biological mechanisms. Previous works showed thata computational model of hippocampal place cells, based on neurobiological studies made onrodent, allows a robot to learn robust navigation behaviors. The robot can learn a round or ahoming behavior from a few associations between places and actions. The learning and recog-nition of a place were only defined by visual information and shows limitations for navigatinglarge environments.Adding other sensorial modalities is an effective solution for improving the robustness of placesrecognition in complex environments. This solution led us to the elementary blocks requiredwhen trying to perform multimodal information merging. Such merging has been done, first,by a simple conditioning between 2 modalities and next improved by a more generic model ofinter-modal prediction. In this model, each modality learns to predict the others in usual situa-tions, in order to be able to detect abnormal situations and to compensate missing informationof the others. Such a low level mechanism allows to keep a coherent perception even if onemodality is wrong. Moreover, the model can detect unexpected situations and thus exhibit someself-assessment capabilities: the assessment of its own perception. Following this model of self-assessment, we focus on the fundamental properties of a system for evaluating its behaviors.The first fundamental property that pops out is the statement that evaluating a behavior is anability to recognize a dynamics between sensations and actions, rather than recognizing a sim-ple sensorial pattern. A first step was thus to take into account the sensation/action couplingand build an internal minimalist model of the interaction between the agent and its environment.Such of model defines the basis on which the system will build predictions and expectations.The second fundamental property of self-assessment is the ability to extract relevant informa-tion by the use of statistical processes to perform predictions. We show how a neural networkcan estimate probability density functions through a simple conditioning rule. This probabilis-tic learning allows to achieve bayesian inferences since the system estimates the probability ofobserving a particular behavior from statistical information it recognizes about this behavior.The robot estimates the different statistical momentums (mean, variance, skewness, etc...) of abehavior dynamics by cascading few simple conditioning. Then, the non-recognition of such adynamics is interpreted as an abnormal behavior.But detecting an abnormal behavior is not sufficient to conclude to its inefficiency. The systemmust also monitor the temporal evolution of such an abnormality to judge the relevance of thebehavior. We show how an emotional meta-controller can use this novelty detection to regu-late behaviors and so select the best appropriate strategy in a given context. Finally, we showhow a simple frustration mechanism allows the robot to call for help when it detects potentialdeadlocks. Such a mechanism highlights situations where a skills improvement is possible, soas some developmental processes
APA, Harvard, Vancouver, ISO, and other styles
13

Drouet, Isabelle. "Causalité et probabilités : réseaux bayésiens, propensionnisme." Phd thesis, Université Panthéon-Sorbonne - Paris I, 2007. http://tel.archives-ouvertes.fr/tel-00265287.

Full text
Abstract:
Les théories probabilistes de la causalité apparaissent dans les années 1960 corrélativement de la critique de l'idée selon laquelle la causalité serait une relation de nécessitation. Le présent travail traite de questions soulevées par l'état actuel du développement de ces théories. En ce qui concerne la causalité générique, on peut considérer que l'analyse conceptuelle de ses rapports avec les probabilités est achevée. Les questions qui se posent aujourd'hui sont donc épistémologiques. Plus exactement, les questions traitées dans ce travail portent sur l'inférence aux causes génériques en tant qu'elle est fondée sur les réseaux bayésiens causaux. De façon sensiblement différente, la question du rapport entre la causalité singulière et les probabilités n'est pas complètement réglée du point de vue conceptuel. Nous abordons cette question à partir d'une analyse de la relation entre la causalité et la théorie propensionniste des probabilités.
APA, Harvard, Vancouver, ISO, and other styles
14

Tsala, Éric. "Désambiguïsation sémantique et réseaux bayésiens dynamiques." Mémoire, Université de Sherbrooke, 2009. http://savoirs.usherbrooke.ca/handle/11143/4833.

Full text
Abstract:
La désambiguïsation sémantique permet de lever des ambiguïtés dans le but d'apporter des informations supplémentaires de façon à orienter le choix d'une signification parmi celles possibles. Si par nature elle est surtout utilisée en linguistique, son champ d'action ne s'y limite pas: certaines techniques de désambiguïsation peuvent aussi être utiles dans d'autres domaines tels que la médecine (diagnostic) et l'informatique (recherche documentaire; e.g. Google, Wikipédia) pour ne citer que ceux-là. Ce mémoire propose l'étude et la comparaison de trois modèles de désambiguïsation supervisés, basées sur les chaînes de Markov à états cachés et plus généralement sur les réseaux bayésiens dynamiques.La comparaison de ces outils sur plusieurs fichiers textes suggère la supériorité des réseaux bayésiens dynamiques généraux sur les chaînes de Markov.
APA, Harvard, Vancouver, ISO, and other styles
15

Ben, Mrad Ali. "Observations probabilistes dans les réseaux bayésiens." Thesis, Valenciennes, 2015. http://www.theses.fr/2015VALE0018/document.

Full text
Abstract:
Dans un réseau bayésien, une observation sur une variable signifie en général que cette variable est instanciée. Ceci signifie que l’observateur peut affirmer avec certitude que la variable est dans l’état signalé. Cette thèse porte sur d’autres types d’observations, souvent appelées observations incertaines, qui ne peuvent pas être représentées par la simple affectation de la variable. Cette thèse clarifie et étudie les différents concepts d’observations incertaines et propose différentes applications des observations incertaines dans les réseaux bayésiens.Nous commençons par dresser un état des lieux sur les observations incertaines dans les réseaux bayésiens dans la littérature et dans les logiciels, en termes de terminologie, de définition, de spécification et de propagation. Il en ressort que le vocabulaire n'est pas clairement établi et que les définitions proposées couvrent parfois des notions différentes.Nous identifions trois types d’observations incertaines dans les réseaux bayésiens et nous proposons la terminologie suivante : observation de vraisemblance, observation probabiliste fixe et observation probabiliste non-fixe. Nous exposons ensuite la façon dont ces observations peuvent être traitées et propagées.Enfin, nous donnons plusieurs exemples d’utilisation des observations probabilistes fixes dans les réseaux bayésiens. Le premier exemple concerne la propagation d'observations sur une sous-population, appliquée aux systèmes d'information géographique. Le second exemple concerne une organisation de plusieurs agents équipés d'un réseau bayésien local et qui doivent collaborer pour résoudre un problème. Le troisième exemple concerne la prise en compte d'observations sur des variables continues dans un RB discret. Pour cela, l'algorithme BN-IPFP-1 a été implémenté et utilisé sur des données médicales de l'hôpital Bourguiba de Sfax
In a Bayesian network, evidence on a variable usually signifies that this variable is instantiated, meaning that the observer can affirm with certainty that the variable is in the signaled state. This thesis focuses on other types of evidence, often called uncertain evidence, which cannot be represented by the simple assignment of the variables. This thesis clarifies and studies different concepts of uncertain evidence in a Bayesian network and offers various applications of uncertain evidence in Bayesian networks.Firstly, we present a review of uncertain evidence in Bayesian networks in terms of terminology, definition, specification and propagation. It shows that the vocabulary is not clear and that some terms are used to represent different concepts.We identify three types of uncertain evidence in Bayesian networks and we propose the followingterminology: likelihood evidence, fixed probabilistic evidence and not-fixed probabilistic evidence. We define them and describe updating algorithms for the propagation of uncertain evidence. Finally, we propose several examples of the use of fixed probabilistic evidence in Bayesian networks. The first example concerns evidence on a subpopulation applied in the context of a geographical information system. The second example is an organization of agent encapsulated Bayesian networks that have to collaborate together to solve a problem. The third example concerns the transformation of evidence on continuous variables into fixed probabilistic evidence. The algorithm BN-IPFP-1 has been implemented and used on medical data from CHU Habib Bourguiba in Sfax
APA, Harvard, Vancouver, ISO, and other styles
16

Touya, Thierry. "Méthodes d'optimisation pour l'espace et l'environnement." Phd thesis, Université Paul Sabatier - Toulouse III, 2008. http://tel.archives-ouvertes.fr/tel-00366141.

Full text
Abstract:
Ce travail se compose de deux parties relevant d'applications industrielles différentes.
La première traite d'une antenne spatiale réseau active.
Il faut d'abord calculer les lois d'alimentation pour satisfaire les contraintes de rayonnement. Nous transformons un problème avec de nombreux minima locaux en un problème d'optimisation convexe, dont l'optimum est le minimum global du problème initial, en utilisant le principe de conservation de l'énergie.
Nous résolvons ensuite un problème d'optimisation topologique: il faut réduire le nombre d'éléments rayonnants (ER). Nous appliquons une décomposition en valeurs singulières à l'ensemble des modules optimaux relaxés, puis un algorithme de type gradient topologique décide les regroupements entre ER élémentaires.

La deuxième partie porte sur une simulation type boîte noire d'un accident chimique.
Nous effectuons une étude de fiabilité et de sensibilité suivant un grand nombre de paramètres (probabilités de défaillance, point de conception, et paramètres influents). Sans disposer du gradient, nous utilisons un modèle réduit.
Dans un premier cas test nous avons comparé les réseaux neuronaux et la méthode d'interpolation sur grille éparse Sparse Grid (SG). Les SG sont une technique émergente: grâce à leur caractère hiérarchique et un algorithme adaptatif, elles deviennent particulièrement efficaces pour les problèmes réels (peu de variables influentes).
Elles sont appliquées à un cas test en plus grande dimension avec des améliorations spécifiques (approximations successives et seuillage des données).
Dans les deux cas, les algorithmes ont donné lieu à des logiciels opérationnels.
APA, Harvard, Vancouver, ISO, and other styles
17

Perez, Joan. "Spatial structures in India in the age of globalisation : a data-driven approach." Thesis, Avignon, 2015. http://www.theses.fr/2015AVIG1151/document.

Full text
Abstract:
Les pays qui se sont insérés plus tardivement dans l'économie mondiale subissent généralement les effets de la mondialisation de manière accrue.De ce point de vue, les BRIC, comparés aux autres pays émergents, possèdent un certain poids dans l’économie mondiale et représentent doncun potentiel de marché important. Avec une croissance économique qui devrait dans un avenir proche dépasser celle de la Chine, l’Inde sembleêtre un remarquable cas d’étude. Cependant, les clichés persistent dans un pays où deux aspects seulement sont le plus souvent mis en avant.D’une part, l’Inde est considérée comme un nouvel eldorado, un espace où les multinationales essaient de s’implanter en raison de l’augmentationsubstantielle du nombre de consommateurs : «the shining India». D’autre part, l’Inde est aussi souvent décrite comme surpeuplée, massivementpauvre et occupée par une forte présence de taudis, tant dans les espaces urbains que ruraux. Spatialement, un modèle dual pourrait en effet contenir d'un côté une part croissante de la classe moyenne en pleine explosion tandis que d'autres verraient s'accentuer les inégalités économiques et sociales. En revanche, il paraît difficile d'imaginer que deux extrêmes seulement puissent représenter la diversité d'un si grand pays. Dans les faits, l’évolution du secteur tertiaire n’est pas assez rapide pour maintenir un haut niveau d’emploi dans certains espaces urbains,alors qu’un modèle agraire de plus en plus intensif en zones rurales contribue à réduire graduellement le nombre d’employés agricoles et depropriétaires terriens. Par conséquent, l’augmentation générale du niveau de vie ne suivra pas forcément le rythme de croissance économiqueet démographique de l’Inde ; d’autant que les inégalités socio-économiques de ce pays sont déjà accentuées par un système rigide de castes. Ilest nécessaire de rappeler que l’inde est un pays d’ancienne urbanisation dont les premières traces remontent à 2400 AEC. De cette particularitérésulte une histoire riche et complexe. Aujourd’hui, l’Inde est caractérisée par une grande diversité de langues, de religions, de castes, de communautés, de tribus, de traditions, d'espaces sous influences métropolitaines, etc. Peu de pays dans le monde présentenet autant de spécificités. Ces faits soulèvent les questions suivantes : comment est-il possible de visualiser et quantifier les inégalités spatiales d'un pays si large et si complexe ? Quels sont les principaux facteurs qui affectent et/ou engendrent ces inégalités spatiales ? Il pourrait être simpliste d'étudier ces écarts spatiaux seulement au travers d’indicateurs macro économiques tel que le PIB. Ainsi, pour faire face à tant de complexité, un modèle conceptuel nous a permis de sélectionner de manière rigoureuse 55 indicateurs afin de renseigner ces récentes transformations spatiales en cette ère de mondialisation accrue. Cette sélection d’indicateurs a donné naissance à une base de données multicritères composée de données économiques,socio-démographiques, géographiques, sociologiques, culturelles, etc., à l’échelle du district (640 unités spatiales) et entre deux dates: 2001 et 2011. L'hypothèse de cette recherche est la suivante : une approche inductive à partir de ces indicateurs pourrait nous permettre une identificationet une caractérisation a-posteriori de structures spatiales en Inde
Countries that have experienced a delayed entry within the world economy have usually sustained an enhanced and faster globalisation process. This is the case for BRIC countries which are, compared to other emerging countries, organised on large economies and thus provide a stronger potential market. From this perspective, India appears to be the perfect case study with an economic growth expected to overcome China’s growth in the near future. However, the «clichés» are persistent within a country mostly depicted as bipolar. On the one hand, it is considered as a new eldorado, the «Shining India», a place where multinationals aim to implement themselves due to the substantial increase of the consumer market. At the same time, India is also characterised by overcrowding, the major presence of slum areas and mass poverty, both in urban and rural areas. It is indeed possible that some areas will accommodate a bigger and bigger share of the growing middle class, while others will accentuate economic and social inequalities. Yet, can these extremes be truly representative of the diversity of such a large country? In fact, in some urban oriented spaces, the evolution of the tertiary sector is not strong enough to maintain a high level of employment while in rural spaces; an intensive farming model contributes to gradually reducing the number of labourers and landowners. As a result, the increase of the standard of living related to both economic and demographic growth is not homogeneously distributed over a territory where socio-economic divisions are already made worse by a tight caste system. With evidence dating back to 2400 BCE, it must be remembered that India is a country of old urbanisation. This has given rise to a rich and complex history and India is now home to a variety of languages, religions, castes, communities, tribes, traditions, urbanisation patterns and, more recently, globalisation-related dynamics. Perhaps no other country in the world seems to be characterised by such a great diversity. This begs the following questions: how is it possible to quantify and visualise the spatial gap of such a complex and subcontinent sized country? What are the main drivers affecting this spatial gap? It would indeed be simplistic to study India only through macro-economic indicators such as GDP. To deal with this complexity, a conceptualisation has been performed to strictly select 55 criteria that can affect the transformation sustained by the Indian territory in this enhanced age of globalisation. These selected factors have fed a multi-critera database characterised by aspects coming from economy, geography, sociology, culture etc. at the district scale level (640 spatial units) and on a ten year timeframe (2001-2011). The assumption is as follows: each Indian district can be driven by different factors. The human capacity to understand a complex issue has been reached here since we cannot take into account and at the same time the behaviour of a large number of elements influencing one another. AI Based Algorithm methods (Bayesian and Neural Networks) have thus been resorted to as a good alternative to process a large number of factors. In order to be as accurate as possible and to keep a transversal point of view, the methodology is divided into a robust procedure including fieldwork steps. The results of the models show that the 55 factors interact, bringing the emergence of unobservable factors representative of broader concepts, which find consistency only in the case of India. It also shows that the Indian territory can be segmented into a multitude of sub-spaces. Some of these profiles are close to the caricatured India. However, in most cases, results show a heterogeneous country with sub-spaces possessing a logic of their own and far away from any cliché
APA, Harvard, Vancouver, ISO, and other styles
18

Trinh, Quoc Anh. "Méthodes neuronales dans l'analyse de survie." Evry, Institut national des télécommunications, 2007. http://www.theses.fr/2007TELE0004.

Full text
Abstract:
Les réseaux de neurones artificiels sont un outil statistique utile à la prédiction de la survie en médecine clinique qui connaît un certain succès comme en témoigne le numéro spécial de la revue Cancer du 15 avril 2001. Ce travail propose une généralisation des modèles classiques de survie où les variables prédictives linéaires sont remplacées par des variables prédictives non linéaires modélisées par des perceptrons multicouches non récurrents. Cette modélisation dont l'objectif est de prédire un temps de survie prend en compte les effets dépendant du temps et les interactions entre variables. Le modèle des réseaux de neurones permet de s'affranchir des restrictions du modèle de Cox car il peut estimer les effets dépendant du temps ainsi que des interactions éventuelles. En outre, la présence de données censurées, la particularité de l'analyse de survie, donne envie de prendre en compte toutes les connaissances disponibles sur les données pour l'apprentissage des modèles neuronaux afin d'avoir un meilleur modèle prédictif. L'approche bayésienne est donc une approche appropriée car elle permet une meilleure généralisation des réseaux pendant la phase d' apprentissage en évitant le sur-ajustement qui peut se produire au cours de l'apprentissage avec l'algorithme de rétro-propagation. De plus, un apprentissage bayésien hiérarchise des réseaux de neurones convient parfaitement à une sélection de variables pertinentes qui permet une meilleure explication des effets dépendant du temps et des interactions entre variables. La performance des approches à base d'apprentissage de réseaux de neurones dans l'analyse de survie dépend notamment de la taille de l'ensemble des données d'apprentissage et du taux de censure de données. En particulier, pour les données de génomes pour lesquelles les variables sont beaucoup plus nombreuses que les observations, une sélection des variables importantes peut être effectuée par des réseaux de neurones après une sélection automatique des variables pertinentes pour diminuer la dimension de l'espace des données. Une estimation plus précise du temps de survie permet une meilleure connaissance physiopathologique de la maladie et une meilleure stratégie thérapeutique. Celle-ci est obtenue grâce à la méthode de ré-échantillonnage de données et à l'adaptativité du modèle neuronal. La construction d'un arbre de décision sur des estimations du réseau permet une meilleure définition des groupes pronostiques de survie
This thesis proposes a generalization of the conventional survival models where the linear prdictive variables are replaced by nonlinear multi-layer perceptions of variables. This modelling by neural networks predict the survival times with talking into account the time effects and the interactions between variables. The neural network models will be validated by cross validation technique or the bayesian slection criterion based on the model's posteriori probability. The prediction is refined by a boostrap aggregating (Bagging) and bayesian models average to increase the precision. Moreower, the censoring, the particularity of the survival analysis, needs a survival model which could take into account all available knowledges on the data for estimation to obtain a better prediction. The bayesian approach is thus a proposed approach because it allows a better generalization of the neural networks because of the avoidance of the overlifting. Moreover, the hierarchical models in bayesian learning of the neural networks is appropriate perfectly for a selection of relevant variables which gives a better explanation of the times effects and the interactions between variables
APA, Harvard, Vancouver, ISO, and other styles
19

Prestat, Emmanuel. "Les réseaux bayésiens : classification et recherche de réseaux locaux en cancérologie." Phd thesis, Université Claude Bernard - Lyon I, 2010. http://tel.archives-ouvertes.fr/tel-00707732.

Full text
Abstract:
En cancérologie, les puces à ADN mesurant le transcriptome sont devenues un outil commun pour chercher à caractériser plus finement les pathologies, dans l'espoir de trouver au travers des expressions géniques : des mécanismes,des classes, des associations entre molécules, des réseaux d'interactions cellulaires. Ces réseaux d'interactions sont très intéressants d'un point de vue biologique car ils concentrent un grand nombre de connaissances sur le fonctionnement cellulaire. Ce travail de thèse a pour but, à partir de ces mêmes données d'expression, d'extraire des structures pouvant s'apparenter à des réseaux d'interactions génétiques. Le cadre méthodologique choisi pour appréhender cette problématique est les " Réseaux Bayésiens ", c'est-à-dire une méthode à la fois graphique et probabiliste permettant de modéliser des systèmes pourtant statiques (ici le réseau d'expression génétique) à l'aide d'indépendances conditionnelles sous forme d'un réseau. L'adaptation de cette méthode à des données dont la dimension des variables (ici l'expression des gènes, dont l'ordre de grandeur est 105) est très supérieure à la dimension des échantillons (ordre102 en cancérologie) pose des problèmes statistiques (de faux positifs et négatifs) et combinatoires (avec seulement 10gènes on a 4×1018 graphes orientés sans circuit possibles). A partir de plusieurs problématiques de cancers (leucémies et cancers du sein), ce projet propose une stratégie d'accélération de recherche de réseaux d'expression à l'aide de Réseaux Bayésiens, ainsi que des mises en œuvre de cette méthode pour classer des tumeurs, sélectionner un ensemble de gènes d'intérêt reliés à une condition biologique particulière, rechercher des réseaux locaux autour d'un gène d'intérêt.On propose parallèlement de modéliser un Réseau Bayésien à partir d'un réseau biologique connu, utile pour simuler des échantillons et tester des méthodes de reconstruction de graphes à partir de données contrôlées.
APA, Harvard, Vancouver, ISO, and other styles
20

Leray, Ph. "Réseaux bayésiens : Apprentissage et diagnostic de systemes complexes." Habilitation à diriger des recherches, Université de Rouen, 2006. http://tel.archives-ouvertes.fr/tel-00485862.

Full text
APA, Harvard, Vancouver, ISO, and other styles
21

Sanchez-Soto, Eduardo. "Réseaux Bayésiens Dynamiques pour la Vérification du Locuteur." Phd thesis, Télécom ParisTech, 2005. http://tel.archives-ouvertes.fr/tel-00011440.

Full text
Abstract:
Cette thèse est concernée avec la modélisation statistique du signal de parole appliqué à la vérification du locuteur (VL) en utilisant des réseaux bayésiens (RBs). L'idée principale de ce travail est d'employer les RBs comme un outil mathématique afin de combiner plusieurs sources d'information obtenues à partir du signal de parole en gardant ses relations. Elle combine de travail théorique et expérimental. Une différence fondamentale entre les systèmes de VL et les humains est la quantité et la qualité de l'information utilisée ainsi que la relation entre les sources d'information employées pour prendre des décisions. L'identité d'un locuteur est codée dans plusieurs sources d'information qui peuvent être modélisées par des RBs. La première partie de cette thèse passe en revue les modules principaux des systèmes de VL, les sources possibles d'information aussi bien que les concepts de base des modèles graphiques. La deuxième partie de cette thèse aborde le module de modélisation du système de VL proposé. On propose une nouvelle façon d'approcher les problèmes liés aux systèmes de VL. Il est décrit comment apprendre les relations d'indépendance conditionnelle parmi les variables directement à partir des données. Enfin, nous proposons une technique pour adapter les RBs basée sur certaines caractéristiques mathématiques des relations d'indépendance conditionnelles. Cette adaptation est basée sur une mesure entre les distributions de probabilité conditionnelles entre des variables discrètes, et de la même façon, sur la matrice de régression pour des variables continues. A l'issue de nos recherches, l'intérêt d'employer les RBs dans les systèmes de VL est clairement montré.
APA, Harvard, Vancouver, ISO, and other styles
22

Smail, Linda. "Algorithmique pour les Réseaux Bayésiens et leurs extensions." Phd thesis, Université de Marne la Vallée, 2004. http://tel.archives-ouvertes.fr/tel-00007170.

Full text
Abstract:
Cette thèse est consacrée à la présentation d'un algorithme nouveau et à la formalisation et l'amélioration d'algorithmes existants pour le calcul des lois marginales et conditionnelles dans les réseaux bayésiens.
Le chapitre 1 présente la théorie des réseaux bayésiens. Nous introduisons une nouvelle notion, celle de réseau bayésien de niveau deux, utile pour l'introduction de notre algorithme de calcul sur les réseaux bayésiens ; nous donnons également quelques résultats fondamentaux et nous situons dans notre formalisme un exemple d'école de réseau bayésien dit «Visite en Asie» .
Dans le second chapitre, nous exposons une propriété graphique appelée «d-séparation» grâce à laquelle on peut déterminer, pour tout couple de variables aléatoires ou de groupes de variables, et tout ensemble de conditionnement, s'il y a nécessairement, ou non, indépendance conditionnelle. Nous présentons également dans ce chapitre des résultats concernant le calcul de probabilités ou probabilités conditionnelles dans les réseaux bayésiens en utilisant les propriétés de la d-séparation. Ces résultats, qui concernent des écritures à notre connaissance originales de la factorisation de la loi jointe et de la loi conditionnée d'une famille de variables aléatoires du réseau bayésien (en liaison avec la notion de réseau bayésien de niveau deux) doivent trouver leur utilité pour les réseaux bayésiens de grande taille.
Le troisième chapitre donne la présentation détaillée et la justification d'un des algorithmes connus de calcul dans les réseaux bayésiens : il s'agit de l'algorithme LS (Lauritzen and Spigelhalter), basé sur la méthode de l'arbre de jonction. Pour notre part, après avoir présenté la notion de suite recouvrante propre possédant la propriété d'intersection courante, nous proposons un algorithme en deux versions (dont l'une est originale) qui permet de construire une suite de parties d'un réseau bayésien possédant cette propriété. Cette présentation est accompagnée d'exemples.
Dans le chapitre 4, nous donnons une présentation détaillée de l'algorithme des restrictions successives que nous proposons pour le calcul de lois (dans sa première version), et de lois conditionnelles (dans sa deuxième version). Cela est présenté après l'introduction d'une nouvelle notion : il s'agit de la descendance proche. Nous présentons également une application de l'algorithme des restrictions successives sur l'exemple «Visite en Asie» présenté en chapitre 1, et nous comparons le nombre d'opérations élémentaires effectuées avec celui qui intervient dans l'application de l'algorithme LS sur le même exemple. Le gain de calcul qui, à la faveur de cet exemple, apparaît au profit de l'algorithme des restrictions successives, sera comme toujours, d'autant plus marqué que la taille des réseaux et le nombre de valeurs prises par les variables seront plus élevés. C'est ce qui justifie l'insertion de notre algorithme au seins de « ProBT » , un logiciel d'inférence probabiliste, réalisé et diffusé par l'équipe Laplace localisée dans le laboratoire Gravir à INRIA Rhône Alpes.
En annexes nous rappelons les propriétés des graphes orientés sans circuits, les notions de base sur l'indépendance conditionnelle et l'équivalence de plusieurs définitions des réseaux bayésiens.
APA, Harvard, Vancouver, ISO, and other styles
23

Sánchez-Soto, Eduardo. "Réseaux bayésiens dynamiques pour la vérification du locuteur." Paris, ENST, 2005. http://www.theses.fr/2005ENST0032.

Full text
Abstract:
Cette thèse est concernée avec la modélisation statistique du signal de parole appliqué à la vérification du locuteur (VL) en utilisant des réseaux bayésiens (RBs). L'idée principale de ce travail est d'employer les RBs comme un outil mathématique afin de combiner plusieurs sources d'information obtenues à partir du signal de parole en gardant ses relations. Elle combine de travail théorique et expérimental. Une différence fondamentale entre les systèmes de VL et les humains est la quantité et la qualité de l'information utilisée ainsi que la relation entre les sources d'information employées pour prendre des décisions. L'identité d'un locuteur est codée dans plusieurs sources d'information qui peuvent être modélisées par des RBs. La première partie de cette thèse passe en revue les modules principaux des systèmes de VL, les sources possibles d'information aussi bien que les concepts de base des modèles graphiques. La deuxième partie de cette thèse aborde le module de modélisation du système de VL proposé. On propose une nouvelle façon d approcher les problèmes liés aux systèmes de VL. Il est décrit comment apprendre les relations d'indépendance conditionnelle parmi les variables directement à partir des données. Enfin, nous proposons une technique pour adapter les RBs basée sur certaines caractéristiques mathématiques des relations d'indépendance conditionnelles. Cette adaptation est basée sur une mesure entre les distributions de probabilité conditionnelles entre des variables discrètes, et de la même façon, sur la matrice de régression pour des variables continues. A l'issue de nos recherches, l'intérêt d'employer les RBs dans les systèmes de VL est clairement montré
This thesis is concerned with the statistical modeling of speech signal applied to Speaker Verification (SV) using Bayesian Networks (BNs). The main idea of this work is to use BNs as a mathematical tool to model pertinent speech features keeping its relations. It combines theoretical and experimental work. The difference between systems and humans performance in SV is the quantity of information and the relationships between the sources of information used to make decisions. A single statistical framework that keeps the conditional dependence and independence relations between those variables is difficult to attain. Therefore, the use of BNs as a tool for modeling the available information and their independence and dependence relationships is proposed. The first part of this work reviews the main modules of a SV system, the possible sources of information as well as the basic concepts of graphical models. The second part deals with Modeling. A new approach to the problems associated with the SV systems is proposed. The problem of inference and learning (parameters and structure)in BNs are presented. In order to obtain an adapted structure the relations of conditional independence among the variables are learned directly from the data. These relations are then used in order to build an adapted BN. In particular, a new model adaptation technique for BN has been proposed. This adaptation is based on a measure between Conditional Probability Distributions for discrete variables and on Regression Matrix for continuous variables used to model the relationships. In a large database for the SV task, the results have confirmed the potential of use the BNs approach
APA, Harvard, Vancouver, ISO, and other styles
24

Wenzek, Didier. "Construction de réseaux de neurones." Phd thesis, Grenoble INPG, 1993. http://tel.archives-ouvertes.fr/tel-00343569.

Full text
Abstract:
La dénomination de réseaux de neurones recouvre tout un ensemble de méthodes de calcul dont le point commun est de décrire le calcul d'une solution a un probleme comme la recherche d'un état d'équilibre par un ensemble de cellules simples inter-agissant entre elles via un réseau de connections paramétrées. L'approche usuelle, pour obtenir un réseau de neurones ayant un comportement souhaite, consiste a tester sur des exemples un réseau choisi a priori et a modifier ses paramètres de contrôle jusqu'à ce que l'on obtienne un comportement satisfaisant. La difficulté de ces méthodes est que leur succès ou leur échec reposent sur le choix d'un premier réseau et que l'on ne dispose pas de règles permettant de déduire ce choix de la structure du probleme. La motivation de cette thèse a donc été de décrire des méthodes de synthèse permettant une construction modulaire de réseaux de neurones. Aussi, cette thèse propose une classe de réseaux de neurones parmi lesquels toute spécification de la forme chercher un élément de e (fini) vérifiant la propriété p admet au moins une réalisation. En outre, les réseaux de cette classe peuvent être combines pour obtenir un réseau réalisant une combinaison des spécifications des réseaux combines
APA, Harvard, Vancouver, ISO, and other styles
25

Hallouli, Khalid. "Reconnaissance de caractères par méthodes markoviennes et réseaux bayésiens." Phd thesis, Télécom ParisTech, 2004. http://pastel.archives-ouvertes.fr/pastel-00000740.

Full text
Abstract:
Cette thése porte sur la reconnaissance de caractères imprimés et manuscrits par méthodes markoviennes et réseaux bayésiens. La première partie consiste à effectuer une modélisation stochastique markovienne en utilisant les HMMs classiques dans deux cas: semi-continu et discret. Un premier modèle HMM est obtenu à partir d'observations de type colonnes de pixels (HMM-vertical), le second à partir d'observations de type lignes (HMM-horizontal). Ensuite nous proposons deux types de modèles de fusion : modèle de fusion de scores qui consiste à combiner les deux vraisemblances résultantes des deux HMMs, et modèle de fusion de données qui regroupe simultanément les deux observations lignes et colonnes. Les résultats montrent l'importance du cas semi-continu et la performance des modèles de fusion. Dans la deuxième partie nous développons les réseaux bayésiens statiques et dynamiques, l'algorithme de Jensen Lauritzen Olesen (JLO) servant comme moteur d'inférence exacte, ainsi que l'apprentissage des paramètres avec des données complètes et incomplètes. Nous proposons une approche pour la reconnaissance de caractères (imprimés et manuscrits) en employant le formalisme des réseaux bayésiens dynamiques. Nous construisons certains types de modèles: HMM sous forme de réseau bayésien dynamique, modèle de trajectoire et modèles de couplages. Les résultats obtenus mettent en évidence la bonne performance des modèles couplés. En général nos applications nous permettent de conclure que l'utilisation des réseaux bayésiens est efficace et très prometteuse par le fait de modéliser les dépendances entre différentes observations dans les images de caractères.
APA, Harvard, Vancouver, ISO, and other styles
26

Verron, Sylvain. "Diagnostic et surveillance des processus complexes par réseaux bayésiens." Phd thesis, Université d'Angers, 2007. http://tel.archives-ouvertes.fr/tel-00517101.

Full text
Abstract:
Cette thèse porte sur la surveillance (détection et diagnostic) des procédés multivariés par réseaux bayésiens. Ceci permet l'unification dans le même outil, un réseau bayésien, de plusieurs méthodes dédiées à la surveillance des procédés, telles que les cartes de contrôles multivariées, l'analyse discriminante ou bien la méthode MYT. Le premier chapitre expose les différents points clés de la surveillance des procédés, en étudiant les diverses approches permettant de réaliser celle-ci. Des méthodes de surveillance supervisées et non-supervisées sont présentées et une étude de différents classifieurs pour la surveillance est effectuée. Le choix d'un classifieur se porte alors sur les réseaux bayésiens. Le second chapitre est l'objet d'une présentation plus approfondie des réseaux bayésiens et des extensions possibles et intéressantes de ce genre d'outil dans le contexte de la surveillance des procédés. Puis, un état de l'art des méthodes de surveillance ou de diagnostic basées sur les réseaux bayésiens est étudié. Le troisième chapitre expose les contributions apportées au domaine de la surveillance des procédés par réseaux bayésiens. Les contributions apportées se répartissent en trois parties : détection, diagnostic supervisé et diagnostic non-supervisé. En s'appuyant sur ces contributions, la structure complète d'un réseau bayésien dédié à la surveillance des procédés est proposée. Le dernier chapitre présente une application de la méthode proposée sur un exemple classique : le procédé Tennessee Eastman. Les performances du réseau en terme de détection et de diagnostic sont évaluées. Finalement, les conclusions et perspectives de l'approche proposée sont émises.
APA, Harvard, Vancouver, ISO, and other styles
27

Rahier, Thibaud. "Réseaux Bayésiens pour fusion de données statiques et temporelles." Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAM083/document.

Full text
Abstract:
La prédiction et l'inférence sur des données temporelles sont très souvent effectuées en utilisant uniquement les séries temporelles. Nous sommes convaincus que ces tâches pourraient tirer parti de l'utilisation des métadonnées contextuelles associées aux séries temporelles, telles que l'emplacement, le type, etc. Réciproquement, les tâches de prédiction et d'inférence sur les métadonnées pourraient bénéficier des informations contenues dans les séries temporelles. Cependant, il n'existe pas de méthode standard pour modéliser conjointement les données de séries temporelles et les métadonnées descriptives. De plus, les métadonnées contiennent fréquemment des informations hautement corrélées ou redondantes et peuvent contenir des erreurs et des valeurs manquantes.Nous examinons d’abord le problème de l’apprentissage de la structure graphique probabiliste inhérente aux métadonnées en tant que réseau Bayésien. Ceci présente deux avantages principaux: (i) une fois structurées en tant que modèle graphique, les métadonnées sont plus faciles à utiliser pour améliorer les tâches sur les données temporelles et (ii) le modèle appris permet des tâches d'inférence sur les métadonnées uniquement, telles que l'imputation de données manquantes. Cependant, l'apprentissage de la structure de réseau Bayésien est un défi mathématique conséquent, impliquant un problème d'optimisation NP-difficile. Pour faire face à ce problème, nous présentons un algorithme d'apprentissage de structure sur mesure, inspiré de nouveaux résultats théoriques, qui exploite les dépendances (quasi)-déterministes généralement présentes dans les métadonnées descriptives. Cet algorithme est testé sur de nombreux jeux de données de référence et sur certains jeux de métadonnées industriels contenant des relations déterministes. Dans les deux cas, il s'est avéré nettement plus rapide que l'état de la l'art, et a même trouvé des structures plus performantes sur des données industrielles. De plus, les réseaux Bayésiens appris sont toujours plus parcimonieux et donc plus lisibles.Nous nous intéressons ensuite à la conception d'un modèle qui inclut à la fois des (méta)données statiques et des données temporelles. En nous inspirant des modèles graphiques probabilistes pour les données temporelles (réseaux Bayésiens dynamiques) et de notre approche pour la modélisation des métadonnées, nous présentons une méthodologie générale pour modéliser conjointement les métadonnées et les données temporelles sous forme de réseaux Bayésiens hybrides statiques-dynamiques. Nous proposons deux algorithmes principaux associés à cette représentation: (i) un algorithme d'apprentissage qui, bien qu'optimisé pour les données industrielles, reste généralisable à toute tâche de fusion de données statiques et dynamiques, et (ii) un algorithme d'inférence permettant les d'effectuer à la fois des requêtes sur des données temporelles ou statiques uniquement, et des requêtes utilisant ces deux types de données.%Nous fournissons ensuite des résultats sur diverses applications inter-domaines telles que les prévisions, le réapprovisionnement en métadonnées à partir de séries chronologiques et l’analyse de dépendance d’alarmes en utilisant les données de certains cas d’utilisation difficiles de Schneider Electric.Enfin, nous approfondissons certaines des notions introduites au cours de la thèse, et notamment la façon de mesurer la performance en généralisation d’un réseau Bayésien par un score inspiré de la procédure de validation croisée provenant de l’apprentissage automatique supervisé. Nous proposons également des extensions diverses aux algorithmes et aux résultats théoriques présentés dans les chapitres précédents, et formulons quelques perspectives de recherche
Prediction and inference on temporal data is very frequently performed using timeseries data alone. We believe that these tasks could benefit from leveraging the contextual metadata associated to timeseries - such as location, type, etc. Conversely, tasks involving prediction and inference on metadata could benefit from information held within timeseries. However, there exists no standard way of jointly modeling both timeseries data and descriptive metadata. Moreover, metadata frequently contains highly correlated or redundant information, and may contain errors and missing values.We first consider the problem of learning the inherent probabilistic graphical structure of metadata as a Bayesian Network. This has two main benefits: (i) once structured as a graphical model, metadata is easier to use in order to improve tasks on temporal data and (ii) the learned model enables inference tasks on metadata alone, such as missing data imputation. However, Bayesian network structure learning is a tremendous mathematical challenge, that involves a NP-Hard optimization problem. We present a tailor-made structure learning algorithm, inspired from novel theoretical results, that exploits (quasi)-determinist dependencies that are typically present in descriptive metadata. This algorithm is tested on numerous benchmark datasets and some industrial metadatasets containing deterministic relationships. In both cases it proved to be significantly faster than state of the art, and even found more performant structures on industrial data. Moreover, learned Bayesian networks are consistently sparser and therefore more readable.We then focus on designing a model that includes both static (meta)data and dynamic data. Taking inspiration from state of the art probabilistic graphical models for temporal data (Dynamic Bayesian Networks) and from our previously described approach for metadata modeling, we present a general methodology to jointly model metadata and temporal data as a hybrid static-dynamic Bayesian network. We propose two main algorithms associated to this representation: (i) a learning algorithm, which while being optimized for industrial data, is still generalizable to any task of static and dynamic data fusion, and (ii) an inference algorithm, enabling both usual tasks on temporal or static data alone, and tasks using the two types of data.%We then provide results on diverse cross-field applications such as forecasting, metadata replenishment from timeseries and alarms dependency analysis using data from some of Schneider Electric’s challenging use-cases.Finally, we discuss some of the notions introduced during the thesis, including ways to measure the generalization performance of a Bayesian network by a score inspired from the cross-validation procedure from supervised machine learning. We also propose various extensions to the algorithms and theoretical results presented in the previous chapters, and formulate some research perspectives
APA, Harvard, Vancouver, ISO, and other styles
28

Nguyen, Hoai-Tuong. "Réseaux bayésiens et apprentissage ensembliste pour l'étude différentielle de réseaux de régulation génétique." Phd thesis, Université de Nantes, 2012. http://tel.archives-ouvertes.fr/tel-00675310.

Full text
Abstract:
Dans les dernières années, les réseaux Bayésiens (RB) sont devenus l'une des méthodes d'apprentissage automatique les plus puissantes permettant de modéliser graphiquement et de manière probabiliste différentes types de systèmes complexes. Un des problèmes communs dans l'apprentissage de la structure des RB est le problème des données de petites tailles. En effet, le résultat de l'apprentissage est sensible au nombre d'échantillons de données. En apprentissage automatique, les méthodes d'apprentissage ensemblistes telles que le bootstrap ou les algorithmes génétiques sont des méthodes souvent utilisées pour traiter le problème de la pauvreté de données. Toutefois, les méthodes existantes se limitent généralement à la fusion d'un ensemble de modèles, mais ne permettent pas de comparer deux ensembles de modèles. Inspiré par les résultats obtenus par les méthodes ensemblistes, nous proposons une nouvelle méthode basée sur le graphe quasi-essentiel (QEG - Quasi-Essential Graph) et l'utilisation d'un test multiple afin de comparer deux ensembles de RB. Le QEG permet de résumer et de visualiser graphiquement un ensemble de RB. Le test multiple permet de vérifier si les différences entre les deux ensembles de RB sont statistiquement significatives et de déterminer la position de ces différences. L'application sur des données synthétiques et expérimentales a démontré les différents intérêts de la méthode proposée dans la reconstruction des réseaux de régulation génétique et perspectivement dans les autres applications avec les données de petites tailles.
APA, Harvard, Vancouver, ISO, and other styles
29

Nguyen, Hoai Tuong. "Réseaux bayésiens et apprentissage ensembliste pour l’étude différentielle de réseaux de régulation génétique." Nantes, 2012. http://www.theses.fr/2012NANT2004.

Full text
Abstract:
Dans les dernières années, les réseaux Bayésiens (RB) sont devenus l'une des méthodes d'apprentissage automatique les plus puissantes permettant de modéliser graphiquement et de manière probabiliste différentes types de systèmes complexes. Un des problèmes communs dans l'apprentissage de la structure des RB est le problème des données de petites tailles. En effet, le résultat de l'apprentissage est sensible au nombre d'échantillons de données. En apprentissage automatique, les méthodes d'apprentissage ensemblistes telles que le bootstrap ou les algorithmes génétiques sont des méthodes souvent utilisées pour traiter le problème de la pauvreté de données. Toutefois, les méthodes existantes se limitent généralement à la fusion d'un ensemble de modèles, mais ne permettent pas de comparer deux ensembles de modèles. Inspiré par les résultats obtenus par les méthodes ensemblistes, nous proposons une nouvelle méthode basée sur le graphe quasi-essentiel (QEG - Quasi-Essential Graph) et l'utilisation d'un test multiple afin de comparer deux ensembles de RB. Le QEG permet de résumer et de visualiser graphiquement un ensemble de RB. Le test multiple permet de vérifier si les différences entre les deux ensembles de RB sont statistiquement significatives et de déterminer la position de ces différences. L'application sur des données synthétiques et expérimentales a démontré les différents intérêts de la méthode proposée dans la reconstruction des réseaux de régulation génétique et perspectivement dans les autres applications avec les données de petites tailles
Ln the recent years, the Bayesian networks (SN) have become one of the most powerful machine learning methods to modeling graphically and probabilistically different kinds of complex systems. One of the common issues in BN structure learning is the small-data problem. Ln fact, the result of learning is sensible to sample size of dataset. Ln machine learning, the set-based learning methods such as Bootstrap ou genetic algorithms are the often used methods to dealing with the small-data problem. However, the existing methods limit generally to the fusion of a set of models, but do not allow to compare two set of models. Inspired from the obtained results of the set-based methods, we proposed a novel method based on the quasi-essential graph (QEG) and the usage of the multiple testing in order to compare two sets of BN. QEG allows to resume and visualize graphically a set of BN. The multiple testing allows to verify if the differences between two set of BN are statistically significative and to determine the position of the differences. The application on the synthetic and experimental data demonstrated the different interests of proposed method in gene regulatory networks reconstruction and perspectively in the other applications with the small dataset
APA, Harvard, Vancouver, ISO, and other styles
30

Tsopze, Norbert. "Treillis de Galois et réseaux de neurones : une approche constructive d'architecture des réseaux de neurones." Thesis, Artois, 2010. http://www.theses.fr/2010ARTO0407/document.

Full text
Abstract:
Les réseaux de neurones artificiels connaissent des succès dans plusieurs domaines. Maisles utilisateurs des réseaux de neurones sont souvent confrontés aux problèmes de définitionde son architecture et d’interprétabilité de ses résultats. Plusieurs travaux ont essayé d’apporterune solution à ces problèmes. Pour les problèmes d’architecture, certains auteurs proposentde déduire cette architecture à partir d’un ensemble de connaissances décrivant le domaine duproblème et d’autres proposent d’ajouter de manière incrémentale les neurones à un réseauayant une taille initiale minimale. Les solutions proposées pour le problème d’interprétabilitédes résultats consistent à extraire un ensemble de règles décrivant le fonctionnement du réseau.Cette thèse contribue à la résolution de ces deux problèmes. Nous nous limitons à l’utilisationdes réseaux de neurones dans la résolution des problèmes de classification.Nous présentons dans cette thèse un état de l’art des méthodes existantes de recherche d’architecturede réseaux de neurones : une étude théorique et expérimentale est aussi faite. Decette étude, nous observons comme limites de ces méthodes la disponibilité absolue des connaissancespour construire un réseau interprétable et la construction des réseaux difficiles à interpréteren absence de connaissances. En alternative, nous proposons une méthode appelée CLANN(Concept Lattice-based Artificial Neural network) basée les treillis de Galois qui construit undemi-treillis à partir des données et déduire de ce demi-treillis l’architacture du réseau. CLANNétant limitée à la résolution des problèmes à deux classes, nous proposons MCLANN permettantd’étendre cette méthodes de recherche d’architecture des réseaux de neurones aux problèmes àplusieurs classes.Nous proposons aussi une méthode appelée ’Approche des MaxSubsets’ pour l’extractiondes règles à partir d’un réseau de neurones. La particularité de cette méthode est la possibilitéd’extraire les deux formats de règles (’si alors’ et ’m parmi N’) à partir d’une structure quenous construisons. Nous proposons aussi une façon d’expliquer le résultat calculé par le réseauconstruit par la méthode MCLANN au sujet d’un exemple
The artificial neural networks are successfully applied in many applications. But theusers are confronted with two problems : defining the architecture of the neural network able tosolve their problems and interpreting the network result. Many research works propose some solutionsabout these problems : to find out the architecture of the network, some authors proposeto use the problem domain theory and deduct the network architecture and some others proposeto dynamically add neurons in the existing networks until satisfaction. For the interpretabilityproblem, solutions consist to extract rules which describe the network behaviour after training.The contributions of this thesis concern these problems. The thesis are limited to the use of theartificial neural networks in solving the classification problem.In this thesis, we present a state of art of the existing methods of finding the neural networkarchitecture : we present a theoritical and experimental study of these methods. From this study,we observe some limits : difficulty to use some method when the knowledges are not available ;and the network is seem as ’black box’ when using other methods. We a new method calledCLANN (Concept Lattice-based Artificial Neural Network) which builds from the training dataa semi concepts lattice and translates this semi lattice into the network architecture. As CLANNis limited to the two classes problems, we propose MCLANN which extends CLANN to manyclasses problems.A new method of rules extraction called ’MaxSubsets Approach’ is also presented in thisthesis. Its particularity is the possibility of extracting the two kind of rules (If then and M-of-N)from an internal structure.We describe how to explain the MCLANN built network result aboutsome inputs
APA, Harvard, Vancouver, ISO, and other styles
31

Maalej, Mohamed-Amine, and Véronique Delcroix. "Diagnostic multiple des systèmes complexes à base de réseaux bayésiens." Valenciennes, 2006. http://ged.univ-valenciennes.fr/nuxeo/site/esupversions/46028b3e-dbca-41c6-a69f-b740ee4d0519.

Full text
Abstract:
Le diagnostic à base de modèles a révolutionné le domaine du diagnostic en ayant pallié le manque de connaissances par l'utilisation de modèle. Notre recherche se concentre sur la tâche de diagnostic multiple pour un système complexe, fiable et de grande taille à partir d’observations de panne. Nous exploitons les modèles en réseaux bayésiens pour perfectionner le diagnostic de ces systèmes. Ces modèles intègrent les probabilités a priori de défaillance des composants, et permettent, par un calcul approché, de calculer les probabilités a posteriori des diagnostics. Nous présentons une méthodologie de diagnostic à base de réseau bayésien, intégrant d'une part, la méthode de conception du modèle et d'autre part, deux algorithmes de diagnostic : le premier permet le calcul des diagnostics les plus probables pour un système défaillant, le deuxième fournit rapidement des représentants des classes de diagnostic et révèle les cas où des observations supplémentaires sont nécessaires. Nous présentons les résultats de ces algorithmes en terme de temps de calculs et qualité des résultats pour des systèmes numériques de différentes tailles
Model Based Diagnosis approach revolutionizes the field of the diagnosis as overcoming the lack of knowledge by using Model. Our research focuses on the task of multiple diagnosis, from failure observations, for complex and highly-reliable large systems. We take the advantages of the Bayesian networks models to improve the diagnosis of this type of systems. These models integrate the components failures prior probabilities, and allow estimating posterior probabilities of diagnoses, by an approached calculation. We present a methodology of diagnosis using Bayesian network. Our approach integrates a model design method, in addition to two diagnosis algorithms : the first algorithm allows calculating the most probable diagnoses for a failing system; the second provides quickly representatives of the diagnosis classes, it reveals also the cases while additional observations are necessary. Finally we test these algorithms in terms of computing time and results quality for digital circuits of various sizes
APA, Harvard, Vancouver, ISO, and other styles
32

Wuillemin, Pierre-Henri. "Améliorations et implémentations d'algorithmes de propagation dans les réseaux bayésiens." Paris 6, 2000. http://www.theses.fr/2000PA066574.

Full text
APA, Harvard, Vancouver, ISO, and other styles
33

Delaplace, Alain. "Approche évolutionnaire de l'apprentissage de structure pour les réseaux bayésiens." Tours, 2007. http://www.theses.fr/2007TOUR4022.

Full text
Abstract:
Dans ce travail de thèse, nous proposons d'étudier le problème de l'apprentissage de la structure d'un réseau bayésien par un ensemble de méthodes évolutionnaires. Après avoir conçu un algorithme génétique parcourant l'espace des structures, nous avons élaboré différentes techniques visant à améliorer les performances de cet algorithme. Nous avons ainsi développé une stratégie de parcours visant à exploiter les propriétés de l'espace des graphes essentiels à travers un mécanisme de niching séquentiel, mécanisme que nous étendons par une hybridation avec une modélisation en îlots. Une autre méthode définit une distribution de probabilités sur les opérations de mutation appliquées à la population, déterminée par la qualité des individus modifiés
In this thesis, we propose a study of the problem of learning the structure of a bayesian network through the use of evolutionary methods. We first designed a genetic algorithm to search the space of structures before establishing various strategies aiming at improving the performances of this algorithm. We consequently developed a search strategy aiming at exploiting the properties of the space of completed partially oriented graphs using a sequential niching principle which we later hybridized with an island model scheme. Another method defines a distribution probability over the mutation operations which are applied to the individuals and that is a function of the qualitative results of previously applied operations
APA, Harvard, Vancouver, ISO, and other styles
34

Voegtlin, Thomas. "Réseaux de neurones et auto-référence." Lyon 2, 2002. http://theses.univ-lyon2.fr/documents/lyon2/2002/voegtlin_t.

Full text
Abstract:
Le sujet de cette thèse est l'étude d'une classe d'algorithmes d'apprentissage non supervisés pour réseaux de neurones récurrents. Dans la 1ere partie (chap. 1 à 4), je présente plusieurs algorithmes, basés sur un même principe d'apprentissage : l'auto-référence. L'apprentissage auto-référent n'implique pas l'optimisation d'un critère objectif (comme une fonction d'erreur), mais il fait intervenir une fonction subjective, qui dépend de ce que le réseau a déjà appris. Un exemple de réseau supervisé basé sur ce principe est le Simple Recurrent Netword d'Elman (1990). Dans ce cas, l'auto-référence est appliquée à l'algorithme de rétro-propagation du gradient. Sur ce point, le réseau d'Elman diffère des autres méthodes de rétro-propagation pour réseaux récurrents, qui font intervenir un gradient objectif (Back-propagation Through Time, Real-Time Recurrent learning). Je montr que l'auto-référence peut être utilisée avec les principales techniques d'apprentissage non supervisé : Cartes de Kohonen, Analyse en composantes principales, Analyse en composantes indépendantes. Ces techniques sont classiquement utilisées pour représenter des données statiques. L'auto-référence permet de les généraliser à des séries temporelles, et de définir des algorithmes d'apprentissage nouveaux
The purpose of this thesis is to present a class of unsupervised learning algorithms for recurrent networks. In the first part (chapters 1 to 4), I propose a new approach to this question, based on a simple principle: self-reference. A self-referent algorithm is not based on the minimization of an objective criterion, such as an error function, but on a subjective function, that depends on what the network has previously learned. An example of a supervised recurrent network where learning is self-referent is the Simple Recurrent Network (SRN) by Elman (1990). In the SRN, self-reference is applied to the supervised error back-propagation algorithm. In this aspect, the SRN differs from other generalizations of back-propagation to recurrent networks, that use an objective criterion, such as Back-Propagation Through Time, or Real-Time Recurrent Learning. In this thesis, I show that self-reference can be combined with several well-known unsupervised learning methods: the Self-Organizing Map (SOM), Principal Components Analysis (PCA), and Independent Components Analysis (ICA). These techniques are classically used to represent static data. Self-reference allows one to generalize these techniques to time series, and to define unsupervised learning algorithms for recurrent networks
APA, Harvard, Vancouver, ISO, and other styles
35

Teytaud, Olivier. "Apprentissage, réseaux de neurones et applications." Lyon 2, 2001. http://theses.univ-lyon2.fr/documents/lyon2/2001/teytaud_o.

Full text
Abstract:
Les fondements théoriques de l'apprentissage sont en grande partie posés. Comme la calculabilité est venue à maturité en s'orientant vers la complexité, l'apprentissage mûrit face à des résultats négatifs forts qui rendent sans espoir la quête d'algorithmes universels, efficaces pour toute donnée. Vraisemblablement les grandes avancées à venir seront (a) soit dans des domaines connexes où l'étude théorique a moins été poussée, (b) soit moins philosophiques et plus concrètes (théorique à préoccupations algorithmiques, représentation de données structurées, implémentation physique, modularité), soit enfin (c) dans la modélisation biologique. Cette thèse résume (et essaie modestement de compléter) les avancées théoriques statistiques, des points de vue successifs des cas où l'apprentissage est difficile (i. E. , où l'on sort du cadre iid sans bruit avec a priori de VC-dimension finie), des utilisations non-standards de la VC-théorie (non-supervisé, extraction de règles : c'est le (a) ci-dessus), puis du passage au concret avec le passage aux préoccupations algorithmiques (validité des approximations dans les Supports Vector Machines, efficacité des algorithmes de Gibbs quoique l'étude soit très incomplète, plus proches voisins rapides d'un point de vue expérimental représentation de données structurées images ou textes - tout cela est le (b)) et la modélisation biologique (c)
APA, Harvard, Vancouver, ISO, and other styles
36

Côté, Marc-Alexandre. "Réseaux de neurones génératifs avec structure." Thèse, Université de Sherbrooke, 2017. http://hdl.handle.net/11143/10489.

Full text
Abstract:
Cette thèse porte sur les modèles génératifs en apprentissage automatique. Deux nouveaux modèles basés sur les réseaux de neurones y sont proposés. Le premier modèle possède une représentation interne où une certaine structure a été imposée afin d’ordonner les caractéristiques apprises. Le deuxième modèle parvient à exploiter la structure topologique des données observées, et d’en tenir compte lors de la phase générative. Cette thèse présente également une des premières applications de l’apprentissage automatique au problème de la tractographie du cerveau. Pour ce faire, un réseau de neurones récurrent est appliqué à des données de diffusion afin d’obtenir une représentation des fibres de la matière blanche sous forme de séquences de points en trois dimensions.
APA, Harvard, Vancouver, ISO, and other styles
37

Saad, Ali. "Detection of Freezing of Gait in Parkinson's disease." Thesis, Le Havre, 2016. http://www.theses.fr/2016LEHA0029/document.

Full text
Abstract:
Le risque de chute provoqué par le phénomène épisodique de ‘Freeze of Gait’ (FoG) est un symptôme commun de la maladie de Parkinson. Cette étude concerne la détection et le diagnostic des épisodes de FoG à l'aide d'un prototype multi-capteurs. La première contribution est l'introduction de nouveaux capteurs (télémètres et goniomètres) dans le dispositif de mesure pour la détection des épisodes de FoG. Nous montrons que l'information supplémentaire obtenue avec ces capteurs améliore les performances de la détection. La seconde contribution met œuvre un algorithme de détection basé sur des réseaux de neurones gaussiens. Les performance de cet algorithme sont discutées et comparées à l'état de l'art. La troisième contribution est développement d'une approche de modélisation probabiliste basée sur les réseaux bayésiens pour diagnostiquer le changement du comportement de marche des patients avant, pendant et après un épisode de FoG. La dernière contribution est l'utilisation de réseaux bayésiens arborescents pour construire un modèle global qui lie plusieurs symptômes de la maladie de Parkinson : les épisodes de FoG, la déformation de l'écriture et de la parole. Pour tester et valider cette étude, des données cliniques ont été obtenues pour des patients atteints de Parkinson. Les performances en détection, classification et diagnostic sont soigneusement étudiées et évaluées
Freezing of Gait (FoG) is an episodic phenomenon that is a common symptom of Parkinson's disease (PD). This research is headed toward implementing a detection, diagnosis and correction system that prevents FoG episodes using a multi-sensor device. This particular study aims to detect/diagnose FoG using different machine learning approaches. In this study we validate the choice of integrating multiple sensors to detect FoG with better performance. Our first level of contribution is introducing new types of sensors for the detection of FoG (telemeter and goniometer). An advantage in our work is that due to the inconsistency of FoG events, the extracted features from all sensors are combined using the Principal Component Analysis technique. The second level of contribution is implementing a new detection algorithm in the field of FoG detection, which is the Gaussian Neural Network algorithm. The third level of contribution is developing a probabilistic modeling approach based on Bayesian Belief Networks that is able to diagnosis the behavioral walking change of patients before, during and after a freezing event. Our final level of contribution is utilizing tree-structured Bayesian Networks to build a global model that links and diagnoses multiple Parkinson's disease symptoms such as FoG, handwriting, and speech. To achieve our goals, clinical data are acquired from patients diagnosed with PD. The acquired data are subjected to effective time and frequency feature extraction then introduced to the different detection/diagnosis approaches. The used detection methods are able to detect 100% of the present appearances of FoG episodes. The classification performances of our approaches are studied thoroughly and the accuracy of all methodologies is considered carefully and evaluated
APA, Harvard, Vancouver, ISO, and other styles
38

Auliac, Cédric. "Approches évolutionnaires pour la reconstruction de réseaux de régulation génétique par apprentissage de réseaux bayésiens." Phd thesis, Université d'Evry-Val d'Essonne, 2008. http://tel.archives-ouvertes.fr/tel-00421388.

Full text
Abstract:
De nombreuses fonctions cellulaires sont réalisées grâce à l'interaction coordonnée de plusieurs gènes. Identifier le graphe de ces interactions, appelé réseau de régulation génétique, à partir de données d'expression de gènes est l'un des objectifs majeurs de la biologie des systèmes. Dans cette thèse, nous abordons ce problème en choisissant de modéliser les relations entre gènes par un réseau bayésien. Se pose alors la question de l'apprentissage de la structure de ce type de modèle à partir de données qui sont en général peu nombreuses. Pour résoudre ce problème, nous recherchons parmi tous les modèles possibles le modèle le plus simple, expliquant le mieux les données. Pour cela, nous introduisons et étudions différents types d'algorithmes génétiques permettant d'explorer l'espace des modèles. Nous nous intéressons plus particulièrement aux méthodes de spéciation. ces dernières, en favorisant la diversité des solutions candidates considérées, empêchent l'algorithme de converger trop rapidement vers des optima locaux. Ces algorithmes génétiques sont comparés avec différentes méthodes d'apprentissage de structure de réseaux bayésiens, classiquement utilisées dans la littérature. Nous mettons ainsi en avant la pertinence des approches evolutionnaires pour l'apprentissage de ces graphes d'interactions. Enfin, nous les comparons à une classe alternative d'algorithmes évolutionnaires qui s'avère particulièrement prometteuse : les algorithmes à estimation de distribution. Tous ces algorithmes sont testés et comparés sur un modèle du réseau de régulation de l'insuline de 35 noeuds dont nous tirons des jeux de données synthétiques de taille modeste.
APA, Harvard, Vancouver, ISO, and other styles
39

Jodouin, Jean-François. "Réseaux de neurones et traitement du langage naturel : étude des réseaux de neurones récurrents et de leurs représentations." Paris 11, 1993. http://www.theses.fr/1993PA112079.

Full text
Abstract:
Le but de ce travail a été d'évaluer les possibilités d'application des réseaux connexionnistes aux taches de haut niveau comme le traitement du langage naturel (tln). Un travail de réflexion a permis de cerner les types de réseaux et les techniques de représentation propices à ce domaine d'application. Deux réseaux de la classe des réseaux récurrents à couches ont été sélectionnés pour des études approfondies: le simple récurrent network et le time-unfolding network (tun). Le perceptron multicouches a servi d'étalon. Un domaine d'application mettant à l'épreuve la mémoire et les capacités de représentation des réseaux a aussi été choisi: la prédiction de séquences non déterministes. Un outil de simulation graphique, Baptise Simon, a été crée pour l'étude. Le travail empirique a consisté en trois séries d'expériences qui ont pour but d'étudier les capacités de réseaux dans des conditions se rapprochant progressivement du traitement d'énoncés réels. Cette étude a été approfondie par l'analyse des représentations développées par les réseaux durant leur traitement. Cette recherche semble montrer que les réseaux récurrents ont le potentiel de développer des représentations complexes, ce qui leur permet de traiter de façon efficace les taches qui leur ont été données. En particulier, les performances des tuns dépassent, dans le meilleur des cas, celles de nos meilleurs outils de comparaison. En conclusion, les réseaux récurrents à couches ont une utilité immédiate à la frontière entre la parole (ou l'information est généralement bruitée et incomplète) et le langage (ou les représentations symboliques pures supportent mal ce type d'imprécision). De plus, si un important travail de recherche reste encore à faire, les résultats obtenus permettent d'espérer l'application future de ces réseaux à des taches plus évoluées du tln
APA, Harvard, Vancouver, ISO, and other styles
40

Lasserre, Marvin. "Apprentissages dans les réseaux bayésiens à base de copules non-paramétriques." Electronic Thesis or Diss., Sorbonne université, 2022. http://www.theses.fr/2022SORUS029.

Full text
Abstract:
La modélisation de distributions continues multivariées est une tâche d'un intérêt central en statistiques et en apprentissage automatique avec de nombreuses applications en sciences et en ingénierie. Cependant, les distributions de grandes dimensions sont difficiles à manipuler et peuvent conduire à des calculs coûteux en temps et en ressources. Les réseaux bayésiens de copules (CBNs) tirent parti à la fois des réseaux bayésiens (BNs) et de la théorie des copules pour représenter de manière compacte de telles distributions multivariées. Les réseaux bayésiens s'appuient sur les indépendances conditionnelles afin de réduire la complexité du problème, tandis que les fonctions copules permettent de modéliser les relations de dépendance entre les variables aléatoires. L'objectif de cette thèse est de donner un cadre commun aux deux domaines et de proposer de nouveaux algorithmes d'apprentissage pour les réseaux bayésiens de copules. Pour ce faire, nous utilisons le fait que les CBNs possèdent le même langage graphique que les BNs ce qui nous permet d'adapter leurs méthodes d'apprentissage à ce modèle. De plus, en utilisant la copule empirique de Bernstein à la fois pour concevoir des tests d'indépendance conditionnelle et pour estimer les copules, nous évitons de faire des hypothèses paramétriques, ce qui donne une plus grande généralité à nos méthodes
Modeling multivariate continuous distributions is a task of central interest in statistics and machine learning with many applications in science and engineering. However, high-dimensional distributions are difficult to handle and can lead to intractable computations. The Copula Bayesian Networks (CBNs) take advantage of both Bayesian networks (BNs) and copula theory to compactly represent such multivariate distributions. Bayesian networks rely on conditional independences in order to reduce the complexity of the problem, while copula functions allow to model the dependence relation between random variables. The goal of this thesis is to give a common framework to both domains and to propose new learning algorithms for copula Bayesian networks. To do so, we use the fact that CBNs have the same graphical language as BNs which allows us to adapt their learning methods to this model. Moreover, using the empirical Bernstein copula both to design conditional independence tests and to estimate copulas from data, we avoid making parametric assumptions, which gives greater generality to our methods
APA, Harvard, Vancouver, ISO, and other styles
41

Brette, Romain. "Modèles Impulsionnels de Réseaux de Neurones Biologiques." Phd thesis, Université Pierre et Marie Curie - Paris VI, 2003. http://tel.archives-ouvertes.fr/tel-00005340.

Full text
Abstract:
Les neurosciences computationnelles sont traditionnellement dominées par la conception selon laquelle les neurones codent l'information à travers leur fréquence de décharge. Récemment, les observations expérimentales de synchronisation neuronale ont motivé un renouveau du point de vue impulsionnel, selon lequel la structure temporelle des décharges est pertinente. Les modèles impulsionnels étant moins bien compris que leurs homologues fréquentiels, nous commençons par établir des résultats théoriques généraux, qui nous permettent en particulier de montrer que les modèles impulsionnels répondent de manière reproductible aux stimulations variables apériodiques. Cette propriété nous permet de construire un modèle de sélectivité à l'orientation dans le cortex visuel, le perceptron impulsionnel, qui, en détectant une propriété géométrique de l'image plutôt que l'adéquation entre l'image et un patron, permet d'obtenir avec une architecture feedforward une invariance naturelle au contraste.
APA, Harvard, Vancouver, ISO, and other styles
42

Tardif, Patrice. "Autostructuration des réseaux de neurones avec retards." Thesis, Université Laval, 2007. http://www.theses.ulaval.ca/2007/24240/24240.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
43

Maktoobi, Sheler. "Couplage diffractif pour réseaux de neurones optiques." Thesis, Bourgogne Franche-Comté, 2020. http://www.theses.fr/2020UBFCD019.

Full text
Abstract:
Les réseaux photoniques à haute performance peuvent être considérés comme des supports pour les futurs systèmes de calcul. Contrairement à l'électronique, les systèmes photoniques offrent des avantages intéressants, par exemple la possibilité de réaliser des réseaux complètement parallèles. Récemment, les réseaux de neurones ont attiré l'attention de la communauté photonique. L'une des difficultés les plus importantes, en matière de réseaux photoniques parallèles à grande échelle, est la réalisation des connexions. La diffraction est exploitée ici comme méthode pour traiter les connexions entre les nœuds (couplage) dans les réseaux de neurones optiques. Dans cette thèse, nous étudions l'extensibilité d'un couplage diffractif en détails de la façon suivante :Tout d'abord, nous commençons par une introduction générale à propos de l'intelligence artificielle, de l'apprentissage machine, des réseaux de neurones artificiels et des réseaux de neurones photoniques. Lors de la conception d'un réseau neuronal fonctionnel, les règles de l'apprentissage machine sont des éléments essentiels pour optimiser une configuration et ainsi obtenir une faible erreur du système, donc les règles de l'apprentissage sont introduites (chapitre 1). Nous étudions les concepts fondamentaux du couplage diffractif dans notre réservoir spatio-temporel. Dans ce cas, la théorie de la diffraction est expliquée. Nous utilisons un schéma analytique pour fournir les limites en termes de taille des réseaux diffractifs, qui font partie intégrante de notre réseau neuronal photonique (chapitre 2). Les concepts du couplage diffractif sont étudiés expérimentalement dans deux expériences différentes afin de confirmer les limites obtenues analytiquement, et pour déterminer le nombre maximum de nœuds pouvant être couplés dans le réseau photonique (Chapitre 3). Les simulations numériques d'une telle expérience sont basées sur deux schémas différents pour calculer numériquement la taille maximale du réseau, qui approche une surface de 100 mm2 (chapitre 4). Enfin, l'ensemble du réseau neuronal photonique est démontré. Nous concevons un réservoir spatialement étendu sur 900 nœuds. En conséquence, notre système généralise la prédiction pour la séquence chaotique de Mackey-Glass (chapitre 5)
Photonic networks with high performance can be considered as substrates for future computing systems. In comparison with electronics, photonic systems have substantial privileges, for instance the possibility of a fully parallel implementation of networks. Recently, neural networks have moved into the center of attention of the photonic community. One of the most important requirements for parallel large-scale photonic networks is to realize the connectivities. Diffraction is considered as a method to process the connections between the nodes (coupling) in optical neural networks. In the current thesis, we evaluate the scalability of a diffractive coupling in more details as follow:First, we begin with a general introductions for artificial intelligence, machine learning, artificial neural network and photonic neural networks. To establish a working neural network, learning rules are an essential part to optimize a configuration for obtaining a low error from the system, hence learning rules are introduced (Chapter 1). We investigate the fundamental concepts of diffractive coupling in our spatio-temporal reservoir. In that case, theory of diffraction is explained. We use an analytical scheme to provide the limits for the size of diffractive networks which is a part of our photonic neural network (Chapter 2). The concepts of diffractive coupling are investigated experimentally by two different experiments to confirm the analytical limits and to obtain maximum number of nodes which can be coupled in the photonic network (Chapter 3). Numerical simulations for such an experimental setup is modeled in two different schemes to obtain the maximum size of network numerically, which approaches a surface of 100 mm2 (Chapter 4). Finally, the complete photonic neural network is demonstrated. We design a spatially extended reservoir for 900 nodes. Consequently, our system generalizes the prediction for the chaotic Mackey–Glass sequence (Chapter 5)
APA, Harvard, Vancouver, ISO, and other styles
44

Ouali, Jamel. "Architecture intégrée flexible pour réseaux de neurones." Grenoble INPG, 1991. http://www.theses.fr/1991INPG0035.

Full text
Abstract:
Ayant rappelé brièvement quelques réalisations matérielles de réseaux de neurones artificiels dans un premier chapitre cette thèse propose une architecture distribuée, synchrone fondée sur l'existence d'un processeur neurone autonome. Ce processeur pourra être personnalise suivant les caractéristiques du réseaux de neurones a implanter et pourra être connecte a d'autres neurones pour former un réseau de structure et de dimension fixées. Ce neurone se présente comme un circuit dédié fabrique dans un temps court dans un environnement du type compilateur de silicium. Un tel neurone a été conçu et fabrique et s'est avéré complètement opérationnel. Il implémenté sous sa version fabrique uniquement la phase de relaxation. Dans un troisième chapitre, on montre que sans modification de l'architecture, on peut inclure des possibilités d'apprentissage. Pour ceci un algorithme d'apprentissage par la rétropropagation du gradient a été propose et étudié et on montre son implantation sur le réseau de neurones propose en précisant l'adjonction dans la partie de contrôle du neurone a implanter. Enfin, dans un dernier chapitre, nous explorons la possibilité de réaliser de très grands circuits ce qui serait très judicieux pour faire face a la taille des réseaux de neurones requise pour les applications. Pour ceci, nous explorons les possibilités d'intégration tranche entière. En effet, il existe une tolérance aux fautes intrinsèques au calcul neuronal et de plus l'implantation physique régulière doit permettre d'isoler et d'exclure les neurones défaillants. Les possibilités d'implantation physique d'une architecture tranche entière sont donc présentées dans ce chapitre
APA, Harvard, Vancouver, ISO, and other styles
45

Cheung-Mon-Chan, Pascal. "Réseaux bayésiens et filtres particulaires pour l'égalisation adaptative et le décodage conjoints." Phd thesis, Télécom ParisTech, 2003. http://pastel.archives-ouvertes.fr/pastel-00000732.

Full text
Abstract:
Cette thèse s'intéresse aux réseaux bayésiens, aux filtres particulaires et à leur application aux communications numériques. Tout d'abord, nous donnons une construction rigoureuse et très générale des réseaux bayésiens et nous présentons l'algorithme de propagation de croyance dans ce contexte. Puis, nous introduisons un nouveau type de filtre particulaire, appelé "filtre particulaire à échantillonnage global", et nous constatons en effectuant des simulations numériques que ce nouvel algorithme se compare favorablement à l'état de l'art. Nous utilisons ensuite le filtrage particulaire pour calculer de façon approchée certains messages de l'algorithme de propagation de croyance. Nous obtenons ainsi un nouvel algorithme, combinant propagation de croyance et filtrage particulaire, que nous avons appelé "algorithme de turbo-filtrage particulaire». Enfin, nous utilisons ces différentes techniques afin de concevoir de façon méthodique un récepteur de communications numériques.
APA, Harvard, Vancouver, ISO, and other styles
46

Tian, Simiao. "Prédiction de la composition corporelle par modélisation locale et les réseaux bayésiens." Thesis, Paris, AgroParisTech, 2013. http://www.theses.fr/2013AGPT0068/document.

Full text
Abstract:
La composition corporelle est importante pour évaluer l'état de santé et le statut nutritionnel d'individus. Le surpoids et l'obésité deviennent des problèmes de santé à l'échelle mondiale. L'accroissement de la masse grasse, notamment celle du tronc, a été associée à une augmentation du risque de maladies métaboliques, telles que le diabète de type 2 et les maladies cardiovasculaires. La masse musculaire, en particulier appendiculaire, est également un indice de santé, et est liée au taux de mortalité. En outre, le vieillissement s'accompagne de changements importants dans la composition corporelle. La masse maigre diminue (Kyle et al., 2001) et la masse grasse augmente, liée à une accumulation de tissus adipeux, en particulier dans la région abdominale (Kuk et al., 2009). Il est donc important d'étudier ces changements en fonction de l'âge pour tenter d'établir un pré-diagnostic et aider à la prévention de la morbidité et de mortalité. La composition corporelle se mesure par différentes méthodes, telles que le pesage sous l'eau ou l'absorption bi-photonique à rayons X (DXA). Cependant, ces méthodes de mesure ne sont pas adaptées pour des populations de taille très grande, car elles nécessitent un équipement fixe, demandent des manipulations longues et sont coûteuses. En revanche, le potentiel de méthodes de prédiction statistique a été mis en évidence pour estimer la composition corporelle (Snijder et al., 2006), et plusieurs modèles ont été proposés pour prédire la composition corporelle, notamment le pourcentage de la masse grasse (BF%) (Gallagher et al.,2000a; Jackson et al., 2002; Mioche et al., 2011b). Le premier objectif de cette thèse est de développer un modèle multivarié à partir de covariables anthropométriques pour prédire simultanément les masses grasse et maigre de différents segments du corps. Pour cela, nous avons proposé une régression linéaire multivariable publiée dans le British Journal of Nutrition. Notre proposition multivariée présente deux avantages principaux. Le premier avantage consiste à utiliser les covariables très simples que sont l'âge, le poids et la taille dont la mesure est facile et peu coûteuse. L'utilité d'ajouter comme covariable le tour de taille a été évaluée. Le deuxième avantage est que l'approche multivariée prend en compte la structure de corrélation entre les variables, ce qui est utile pour certaines études d'inférence où on s'intéresse à des fonctions des variables prédites. La qualité de la précision multivariée a été évaluée par comparaison avec celle des modèles univariés déjà publiés. Nous avons montré que la prédiction multivariée est bonne et que notre approche peut donc être utilisée pour des études de risques métaboliques en grandes populations. Le second objectif de cette thèse est d'étudier l'évolution de la composition corporelle au cours du vieillissement, en tenant compte des covariables anthropométriques. Deux modélisations bayésiennes ont été retenues et développées. Un des avantages principaux de nos propositions est, grâce à une modélisation, de réaliser une analyse longitudinale à partir de données transversales. En outre, la modélisation bayésienne permet de fournir une distribution prédictive, et non pas une simple valeur prédite, ce qui permet d'explorer l'incertitude de la prédiction. Également, des résultats antérieurs ou publiés peuvent être incorporés dans la distribution priore, ce qui conduit à des conclusions plus précises. Les prédictions précédentes sont fondées sur des modèles où la structure de corrélation entre les variables est laissée libre, le troisième objectif de notre travail a été d'imposer une structure de corrélation particulière adaptée au problème. L'avantage est l'utilisation d'un sous-modèle parcimonieux du modèle multivarié précédent. Cette structure est décrite au moyen d'un réseau bayésien gaussien (GBN). [...] Suite et fin du résumé dans la thèse
The assessment of human body composition is important for evaluating health and nutritional status. Among health issues, overweight and obesity are worldwide problems. Increased fat mass, especially in the trunk location, has been associated with an increased risk of metabolic diseases, such as type 2 diabetes and cardiovascular disease. The lean body mass, especially appendicular muscle mass, is also directly related to health and particularly with the mortality rate. Also, aging is associated with substantial changes in body composition. Reduction in body lean or body fat-free mass occurs during aging (Kyle et al., 2001) together with an increase of body fat related to accumulation of adipose tissues, particularly in abdominal region (Kuk et al., 2009); therefore assessing these changes in segmental body composition may be important because the study will lead to a pre-diagnosis for the prevention of morbidity and mortality risk. Accurate measurements of body composition can be obtained from different methods, such as underwater weighing and dual-energy X-ray absorptiometry (DXA). However, their applications are not always convenient, because they require fixed equipment and they are also time consuming and expensive. As a result, they are not convenient for use as a part of routine clinical examinations or population studies. The potential uses of statistical methods for body composition assessment have been highlighted (Snijder et al., 2006), and several attempts to predict body composition, particularly body fat percentage (BF%), have been made (Gallagher et al., 2000a; Jackson et al., 2002; Mioche et al., 2011b).The first aim in this thesis was to develop a multivariate model for predicting simultaneously body, trunk and appendicular fat and lean masses from easily measured anthropometric covariables. We proposed a linear solution published in the British Journal of Nutrition. There are two main advantages in our proposed multivariate approach. The first consists in using very simple covariables, such as body weight and height, because these measurements are easy and not expensive. The usefulness of waist circumference is also investigated and combined with age, height and weight as predictor variables. The second advantage is that the multivariate approach enables to take into account the correlation structure between the responses into account, which is useful for a number of inference tasks, e.g., to give simultaneous confidence regions for all the responses together. Then the prediction accuracy of the multivariate approach is justified by comparing with that of the available univariate models that predict body fat percentage (BF%). With a good accuracy, the multivariate outcomes might then be used in studies necessitating the assessment of metabolic risk factors in large populations.The second aim in this thesis was to study age-related changes in segmental body compositions, associated with anthropometric covariables. Two Bayesian modeling methods are proposed for the exploration of age-related changes. The main advantage of these methods is to propose a surrogate for a longitudinal analysis from the cross-sectional datasets. Moreover, the Bayesian modeling enables to provide a prediction distribution, rather than a simple estimate, this is more relevant for exploring the uncertainty or accuracy problems. Also we can incorporate the previous findings in the prior distribution, by combining it with the datasets, we could obtain more suitable conclusions.The previous predictions were based on models supposing any correlation structure within the variables, the third aim in this thesis was to propose a parsimonious sub-model of the multivariable model described by a Gaussian Bayesian network (GBN), more precisely Crossed Gaussian Bayesian Networks (CGBN). Last and final summary in the thesis
APA, Harvard, Vancouver, ISO, and other styles
47

Bendou, Mohamed. "Extraction de connaissances à partir des données à l'aide des réseaux bayésiens." Paris 11, 2003. http://www.theses.fr/2003PA112053.

Full text
Abstract:
L'objectif principal de cette thèse se focalise essentiellement sur la conception de nouveaux algorithmes d'apprentissage de réseaux Bayésiens, plus précis, plus efficaces, plus robustes en présence du bruit et, donc, plus adaptés aux tâches pratiques d'ECD. Partant de l'observation que la plupart des optima locaux dans l'espace des structures de réseaux bayésiens sont directement liés à l'existence des classes d'équivalence (ensembles de structures encodant les mêmes relations d'indépendance conditionnelle, représentées par des graphes semi-orientés), nous avons concentré une partie importante de nos recherches sur l'élaboration d'une nouvelle famille d'algorithmes d'apprentissage: EQ, qui explorent directement l'espace des classes d'équivalence, ainsi que sur le développement d'une "boîte à outils" théoriques et algorithmiques pour l'analyse et le traitement des graphes semi-orientés. Nous avons pu démontrer que les gains de précision significatifs apportés par ce type d'approche peuvent être obtenus tout en conservant des temps de calcul comparables à ceux des approches classiques. Ainsi, nous avons contribué au regain d'intérêt actuel pour l'apprentissage des classes d'équivalence de réseaux bayésiens (considéré pendant longtemps comme trop complexe par la communauté scientifique). Enfin, un autre volet de nos recherches a été consacré à l'analyse des effets du bruit présent dans les données sur l'apprentissage des réseaux Bayésiens. Nous avons analysé et expliqué l'augmentation de la complexité des réseaux Bayésiens appris à partir de données bruitées et montré que, contrairement aux sur-spécialisations classiques affectant les autres classes de méthodes d'apprentissage, ce phénomène est justifié théoriquement et bénéfique pour le pouvoir prédictif des modèles appris
The main objective of this thesis basically focuses on developing a new kind of learning algorithms of Bayésiens networks, more accurate, efficient and robust in presence of the noise and, therefore, adapted to KDD tasks. Since most of local optima in the space of networks bayésiens structures are caused directly by the existence of equivalence classes (sets of structures encoding the same conditional independence relations, represented by the partially oriented graphs), we concentrated important part of our researches on the development of a new family of learning algorithms: EQ. These algorithms directly explore the space of equivalence classes. We also developed theoretical and algorithmic tools for the analysis and the treatment of partially oriented graphs. We could demonstrate that a meaningful precision gains brought by this kind of approach can be obtained in a comparable time than the classical approaches. We, thus, contributed to the present interest renewal for the learning of equivalence classes of bayesian networks (considered for a long time as too complex by the scientific community). Finally, another aspect of our research has been dedicated to the analysis of noise effects in data on the learning of the Bayesians networks. We analyzed and explained the increase of the complexity of learned Bayesian networks learned from noisy data and shown that, unlike classical over-fitting which affects other classes of learning methods, this phenomenon is theoretically justified by the alteration of the conditional independence relations between the variables and is beneficial for the predictive power of the learned models
APA, Harvard, Vancouver, ISO, and other styles
48

Bigot, Pascal. "Utilisation des réseaux de neurones pour la télégestion des réseaux techniques urbains." Lyon 1, 1995. http://www.theses.fr/1995LYO10036.

Full text
Abstract:
La telegestion des reseaux techniques urbains fait appel a des techniques de reconnaissance de formes: etant donnee une image de l'etat du reseau, determiner si il fonctionne correctement ou non. Une methode employee pour resoudre ce type de probleme fait appel aux reseaux de neurones. Nous definissons une methodologie de construction de l'architecture employee afin d'obtenir des capacites de generalisation satisfaisantes. On s'oriente vers un reseau multicouches et l'algorithme de retropropagation du gradient. Nous precisons aussi une methodologie d'elaboration des bases d'apprentissage qui tienne compte de la nature numerique des donnees utilisees et, en particulier, des sources d'incertitudes qui les caracterisent. Celles-ci sont d'ordre physique (erreurs dues a l'imprecision des mesures et a la presence de bruit) et d'ordre statistique (erreurs dues a des previsions de grandeurs non mesurables). La methode utilisee suppose que l'on peut mesurer tous les parametres necessaires a sa mise en uvre. Ce qui n'est pas le cas dans la pratique. C'est pourquoi nous explorons differentes techniques de selection des parametres mesures et nous etudions les degradations eventuelles des capacites de detection. Nous etudions ensuite un systeme de localisation geographique des anomalies qui utilise les reseaux de neurones. On en montre les limitations. Cette approche est experimentee sur un reseau de distribution d'eau potable. Nous developpons d'autre part une etude theorique sur les relations qui existent entre les fonctions calculables par un reseau de neurones et celles qui sont calculables par un arbre binaire de decision. Ceci nous conduit a des algorithmes d'apprentissage pour des reseaux de neurones dont l'architecture (le nombre de neurones par couches) est variable
APA, Harvard, Vancouver, ISO, and other styles
49

Koiran, Pascal. "Puissance de calcul des réseaux de neurones artificiels." Lyon 1, 1993. http://www.theses.fr/1993LYO19003.

Full text
Abstract:
Depuis quelques annees on s'est beaucoup interesse a la resolution de problemes d'ingenierie avec des reseaux de neurones artificiels (par exemple en reconnaissance de formes, robotique, prediction de series temporelles, optimisation. . . ). La plupart de ces travaux sont de nature empirique, et ne comportent que peu ou pas du tout d'analyse mathematique rigoureuse. Cette these se situe dans une perspective tout-a-fait differente: il s'agit d'etudier les relations entre les reseaux de neurones et les modeles de calculs classiques ou moins classiques de l'informatique theorique (automates finis, machines de turing, circuits booleens, machines de turing reelles de blum, shub et smale). Les principaux resultats sont les suivants: 1) simulation d'une machine de turing universelle par des reseaux recurrents; 2) etude generale de la puissance de calcul des systemes dynamiques definis par des iterations de fonctions, notamment en petites dimensions; 3) etude de modeles de calculs sur les nombres reels, avec application aux reseaux recurrents et acycliques. On montre que la classe des fonctions (discretes) calculables en temps polynomial est p/poly
APA, Harvard, Vancouver, ISO, and other styles
50

Graïne, Slimane. "Inférence grammaticale régulière par les réseaux de neurones." Paris 13, 1994. http://www.theses.fr/1994PA132020.

Full text
Abstract:
Dans cette thèse, nous proposons: - une méthode pour la simulation des automates finis par les réseaux de neurones (chapitre 4), - une méthode pour la reconnaissance des grammaires hors contexte et des grammaires stochastiques hors contexte par les réseaux de neurones (chapitre (5), - deux méthodes pour l'apprentissage des langages réguliers par les réseaux de neurones (chapitre 6). Les chapitres 2 et 3 présentent respectivement les réseaux de neurones et le problème de l'inférence grammaticale. Les chapitres 1 et 7 respectivement consacrés à l'introduction et à la conclusion.
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography