Se connecter

Bibliographies thématiques / Analyse de données réseaux / Thèses

Thèses sur le sujet « Analyse de données réseaux »

Pour voir les autres types de publications sur ce sujet consultez le lien suivant : Analyse de données réseaux.

Auteur : Grafiati

Publié le 25 mai 2024

Créez une référence correcte selon les styles APA, MLA, Chicago, Harvard et plusieurs autres

Choisissez une source :

Consultez les 50 meilleures thèses pour votre recherche sur le sujet « Analyse de données réseaux ».

À côté de chaque source dans la liste de références il y a un bouton « Ajouter à la bibliographie ». Cliquez sur ce bouton, et nous générerons automatiquement la référence bibliographique pour la source choisie selon votre style de citation préféré : APA, MLA, Harvard, Vancouver, Chicago, etc.

Vous pouvez aussi télécharger le texte intégral de la publication scolaire au format pdf et consulter son résumé en ligne lorsque ces informations sont inclues dans les métadonnées.

Parcourez les thèses sur diverses disciplines et organisez correctement votre bibliographie.

1

Demartines, Pierre. « Analyse de données par réseaux de neurones auto-organisés ». Grenoble INPG, 1994. http://www.theses.fr/1994INPG0129.

Texte intégral

Résumé :

Chercher a comprendre des donnees, c'est souvent chercher a trouver de l'information cachee dans un gros volume de mesures redondantes. C'est chercher des dependances, lineaires ou non, entre les variables observees pour pouvoir resumer ces dernieres par un petit nombre de parametres. Une methode classique, l'analyse en composantes principales (acp), est abondamment employee dans ce but. Malheureusement, il s'agit d'une methode exclusivement lineaire, qui est donc incapable de reveler les dependances non lineaires entre les variables. Les cartes auto-organisantes de kohonen sont des reseaux de neurones artificiels dont la fonction peut etre vue comme une extension de l'acp aux cas non-lineaires. L'espace parametrique est represente par une grille de neurones, dont al forme, generaleent carree ou rectangulaire, doit malheureusement etre choisie a priori. Cette forme est souvent inadaptee a celle de l'espace parametriue recherche. Nous liberons cette contrainte avec un nouvel algorithme, nomme vector quantization and projection (vqp), qui est une sorte de carte auto-organisante dont l'espace de sortie est continu et prend automatiquement la forme adequate. Sur le plan mathematique, vqp peut etre defini comme la recherche d'un diffeomorphisme entre l'espace brute des donnees et un espace parametrique inconnu a trouver. Plus intuitivement, il s'agit d'un depliage de la structure des donnees vers un espace de plus petite dimension. Cette dimension, qui correspond au nombre de degres de liberte du phenomene etudie, peut etre determinee par des methodes d'analyse fractale du nuage de donnees. Afin d'illustrer la generalite de l'approche vqp, nous donnons une serie d'exemples d'applications, simulees ou reelles, dans des domaines varies qui vont de la fusion de donnees a l'appariement de graphes, en passant par l'analyse ou la surveillance de procedes industriels, la detection de defauts dans des machines ou le routage adaptatif en telecommunications

Styles APA, Harvard, Vancouver, ISO, etc.

2

Chautard, Émilie. « Construction et analyse de réseaux d’interactions extracellulaires ». Thesis, Lyon 1, 2010. http://www.theses.fr/2010LYO10161.

Texte intégral

Résumé :

La matrice extracellulaire est constituée d'un réseau tridimensionnel de protéines et de polysaccharides complexes, les glycosaminoglycanes. Elle apporte un support structural aux tissus et aux cellules dont elle est capable de moduler la prolifération, la migration et la différenciation. Nous avons créé une base de données d'interactions extracellulaires protéine-protéine et protéine-glycosaminoglycane, MatrixDB, qui est disponible sur le Web (http://matrixdb.ibcp.fr). Nous avons intégré des données expérimentales, des données issues de l’analyse de la littérature et des données issues de bases de données d'interactions publiquement disponibles. Nous avons respecté les standards de curation et d’échange de données du consortium IMEx dont fait partie MatrixDB. MatrixDB permet la construction et la visualisation de l'interactome extracellulaire entier et de plusieurs types de réseaux d'interactions, spécifiques d'une molécule, d'un tissu, d'une pathologie ou d'un processus biologique. Nous avons ainsi caractérisé le réseau d’interactions extracellulaire associé au vieillissement et mis en évidence le rôle important des glycosaminoglycanes et du calcium dans ce réseau. Nous avons construit le réseau d'interactions d'une matricryptine anti-angiogénique et anti-tumorale, l'endostatine, qui est issue du collagène XVIII. Les analyses structurales et fonctionnelles de ce réseau ont montré que les partenaires de l’endostatine sont majoritairement impliqués dans l’adhésion cellulaire et que les domaines EGF (Epidermal Growth Factor) sont surreprésentés. Cette propriété nous a permis d'identifier expérimentalement d'autres partenaires de l'endostatine possédant un ou plusieurs domaines EGF et de nouvelles fonctions de l’endostatine. Nous avons modélisé les complexes formés par l'endostatine avec deux de ses partenaires pour identifier les sites d'interactions. Ces prédictions, associées aux données expérimentales, ont permis de déterminer des interactions susceptibles d'être établies simultanément par l'endostatine. L'intégration de ces données et des paramètres cinétiques et d'affinité dans le réseau d'interactions de l'endostatine sera utilisée pour proposer un modèle de son mécanisme d'action qui reste mal connu
The extracellular matrix is composed of a tridimensional network of proteins and complex polysaccharides called glycosaminoglycans. It provides a structural support to tissues and modulates cell proliferation, migration and differenciation. We have created a database of protein-protein and proteinglycosaminoglycan extracellular interactions, MatrixDB (http://matrixdb.ibcp.fr). We have integrated experimental data, data issued of the literature curation and data from interaction databases publicly available. We have respected the curation and exchange standards of the IMEx consortium that includes MatrixDB. MatrixDB allows the construction and the visualization of the entire extracellular network and other types of interaction networks specific of a molecule, a tissue, a disease or a biological process. We have characterized the aging-related extracellular interaction network and underlined the important role of glycosaminoglycans and calcium in this network. We have constructed the interaction network of an antitumoral and anti-angiogenic matricryptin, endostatin, issued from collagen XVIII. Functional and structural analysis of their network showed that partners of endostatin are mostly involved in cell adhesion and that EGF domains are overrepresented. This has allowed us to to identify experimentally other partners of endostatin possessing one or more EGF domains and to propose new functions of endostatin. We have modelled complexes formed by endostatin with two of its partners to identify the binding sites.These predictions, associated with experimental data, allowed us to determine interactions able to be established simultaneously by endostatin. Integration of these data and of kinetics and affinity parameters in the interaction network of endostatin will be used to build a model of its mechanism of action that is not fully elucidated

Styles APA, Harvard, Vancouver, ISO, etc.

3

Cougoul, Arnaud. « Analyse statistique de réseaux d'associations entre espèces microbiennes à partir de données métagénomiques ». Thesis, Université Clermont Auvergne‎ (2017-2020), 2019. http://www.theses.fr/2019CLFAC103.

Texte intégral

Résumé :

Le séquençage haut débit révèle une nouvelle écologie des microorganismes. Ils sont présents partout et leurs fonctions sont primordiales pour leurs écosystèmes hôtes, organismes ou environnements. La métagénomique permet notamment d'estimer la composition et l'abondance des espèces microbiennes d'un ensemble d'échantillons de même type de communautés microbiennes. Lors d'études cherchant à comprendre la diversité et la structure de telles communautés, des approches réseaux permettent d'identifier des associations statistiques entre microbes, en faisant l'hypothèse que ces associations statistiques reflètent les interactions biologiques. Dans ce contexte, le sujet de ma thèse était de mieux cerner le potentiel des approches réseaux dans la détection d'associations entre OTUs au sein de données métagénomiques et de développer les outils nécessaires pour améliorer l'analyse des jeux de données. Dans un premier temps, j'ai étudié les pratiques et les outils d'analyse utilisables pour inférer des réseaux d'associations au sein de métagénomes. Compte-tenu des propriétés des données métagénomiques, j'ai déterminé leur efficacité et leurs limites. Ces travaux m'ont permis de déterminer des pistes pour améliorer l'étude des associations microbiennes. Sur la base des connaissances accumulées, j'ai développé un package d'analyse des associations entre OTUs (nommé MAGMA) visant à inférer les associations pertinentes au sein de métagénomes. MAGMA prend en compte les spécificités des données métagénomiques et offre la possibilité de prendre en compte l'effet d'un facteur structurant sur la distribution des OTUs avant de rechercher les associations entre microbes. Par le biais de participations dans différents projets de métagénomique, j'ai confirmé la pertinence de l'outil développé et identifié des pistes d'améliorations permettant de faire face aux problématiques biologiques actuelles
High throughput sequencing reveals a new ecology of microorganisms. They are everywhere and their functions are essential for their host ecosystems, organisms or environments. Metagenomics makes it possible to estimate the composition and abundance of microbial species from a set of samples of the same type of microbial communities. In the studies that seek to understand the diversity and structure of such communities, network approaches can identify statistical associations between microbes, assuming that these statistical associations reflect biological interactions. In this context, the subject of my thesis was to better understand the potential of network approaches in the detection of associations between OTUs within metagenomic data and to develop the necessary tools to improve the analysis of datasets. As a first step, I studied the practices and analysis tools that can be used to infer association networks within metagenomes. Given the properties of metagenomic data, I determined their effectiveness and their limits. This work allowed me to identify ways to improve the study of microbial associations. Based on the accumulated knowledge, I developed an association analysis package between OTUs (named MAGMA) to infer relevant associations within metagenomes. MAGMA takes into account the specificities of metagenomic data and offers the possibility to take into account the effect of a structuring factor on the distribution of OTUs before looking for associations between microbes. Through participations in different metagenomics projects, I confirmed the relevance of the tool developed and identified ways of improving the current biological issues

Styles APA, Harvard, Vancouver, ISO, etc.

4

Jourdan, Fabien. « Visualisation d'information : dessin, indices structuraux et navigation : Applications aux réseaux biologiques et aux réseaux sociaux ». Montpellier 2, 2004. http://www.theses.fr/2004MON20205.

Texte intégral

Styles APA, Harvard, Vancouver, ISO, etc.

5

Charbey, Raphaël. « Sociabilités en ligne, usages et réseaux ». Thesis, Paris, ENST, 2018. http://www.theses.fr/2018ENST0049/document.

Texte intégral

Résumé :

Avec l’avènement du numérique, il est désormais possible aux chercheurs d’amasser des grandes quantités de données et les plateformes de réseaux sociaux en ligne ne font pas exception à cela. Les sociologues, comme d’autres, se sont emparés de ces nouvelles ressources afin de poursuivre leurs enquêtes sur les modalités de l’interaction entre individus et leur impact sur la structuration de la sociabilité. Suivant cette voie, ce travail de thèse vise à l’analyse d’un grand nombre de comptes Facebook, aussi bien au travers des outils classiques de l’analyse de données que de la théorie des graphes, à laquelle des contributions méthodologiques sont apportées. Deux facteurs principaux encouragent l’étude de l’activité et de la sociabilité en ligne. D’une part, le temps important dédié à cette plateforme par de nombreux internautes justifie l’intérêt porté par les sociologues aux échanges qui s’y construisent. Par ailleurs, et contrairement à ce que l’on peut observer sur d’autre sites de réseaux sociaux en ligne, les liens entre individus sur Facebook sont proches de ceux hors-lignes. Dans un premier temps, la thèse s’évertue à démêler les multiples facettes de ce à quoi ”être sur Facebook” correspond. Distribués autour de pratiques normatives fabulées, les usages de nos enquêtés fluctuent au gré de leur appropriation ou non des composantes de l’importante variété de moyens de communication proposés par la plateforme. Ces usages, comme on le verra, sont ainsi différemment adoptés selon les catégories socioprofessionnelles et influent par ailleurs sur les modalités d’échanges et d’interactions des enquêtés avec leurs amis en ligne. Ces modalités sont également explorées dans ce travail, tout comme le rôle du conjoint et sa place dans la structure relationnelle. La seconde partie de la thèse se propose de construire une typologie de ces structures relationnelles dites égocentrées, c’est-à-dire depuis le point de vue de l’enquêté. Cette typologie des réseaux de sociabilité en ligne se base sur l’énumération de leurs sous-graphes induits, les graphlets, initialement développée par des chercheurs en bioinformatique. Cette approche offre une vision méso (entre micro et macro) des réseaux, propice à souligner des phénomènes inédits de sociologie des réseaux. A fort potentiel pluri-disciplinaire, la méthodologie graphlets elle même est également discutée et explorée
With the digital advent, it is now possible for researchers to collect important amounts of data and online social network platforms are surely part of it. Sociologists, among others, seized those new resources to investigate over interaction modalities between individuals as well as their impact on the structure of sociability. Following this lead, this thesis work aims at analyzing a large number of Facebook accounts, through data analysis and graph theory classical tools, and to bring methodological contributions. Two main factors encourage to study Facebook social activities. On one hand, the importance of time spent on this platform by many Internet users justifies by itself the sociologists interest. On the other, and contrarily to what we observe on other social network websites, ties between individuals are similar to the ones that appear offline. First, the thesis proposes to detangle the multiple meanings that are behind the fact of ”being on Facebook”. The uses of our surveyed are not compacted in fantasized normative practices but vary depending on how they appropriate the different composers of the platform tools. These uses, as we will see it, do not concern all the socioprofessional categories in the same way and they also influence how the respondents interact with their online friends. The manuscript also explores these interactions, as well as the lover role into the relational structure. Second part of the thesis builds a typology of these relational structures. They are said as egocentred, which means that they are taken from the perspective of the respondent. This typology of social networks is based on their graphlet counts, that are the number of times each type of subnetwork appear in them. This approach offers a meso perspective (between micro and macro), that is propitious to underline some new social phenomena. With a high pluri-disciplinary potential, the graphlet methodology is also discussed and explored itself

Styles APA, Harvard, Vancouver, ISO, etc.

6

Kamal-Idrissi, Assia. « Optimisation des réseaux aériens : analyse et sélection de nouveaux marchés ». Thesis, Université Côte d'Azur, 2020. https://tel.archives-ouvertes.fr/tel-03177526.

Texte intégral

Résumé :

Les problèmes rencontrés dans l’industrie aérienne sont divers et compliqués. Leur résolution réduit les coûts et maximise les revenus tout en améliorant la qualité de service, par exemple, en capturant de nouveaux passagers sur des vols existants ou sur de nouveaux marchés. La sélection des nouveaux marchés permet de définir la structure du réseau à opérer, et d’estimer le flux des passagers, leurs choix d’itinéraires ainsi que les revenus et les coûts impliqués par ces décisions. Nos travaux concernent l’amélioration du calculateur de parts de marché dans l’application PlanetOptim de la startup Milanamos. Cet outil permet aux décideurs des aéroports et des compagnies aériennes d’analyser l’historique des données et de simuler des marchés afin de trouver une opportunité économique. Ces travaux sont orientés vers les niveaux de décision stratégiques et tactiques. Grâce à une analyse poussée des données, le réseau aérien a pu être modélisé par un graphe indépendant du temps stocké dans une base de données orientée grapheNeo4j. Nous avons alors défini le Flight Radius Problem dont la résolution permet de déterminer un sous-réseau centré autour d’un vol pour lequel les parts de marchés du vol sont non négligeables. Plusieurs méthodes de résolution ont été proposées basées sur des requêtes ou des algorithmes de plus courts chemins couplés à des techniques d’accélération et de parallélisme. Nos algorithmes identifient rapidement un ensemble de marchés prometteurs centré sur un vol. L’intégration de la théorie des graphes dans les bases de données ouvre de nouvelles perspectives pour l’analyse et la compréhension de grands réseaux
In the airline industry, problems are various and complicated. Solving these problems aims at reducing costs and maximizing revenues. Revenues can be increased while improving the quality of service. For example, one way is to catch new passengers on existing flight connections or on new markets. The selection of new markets consists in determining network structure to operate, and to estimate passengers flow, their choice of itineraries as well as incomes and costs incurred by these decisions. Our research is about improving market planner engine. Milanamos develops an application for the analysis and simulation of markets intended for air-ports and airlines. It offers its customers a decision-making tool to analyze historical data andto simulate markets in order to find an economic opportunity. This project takes place earlierin the decision process. Thanks to a thorough data analysis, the air transport network could be modelized as a time-independent graph and stored in the Neo4j graph database. We then defined the Flight Radius problem which resolution allows to determine a sub-network centered around a flight for which market shares of the flight are meaningful. Several methods have beenproposed based on queries or on shortest path algorithms combined with acceleration and parallelism techniques. Our algorithms identify some new markets for a flight. Combining graph theory with databases offers new opportunities for analyzing and studying large networks

Styles APA, Harvard, Vancouver, ISO, etc.

7

Charbey, Raphaël. « Sociabilités en ligne, usages et réseaux ». Electronic Thesis or Diss., Paris, ENST, 2018. http://www.theses.fr/2018ENST0049.

Texte intégral

Résumé :

Avec l’avènement du numérique, il est désormais possible aux chercheurs d’amasser des grandes quantités de données et les plateformes de réseaux sociaux en ligne ne font pas exception à cela. Les sociologues, comme d’autres, se sont emparés de ces nouvelles ressources afin de poursuivre leurs enquêtes sur les modalités de l’interaction entre individus et leur impact sur la structuration de la sociabilité. Suivant cette voie, ce travail de thèse vise à l’analyse d’un grand nombre de comptes Facebook, aussi bien au travers des outils classiques de l’analyse de données que de la théorie des graphes, à laquelle des contributions méthodologiques sont apportées. Deux facteurs principaux encouragent l’étude de l’activité et de la sociabilité en ligne. D’une part, le temps important dédié à cette plateforme par de nombreux internautes justifie l’intérêt porté par les sociologues aux échanges qui s’y construisent. Par ailleurs, et contrairement à ce que l’on peut observer sur d’autre sites de réseaux sociaux en ligne, les liens entre individus sur Facebook sont proches de ceux hors-lignes. Dans un premier temps, la thèse s’évertue à démêler les multiples facettes de ce à quoi ”être sur Facebook” correspond. Distribués autour de pratiques normatives fabulées, les usages de nos enquêtés fluctuent au gré de leur appropriation ou non des composantes de l’importante variété de moyens de communication proposés par la plateforme. Ces usages, comme on le verra, sont ainsi différemment adoptés selon les catégories socioprofessionnelles et influent par ailleurs sur les modalités d’échanges et d’interactions des enquêtés avec leurs amis en ligne. Ces modalités sont également explorées dans ce travail, tout comme le rôle du conjoint et sa place dans la structure relationnelle. La seconde partie de la thèse se propose de construire une typologie de ces structures relationnelles dites égocentrées, c’est-à-dire depuis le point de vue de l’enquêté. Cette typologie des réseaux de sociabilité en ligne se base sur l’énumération de leurs sous-graphes induits, les graphlets, initialement développée par des chercheurs en bioinformatique. Cette approche offre une vision méso (entre micro et macro) des réseaux, propice à souligner des phénomènes inédits de sociologie des réseaux. A fort potentiel pluri-disciplinaire, la méthodologie graphlets elle même est également discutée et explorée
With the digital advent, it is now possible for researchers to collect important amounts of data and online social network platforms are surely part of it. Sociologists, among others, seized those new resources to investigate over interaction modalities between individuals as well as their impact on the structure of sociability. Following this lead, this thesis work aims at analyzing a large number of Facebook accounts, through data analysis and graph theory classical tools, and to bring methodological contributions. Two main factors encourage to study Facebook social activities. On one hand, the importance of time spent on this platform by many Internet users justifies by itself the sociologists interest. On the other, and contrarily to what we observe on other social network websites, ties between individuals are similar to the ones that appear offline. First, the thesis proposes to detangle the multiple meanings that are behind the fact of ”being on Facebook”. The uses of our surveyed are not compacted in fantasized normative practices but vary depending on how they appropriate the different composers of the platform tools. These uses, as we will see it, do not concern all the socioprofessional categories in the same way and they also influence how the respondents interact with their online friends. The manuscript also explores these interactions, as well as the lover role into the relational structure. Second part of the thesis builds a typology of these relational structures. They are said as egocentred, which means that they are taken from the perspective of the respondent. This typology of social networks is based on their graphlet counts, that are the number of times each type of subnetwork appear in them. This approach offers a meso perspective (between micro and macro), that is propitious to underline some new social phenomena. With a high pluri-disciplinary potential, the graphlet methodology is also discussed and explored itself

Styles APA, Harvard, Vancouver, ISO, etc.

8

Payet, Lucille. « Remodelage de réseaux d'échangeurs de chaleur : collecte de données avancée, diagnostic énergétique et flexibilité ». Thesis, Toulouse, INPT, 2018. http://www.theses.fr/2018INPT0149/document.

Texte intégral

Résumé :

Dans un contexte de transition énergétique et numérique, L’Usine du Futur se définit commeéconome en énergie, mais aussi agile grâce à des moyens de production flexibles etreconfigurables. Conférer ces propriétés aux procédés existants est un challenge complexe quiinduit souvent une réorganisation des unités. Dans ce cadre, la méthodologie RREFlex a pourobjectif de proposer des solutions alternatives d’intégration énergétique à la fois viables, robusteset adaptables via le remodelage des réseaux d’échangeurs de chaleur déjà installés.Contrairement à la conception initiale consistant à réaliser de manière conjointe la conception duprocédé et du réseau d’échangeur de chaleur associé, l’exercice de remodelage d’unitésexistantes peut s’avérer sensiblement plus complexe. En effet, il s’inscrit souvent dans unedémarche d’amélioration continue sur des installations ayant déjà connu au cours de leur vie destransformations pour faire face aux évolutions de la demande ou à de nouvelles contraintesenvironnementales. Aujourd’hui, nombre d’analyses de récupération énergétique sont réaliséessur les sites industriels mais celles-ci ne donnent pas nécessairement lieu à des réalisationsconcrètes. Les raisons le plus souvent invoquées sont d’ordre financières mais aussi, pratiques.En effet, les solutions proposées ne sont pas toujours réalistes d’un point de vue opérationnellecar elles tiennent rarement compte de la variabilité du procédé, soit due à des perturbations nonmaitrisées sur les températures et les débits, soit due à la présence de multiples points defonctionnement (changement de campagne, évolution de la charge, etc.). De plus, ces solutionstiennent peu compte des contraintes spécifiques du site étudié (topologie des unités, compatibilitédes courants, sécurité, etc.), la formulation a priori de ces dernières ne pouvant être exhaustive.L’outil RREFlex - outil Robuste pour la synthèse de Réseaux d’Echangeurs Flexibles - a étédéveloppée pour pallier autant que possible ces limites. S’appuyant sur une analyse statistiquedes historiques de mesures remontés en salle de contrôle, un premier module - EDiFy : EnhancedData collection for Flexibility analysis - permet de localiser et de caractériser les différents cas demarche des unités. Notamment, la valeur moyenne et la variance des données caractéristiques duprocédé (températures, flux calorifiques) sont estimées pour chaque cas de marche. Ce jeu dedonnées étant souvent incomplet, il est nécessaire d’avoir recours à un modèle de simulation duprocédé pour le compléter et valider la cohérence des données mesurées pour chaque cas demarche potentiellement identifié. Sur cette base, une seconde étape dédiée au diagnosticénergétique permet d’évaluer la pertinence des échangeurs de récupération déjà installés. Cetteanalyse permet d’identifier et de prioriser un ensemble de scenarii de remodelage considéréscomme prometteurs. Chacun d’eux est défini par la liste des échangeurs à reconsidérer et uncertain nombre de paramètres de configuration. Chaque scenario retenu est alors exploité pour lasynthèse du réseau d’échangeurs associé. Cette étape s’appuie sur un modèle de programmationlinéaire mixte multi-période (PLM) pour déterminer la nouvelle topologie du réseau d’échangeurs.Dans ce cadre, le modèle a évidemment la possibilité d’introduire de nouveaux échangeurs maisaussi de déplacer les échangeurs existants et conservés dans un scénario donné, tant qu’ilscouplent la même paire de courant qu’initialement. Les réseaux obtenus sont donc adaptables auxdifférents cas de marche identifiés à la première étape et reconfigurable grâce à l’implantation deby-pass. Le panel de réseaux proposés est enfin évalué et classé au moyen d’indicateurs deperformance, dont notamment la robustesse vis-à-vis de la variabilité du procédé. L’approche aété validée sur deux sites de dimension industrielle: un procédé de fabrication de MVC et un trainde préchauffe de pétrole brut
In a context of numerical and energy transition, the Factory of the Future is meant to be moreenergy efficient but also smarter and agile through the use of flexible and reconfigurableproduction means. Enabling existing processes to achieve those properties is a difficult challengewhich often induces a reorganization of the units. In this context, RREFlex methodology wasdeveloped to provide several alternatives heat integration solutions both viable, robust andadaptable through the retrofitting of existing heat exchanger networks. Unlike grass-root design,which consists in designing both the process and the heat exchanger network at the same time(and thus, allowing many possibilities), retrofitting existing units can be a lot more complex.Indeed, as part of a continuous improvement process of the production, the plants have oftenalready undergone transformations during their life to cope with changes in demand or newenvironmental constraints. Currently, numerous energy recovery analysis are performed onindustrial sites but do not necessarily involves concrete industrial measures. The main reasons forthe lack of results are mainly financial but also practical. The provided solutions are often nonrealistic in terms of operability because of the lack of accounting for the variability of the process,whether due to external disturbances on temperatures and flowrates or due to multiple operatingconditions (many production campaigns, evolution in process load, etc.). Moreover, thosesolutions also do not take on-site constraints into account (units topology, process streamscompatibility, safety, etc.), as it is difficult to apprehend such constraints. The RREFlex module(Robust software tool for the synthesis of Flexible Heat Exchanger Networks), was developed toassess these issues. Based on a statistical analysis of historical data extracted from on-sitemeasurements, a first module - EDiFy : Enhanced Data collection for Flexibility analysis – enablesthe location and characterization of the multiple steady state regimes. The mean value andvariance of operating conditions characterizing the process (e.g. temperature, heat flow) areestimated for each steady state. As this data set is usually incomplete, it is necessary to use asimulation model of the process to complete and validate the consistency of the measurements ofeach identified steady state.Based upon those data, an energy diagnosis step enables the assessment of each existing heatexchanger liability. This analysis results in the identification and classification of several promisingretrofitting scenarios. Each one is defined by a list of heat exchangers to reconsider and severalconfiguration parameters.Each selected scenario is then used to design the corresponding optimal heat exchanger network.The latter step, which is based on a multi-period mixed linear programming model, aims at thedesign of a new heat exchanger network topology. In this context, the model includes not only thepossibility to add new heat exchangers but also to shift the preserved heat exchangers for a givenscenario, as long as the original pair of streams is kept. The resulting heat exchanger networksare thus adaptable to every operating conditions identified in the first step of the methodology butalso reconfigurable through the use of by-passes. The performances of the resulting networks areevaluated and classified using key performance indicators, especially the robustness which iscrucial to account for the process variability.The approach was validated on two industrial scale case studies: a MVC production process and arefinery heating train

Styles APA, Harvard, Vancouver, ISO, etc.

9

Fournel, Arnaud. « Classification automatique de données IRMf : application à l'étude des réseaux de l'émotion ». Thesis, Lyon 2, 2013. http://www.theses.fr/2013LYO20066.

Texte intégral

Résumé :

Depuis une quinzaine d'années, l'Imagerie par Résonance Magnétique fonctionnelle (IRMf) permet d'extraire de l'information sur le fonctionnement cérébral et particulièrement sur la localisation des processus cognitifs. L'information contenue par les acquisitions en IRMf est extraite à l'aide du modèle linéaire général et du processus d'inférence statistique. Bien que cette méthode dite « classique » ait permis de valider la plupart des modèles lésionnels de manière non invasive, elle souffre de certaines limites. Pour résoudre ce problème, différentes techniques d'analyse ont émergé et proposent une nouvelle façon d'interpréter les données de la neuroimagerie. Nous présentons deux nouvelles méthodes multivariées basées sur les cartes de Kohonen. Nos méthodes analysent les données IRMf avec le moins d'a priori possibles. En parallèle, nous tentons d'extraire de l'information sur les réseaux neuronaux impliqués dans les émotions. La première de ces méthodes s'intéresse à l'information de spécialisation fonctionnelle et la seconde à l'information de connectivité fonctionnelle. Nous présentons les résultats qui en découlent, puis chacune des méthodes est comparée à l'analyse dite classique en termes d'informations extraites. De plus, notre attention s'est focalisée sur la notion de valence émotionnelle et nous tentons d'établir l'existence d'un éventuel réseau partagé entre valence positive et valence négative. La constance de ce réseau est évaluée à la fois entre modalités perceptives et entre catégories de stimuli. Chacune des méthodes proposées permet de corroborer l'information recueillie par la méthode classique, en apportant de nouvelles informations sur les processus étudiés. Du point de vue des émotions, notre travail met en lumière un partage du réseau cérébral pour les va-lences négative et positive ainsi qu'une constance de cette information dans certaines régions cérébrales entre modalités perceptives et entre catégories
In the last fifteen years, functional magnetic resonance imaging (fMRI) have been used to extract information about cognitive processes location. The information contained in fMRI acquisitions is usually extracted using the general linear model coupled to the statistical inference process. Although this classical method has validated noninvasively most of the lesional models, it suffers from some limitations. To solve this problem, various analysis techniques have emerged and propose a new way of interpreting neuroimaging data. In this thesis, we present two multivariate methods to analyze fMRI data with the least possible a priori. In parallel, we are trying to extract information about brain emotion processing. The first method focuses on the brain functional specialization and the second method on the brain functional connectivity. After results presentation, each method is compared to the so-called classical analysis in terms of extracted information. In addition, emphasis was put on the concept of emotional valence. We try to establish the existence of a possible split between positive and negative valence networks. The consistency of the network is evaluated across both perceptual modalities and stimuli categories. Each of the proposed methods are as accurate as the conventional method and provide new highlights on the studied processes. From the perspective of emotions, our work highlights a shared brain network for positive and negative valences and a consistency of this information in some brain regions across both perceptual modalities and stimuli categories

Styles APA, Harvard, Vancouver, ISO, etc.

10

Karkar, Slim Ismael. « Parcellisation et analyse multi-niveaux de données : Application à l’étude des réseaux de connectivité cérébrale ». Strasbourg, 2011. https://publication-theses.unistra.fr/public/theses_doctorat/2011/KARKAR_Slim_Ismael_2011.pdf.

Texte intégral

Résumé :

Durant les dernières décennies, l'IRM fonctionnelle a permis de cartographier les différentes fonctions cérébrales et, plus récemment, d'identifier les réseaux fonctionnels qui décrivent les interactions qui peuvent s'établir entre régions cérébrales, proches ou distantes, lors de l'exécution d'une tâche cognitive. Pour identifier ces réseaux, une stratégie récente repose sur une parcellisation préliminaire du cerveau en régions fonctionnellement homogènes, puis sur l'identification des réseaux fonctionnels significatifs depuis une mesure des interactions entre l'ensemble des régions. Ainsi, la première partie de cette thèse propose une nouvelle méthode de parcellisation du cerveau en régions fonctionnellement homogènes. La méthode proposée est exploratoire et multi-niveaux : elle fournit plusieurs niveaux de parcellisation, et nous avons montré que les régions définies par notre méthode se superposent de manière satisfaisante aux structures anatomiques du cortex. Dans la deuxième partie de la thèse, nous avons proposé une méthode originale d'identification des réseaux fonctionnels. L'approche développée permet la significativité des réseaux étant donné leur taille et le seuil utilisé pour leur détection. Une telle approche permet de détecter des réseaux de faible taille qui impliquent des liens très significatifs, et également des réseaux plus grands impliquant des liens moins significatifs. Enfin, nous avons développé une approche permettant de classer les réseaux obtenus, de manière à réaliser une étude de groupe. L'information disponible sur l'ensemble des sujets permet alors de définir des classes qui synthétisent les caractéristiques des réseaux les plus partagés au sein d'une population de sujets
Over the last decade, functional MRI has emerged as a widely used tool for mapping functions of the brain. More recently, it has been used for identifying networks of cerebral connectivity that represent the interactions between different brain areas. In this context, a recent strategy is based on a preliminary parcellation of the brain into functional regions, and then identifying functional networks from a measurement of interactions between each area. The first part of this thesis describes a novel approach for parcellation that produces regions that are homogeneous at several levels. These regions are shown to be consistent with the anatomical landmarks of the processed subjects. In the second part, we propose a new family of statistics to identify significant networks of functional connectivity. This approach enables the detection of small, strongly-connected networks as well as larger networks that involve weaker interactions. Finally, within a classification framework, we developed a group-level study, producing networks that synthesize characteristics of functional networks across the population under study

Styles APA, Harvard, Vancouver, ISO, etc.

11

Khelil, Yassine. « Analyse des données en vue du diagnostic des moteurs Diesel de grande puissance ». Thesis, Aix-Marseille, 2013. http://www.theses.fr/2013AIXM4315.

Texte intégral

Résumé :

Cette thèse a été réalisée dans le cadre d'un projet industriel (BMCI), dont l'objectif est d'augmenter la disponibilité des équipements sur les navires. Dans cette thèse, nous proposons une approche qui met à contribution deux approches différentes, à savoir une approche à base de données pour la détection des défauts et une approche à base de connaissances d'experts pour l'isolation des défauts. Cette approche se veut générique et applicable à différents sous-systèmes du moteur ainsi qu'à divers moteurs et offre une ouverture pour une éventuelle application sur d'autres équipements. De plus, elle est tolérante vis-à-vis des éventuels changements au niveau de l'instrumentation disponible. Cette approche a été testée sur la détection et l'isolation des défauts les plus fréquents et aux conséquences graves auxquels les moteurs Diesel sont sujets. Tous les sous-systèmes du moteurs Diesel sont inclus et l'approche de diagnostic prend en considération les interactions existantes entre les sous-systèmes. L'approche de diagnostic a été testée sur un banc d'essai et sur le navire militaire Adroit de DCNS. Les défauts réalisés sur divers circuits du banc moteur et les défauts apparus en fonctionnement sur certains moteurs de l'Adroit, ont été majoritairement détectés et isolés avec succès. De plus, pour pallier à l'incertitude et au caractère flou des relations expertes utilisées dans la procédure d'isolation, une validation des relations de cause à effet a été réalisée, dans le cadre de cette thèse, par la réalisation d'un modèle analytique de simulation de défauts
This thesis is carried out within an industrial framework (BMCI) which aims to enhance the availability of equipments on board ships. In this work, a data-based method for fault detection is combined with a knowledge-based method for fault isolation. The presented approach is generic and characterized by the ability to be applied to all the Diesel engine subsystems, to different kind of Diesel engines and can also be extended to other equipments. Moreover, this approach is tolerant regarding differences in instrumentation. This approach is tested upon the detection and isolation of the most hazardous and frequent faults which subject Diesel engines. This approach intends to make diagnosis upon the entire Diesel engine including all the subsystems and the existing interactions between the subsystems. The proposed approach is tested upon a test bench and upon the Diesel engines of the DCNS military vessel textquotedblleft Adroit". Most of the introduced faults on the test bench and the appeared faults on the Adroit engines have been successfully detected and isolated. In addition, to deal with uncertainties and fuzziness of the causal relationships given by maintenance experts, a model is developed. This model aims to validate these causal relationships used in the isolation part of the diagnosis approach

Styles APA, Harvard, Vancouver, ISO, etc.

12

Zreik, Rawya. « Analyse statistique des réseaux et applications aux sciences humaines ». Thesis, Paris 1, 2016. http://www.theses.fr/2016PA01E061/document.

Texte intégral

Résumé :

Depuis les travaux précurseurs de Moreno (1934), l’analyse des réseaux est devenue une discipline forte, qui ne se limite plus à la sociologie et qui est à présent appliquée à des domaines très variés tels que la biologie, la géographie ou l’histoire. L’intérêt croissant pour l’analyse des réseaux s’explique d’une part par la forte présence de ce type de données dans le monde numérique d’aujourd’hui et, d’autre part, par les progrès récents dans la modélisation et le traitement de ces données. En effet, informaticiens et statisticiens ont porté leurs efforts depuis plus d’une dizaine d’années sur ces données de type réseau en proposant des nombreuses techniques permettant leur analyse. Parmi ces techniques on note les méthodes de clustering qui permettent en particulier de découvrir une structure en groupes cachés dans le réseau. De nombreux facteurs peuvent exercer une influence sur la structure d’un réseau ou rendre les analyses plus faciles à comprendre. Parmi ceux-ci, on trouve deux facteurs importants: le facteur du temps, et le contexte du réseau. Le premier implique l’évolution des connexions entre les nœuds au cours du temps. Le contexte du réseau peut alors être caractérisé par différents types d’informations, par exemple des messages texte (courrier électronique, tweets, Facebook, messages, etc.) échangés entre des nœuds, des informations catégoriques sur les nœuds (âge, sexe, passe-temps, Les fréquences d’interaction (par exemple, le nombre de courriels envoyés ou les commentaires affichés), et ainsi de suite. La prise en considération de ces facteurs nous permet de capturer de plus en plus d’informations complexes et cachées à partir des données. L’objectif de ma thèse été de définir des nouveaux modèles de graphes aléatoires qui prennent en compte les deux facteurs mentionnés ci-dessus, afin de développer l’analyse de la structure du réseau et permettre l’extraction de l’information cachée à partir des données. Ces modèles visent à regrouper les sommets d’un réseau en fonction de leurs profils de connexion et structures de réseau, qui sont statiques ou évoluant dynamiquement au cours du temps. Le point de départ de ces travaux est le modèle de bloc stochastique (SBM). Il s’agit d’un modèle de mélange pour les graphiques qui ont été initialement développés en sciences sociales. Il suppose que les sommets d’un réseau sont répartis sur différentes classes, de sorte que la probabilité d’une arête entre deux sommets ne dépend que des classes auxquelles ils appartiennent
Over the last two decades, network structure analysis has experienced rapid growth with its construction and its intervention in many fields, such as: communication networks, financial transaction networks, gene regulatory networks, disease transmission networks, mobile telephone networks. Social networks are now commonly used to represent the interactions between groups of people; for instance, ourselves, our professional colleagues, our friends and family, are often part of online networks, such as Facebook, Twitter, email. In a network, many factors can exert influence or make analyses easier to understand. Among these, we find two important ones: the time factor, and the network context. The former involves the evolution of connections between nodes over time. The network context can then be characterized by different types of information such as text messages (email, tweets, Facebook, posts, etc.) exchanged between nodes, categorical information on the nodes (age, gender, hobbies, status, etc.), interaction frequencies (e.g., number of emails sent or comments posted), and so on. Taking into consideration these factors can lead to the capture of increasingly complex and hidden information from the data. The aim of this thesis is to define new models for graphs which take into consideration the two factors mentioned above, in order to develop the analysis of network structure and allow extraction of the hidden information from the data. These models aim at clustering the vertices of a network depending on their connection profiles and network structures, which are either static or dynamically evolving. The starting point of this work is the stochastic block model, or SBM. This is a mixture model for graphs which was originally developed in social sciences. It assumes that the vertices of a network are spread over different classes, so that the probability of an edge between two vertices only depends on the classes they belong to

Styles APA, Harvard, Vancouver, ISO, etc.

13

Fromantin, Jonathan. « Modélisation hybride temporelle et analyse par contraintes des réseaux de régulation biologiques ». Ecole Centrale de Nantes, 2009. http://www.theses.fr/2009ECDN0009.

Texte intégral

Styles APA, Harvard, Vancouver, ISO, etc.

14

Karkar, Slim. « Parcellisation et analyse multi-niveaux de données IRM fonctionnelles. Application à l'étude des réseaux de connectivité cérébrale ». Phd thesis, Université de Strasbourg, 2011. http://tel.archives-ouvertes.fr/tel-00652609.

Texte intégral

Résumé :

Durant les dernières décennies, l'IRM fonctionnelle a permis de cartographier les différentes fonctions cérébrales et, plus récemment, d'identifier les réseaux fonctionnels qui décrivent les interactions qui peuvent s'établir entre régions cérébrales, proches ou distantes, lors de l'exécution d'une tâche cognitive. Pour identifier ces réseaux, une stratégie récente repose sur une parcellisation préliminaire du cerveau en régions fonctionnellement homogènes, puis sur l'identification des réseaux fonctionnels significatifs depuis une mesure des interactions entre l'ensemble des régions. Ainsi, la première partie de cette thèse propose une nouvelle méthode de parcellisation du cerveau en régions fonctionnellement homogènes. La méthode proposée est exploratoire et multi-niveaux : elle fournit plusieurs niveaux de parcellisation, et nous avons montré que les régions définies par notre méthode se superposent de manière satisfaisante aux structures anatomiques du cortex. Dans la deuxième partie de la thèse, nous avons proposé une méthode originale d'identification des réseaux fonctionnels. L'approche développée permet la significativité des réseaux étant donné leur taille et le seuil utilisé pour leur détection. Une telle approche permet de détecter des réseaux de faible taille qui impliquent des liens très significatifs, et également des réseaux plus grands impliquant des liens moins significatifs. Enfin, nous avons développé une approche permettant de classer les réseaux obtenus, de manière à réaliser une étude de groupe. L'information disponible sur l'ensemble des sujets permet alors de définir des classes qui synthétisent les caractéristiques des réseaux les plus partagés au sein d'une population de sujets.

Styles APA, Harvard, Vancouver, ISO, etc.

15

Blum, Anne Yuna. « Analyse génétique d’un caractère complexe à l’aide de données transcriptomiquesPport de la modèlisation de réseaux de gènes ». Rennes, Agrocampus Ouest, 2012. http://www.theses.fr/2012NSARB228.

Texte intégral

Résumé :

Depuis une dizaine d’années, de nombreux projets de génomique fonctionnelle se sont développés, avec pour objectif de mieux comprendre des caractères complexes d’intérêt socio-éconmique en vue de mieux les maîtriser. Ces c aractères sont dits complexes car contrôlés par de multiples facteurs : génétique, alimentation, état de santé…Une stratégie couramment utilisée pour l’étude de tels caractères consiste à localiser des QTL, c'est-à-dire des régions chromosomiques contrôlant leur variabilité. Prarralèlement au développement de ces travaux, les technologies de puces à ADN ont émergé, permettant de mesurer à haut débit l’expression de l’ensemble des gènes d’un organisme via la quantification des transcrits (données transcriptomiques). Des stratégies dites de génétique génomique combinant des approches de génomique fonctionnelle et de cartographie de QTL on alors été développées avec comme objectif de faciliter l’identification des mutations causales sous-jacentes aux QTL détectés. Dans ce contexte nouveau, une originalité de la thèse est de prendre en compte l’hétérogénéité existante dans les données transcriptomiques et causées par des facteurs connus ou inconnus indépendamment au cractère d’intérêt. Au travers de plusieurs études, on montre que l’hétérogénéité du signal d’expression ou des profils d’expression masque bien souvent la détection des gènes et des régions du génome liés aux caractère d’intérêt. Un deuxième volet de la thèse concerne l’inférence de réseaux de gènes. Nous développons de nouvelles méthodes pour l’estimation de telles structures basées sur un modèle à facteurs. Ces méthodes permettent de caractériser des régulateurs clés et des processus biologiques sous-jacents à la variabilité de caractères complexes, apportant de nouvelles informations fonctionnelles quant aux mutations causales recherchées
For the past ten years, many projects on functional genomics have been developed with the aim of better understanding complex traits of socio-economical interest in order to better control them. These traits are called complex traits because they are controlled by multiple factors : genetics food, health stutus… One strategy commonly used to analyze such traits involves localizing QTL (Quantitative Trait Loci), i. E. Chromosomic regions controlling their variability. In parallel to this work, new technologies (microarrays) have emerged, which allow the high throughput measurement of gene expression through the quantification of transcripts (transcriptomic data). Genetical genomic approaches combining functional genomic methods and QTL mapping have been developed with the aim of facilitating the identification of causal mutations underlying detected QTL. In this new context, an original aspect of my thesis is to take into account the heterogeneity existing in transcriptomic data and due to know or unkno

Styles APA, Harvard, Vancouver, ISO, etc.

16

Hatoum, Abbas Antoun. « Gestion de ressources et d'interférences dans les réseaux femtocell ofdma ». Paris 6, 2013. http://www.theses.fr/2013PA066093.

Texte intégral

Résumé :

Les opérateurs de télécommunication se dirigent récemment vers les réseaux femtocell afin d'améliorer la couverture à l'intérieur, augmenter la capacité du réseau et assurer une bonne qualité de service puisque les stations de base traditionnelle (macrocells) toute seules ne parviennent pas à atteindre ces objectifs. Néanmoins, cette technologie est confrontée à de nombreux défis. En effet, avec les problèmes de la bande passante et les ressources qui sont limités on doit servir un très grand nombre d'utilisateurs qui nécessitent un service de plus en plus strict en termes de qualité et de débit. Dans cette thèse, nous abordons la problématique de l'allocation des ressources et la gestion de l'interférence dans les réseaux femtocell en utilisant la technologie OFDMA (LTE, WiMAX). Plus précisément, nous proposons tout d'abord une stratégie hybride centralisé/distribué, nommée (FCRA) pour l'allocation des ressources considérant une division orthogonale du spectre orthogonal entre les femtocell et les macrocells. Tout d'abord, FCRA construit des clusters disjoints. Puis, au sein du cluster l'allocation optimale des ressources pour chaque femtocell est exécutée par le chef du cluster (Cluster Head). Enfin, les collisions éventuelles entre les différents clusters sont traitées d'une manière distribuée au sein de chaque femtocell. Pour cela, nous formulons le problème mathématiquement comme problème d'optimisation Min-Max. Ensuite, un algorithme co-channel est proposé : (CO-FCRA). Dans ce cas on introduit le partage du spectre entre les utilisateurs femto et macro. Des approches de spectrum sensing sont utilisés pour détecter les transmissions existantes dans le uplink et estime les ressources utilisées dans le downlink afin d'allouer les ressources libres par la suite aux utilisateurs femtocell. Dans une deuxième approche, nous considérons un réseau avec une qualité de service et proposons une différenciation entre les utilisateurs avec un nouvel algorithme, appelé (Q-FCRA). Dans ce cas, le réseau peut servir avec à la fois des utilisateurs avec une haute priorité (HP) et des utilisateurs best effort (BE). Le problème d'optimisation est modifié pour prendre en compte les deux types d'utilisateurs et leur alloue les ressources en conséquence. L'objectif est de maximiser le nombre d'utilisateurs prioritaires et servir au mieux possible les utilisateurs best effort. Une troisième contribution est présentée, où nous proposons un algorithme de contrôle de puissance (QP-FCRA). Dans cet algorithme les stations femto doivent allouer en même temps des blocs de ressource et de puissance de transmission sur les différents canaux afin de réduire efficacement les interférences dans le même cluster et d'augmenter la réutilisation spatial du spectre. La puissance d'émission est calculée sur la base de l'interférence reçue pour satisfaire un seuil SINR minimum requis. Plusieurs travaux existants ont été utilisés pour la comparaison. La densité du réseau, les niveaux d'interférences, la durée de session et les taux de mobilité ont été pris en compte. L'évaluation des performances montre l'amélioration et la performance de nos algorithmes par rapport aux techniques existantes dans les différents paramètres de performance, tels que le nombre d'utilisateurs acceptées et refusées, l'équité, le taux de satisfaction, le débit, la réutilisation du spectre spatial, la convergence et le temps de calcul. L'amélioration de notre algorithme est prouvée par rapport aux approches centralisés, qui ne passent pas toujours à l'échelle, et les méthodes distribués avec lesquelles la performance est réduite pour des niveaux d'interférences et de densités élevées
Recently, operators have resorted to femtocell networks in order to enhance indoor coverage, network capacity and quality of service since macro-antennas alone fail to reach these objectives. Nevertheless, they are confronted to many challenges. To successfully deploy such solution, efficient resource allocation algorithms and interference mitigation techniques should be deployed. In this thesis, we address the issue of resources allocation in femtocell networks using OFDMA technology (e. G. , WiMAX, LTE). Specifically, we first propose a hybrid centralized/distributed resource allocation strategy for split spectrum namely Femtocell Cluster-based Resource Allocation (FCRA). Firstly, FCRA builds disjoint femtocell clusters. Then, within a cluster the optimal resource allocation for each femtocell is performed by its clusterhead. Finally, the contingent collisions among different clusters are fixed. To achieve this, we formulate the problem mathematically as Min-Max optimization problem. Then, a co-channel resource allocation algorithm (CO-FCRA) introduces spectrum sharing between femto and macro users. Spectrum sensing approaches are used to detect existing neighboring transmissions in the uplink and estimates resources used in the downlink to allocate resources accordingly. In a second approach, we consider networks with quality of service differentiation among users and propose a new algorithm, namely (Q-FCRA) with both high priority and best effort users. The optimization problem is modified to take into account both user types and allocates resources accordingly. The objective is to maximize the number of accepted high priority users and allocate as much as possible best effort users. As a third contribution, we present a power control algorithm (QP-FCRA), where femto stations allocate both resource blocks and transmission power on the different channels to effectively mitigate interference within the same cluster and increase the spectrum spatial reuse. The transmission power is calculated based on the interference received to satisfy a minimum required SINR threshold. Several existing works have been used for comparison. Different network densities, interference levels, session duration and mobility rates have been considered. Performance evaluation shows the improvement and the outperformance of our algorithms compared to the existing techniques regarding different performance metrics such as the number of accepted and rejected users, the fairness, the throughput satisfaction rate, the spectrum spatial reuse and the convergence and computation time. The scalability of our algorithm compared to the centralized ones is proven as well as the performance compared to the distributed algorithms

Styles APA, Harvard, Vancouver, ISO, etc.

17

Le, Béchec Antony. « Gestion, analyse et intégration des données transcriptomiques ». Rennes 1, 2007. http://www.theses.fr/2007REN1S051.

Texte intégral

Résumé :

Dans le cadre de l'étude des mécanismes moléculaires impliqués dans les processus biologiques liés aux pathologies, la transcriptomique permet d’étudier l’expression de plusieurs milliers de gènes en une seule expérience. Les standards internationaux permettent actuellement de gérer la grande quantité de données générées par cette technologie et de nombreux algorithmes permettent le traitement et l’analyse des données d’expression. Le grand défi d’aujourd’hui réside dans l’interprétation des données, notamment par l’intégration de connaissances biologiques supplémentaires permettant la création d’un contexte d’étude aidant à la compréhension des mécanismes biologiques. Afin de répondre aux besoins liés à l’exploitation de ces données transcriptomiques, un environnement complet et évolutif a été développé, M@IA (Micro@rray Integrated Application), permettant de gérer les expériences de puces à ADN mais également traiter et analyser les données d’expression. Une méthode de biologie intégrative combinant de multiples sources de données a été conçue pour exploiter des listes de gènes différentiellement exprimés par l’interprétation de réseaux de gènes représentés sous forme de graphes d’interaction. Egalement, une méthode de méta-analyse de données d’expression de gènes issues de la bibliographie a permis de sélectionner et combiner des études similaires associées à la progression tumorale du foie. En conclusion, ces travaux s’intègrent totalement à l’actuel développement de la biologie intégrative, indispensable à la résolution des mécanismes physiopathologiques
Aiming at a better understanding of diseases, transcriptomic approaches allow the analysis of several thousands of genes in a single experiment. To date, international standard initiatives have allowed the utilization of large quantity of data generated using transcriptomic approaches by the whole scientific community, and a large number of algorithms are available to process and analyze the data sets. However, the major challenge remaining to tackle is now to provide biological interpretations to these large sets of data. In particular, their integration with additional biological knowledge would certainly lead to an improved understanding of complex biological mechanisms. In my thesis work, I have developed a novel and evolutive environment for the management and analysis of transcriptomic data. Micro@rray Integrated Application (M@IA) allows for management, processing and analysis of large scale expression data sets. In addition, I elaborated a computational method to combine multiple data sources and represent differentially expressed gene networks as interaction graphs. Finally, I used a meta-analysis of gene expression data extracted from the literature to select and combine similar studies associated with the progression of liver cancer. In conclusion, this work provides a novel tool and original analytical methodologies thus contributing to the emerging field of integrative biology and indispensable for a better understanding of complex pathophysiological processes

Styles APA, Harvard, Vancouver, ISO, etc.

18

Aupetit, Michaël. « Approximation de variétés par réseaux de neurones auto-organisés ». Grenoble INPG, 2001. http://www.theses.fr/2001INPG0128.

Texte intégral

Résumé :

Les problèmes de discrimination, de classification, d'approximation de fonctions, de diagnostic ou de commande qui se posent notamment dans le domaine du génie industriel, peuvent se ramener à un problème d'approximation de variétés. Nous proposons une méthode d'approximation de variétés sous-jacentes à une distribution de données, basée sur une approche connexionniste auto-organisée et procédant en trois étapes : un positionnement de représentants de la distribution par des techniques de quantification vectorielle permet d'obtenir un modèle discret, un apprentissage de la topologie de cette distribution par construction de la triangulation induite de Delaunay selon un algorithme d'apprentissage compétitif donne un modèle linéaire par morceaux, et une interpolation non linéaire mène à un modèle non linéaire des variétés. Notre première contribution concerne la définition, l'étude des propriétés géométriques et la proposition d'algorithmes de recherche d'un nouveau type de voisinage "[gamma]-Observable" alliant des avantages du voisinage des k-plus-proches-voisins et du voisinage naturel, utilisable en grande dimension et en quantification vectorielle. Notre seconde contribution concerne une méthode d'interpolation basée sur des "noyaux de Voronoi͏̈" assurant la propriété d'orthogonalité nécessaire à la modélisation de variétés, avec une complexité de calcul équivalente ou plus faible que les méthodes d'interpolation existantes. Cette technique est liée au voisinage [gamma]-Observable et permet de construire différents noyaux gaussiens utilisés dans les réseaux RBFs. Les outils développés dans cette approche originale sont appliqués en approximation de fonctions pour l'identification d'un préhenseur électropneumatique, en approximation de variétés, et en discrimination et analyse de données. Il est notamment montré qu'il est intéressant d'utiliser les voisins 0. 5-observables pour définir les points frontières entre classes et affecter les éléments à leur classe d'appartenance.

Styles APA, Harvard, Vancouver, ISO, etc.

19

Stoica, Beck Alina. « Analyse de la structure locale des grands réseaux sociaux ». Phd thesis, Université Paris-Diderot - Paris VII, 2010. http://tel.archives-ouvertes.fr/tel-00987880.

Texte intégral

Résumé :

Le principal but de notre recherche a été de caractériser les individus connectés dans un réseau social en analysant la structure locale du réseau. Pour cela, nous avons proposé une méthode qui décrit la façon dont un noeud (correspondant à un individu) est intégré dans le réseau. Notre méthode est liée à l'analyse de réseaux égocentrés en sociologie et à l'approche locale dans l'étude des grands graphes de terrain. Elle peut être appliquée à des petits réseaux, à des fractions de réseaux et aussi à des grands réseaux, grâce à sa petite complexité. Nous avons appliqué la méthode proposée à deux grands réseaux sociaux, un modélisant des activités enligne sur MySpace, l'autre modélisant des communications par téléphone mobile. Dans le premier cas nous nous sommes intéressés à l'analyse de la popularité enligne des artistes sur MySpace. Dans le deuxième cas, nous avons proposé et avons utilisé une méthode pour regrouper les noeuds qui sont connectés au réseau de façon similaire. Nous avons constaté que la distribution des utilisateurs de téléphone mobile dans des groupes était corrélée à d'autres caractéristiques des individus (intensité de communication et 'âge). Bien que dans cette thèse nous ayons appliqué les deux méthodes seulement aux réseaux sociaux, elles peuvent être appliquées de la même manière à tout autre graphe, peu importe son origine.

Styles APA, Harvard, Vancouver, ISO, etc.

20

Poussevin, Mickael. « Apprentissage de représentation pour des données générées par des utilisateurs ». Electronic Thesis or Diss., Paris 6, 2015. https://accesdistant.sorbonne-universite.fr/login?url=https://theses-intra.sorbonne-universite.fr/2015PA066040.pdf.

Texte intégral

Résumé :

Dans cette thèse, nous étudions comment les méthodes d'apprentissage de représentations peuvent être appliquées à des données générées par l'utilisateur. Nos contributions couvrent trois applications différentes, mais partagent un dénominateur commun: l'extraction des représentations d'utilisateurs concernés. Notre première application est la tâche de recommandation de produits, où les systèmes existant créent des profils utilisateurs et objets qui reflètent les préférences des premiers et les caractéristiques des derniers, en utilisant l'historique. De nos jours, un texte accompagne souvent cette note et nous proposons de l'utiliser pour enrichir les profils extraits. Notre espoir est d'en extraire une connaissance plus fine des goûts des utilisateurs. Nous pouvons, en utilisant ces modèles, prédire le texte qu'un utilisateur va écrire sur un objet. Notre deuxième application est l'analyse des sentiments et, en particulier, la classification de polarité. Notre idée est que les systèmes de recommandation peuvent être utilisés pour une telle tâche. Les systèmes de recommandation et classificateurs de polarité traditionnels fonctionnent sur différentes échelles de temps. Nous proposons deux hybridations de ces modèles: la première a de meilleures performances en classification, la seconde exhibe un vocabulaire de surprise. La troisième et dernière application que nous considérons est la mobilité urbaine. Elle a lieu au-delà des frontières d'Internet, dans le monde physique. Nous utilisons les journaux d'authentification des usagers du métro, enregistrant l'heure et la station d'origine des trajets, pour caractériser les utilisateurs par ses usages et habitudes temporelles
In this thesis, we study how representation learning methods can be applied to user-generated data. Our contributions cover three different applications but share a common denominator: the extraction of relevant user representations. Our first application is the item recommendation task, where recommender systems build user and item profiles out of past ratings reflecting user preferences and item characteristics. Nowadays, textual information is often together with ratings available and we propose to use it to enrich the profiles extracted from the ratings. Our hope is to extract from the textual content shared opinions and preferences. The models we propose provide another opportunity: predicting the text a user would write on an item. Our second application is sentiment analysis and, in particular, polarity classification. Our idea is that recommender systems can be used for such a task. Recommender systems and traditional polarity classifiers operate on different time scales. We propose two hybridizations of these models: the former has better classification performance, the latter highlights a vocabulary of surprise in the texts of the reviews. The third and final application we consider is urban mobility. It takes place beyond the frontiers of the Internet, in the physical world. Using authentication logs of the subway users, logging the time and station at which users take the subway, we show that it is possible to extract robust temporal profiles

Styles APA, Harvard, Vancouver, ISO, etc.

21

Agnaou, Youssef Joseph. « Analyse statistique de données de croissance humaine : estimation et ajustement paramétriques, non paramétriques, et par réseaux de neurones ». Bordeaux 1, 2001. http://www.theses.fr/2001BOR12404.

Texte intégral

Résumé :

L'étude des courbes de croissance est abordée, du point de vue statistique par différentes méthodes paramétriques et non-paramétriques. Le travail présenté compare, sur deux familles de données réelles (individuelles et longitudinales) concernant la croissance humaine, les méthodes paramétriques classiques, certains estimateurs à noyau, et l'utilisation de réseaux neuronaux, méthode assez peu utilisée dans ce contexte. Une large annexe présente les bases de cette méthode.

Styles APA, Harvard, Vancouver, ISO, etc.

22

Mostafa, Mahmoud. « Analyse de sécurité et QoS dans les réseaux à contraintes temporelles ». Thesis, Toulouse, INPT, 2011. http://www.theses.fr/2011INPT0074/document.

Texte intégral

Résumé :

Dans le domaine des réseaux, deux précieux objectifs doivent être atteints, à savoir la QoS et la sécurité, plus particulièrement lorsqu’il s’agit des réseaux à caractère critique et à fortes contraintes temporelles. Malheureusement, un conflit existe : tandis que la QoS œuvre à réduire les temps de traitement, les mécanismes de sécurité quant à eux requièrent d’importants temps de traitement et causent, par conséquent, des délais et dégradent la QoS. Par ailleurs, les systèmes temps réel, la QoS et la sécurité ont très souvent été étudiés séparément, par des communautés différentes. Dans le contexte des réseaux avioniques de données, de nombreux domaines et applications, de criticités différentes, échangent mutuellement des informations, souvent à travers des passerelles. Il apparaît clairement que ces informations présentent différents niveaux de sensibilité en termes de sécurité et de QoS. Tenant compte de cela, le but de cette thèse est d’accroître la robustesse des futures générations de réseaux avioniques de données en contrant les menaces de sécurité et évitant les ruptures de trafic de données. A cet effet, nous avons réalisé un état de l’art des mécanismes de sécurité, de la QoS et des applications à contraintes temporelles. Nous avons, ensuite étudié la nouvelle génération des réseaux avioniques de données. Chose qui nous a permis de déterminer correctement les différentes menaces de sécurité. Sur la base de cette étude, nous avons identifié à la fois les exigences de sécurité et de QoS de cette nouvelle génération de réseaux avioniques. Afin de les satisfaire, nous avons proposé une architecture de passerelle de sécurité tenant compte de la QoS pour protéger ces réseaux avioniques et assurer une haute disponibilité en faveur des données critiques. Pour assurer l’intégration des différentes composantes de la passerelle, nous avons développé une table de session intégrée permettant de stocker toutes les informations nécessaires relatives aux sessions et d’accélérer les traitements appliqués aux paquets (filtrage à états, les traductions d’adresses NAT, la classification QoS et le routage). Cela a donc nécessité, en premier lieu, l'étude de la structure existante de la table de session puis, en second lieu, la proposition d'une toute nouvelle structure répondant à nos objectifs. Aussi, avons-nous présenté un algorithme permettant l’accès et l’exploitation de la nouvelle table de session intégrée. En ce qui concerne le composant VPN IPSec, nous avons détecté que le trafic chiffré par le protocole ESP d’IPSec ne peut pas être classé correctement par les routeurs de bordure. Afin de surmonter ce problème, nous avons développé un protocole, Q-ESP, permettant la classification des trafics chiffrés et offrant les services de sécurité fournis par les protocoles AH et ESP combinés. Plusieurs techniques de gestion de bande passante ont été développées en vue d’optimiser la gestion du trafic réseau. Pour évaluer les performances offertes par ces techniques et identifier laquelle serait la plus appropriée dans notre cas, nous avons effectué une comparaison basée sur le critère du délai, par le biais de tests expérimentaux. En dernière étape, nous avons évalué et comparé les performances de la passerelle de sécurité que nous proposons par rapport à trois produits commerciaux offrant les fonctions de passerelle de sécurité logicielle en vue de déterminer les points forts et faibles de notre implémentation pour la développer ultérieurement. Le manuscrit s’organise en deux parties : la première est rédigée en français et représente un résumé détaillé de la deuxième partie qui est, quant à elle, rédigée en anglais
QoS and security are two precious objectives for network systems to attain, especially for critical networks with temporal constraints. Unfortunately, they often conflict; while QoS tries to minimize the processing delay, strong security protection requires more processing time and causes traffic delay and QoS degradation. Moreover, real-time systems, QoS and security have often been studied separately and by different communities. In the context of the avionic data network various domains and heterogeneous applications with different levels of criticality cooperate for the mutual exchange of information, often through gateways. It is clear that this information has different levels of sensitivity in terms of security and QoS constraints. Given this context, the major goal of this thesis is then to increase the robustness of the next generation e-enabled avionic data network with respect to security threats and ruptures in traffic characteristics. From this perspective, we surveyed the literature to establish state of the art network security, QoS and applications with time constraints. Then, we studied the next generation e-enabled avionic data network. This allowed us to draw a map of the field, and to understand security threats. Based on this study we identified both security and QoS requirements of the next generation e-enabled avionic data network. In order to satisfy these requirements we proposed the architecture of QoS capable integrated security gateway to protect the next generation e-enabled avionic data network and ensure the availability of critical traffic. To provide for a true integration between the different gateway components we built an integrated session table to store all the needed session information and to speed up the packet processing (firewall stateful inspection, NAT mapping, QoS classification and routing). This necessitates the study of the existing session table structure and the proposition of a new structure to fulfill our objective. Also, we present the necessary processing algorithms to access the new integrated session table. In IPSec VPN component we identified the problem that IPSec ESP encrypted traffic cannot be classified appropriately by QoS edge routers. To overcome this problem, we developed a Q-ESP protocol which allows the classifications of encrypted traffic and combines the security services provided by IPSec ESP and AH. To manage the network traffic wisely, a variety of bandwidth management techniques have been developed. To assess their performance and identify which bandwidth management technique is the most suitable given our context we performed a delay-based comparison using experimental tests. In the final stage, we benchmarked our implemented security gateway against three commercially available software gateways. The goal of this benchmark test is to evaluate performance and identify problems for future research work. This dissertation is divided into two parts: in French and in English respectively. Both parts follow the same structure where the first is an extended summary of the second

Styles APA, Harvard, Vancouver, ISO, etc.

23

Biela, Philippe. « Classification automatique d'observations multidimensionnelles par réseaux de neurones compétitifs ». Lille 1, 1999. https://pepite-depot.univ-lille.fr/LIBRE/Th_Num/1999/50376-1999-469.pdf.

Texte intégral

Résumé :

L'objet du travail présenté dans ce mémoire est la classification d'observations multidimensionnelles à l'aide d'outils connexionistes appelés réseaux de neurones compétitifs. Le premier chapitre expose les principales techniques dites classique dédiées à la classification automatique d'un ensemble d'observations. Le second chapitre positionne le champ d'investigation de nos recherches dans le domaine de la classification automatique par réseaux de neurones. Nous y présentons quelques développements récents faits en classification dans le domaine cognitif en distinguant les techniques probabilistes utilisant une approche statistique et celles dédiées au domaine métrique avec une approche itérative. Le troisième chapitre présente dans le détail l'architecture et les spécificités comportementales de l'outil que nous avons développé à des fins de classification : le réseau de neurones compétitif. Enfin, le dernier chapitre montre comment, par l'action simultanée et coopérative des réseaux compétitifs, nous pouvons engendrer une action de classification cohérente parmi un ensemble d'observations disponibles d'origines inconnues. Pour illustrer et valider notre méthode nous utilisons différents échantillons d'observations issus de la simulation ou d'applications réelles comme le contrôle qualité de bouteilles en verre par vision artificielle.

Styles APA, Harvard, Vancouver, ISO, etc.

24

Poussevin, Mickael. « Apprentissage de représentation pour des données générées par des utilisateurs ». Thesis, Paris 6, 2015. http://www.theses.fr/2015PA066040/document.

Texte intégral

Résumé :

Dans cette thèse, nous étudions comment les méthodes d'apprentissage de représentations peuvent être appliquées à des données générées par l'utilisateur. Nos contributions couvrent trois applications différentes, mais partagent un dénominateur commun: l'extraction des représentations d'utilisateurs concernés. Notre première application est la tâche de recommandation de produits, où les systèmes existant créent des profils utilisateurs et objets qui reflètent les préférences des premiers et les caractéristiques des derniers, en utilisant l'historique. De nos jours, un texte accompagne souvent cette note et nous proposons de l'utiliser pour enrichir les profils extraits. Notre espoir est d'en extraire une connaissance plus fine des goûts des utilisateurs. Nous pouvons, en utilisant ces modèles, prédire le texte qu'un utilisateur va écrire sur un objet. Notre deuxième application est l'analyse des sentiments et, en particulier, la classification de polarité. Notre idée est que les systèmes de recommandation peuvent être utilisés pour une telle tâche. Les systèmes de recommandation et classificateurs de polarité traditionnels fonctionnent sur différentes échelles de temps. Nous proposons deux hybridations de ces modèles: la première a de meilleures performances en classification, la seconde exhibe un vocabulaire de surprise. La troisième et dernière application que nous considérons est la mobilité urbaine. Elle a lieu au-delà des frontières d'Internet, dans le monde physique. Nous utilisons les journaux d'authentification des usagers du métro, enregistrant l'heure et la station d'origine des trajets, pour caractériser les utilisateurs par ses usages et habitudes temporelles
In this thesis, we study how representation learning methods can be applied to user-generated data. Our contributions cover three different applications but share a common denominator: the extraction of relevant user representations. Our first application is the item recommendation task, where recommender systems build user and item profiles out of past ratings reflecting user preferences and item characteristics. Nowadays, textual information is often together with ratings available and we propose to use it to enrich the profiles extracted from the ratings. Our hope is to extract from the textual content shared opinions and preferences. The models we propose provide another opportunity: predicting the text a user would write on an item. Our second application is sentiment analysis and, in particular, polarity classification. Our idea is that recommender systems can be used for such a task. Recommender systems and traditional polarity classifiers operate on different time scales. We propose two hybridizations of these models: the former has better classification performance, the latter highlights a vocabulary of surprise in the texts of the reviews. The third and final application we consider is urban mobility. It takes place beyond the frontiers of the Internet, in the physical world. Using authentication logs of the subway users, logging the time and station at which users take the subway, we show that it is possible to extract robust temporal profiles

Styles APA, Harvard, Vancouver, ISO, etc.

25

Minaburo, Villar Ana Carolina. « Compression des en-têtes sur les réseaux bas-débit ». Rennes 1, 2003. http://www.theses.fr/2003REN10144.

Texte intégral

Résumé :

Dans les réseaux téléphoniques de troisième génération, l'utilisation d'un mécanisme de compression robuste peut réduire le temps de transmission et augmenter l'utilisation d'une ressource rare tel que le support de transmission Hertzien. Mais la compression des en-têtes signifie aussi la réduction de la redondance dans l'information transmise qui se traduit par la perte des paquets s'il y a eu une erreur. Les travaux de cette thèse se concentrent sur les principales fonctionnalités du mécanisme de compression des en-têtes ROHC (Robust Header Compression), ainsi que les résultats obtenus dans nos expérimentations, plus particulièrement sur la compression du protocole IPv6. L'architecture de ROHC est complexe mais lui permet de s'adapter aux différentes caractéristiques du lien et au flux de données. L'analyse du mécanisme ROHC dans les réseaux bas-débit nous ont permit d'identifier les différentes caractéristiques du ROHC et d'étudier le paramétrage de ROHC sur les différentes liaisons et les performances dans les réseaux bruités.

Styles APA, Harvard, Vancouver, ISO, etc.

26

Mdini, Maha. « Anomaly detection and root cause diagnosis in cellular networks ». Thesis, Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire, 2019. http://www.theses.fr/2019IMTA0144/document.

Texte intégral

Résumé :

Grâce à l'évolution des outils d'automatisation et d'intelligence artificielle, les réseauxmobiles sont devenus de plus en plus dépendants de la machine. De nos jours, une grandepartie des tâches de gestion de réseaux est exécutée d'une façon autonome, sans interventionhumaine. Dans cette thèse, nous avons focalisé sur l'utilisation des techniques d'analyse dedonnées dans le but d'automatiser et de consolider le processus de résolution de défaillancesdans les réseaux. Pour ce faire, nous avons défini deux objectifs principaux : la détectiond'anomalies et le diagnostic des causes racines de ces anomalies. Le premier objectif consiste àdétecter automatiquement les anomalies dans les réseaux sans faire appel aux connaissancesdes experts. Pour atteindre cet objectif, nous avons proposé un algorithme, Watchmen AnomalyDetection (WAD), basé sur le concept de la reconnaissance de formes (pattern recognition). Cetalgorithme apprend le modèle du trafic réseau à partir de séries temporelles périodiques etdétecte des distorsions par rapport à ce modèle dans le flux de nouvelles données. Le secondobjectif a pour objet la détermination des causes racines des problèmes réseau sans aucuneconnaissance préalable sur l'architecture du réseau et des différents services. Pour ceci, nousavons conçu un algorithme, Automatic Root Cause Diagnosis (ARCD), qui permet de localiser lessources d'inefficacité dans le réseau. ARCD est composé de deux processus indépendants :l'identification des contributeurs majeurs à l'inefficacité globale du réseau et la détection desincompatibilités. WAD et ARCD ont fait preuve d'efficacité. Cependant, il est possible d'améliorerces algorithmes sur plusieurs aspects
With the evolution of automation and artificial intelligence tools, mobile networks havebecome more and more machine reliant. Today, a large part of their management tasks runs inan autonomous way, without human intervention. In this thesis, we have focused on takingadvantage of the data analysis tools to automate the troubleshooting task and carry it to a deeperlevel. To do so, we have defined two main objectives: anomaly detection and root causediagnosis. The first objective is about detecting issues in the network automatically withoutincluding expert knowledge. To meet this objective, we have proposed an algorithm, WatchmenAnomaly Detection (WAD), based on pattern recognition. It learns patterns from periodic timeseries and detect distortions in the flow of new data. The second objective aims at identifying theroot cause of issues without any prior knowledge about the network topology and services. Toaddress this question, we have designed an algorithm, Automatic Root Cause Diagnosis (ARCD)that identifies the roots of network issues. ARCD is composed of two independent threads: MajorContributor identification and Incompatibility detection. WAD and ARCD have been proven to beeffective. However, many improvements of these algorithms are possible

Styles APA, Harvard, Vancouver, ISO, etc.

27

Gilbert, Frédéric. « Méthodes et modèles pour la visualisation de grandes masses de données multidimensionnelles nominatives dynamiques ». Thesis, Bordeaux 1, 2012. http://www.theses.fr/2012BOR14498/document.

Texte intégral

Résumé :

La visualisation d'informations est un domaine qui connaît un réel intérêt depuis une dizaine d'années. Dernièrement, avec l'explosion des moyens de communication, l'analyse de réseaux sociaux fait l'objet de nombreux travaux de recherches. Nous présentons dans cette thèse des travaux sur l'analyse de réseaux sociaux dynamiques, c'est à dire que nous prenons en compte l'aspect temporel des données. [...]
Since ten years, informations visualization domain knows a real interest.Recently, with the growing of communications, the research on social networks analysis becomes strongly active. In this thesis, we present results on dynamic social networks analysis. That means that we take into account the temporal aspect of data. We were particularly interested in communities extraction within networks and their evolutions through time. [...]

Styles APA, Harvard, Vancouver, ISO, etc.

28

Perez, Charles. « Approche comportementale pour la sécurisation des utilisateurs de réseaux sociaux numériques mobiles ». Thesis, Troyes, 2014. http://www.theses.fr/2014TROY0019/document.

Texte intégral

Résumé :

Notre société doit faire face à de nombreux changements dans les modes de communication.L’émergence simultanée des terminaux nomades et des réseaux sociaux numériques permet désormais de partager des informations depuis presque n’importe quel lieu et potentiellement avec toutes les entités connectées.Le développement de l’usage des smartphones dans un cadre professionnel ainsi que celui des réseaux sociaux numériques constitue une opportunité, mais également une source d’exposition à de nombreuses menaces telles que la fuites d’information sensible, le hameçonnage, l’accès non légitime à des données personnelles, etc.Alors que nous observons une augmentation significative de la malveillance sur les plateformes sociales, aucune solution ne permet d’assurer un usage totalement maîtrisé des réseaux sociaux numériques. L’apport principal de ce travail est la mise en place de la méthodologie (SPOTLIGHT) qui décrit un outil d’analyse comportementale d’un utilisateur de smartphone et de ses contacts sur les différents médias sociaux. La principale hypothèse est que les smartphones, qui sont étroitement liés à leurs propriétaires, mémorisent les activités de l’utilisateur (interactions) et peuvent être utiles pour mieux le protéger sur le numérique.Cette approche est implémentée dans un prototype d’application mobile appelé SPOTLIGHT 1.0 qui permet d’analyser les traces mémorisées dans le smartphone d’un utilisateur afin de l’aider à prendre les décisions adéquates dans le but de protéger ses données
Our society is facing many changes in the way it communicates. The emergence of mobile terminals alongside digital social networks allows information to be shared from almost anywhere with the option of all parties being connected simultaneously. The growing use of smartphones and digital social networks in a professional context presents an opportunity, but it also exposes businesses and users to many threats, such as leakage of sensitive information, spamming, illegal access to personal data, etc.Although a significant increase in malicious activities on social platforms can be observed, currently there is no solution that ensures a completely controlled usage of digital social networks. This work aims to make a major contribution in this area through the implementation of a methodology (SPOTLIGHT) that not only uses the behaviour of profiles for evaluation purposes, but also to protect the user. This methodology relies on the assumption that smartphones, which are closely related to their owners, store and memorise traces of activity (interactions) that can be used to better protect the user online.This approach is implemented in a mobile prototype called SPOTLIGHT 1.0, which analyses traces stored in users’ smartphone to help them make the right decisions to protect their data

Styles APA, Harvard, Vancouver, ISO, etc.

29

Rebecq, Antoine. « Méthodes de sondage pour les données massives ». Thesis, Paris 10, 2019. http://www.theses.fr/2019PA100014/document.

Texte intégral

Résumé :

Cette thèse présente trois parties liées à la théorie des sondages. La première partie présente deux résultats originaux de sondages qui ont eu des applications pratiques dans des enquêtes par sondage de l'Insee. Le premier article présente un théorème autorisant un plan de sondage stratifié constituant un compromis entre la dispersion des poids et l'allocation de précision optimale pour une variable d'intérêt spécifique. Les données d’enquête sont souvent utilisées pour estimer nombre de totaux ou modèles issus de variables exclues du design. La précision attendue pour ces variables est donc faible, mais une faible dispersion des poids permet de limiter les risques qu'une estimation dépendant d'une de ces variables ait une très mauvaise précision. Le second article concerne le facteur de repondération dans les estimateurs par calage. On propose un algorithme efficace capable de calculer les facteurs de poids les plus rapprochés autour de 1 tels qu'une solution au problème de calage existe. Cela permet de limiter les risques d'apparition d'unités influentes, particulièrement pour l'estimation sur des domaines. On étudie par simulations sur données réelles les propriétés statistiques des estimateurs obtenus. La seconde partie concerne l'étude des propriétés asymptotique des estimateurs sur données issues de sondage. Celles-ci sont difficiles à étudier en général. On présente une méthode originale qui établit la convergence faible vers un processus gaussien pour le processus empirique d'Horvitz-Thompson indexé par des classes de fonction, pour de nombreux algorithmes de sondage différents utilisés en pratique. Dans la dernière partie, on s'intéresse à des méthodes de sondage pour des données issues de graphes, qui ont des applications pratiques lorsque les graphes sont de taille telles que leur exploitation informatique est coûteuse. On détaille des algorithmes de sondage permettant d'estimer des statistiques d'intérêt pour le réseaux. Deux applications, à des données de Twitter puis à des données simulées, concluent cette partie
This thesis presents three different parts with ties to survey sampling theory. In the first part, we present two original results that led to practical applications in surveys conducted at Insee (French official statistics Institute). The first chapter deals with allocations in stratified sampling. We present a theorem that proves the existence of an optimal compromise between the dispersion of the sampling weights and the allocation yielding optimal precision for a specific variable of interest. Survey data are commonly used to compute estimates for variables that were not included in the survey design. Expected precision is poor, but a low dispersion of the weights limits risks of very high variance for one or several estimates. The second chapter deals with reweighting factors in calibration estimates. We study an algorithm that computes the minimal bounds so that the calibration estimators exist, and propose an efficient way of resolution. We also study the statistical properties of estimates using these minimal bounds. The second part studies asymptotic properties of sampling estimates. Obtaining asymptotic guarantees is often hard in practice. We present an original method that establishes weak convergence for the Horvitz-Thompson empirical process indexed by a class of functions for a lot of sampling algorithms used in practice. In the third and last part, we focus on sampling methods for populations that can be described as networks. They have many applications when the graphs are so big that storing and computing algorithms on them are very costly. Two applications are presented, one using Twitter data, and the other using simulated data to establish guidelines to design efficient sampling designs for graphs

Styles APA, Harvard, Vancouver, ISO, etc.

30

Leblanc, Brice. « Analyse non supervisée de données issues de Systèmes de Transport Intelligent-Coopératif ». Thesis, Reims, 2020. http://www.theses.fr/2020REIMS014.

Texte intégral

Résumé :

Cette thèse se situe dans le contexte des réseaux véhiculaires (VANET), et plus particulièrement dans le contexte des Systèmes de Transport Intelligent-Coopératif (STI-C). Ces systèmes échangent des informations pour améliorer la sécurité routière.Le but de cette thèse est d'introduire des outils d'analyse de données qui peuvent fournir aux opérateurs routiers des informations sur l'utilisation et état de leurs infrastructures. Par conséquent, ces informations peuvent contribuer à améliorer la sécurité routière. Nous identifions deux cas que nous voulons traiter : l'identification des profils de conduite et la détection des obstacles routiers.Pour traiter ces questions, nous proposons d'utiliser des approches d'apprentissage non supervisées : des méthodes de regroupement pour l'identification des profils de conduite, et la détection de changement de concept pour la détection des obstacles. Cette thèse présente trois contributions principales : une méthodologie nous permettant de transformer les données brutes des STI-C en un ensemble de trajectoires puis de données d'apprentissage ; l'utilisation de méthodes classiques de regroupement et des points d'intérêt pour les profils de conduite avec des expériences sur les données issues des appareils mobiles et des journaux du réseau ; et la prise en compte d'une foule de véhicules fournissant des journaux du réseau considérés comme flux de données en entrée d'algorithmes de détection de changement de concept pour reconnaître les obstacles routiers
This thesis takes place in the context of Vehicular Ad-hoc Networks (VANET), and more specifically the context of Cooperative-Intelligent Transport System (C-ITS). These systems are exchanging information to enhance road safety.The purpose of this thesis is to introduce data analysis tools that may provide road operators information on the usage/state of their infrastructures. Therefore, this information may help to improve road safety. We identify two cases we want to deal with: driving profile identification and road obstacle detection.For dealing with those issues, we propose to use unsupervised learning approaches: clustering methods for driving profile identification, and concept drift detection for obstacle detection. This thesis introduces three main contributions: a methodology allowing us to transform raw C-ITS data in, first, trajectory, and then, learning data-set; the use of classical clustering methods and Points Of Interests for driving profiles with experiments on mobile device data and network logs data; and the consideration of a crowd of vehicles providing network log data as data streams and considered as input of concept drift detection algorithms to recognize road obstacles

Styles APA, Harvard, Vancouver, ISO, etc.

31

Hassan, Hassan. « Modélisation et analyse de performances du trafic multimédia dans les réseaux hétérogènes ». Phd thesis, Université Paul Sabatier - Toulouse III, 2006. http://tel.archives-ouvertes.fr/tel-00130060.

Texte intégral

Résumé :

Ces travaux concernent la modélisation et l'analyse de performances du trafic et des applications multimédia dans les réseaux hétérogènes. Le trafic IP agrégé et les applications audio, vidéo et données sont étudiés. Cette étude nous conduit à proposer un modèle générique et hiérarchique pour la représentation des sources de trafics multimédia qui permet de décrire les applications multimédia d'une façon simple, précise et générique. Le modèle générique est implémenté et constitue le noyau d'un outil de modélisation et simulation des sources de trafics. Une caractérisation du trafic IP issu d'applications multimédia est conduite en utilisant les modèles développés avec cet outil. Particulièrement, la problématique de la modélisation des sources de trafics agrégées est adressée, et des modèles agrégés simples sont déduites pour la superposition des sources de trafics audio, vidéo et données. Le trafic agrégé de type TCP présente des propriétés statistiques variables en fonction du taux de pertes de paquets sur le réseau à cause du contrôle en boucle fermée imposé par TCP. Un nouveau modèle analytique du protocole TCP basé sur la théorie différentielle du trafic est ensuite proposé. Ce modèle permet une représentation fiable du trafic TCP tout en étant très performant sur les réseaux à grande échelle. Finalement, une extension de l'architecture du protocole SIP est présentée afin de permettre une gestion de la qualité d service au niveau session. Les mécanismes proposés reposent sur l'ordonnancement stochastique des sessions et l'allocation de la bande passante par des approches d'évaluation de bande passante équivalente. Cette dernière technique rend possible l'utilisation des formules d'Erlang dans les réseaux à commutation de paquets

Styles APA, Harvard, Vancouver, ISO, etc.

32

Michaut, Magali. « Analyse de données transcriptome et protéome pour l’étude des réponses aux stress oxydants et aux métaux lourds ». Paris 11, 2008. http://www.theses.fr/2008PA112178.

Texte intégral

Résumé :

Ce travail a pour objet l'analyse de données transcriptome et protéome pour l'étude des réponses aux stress oxydants et aux métaux lourds, en particulier chez la cyanobactérie Synechocystis. Cet organisme procaryote permet notamment d'aider à la compréhension des plantes tout en étant facilement manipulable génétiquement. La démarche a d'abord consisté à analyser les réponses transcriptionnelles des gènes de Synechocystis en conditions de stress, notamment en présence de cadmium ou de peroxyde d'hydrogène. Des méthodes de prédiction d'interactions protéine-protéine ont ensuite été développées afin de construire un réseau d'interactions. Ce dernier a été comparé à un réseau d'interactions identifiées expérimentalement, notamment en termes de structure. Puis il a été complété avec les données de transcriptome précédemment analysées, afin d’obtenir une vision plus intégrée des différents phénomènes et d’étudier la dynamique des modules fonctionnels. Les résultats font apparaître différentes phases dans les réponses transcriptionnelles, ainsi que des groupes fonctionnels de protéines en interaction et co-exprimées. De plus, l'automatisation d'une méthode de classification mixte hiérarchique-pyramidale est proposée. Une méthode d'identification de biais de composition entre des groupes de protéines a aussi été développée. Par ailleurs, un outil de prédiction d'interactions protéine-protéine, applicable à toutes les espèces séquencées, a été développé. Ce logiciel open-source, InteroPorc, présente l'avantage d'être flexible, puisqu'il peut s'appliquer à différents jeux d’interactions sources. En outre, l’outil est facilement utilisable en ligne à travers une interface web
This work aims at studying responses to oxidative stress and heavy metals through transcriptomic and proteomic data analysis, in particular in the cyanobacterium Synechocystis. This organism is a prokaryote largely studied which notably enables to improve the understanding of plants and is easy to manipulate genetically. The approach first involved analysing the transcriptional responses of Synechocystis' genes in stress conditions, particularly in the presence of cadmium or hydrogen peroxide. Methods to predict protein-protein interactions were then developed in order to construct an interaction network. This network was compared to an experimental network in terms of structure. It was then complemented with transcriptomic data previously analysed in order to obtain a more integrated view of the different phenomena and to study the dynamics of functional modules. The results show different phases in the transcriptional responses as well as functional groups of interacting and coexpressed proteins. In addition, the automation of a mixed hierarchical-pyramidal classification method is proposed. A method to identify composition biases between groups of proteins was also developed. Furthermore, a protein-protein interaction prediction tool was developed, of use for all sequenced species. This open-source software, InteroPorc, has been made available and has the great advantage of being flexible since it can be applied to different source interactions. Furthermore this tool can be easily run online through a web interface (http://biodev. Extra. Cea. Fr/interoporc/)

Styles APA, Harvard, Vancouver, ISO, etc.

33

Stattner, Erick. « Contributions à l'étude des réseaux sociaux : propagation, fouille, collecte de données ». Phd thesis, Université des Antilles-Guyane, 2012. http://tel.archives-ouvertes.fr/tel-00830882.

Texte intégral

Résumé :

Le concept de réseau offre un modèle de représentation pour une grande variété d'objets et de systèmes, aussi bien naturels que sociaux, dans lesquels un ensemble d'entités homogènes ou hétérogènes interagissent entre elles. Il est aujourd'hui employé couramment pour désigner divers types de structures relationnelles. Pourtant, si chacun a une idée plus ou moins précise de ce qu'est un réseau, nous ignorons encore souvent les implications qu'ont ces structures dans de nombreux phénomènes du monde qui nous entoure. C'est par exemple le cas de processus tels que la diffusion d'une rumeur, la transmission d'une maladie, ou même l'émergence de sujets d'intérêt commun à un groupe d'individus, dans lesquels les relations que maintiennent les individus entre eux et leur nature s'avèrent souvent être les principaux facteurs déterminants l'évolution du phénomène. C'est ainsi que l'étude des réseaux est devenue l'un des domaines émergents du 21e siècle appelé la "Science des réseaux". Dans ce mémoire, nous abordons trois problèmes de la science des réseaux: le problème de la diffusion dans les réseaux sociaux, où nous nous sommes intéressés plus particulièrement à l'impact de la dynamique du réseau sur le processus de diffusion, le problème de l'analyse des réseaux sociaux, dans lequel nous avons proposé une solution pour tirer parti de l'ensemble des informations disponibles en combinant les informations sur la structure du réseau et les attributs des noeuds et le problème central de la collecte de données sociales, où nous nous sommes intéressés au cas particulier de la collecte de données en milieux sauvages.

Styles APA, Harvard, Vancouver, ISO, etc.

34

Jaffré, Mikaël. « Migration des oiseaux et changement climatique : analyse des données de migration active en France et en Europe ». Thesis, Lille 1, 2012. http://www.theses.fr/2012LIL10176.

Texte intégral

Résumé :

Ces dernières années, de nombreuses études ont mis en évidence que le cycle de vie et le comportement des organismes sont en train de changer en réponse au réchauffement climatique. Le modèle d’étude des oiseaux apparaît être un excellent témoin de ces changements et présente l’avantage d’être particulièrement bien documenté, grâce notamment à l’existence de séries de données biologiques sur de longues périodes. Parmi ces séries, celles recueillies sur les sites de suivi de la migration active sont particulièrement appropriées pour détecter les changements phénologiques et la tendance populationnelle des oiseaux migrateurs sur le long terme, et n’ont jusque là que très peu été considérées. Au cours de cette thèse, après avoir réalisé un inventaire exhaustif des sites de suivi de la migration active en France, nous avons déterminé les critères d’exploitabilité de ces données et les méthodes adaptées à leur utilisation. En analysant ces données, il a été mis en évidence chez les migrateurs courte-distance un allongement du temps de présence sur les sites de reproduction ainsi qu’un raccourcissement des distances de migration, laissant supposer une tendance à la sédentarisation à proximité des sites de reproduction. De plus, nous avons montré que ces changements du comportement migratoire ne s’opèrent pas systématiquement de façon linéaire, progressive, mais souvent de façon abrupte, soudaine, et synchrone (e.g. circa 1995). Une telle modification est à la fois la cause et la conséquence d’une réorganisation dynamique des écosystèmes qui opère notamment au travers des réseaux trophiques, témoignant d’une réponse à grande échelle des écosystèmes face au changement climatique
In recent years, a number of studies have highlighted that the life cycle and behaviour of organisms are changing as a result of global warming. Birds appear to be suitable models to detect these changes because this taxonomic group is particularly well documented, with a large amount of biological datasets available over long periods. Among them, those collected at migration watchsites are particularly valuable to detect long term phenological changes and population trends of migratory birds, but these data have been poorly considered so far. In this thesis, an exhaustive inventory of monitoring watchsites in France is first performed; we then determined the minimum requirements to use such heterogeneous datasets in order to reliably estimate changes in bird phenology and population. We showed that short-distance migrants have lengthened their breeding area residence time and have shortened their migration distances. It suggests that these birds may become resident close to their breeding sites. In addition, we demonstrated that these changes in migratory behaviour do not always occur linearly or gradually, but often abruptly, suddenly, and in a synchronous way (e.g. circa 1995). Such changes are both the cause and the consequence of a dynamical reorganization of ecosystems identified through food webs, indicating a large-scale response of ecosystems to climate change

Styles APA, Harvard, Vancouver, ISO, etc.

35

Bigeard, Elise. « Détection et analyse de la non-adhérence médicamenteuse dans les réseaux sociaux ». Thesis, Lille 3, 2019. http://www.theses.fr/2019LIL3H026.

Texte intégral

Résumé :

La non-adhérence médicamenteuse désigne les situations où le patient ne suit pas les directives des autorités médicales concernant la prise d'un médicament. Il peut s'agir d'une situation où le patient prend trop (sur-usage) ou pas assez (sous-usage) de médicaments, boit de l'alcool alors qu'il y a une contrindication, ou encore commet une tentative de suicide à l'aide de médicaments. Selon [HAYNES 2002] améliorer l'adhérence pourrait avoir un plus grand impact sur la santé de la population que tout autre amélioration d'un traitement médical spécifique. Cependant les données sur la non-adhérence sont difficiles à acquérir, puisque les patients en situation de non-adhérence sont peu susceptibles de rapporter leurs actions à leurs médecins. Nous proposons d'exploiter les données des réseaux sociaux pour étudier la non-adhérence médicamenteuse.Dans un premier temps, nous collectons un corpus de messages postés sur des forums médicaux. Nous construisons des vocabulaires de noms de médicaments et de maladies utilisés par les patients. Nous utilisons ces vocabulaires pour indexer les médicaments et maladies dans les messages. Ensuite nous utilisons des méthodes d'apprentissage supervisé et de recherche d'information pour détecter les messages de forum parlant d'une situation de non-adhérence. Avec les méthodes d'apprentissage supervisé, nous obtenons 0,433 de F-mesure, avec un maximum de 0,421 de précision ou 0,610 de rappel. Avec les méthodes de recherche d'information, nous atteignons une précision de 0,8 sur les dix premiers résultats. Nous étudions ensuite le contenu des messages ainsi découverts pour connaître les différents types de non-adhérence et savoir comment et pourquoi les patients se retrouvent dans de telles situations. Nous identifions 3 motivations : gérer soi-même sa santé, rechercher un effet différent de celui pour lequel le médicament est prescrit, être en situation d'addiction ou d'accoutumance. La gestion de sa santé recouvre ainsi plusieurs situations : éviter un effet secondaire, moduler l'effet du médicament, sous-utiliser un médicament perçu comme inutile, agir sans avis médical. Additionnellement, une non-adhérence peut survenir par erreur ou négligence, sans motivation particulière. À l'issue de notre étude nous produisons : un corpus annoté avec des messages de non-adhérence, un classifieur capable de détecter les messages de non-adhérence, une typologie des situations de non-adhérence et une analyse des causes de la non-adhérence
Drug non-compliance refers to situations where the patient does not follow instructions from medical authorities when taking medications. Such situations include taking too much (overuse) or too little (underuse) of medications, drinking contraindicated alcohol, or making a suicide attempt using medication. According to [HAYNES 2002] increasing drug compliance may have a bigger impact on public health than any other medical improvements. However non-compliance data are difficult to obtain since non-adherent patients are unlikely to report their behaviour to their healthcare providers. This is why we use data from social media to study drug non-compliance. Our study is applied to French-speaking forums.First we collect a corpus of messages written by users from medical forums. We build vocabularies of medication and disorder names such as used by patients. We use these vocabularies to index medications and disorders in the corpus. Then we use supervised learning and information retrieval methods to detect messages talking about non-compliance. With machine learning, we obtain 0.433 F-mesure, with up to 0.421 precision or 0.610 recall. With information retrieval, we reach 0.8 precision on the first ten results.After that, we study the content of the non-compliance messages. We identify various non-compliance situations and patient's motivations. We identify 3 main motivations: self-medication, seeking an effect besides the effect the medication was prescribed for, or being in addiction or habituation situation. Self-medication is an umbrella for several situations: avoiding an adverse effect, adjusting the medication's effect, underuse a medication seen as useless, taking decisions without a doctor's advice. Non-compliance can also happen thanks to errors or carelessness, without any particular motivation.Our work provides several kinds of result: annotated corpus with non-compliance messages, classifier for the detection of non-compliance messages, typology of non-compliance situations and analysis of the causes of non-compliance

Styles APA, Harvard, Vancouver, ISO, etc.

36

Hulot, Audrey. « Analyses de données omiques : clustering et inférence de réseaux Female ponderal index at birth and idiopathic infertility ». Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASL034.

Texte intégral

Résumé :

Le développement des méthodes de biologie haut-débit (séquençage et spectrométrie de masse) a permis de générer de grandes masses de données, dites -omiques, qui nous aident à mieux comprendre les processus biologiques.Cependant, isolément, chaque source -omique ne permet d'expliquer que partiellement ces processus. Mettre en relation les différentes sources de donnés -omiques devrait permettre de mieux comprendre les processus biologiques mais constitue un défi considérable.Dans cette thèse, nous nous intéressons particulièrement aux méthodes de clustering et d’inférence de réseaux, appliquées aux données -omiques.La première partie du manuscrit présente trois méthodes. Les deux premières méthodes sont applicables dans un contexte où les données peuvent être de nature hétérogène.La première concerne un algorithme d’agrégation d’arbres, permettant la construction d’un clustering hiérarchique consensus. La complexité sous-quadratique de cette méthode a fait l’objet d’une démonstration, et permet son application dans un contexte de grande dimension. Cette méthode est disponible dans le package R mergeTrees, accessible sur le CRAN.La seconde méthode concerne l’intégration de données provenant d’arbres ou de réseaux, en transformant les objets via la distance cophénétique ou via le plus court chemin, en matrices de distances. Elle utilise le Multidimensional Scaling et l’Analyse Factorielle Multiple et peut servir à la construction d’arbres et de réseaux consensus.Enfin, dans une troisième méthode, on se place dans le contexte des modèles graphiques gaussiens, et cherchons à estimer un graphe, ainsi que des communautés d’entités, à partir de plusieurs tables de données. Cette méthode est basée sur la combinaison d’un Stochastic Block Model, un Latent block Model et du Graphical Lasso.Cette thèse présente en deuxième partie les résultats d’une étude de données transcriptomiques et métagénomiques, réalisée dans le cadre d’un projet appliqué, sur des données concernant la Spondylarthrite ankylosante
The development of biological high-throughput technologies (next-generation sequencing and mass spectrometry) have provided researchers with a large amount of data, also known as -omics, that help better understand the biological processes.However, each source of data separately explains only a very small part of a given process. Linking the differents -omics sources between them should help us understand more of these processes.In this manuscript, we will focus on two approaches, clustering and network inference, applied to omics data.The first part of the manuscript presents three methodological developments on this topic. The first two methods are applicable in a situation where the data are heterogeneous.The first method is an algorithm for aggregating trees, in order to create a consensus out of a set of trees. The complexity of the process is sub-quadratic, allowing to use it on data leading to a great number of leaves in the trees. This algorithm is available in an R-package named mergeTrees on the CRAN.The second method deals with the integration data from trees and networks, by transforming these objects into distance matrices using cophenetic and shortest path distances, respectively. This method relies on Multidimensional Scaling and Multiple Factor Analysis and can be also used to build consensus trees or networks.Finally, we use the Gaussian Graphical Models setting and seek to estimate a graph, as well as communities in the graph, from several tables. This method is based on a combination of Stochastic Block Model, Latent Block Model and Graphical Lasso.The second part of the manuscript presents analyses conducted on transcriptomics and metagenomics data to identify targets to gain insight into the predisposition of Ankylosing Spondylitis

Styles APA, Harvard, Vancouver, ISO, etc.

37

Ben, Abdallah Emna. « Étude de la dynamique des réseaux biologiques : apprentissage des modèles, intégration des données temporelles et analyse formelle des propriétés dynamiques ». Thesis, Ecole centrale de Nantes, 2017. http://www.theses.fr/2017ECDN0041.

Texte intégral

Résumé :

Au cours des dernières décennies, l’émergence d’une large gamme de nouvelles technologies a permis de produire une quantité massive de données biologiques (génomique, protéomique...). Ainsi, une grande quantité de données de séries temporelles est maintenant élaborée tous les jours. Nouvellement produites, ces données peuvent nous fournir des nouvelles interprétations sur le comportement des Systèmes Biologiques (SB). Cela conduit alors à des développements considérables dans le domaine de la bioinformatique qui peuvent tirer profit de ces données. Ceci justifie notre motivation pour le développement de méthodes efficaces qui exploitent ces données pour l’apprentissage des Réseaux de Régulation Biologique (RRB) modélisant les SB. Nous introduisons alors, dans cette thèse, une nouvelle approche qui infère des RRB à partir des données de séries temporelles. Les RRB appris sont présentés avec un nouveau formalisme, introduit dans cette thèse, appelé " réseau d’automates avec le temps" (T-AN). Ce dernier assure le raffinement de la dynamique des RRB, modélisés avec le formalisme des réseaux d’automates (AN), grâce à l’intégration d’un paramètre temporel (délai) dans les transitions locales des automates. Cet enrichissement permet de paramétrer les transitions entre les états locaux des automates et aussi entre les états globaux du réseau. À posteriori de l’apprentissage des RRB, et dans le but d’avoir une meilleure compréhension de la nature du fonctionnement des SB, nous procédons à l’analyse formelle de la dynamique des RRB. Nous introduisons alors des méthodes logiques originales (développées en Answer Set Programming) pour déchiffrer l’énorme complexité de la dynamique des SB. Les propriétés dynamiques étudiées sont : l’identification des attracteurs (ensemble d’états globaux terminaux dont le réseau ne peut plus s’échapper) et la vérification de la propriété d’atteignabilité d’un objectif (un ensemble de composants) à partir d’un état global initial du réseau
Over the last few decades, the emergence of a wide range of new technologies has produced a massive amount of biological data (genomics, proteomics...). Thus, a very large amount of time series data is now produced every day. The newly produced data can give us new ideas about the behavior of biological systems. This leads to considerable developments in the field of bioinformatics that could benefit from these enormous data. This justifies the motivation to develop efficient methods for learning Biological Regulatory Networks (BRN) modeling a biological system from its time series data. Then, in order to understand the nature of system functions, we study, in this thesis, the dynamics of their BRN models. Indeed, we focus on developing original and scalable logical methods (implemented in Answer Set Programming) to deciphering the emerging complexity of dynamics of biological systems. The main contributions of this thesis are enumerated in the following. (i) Refining the dynamics of the BRN, modeling with the automata Network (AN) formalism, by integrating a temporal parameter (delay) in the local transitions of the automata. We call the extended formalism a Timed Automata Network (T-AN). This integration allows the parametrization of the transitions between each automata local states as well as between the network global states. (ii) Learning BRNs modeling biological systems from their time series data. (iii) Model checking of discrete dynamical properties of BRN (modeling with AN and T-AN) by dynamical formal analysis : attractors identification (minimal trap domains from which the network cannot escape) and reachability verification of an objective from a network global initial state

Styles APA, Harvard, Vancouver, ISO, etc.

38

Abidi, Karima. « La construction automatique de ressources multilingues à partir des réseaux sociaux : application aux données dialectales du Maghreb ». Electronic Thesis or Diss., Université de Lorraine, 2019. http://www.theses.fr/2019LORR0274.

Texte intégral

Résumé :

Le traitement automatique des langues est fondé sur l'utilisation des ressources langagières telles que les corpus de textes, les dictionnaires, les lexiques de sentiments, les analyseurs morpho-syntaxiques, les taggers, etc. Pour les langues naturelles, ces ressources sont souvent disponibles. En revanche, lorsqu'il est question de traiter les langues peu dotées, on est souvent confronté au manque d'outils et de données. Dans cette thèse, on s'intéresse à certaines formes vernaculaires de l'arabe utilisées au Maghreb. Ces formes sont connues sous le terme de dialecte que l'on peut classer dans la catégorie des langues peu dotées. Exceptés des textes brutes extraits généralement des réseaux sociaux, il existe très peu de ressources permettant de traiter les dialectes arabes. Ces derniers, comparativement aux autres langues peu dotées possèdent plusieurs spécificités qui les rendent plus difficile à traiter. Nous pouvons citer notamment l'absence de règles d'écriture de ces dialectes, ce qui conduit les usagers à écrire le dialecte sans suivre des règles précises, par conséquent un même mot peut avoir plusieurs graphies. Les mots en arabe dialectal peuvent s’écrire en utilisant le script arabe et/ou le script latin (écriture dite arabizi). Pour les dialectes arabes du Maghreb, ils sont particulièrement influencés par des langues étrangères comme le français et l'anglais. En plus de l'emprunt de mots de ces langues, un autre phénomène est à prendre en compte en traitement automatique des dialectes. Il s'agit du problème connu sous le terme de code-switching. Ce phénomène est connu en linguistique sous le terme de diglossie. Cela a pour conséquence de laisser libre cours à l’utilisateur qui peut écrire en plusieurs langues dans une même phrase. Il peut ainsi commencer en dialecte arabe et au milieu de la phrase, il peut "switcher" vers le français, l'anglais ou l’arabe standard. En plus de cela, il existe plusieurs dialectes dans un même pays et a fortiori plusieurs dialectes différents dans le monde arabe. Il est donc clair que les outils NLP classiques développés pour l’arabe standard ne peuvent être utilisés directement pour traiter les dialectes. L'objectif principal de ce travail consiste à proposer des méthodes permettant la construction automatique de ressources pour les dialectes arabes en général et les dialectes du Maghreb en particulier. Cela représente notre contribution à l'effort fourni par la communauté travaillant sur le traitement automatique des dialectes arabes. Nous avons ainsi produit des méthodes permettant de construire des corpus comparables, des ressources lexicales contenant les différentes formes d'une entrée et leur polarité. Par ailleurs, nous avons développé des méthodes pour le traitement de l'arabe standard sur des données de Twitter et également sur les transcriptions provenant d'un système de reconnaissance automatique de la parole opérant sur des vidéos en arabe extraites de chaînes de télévisions arabes telles que Al Jazeera, France24, Euronews, etc. Nous avons ainsi comparé les opinions des transcriptions automatiques provenant de sources vidéos multilingues différentes et portant sur le même sujet en développant une méthode fondée sur la théorie linguistique dite Appraisal
Automatic language processing is based on the use of language resources such as corpora, dictionaries, lexicons of sentiments, morpho-syntactic analyzers, taggers, etc. For natural languages, these resources are often available. On the other hand, when it comes to dealing with under-resourced languages, there is often a lack of tools and data. In this thesis, we are interested in some of the vernacular forms of Arabic used in Maghreb. These forms are known as dialects, which can be classified as poorly endowed languages. Except for raw texts, which are generally extracted from social networks, there is not plenty resources allowing to process Arabic dialects. The latter, compared to other under-resourced languages, have several specificities that make them more difficult to process. We can mention, in particular the lack of rules for writing these dialects, which leads the users to write the dialect without following strict rules, so the same word can have several spellings. Words in Arabic dialect can be written using the Arabic script and/or the Latin script (arabizi). For the Arab dialects of the Maghreb, they are particularly impacted by foreign languages such as French and English. In addition to the borrowed words from these languages, another phenomenon must be taken into account in automatic dialect processing. This is the problem known as code- switching. This phenomenon is known in linguistics as diglossia. This gives free rein to the user who can write in several languages in the same sentence. He can start in Arabic dialect and in the middle of the sentence, he can switch to French, English or modern standard Arabic. In addition to this, there are several dialects in the same country and a fortiori several different dialects in the Arab world. It is therefore clear that the classic NLP tools developed for modern standard Arabic cannot be used directly to process dialects. The main objective of this thesis is to propose methods to build automatically resources for Arab dialects in general and more particularly for Maghreb dialects. This represents our contribution to the effort made by the community working on Arabic dialects. We have thus produced methods for building comparable corpora, lexical resources containing the different forms of an input and their polarity. In addition, we developed methods for processing modern standard Arabic on Twitter data and also on transcripts from an automatic speech recognition system operating on Arabic videos extracted from Arab television channels such as Al Jazeera, France24, Euronews, etc. We compared the opinions of automatic transcriptions from different multilingual video sources related to the same subject by developing a method based on linguistic theory called Appraisal

Styles APA, Harvard, Vancouver, ISO, etc.

39

El, Haddadi Anass. « Fouille multidimensionnelle sur les données textuelles visant à extraire les réseaux sociaux et sémantiques pour leur exploitation via la téléphonie mobile ». Toulouse 3, 2011. http://thesesups.ups-tlse.fr/1378/.

Texte intégral

Résumé :

La concurrence est un concept fondamental de la tradition libérale et des sciences économiques qui oblige les entreprises à pratiquer l'Intelligence Economique (IE) pour bien se positionner sur le marché ou tout simplement pour survivre. Mais souvent, ce n'est pas le plus fort qui survit, ni le plus intelligent, mais celui qui est le plus sensible au changement, facteur dominant dans la société actuelle. Les changements proviennent de l'extérieur ou naissent au sein même de l'entreprise et peuvent l'affecter plus ou moins durablement. Dès lors, les entreprises sont appelées à rester constamment en veille pour guetter le moindre changement en vue d'y apporter la solution adéquate en temps réel. Cependant, pour une veille réussie, on ne doit pas se contenter uniquement de surveiller les opportunités, mais avant tout, d'anticiper les menaces. Malheureusement, cette veille se déroule en oubliant l'indispensable volet sécurité de l'IE à savoir la sécurité des données manipulées et celle des procédés suivis pour atteindre les objectifs de l'IE. Nos travaux de recherche consistent à proposer un Système d'Intelligence Economique (SIE) Généraliste et Mobile. Ce SIE intègre une approche de modélisation du contrôle d'accès aux données et aux traitements pour sécuriser toutes les informations et les flux d'interaction durant son cycle de vie. Le besoin en matière de sécurité dans un SIE provient du fait que les informations manipulées sont d'ordre stratégique ayant une valeur assez importante. Une telle sécurité ne doit pas être considérée comme une option supplémentaire qu'offre un SIE pour se distinguer d'un autre. D'autant plus que la fuite de ces informations n'est pas le fait de faiblesses inhérentes aux systèmes informatiques des entreprises, mais c'est avant tout une question organisationnelle. La mobilité présente un choix stratégique pour notre SIE ''XPlor EveryWhere'', dont le but est de permettre aux utilisateurs de nos solutions de veille de continuer à rechercher, surveiller, valider et rediffuser des informations stratégiques au cours de leurs déplacements. Ils n'ont ainsi plus besoin d'être assis face à leur ordinateur pour accéder à des données utiles dans l'instant (préparation d'une réunion, nouvel ordre du jour, information sur un interlocuteur, une technologie, un marché, demande urgente d'une analyse ou d'un focus spécifique). Il leur suffit simplement d'utiliser discrètement, et en tout sécurité, leur appareil mobile. Grâce à XPlor EveryWhere, ils sont en permanence au cœur de l'information pertinente
Competition is a fundamental concept of the liberal economy tradition that requires companies to resort to Competitive Intelligence (CI) in order to be advantageously positioned on the market, or simply to survive. Nevertheless, it is well known that it is not the strongest of the organizations that survives, nor the most intelligent, but rather, the one most adaptable to change, the dominant factor in society today. Therefore, companies are required to remain constantly on a wakeful state to watch for any change in order to make appropriate solutions in real time. However, for a successful vigil, we should not be satisfied merely to monitor the opportunities, but before all, to anticipate risks. The external risk factors have never been so many: extremely dynamic and unpredictable markets, new entrants, mergers and acquisitions, sharp price reduction, rapid changes in consumption patterns and values, fragility of brands and their reputation. To face all these challenges, our research consists in proposing a Competitive Intelligence System (CIS) designed to provide online services. Through descriptive and statistics exploratory methods of data, Xplor EveryWhere display, in a very short time, new strategic knowledge such as: the profile of the actors, their reputation, their relationships, their sites of action, their mobility, emerging issues and concepts, terminology, promising fields etc. The need for security in XPlor EveryWhere arises out of the strategic nature of information conveyed with quite a substantial value. Such security should not be considered as an additional option that a CIS can provide just in order to be distinguished from one another. Especially as the leak of this information is not the result of inherent weaknesses in corporate computer systems, but above all it is an organizational issue. With Xplor EveryWhere we completed the reporting service, especially the aspect of mobility. Lastly with this system, it's possible to: View updated information as we have access to our strategic database server in real-time, itself fed daily by watchmen. They can enter information at trade shows, customer visits or after meetings

Styles APA, Harvard, Vancouver, ISO, etc.

40

El, Khoury Hicham. « Une modélisation formelle orientée flux de données pour l'analyse de configuration de sécurité réseau ». Toulouse 3, 2014. http://thesesups.ups-tlse.fr/2499/.

Texte intégral

Résumé :

La mise en œuvre d’une politique de sécurité réseau consiste en la configuration de mécanismes de sécurité hétérogènes (passerelles IPsec, listes de contrôle d’accès sur les routeurs, pare-feux à états, proxys, etc. ) disponibles dans un environnement réseau donné. La complexité de cette tâche réside dans le nombre, la nature, et l’interdépendance des mécanismes à considérer. Si différents travaux de recherche ont tenté de fournir des outils d’analyse, la réalisation de cette tâche repose aujourd’hui encore sur l’expérience et la connaissance des administrateurs sécurité qui doivent maîtriser tous ces paramètres. Dans cette thèse nous proposons une solution pour faciliter le travail des administrateurs réseau. En effet, nombre d’inconsistances viennent de l’incompatibilité de règles de politiques, de l’incompatibilité de mécanismes mis en œuvre successivement au sein des équipements traversés. Une théorie formelle générique qui permet de raisonner sur les flux de données réseau est manquante. Dans cette optique, nous présentons trois résultats complémentaires : 1-un modèle formel orienté flux de données pour l’analyse de politiques de sécurité réseau afin de détecter les problèmes de consistance entre différents mécanismes de sécurité sur des équipements différents jouant un rôle à différents niveaux dans les couches ISO. Dans ce modèle, nous avons modélisé un flux d’information par un triplet contenant la liste des protocoles de communication dont le flux résulte, la liste des attributs dont l’authentification est garantie, et la liste des attributs dont la confidentialité est garantie. 2-un formalisme indépendant de la technologie basé sur les flux de données pour la représentation des mécanismes de sécurité ; nous avons spécifié formellement la capacité et la configuration des mécanismes de sécurité devant être mis en œuvre en construisant une abstraction des flux physiques de blocs de données. Nous avons proposé une solution qui peut répondre aux exigences de sécurité et qui peut aider à analyser les conflits liés au déploiement de plusieurs technologies installées sur plusieurs équipements 3-afin d’évaluer à la fois la capacité d’expression et d’analyse du langage de modélisation, nous avons utilisé les réseaux de Petri colorés pour spécifier formellement notre langage. L’objectif de nos recherches vise l’intérêt et la mise à disposition d’un langage de modélisation pour décrire et valider les architectures solutions répondant à des exigences de sécurité réseau. Des simulations appliquées à des cas particuliers, comme le protocole IPsec, NA(P)T et Netfilter/iptables, complètent notre démarche. Néanmoins, l’analyse des conflits de sécurité se fait actuellement par simulation et de manière non exhaustive. Nos travaux futurs viseront à aider/automatiser l’analyse en permettant aux intéressés de définir les propriétés en logique temporelle par exemple qui seront contrôlées automatiquement
The implementation of network security policy requires the configuration of heterogeneous and complex security mechanisms in a given network environment (IPsec gateways, ACLs on routers, stateful firewalls, proxies, etc. ). The complexity of this task resides in the number, the nature, and the interdependence of these mechanisms. Although several researchers have proposed different analysis tools, achieving this task still requires experienced and proficient security administrators who can handle all these parameters. In this thesis, we propose a solution to facilitate the work of network administrators. Indeed, many inconsistencies come from the incompatibility of policy rules and/or incompatible mechanisms implemented in devices through which packets travel. A generic formal theory that allows reasoning about network data flows and security mechanisms is missing. With this end in mind, we develop in this thesis three results: •A formal data-flow oriented model to analyze and detect network security conflicts between different mechanisms playing a role at various ISO levels. We modeled a flow of information by a triplet containing the list of communication protocols (i. E. , encapsulation), the list of authenticated attributes and the list of encrypted attributes, •A generic attribute-based model for network security mechanisms representation and configuration. We have formally specified the capacity and configuration of security mechanisms by constructing an abstraction of physical flows of data blocks. We have proposed a solution that can satisfy security requirements and can help conflicts analysis in the deployment of technologies installed on different devices, •To evaluate both the ability of expression and analysis power of the modeling language. We have used CPN Tools [Jensen et Kristensen 2009] and [CPN tools] to formally specify our language. The goal of our research is to propose a modeling language for describing and validating architectural solutions that meet network security requirements. Simulations are applied to specific scenarios, such as the IPsec, NA(P)T and Netfilter/iptables protocols, to validate our approach. Nevertheless, the analysis of security conflicts is currently done by simulation and in a non-exhaustive manner. Our future work will aim to assist/automate the analysis by allowing the definition of properties in temporal logic for instance which will be automatically controlled

Styles APA, Harvard, Vancouver, ISO, etc.

41

Bendella, Meryem. « Fouille de données provenant des réseaux sociaux pour la détection et la recherche ». Electronic Thesis or Diss., Aix-Marseille, 2019. http://www.theses.fr/2019AIXM0612.

Texte intégral

Résumé :

L'avènement des réseaux sociaux a suscité un intérêt considérable pour la société au cours de notre décennie. Ces plateformes permettent aux utilisateurs de produire, partager et échanger des contenus divers. Twitter est l'un des réseaux sociaux les plus populaires permettant à ses utilisateurs de publier des messages, appelés tweets. Ces derniers peuvent contenir des textes offensifs, tels que les messages de harcèlement, ou encore des informations liées à des sujets controversés. De nombreux travaux de recherche ont montré comment ces contenus sociaux peuvent avoir une influence sur les utilisateurs. Un système de détection de ce type de messages est nécessaire afin de protéger l'utilisateur et prédire l'apparition des évènements. Dans ce travail de thèse, nous proposons un système de détection de tweets suspects basé sur les modèles thématiques probabilistes et la logique floue. Afin d'identifier les tweets de harcèlement, nous introduisons un modèle de classification exploitant un ensemble de caractéristiques et utilisant des algorithmes d'apprentissage supervisé. Les utilisateurs effectuent également des recherches sur ces plateformes pour trouver des informations qui répondent à un besoin exprimé par une requête. Cependant, les tweets sont courts et l'accès à l'information est parfois difficile. Une partie de nos travaux se situe plus particulièrement dans le contexte de la recherche d'information sociale et vise à améliorer la recherche de tweets. Nous proposons une méthode d'expansion de requêtes, afin de pallier le problème de concision des messages ainsi que des requêtes, basée sur l’extraction des motifs fermés fréquents et utilisant des plongements lexicaux
Social networks have gained a significant interest for society during our decade. These platforms allow users to produce, share and exchange various content. Twitter is one of the most popular social networks that allow users to publish messages, called tweets. These tweets may contain offensive texts, such as harassment or bullying messages, or information related to abnormal topics. Many research studies have shown how such social content can have an impact on users and cause psychological harm. Developing a system for detecting such type of messages is necessary to protect the user and predict tragic events. The work presented in this thesis is brought into the context of data mining from Twitter to identify and detect such messages. We propose a suspicious tweets detection system based on probabilistic topic models and fuzzy logic. In order to identify harassment tweets, we introduce a classification model that exploits a set of features and uses supervised learning algorithms. People also use social networks to search for relevant posts that satisfy their information need where this need is usually formulated using a textual query. Twitter’s messages are short and access to information is sometimes difficult because of the variety of published content and huge amount of data generated. The second part of this work deals with the context of social information retrieval and aims to improve tweets retrieval quality. We propose a query expansion approach to overcome the shortness of user queries and tweets by extracting frequent closed patterns and using word embeddings

Styles APA, Harvard, Vancouver, ISO, etc.

42

Dang, The Anh. « Analysis of community in social networks ». Paris 13, 2012. http://www.theses.fr/2012PA132043.

Texte intégral

Résumé :

Un réseau social est une structure composée d'entités reliées par un ou plusieurs types d'interdépendance, le plus souvent modélisé par un ou plusieurs graphes. Une caractéristique importante des réseaux sociaux est leur structure en communautés. Une communauté est définie comme un ensemble de nœuds qui interagissent d'avantage entre eux qu'avec le reste du réseau. Cette thèse porte sur l'analyse des communautés dans les réseaux sociaux, qui est utile pour de nombreuses tâches, telles la caractérisation de la structure, les systèmes de recommandation, la visualisation, ou encore le suivi de la dynamique. Nous proposons notamment des techniques pour découvrir les communautés dans les graphes bipartites, basé sur l'optimisation de modularités bipartites. Nous étudions ensuite la détection de communautés dans les graphes dont les nœuds sont associés à des attributs, comme cela est très souvent le cas dans les applications réelles. Nos algorithmes considèrent simultanément la structure et les attributs du graphe et détectent des communautés telles que les nœuds dans la même communauté soient densément connectés et portent des attributs proches. Les méthodes développées sont appliquées à l'analyse des communautés du site web social Skyrock et de réseaux de blogs, dans le cadre du projet ANR ExDEUSS CEDRES. Nous étudions aussi la contribution des informations extraites des communautés pour améliorer la performance des systèmes de recommandation. Enfin, nous proposons un modèle génératif de réseau social intégrant les attributs de nœuds et la structure des communautés, qui nous permet de proposer des jeux de tests artificiels simulant des réseaux complexes réels.

Styles APA, Harvard, Vancouver, ISO, etc.

43

Bonnaffoux, Arnaud. « Inférence de réseaux de régulation de gènes à partir de données dynamiques multi-échelles ». Thesis, Lyon, 2018. http://www.theses.fr/2018LYSEN054/document.

Texte intégral

Résumé :

L'inférence des réseaux de régulation de gènes (RRG) à partir de données d'expression est un défi majeur en biologie. L’arrivée des technologies de mesure de transcriptomique à l’échelle de la cellule a suscité de nombreux espoirs, mais paradoxalement elles montrent une nouvelle complexité du problème d’inférence des RRG qui limite encore les approches existantes. Nous avons commencé par montrer, à partir de données d'expression en cellules uniques acquises sur un modèle aviaire de différenciation érythrocytaire, que les RRG sont des systèmes stochastiques à l'échelle de la cellule et qu'il y a une évolution dynamique de cette stochasticité au cours du processus de différenciation (Richard et al, PLOS Comp.Biol., 2016). C'est pourquoi nous avons développé par la suite un modèle de RRG mécaniste qui inclus cette stochasticité afin d'exploiter au maximum l'information des données expérimentales à l'échelle de la cellule (Herbach et al, BMC Sys.Biol., 2017). Ce modèle décrit les interactions entre gènes comme un couplage de processus de Markov déterministes par morceaux. En régime stationnaire une formule explicite de la distribution jointe est dérivée du modèle et peut servir à inférer des réseaux simples. Afin d'exploiter l'information dynamique et d'intégrer d'autres données expérimentales (protéomique, demi-vie des ARN), j’ai développé à partir du modèle précédent une approche itérative, intégrative et parallèle, baptisée WASABI qui est basé sur le concept de vague d'expression (Bonnaffoux et al, en révision, 2018). Cette approche originale a été validée sur des modèles in-silico de RRG, puis sur nos données in-vitro. Les RRG inférés affichent une structure de réseau originale au regard de la littérature, avec un rôle central du stimulus et une topologie très distribuée et limitée. Les résultats montrent que WASABI surmonte certaines limitations des approches existantes et sera certainement utile pour aider les biologistes dans l’analyse et l’intégration de leurs données
Inference of gene regulatory networks from gene expression data has been a long-standing and notoriously difficult task in systems biology. Recently, single-cell transcriptomic data have been massively used for gene regulatory network inference, with both successes and limitations.In the present work we propose an iterative algorithm called WASABI, dedicated to inferring a causal dynamical network from timestamped single-cell data, which tackles some of the limitations associated with current approaches. We first introduce the concept of waves, which posits that the information provided by an external stimulus will affect genes one-byone through a cascade, like waves spreading through a network. This concept allows us to infer the network one gene at a time, after genes have been ordered regarding their time of regulation. We then demonstrate the ability of WASABI to correctly infer small networks, which have been simulated in-silico using a mechanistic model consisting of coupled piecewise-deterministic Markov processes for the proper description of gene expression at the single-cell level. We finally apply WASABI on in-vitro generated data on an avian model of erythroid differentiation. The structure of the resulting gene regulatory network sheds a fascinating new light on the molecular mechanisms controlling this process. In particular, we find no evidence for hub genes and a much more distributed network structure than expected. Interestingly, we find that a majority of genes are under the direct control of the differentiation-inducing stimulus. Together, these results demonstrate WASABI versatility and ability to tackle some general gene regulatory networks inference issues. It is our hope that WASABI will prove useful in helping biologists to fully exploit the power of time-stamped single-cell data

Styles APA, Harvard, Vancouver, ISO, etc.

44

Ouali, Abdelaziz. « Nouvelle approche de "Fouille de données" permettant le démembrement syndromique des troubles psychotiques ». Versailles-St Quentin en Yvelines, 2006. http://www.theses.fr/2006VERS0002.

Texte intégral

Résumé :

Les démarches classiques dans le domaine de l’analyse des données médicales utilisent des méthodes statistiques traditionnelles qui ont montré leurs limitations. La fouille de données est de nature exploratoire et traite de gros volumes de données sans a priori alors que les autres domaines sont confirmatoires et exploitent des données structurées et souvent de tailles plus faibles. L’objectif de notre thèse est de proposer une démarche basée sur un algorithme hybride de DataMining pour des fins d’extraction de connaissances appliqué à des bases de données médicales. L’objet de notre étude concerne une maladie qui touche près de 1% de la population française qu’est la Schizophrénie. Si les descriptions classiques, codifiées par les efforts de classifications internationalement reconnues ont permis de définir un découpage nosographique des troubles psychiatriques, ce découpage n’a jamais été validé par de résultats physiopathologiques. Il en découle une masse considérable de données, qu’il faut pouvoir optimiser, tant sur le plan opérationnel que scientifique. Il est indispensable d'utiliser des outils de caractérisation phénotypique précis et d’apporter une appréciation qualitative sur la valeur des variables, afin de choisir les meilleures pour définir d'éventuels sous groupes de la maladie. Nous proposons de mettre en place d’une architecture d’extraction de connaissances fusionnant des algorithmes de DataMining, la première partie de cette architecture utilisera l’algorithme de règles d’association comme outil de sélection de variables les plus pertinents pour décrire une sortie désirée. En se basant sur se sous groupe d’attributs, la deuxième partie aura pour but de fournir des profils probabilistes concernant des caractéristiques phénotypiques de patients soufrant de schizophrénie et de créer un modèle de classification fiable par l’utilisation des algorithmes de Réseaux Bayesiens et de Réseaux de neurones
Current approaches in the field of data analysis applied to Medicine use traditional statistical methods which showed limitations Data Mining consists in exploring and processing large volumes of data while the other methods are confirmatory and use structured data of often smaller sizes The main motivation of our thesis consist on the proposal of a new approach based on a hybrid Data Mining algorithm in order to extract knowledge applied to medical databases. The object of our study concerns a disease which affects about 1 % of the French population that is Schizophrenia. Conventional descriptions, codified by means of internationally recognized classifications, allowed the definition of nosographic categories of psychiatric disorders, which were however never validated by physiopathological data. It results in a considerable amount of data that needs to be optimizing both for operational and scientific purpose. It is thus necessary to use precise tools for phenotypic characterization and provide with an appreciation of the value of those variables to define possible sub-groups of the disease. We suggest setting up knowledge extraction architecture merging DataMining algorithms, the first part of this architecture will use the algorithm of association rules as the most relevant tool of feature selection of variables. Based on this sub-group of attributes, the second part will aim at supplying probabilistic profiles concerning phonotypical characteristics of patients suffering schizophrenia and to create a model of reliable classification by the use of the algorithms of Bayesians Networks and Neuronal Networks

Styles APA, Harvard, Vancouver, ISO, etc.

45

Marc, Philippe. « Analyse bio-informatique des réseaux de régulation transcriptionnels de la levure Saccharomyces cerevisiae grâce aux puces à ADN ». Paris 7, 2002. http://www.theses.fr/2002PA077116.

Texte intégral

Styles APA, Harvard, Vancouver, ISO, etc.

46

Lepoivre, Cyrille. « Apports de l' analyse et l'intégration de données génomiques pour l'étude de la transcription et des réseaux de régulation dans le système hématopoïétique ». Thesis, Aix-Marseille, 2012. http://www.theses.fr/2012AIXM4065.

Texte intégral

Résumé :

Un des défis fondamentaux de la biologie moderne est une meilleure compréhension des mécanismes de régulation de l'expression des gènes, dont dépendent notamment le fonctionnement et la différentiation des cellules. En outre, leurs dérèglements peuvent être à l'origine de pathologies comme par exemple les cancers. Les technologies haut-débit de l'ère post-génomique permettent la production massive de données concernant notamment l'expression des gènes, les sites de fixation des facteurs de transcription et l'état de la chromatine. Ces données sont une mine d'informations pour l'étude des mécanismes de régulation. Cependant, la quantité et l'hétérogénéité de ces données soulèvent de nombreuses problématiques bioinformatiques liées à l'accès, la visualisation, l'analyse et l'intégration de celles-ci.Cette thèse aborde un certain nombre de ces aspects, à travers plusieurs projets :- la caractérisation bioinformatique de transcrits anti-sens produits par des promoteurs bidirectionnels durant le développement thymocytaire- le développement et l'intégration d'un compendium d'interactions géniques de natures diverses (interactions physiques, régulations, etc), ainsi qu'un outil de visualisation de graphes adapté - l'étude d'un système de transdifférentiation de lymphocytes pre-B en macrophages par induction de CEBPa, et la construction d'un modèle de régulation, grâce à l'analyse intégrée de données de puces à ADN, de ChIP-seq et de séquence
One of the fundamental challenges of modern biology is to better understand the mechanisms regulating gene expression, on which the functioning and differentiation of cells depend. In particular, disorders in these mechanisms may be the cause of diseases such as cancer. High throughput technologies of the post-genomic era allow mass production of data including gene expression, binding sites of transcription factors and chromatin state. These data a wealth of information for the study of regulatory mechanisms. However, the amount and heterogeneity of these data raise many bioinformatics issues related to access, visualization, analysis and integration of these.This thesis addresses a number of these aspects, through several projects:- bioinformatics characterization of antisense transcripts produced by bidirectional promoters during thymocyte development,- development and integration of a compendium of gene interactions of various kinds (physical interactions, regulations, etc.), and a graph visualization tool,- the study of a transdifferentiation system of pre-B lymphocytes into macrophages by induction of CEBPa, and the construction of a regulation model, thanks to the integrated analysis of DNA microarrays, ChIP-seq and sequence data.This work provides an illustration of some of the bioinformatics issues related to the exploitation of these data and methodologies to efficiently extract biological information, particularly to answer questions regarding the mechanisms of transcription and its regulation in the hematopoietic system

Styles APA, Harvard, Vancouver, ISO, etc.

47

Awasthi, Anjali. « Développement d'un système de routage hiérarchique pour les réseaux urbains ». Phd thesis, Université de Metz, 2004. http://tel.archives-ouvertes.fr/tel-00007751.

Texte intégral

Résumé :

Cette thèse se divise en quatre parties. La première partie est consacrée à l'étude bibliographique des différents modèles de transport actuellement utilisés pour la simulation du trafic urbain. Une nouvelle classification est proposée : elle consiste à distinguer les modèles à partir de quatre critères qui sont présentés en détail dans le chapitre 1.

La deuxième partie de la thèse est consacrée au problème de décomposition d'un réseau urbain en sous réseaux de taille raisonnable et aussi indépendants les uns des autres que possible, c'est-à-dire ayant un nombre de connexions
aussi faible que possible.

Dans la troisième partie de la thèse nous présentons un programme de simulation pour générer les données qui, à leur tour, vont servir à constituer une mémoire. Cette mémoire a pour objectif de proposer le chemin le plus rapide à l'intérieur d'un sous-réseau dès que l'on connaît l'état du sous-réseau ainsi que l'origine et la destination du véhicule.

Enfin, la dernière partie de la thèse est la plus novatrice. Elle fait intervenir les techniques de l'analyse des données pour constituer la mémoire et permettre ainsi de choisir le chemin le plus rapide en temps réel.

Styles APA, Harvard, Vancouver, ISO, etc.

48

Veber, Philippe. « Modélisation grande échelle de réseaux biologiques : vérification par contraintes booléennes de la cohérence des données ». Phd thesis, Université Rennes 1, 2007. http://tel.archives-ouvertes.fr/tel-00185895.

Texte intégral

Résumé :

Les techniques de biologie moléculaire dites haut-débit permettent de mesurer un grand nombre de variables simultanément. Elles sont aujourd'hui couramment utilisées et produisent des masses importantes de données. Leur exploitation est compliquée par le bruit généralement observé dans les mesures, et ce d'autant plus que ces dernières sont en général trop onéreuses pour être suffisamment reproduites. La question abordée dans cette thèse porte sur l'intégration et l'exploitation des données haut-débit : chaque source de données mesurant un aspect du fonctionnement cellulaire, comment les combiner dans un modèle et en tirer des conclusions pertinentes sur le plan biologique ? Nous introduisons un critère de consistance entre un modèle graphique des régulations cellulaires et des données de déplacement d'équilibre. Nous montrons ensuite comment utiliser ce critère comme guide pour formuler des prédictions ou proposer des corrections en cas d'incompatibilité. Ces différentes tâches impliquent la résolution de contraintes à variables sur domaines finis, pour lesquelles nous proposons deux approches complémentaires. La première est basée sur la notion de diagramme de décision, qui est une structure de données utilisée pour la vérification des circuits ; la deuxième fait appel à des techniques récentes de programmation logique. L'utilisation de ces techniques est illustrée avec des données réelles sur la bactérie "E. coli" et sur la levure. Les réseaux étudiés comportent jusqu'à plusieurs milliers de gènes et de régulations. Nous montrons enfin, sur ces données, comment notre critère de consistance nous permet d'arriver à des prédictions robustes, ainsi que des corrections pertinentes du modèle étudié.

Styles APA, Harvard, Vancouver, ISO, etc.

49

Flé, Marie-Paule. « Analyse des phénomènes de concurrence dans les systèmes parallèles : le principe de sérialisation ». Paris 11, 1986. http://www.theses.fr/1986PA112026.

Texte intégral

Résumé :

Cette thèse concerne la formalisation des problèmes de concurrence dans les systèmes parallèles. Un comportement parallèle de plusieurs processus étant représenté par un mot obtenu par mélange des actions de ces processus, sont considérés comme corrects les comportements sérialisables, i. E. Pour lesquels l'ordre des actions dites conflictuelles est le même que pour un comportement résultant d'une exécution séquentielle de ces processus. Des exemples d'application montrent que l'on peut ainsi aborder des problèmes de synchronisation de nature aussi différente que les accès concurrents à une Base de données, le partage de ressources ou encore certains problèmes de robotique. Dans un premier temps les processus sont des suites d'actions autorisées à se répéter un nombre arbitrairement grand de fois et l'on montre que l'ensemble des calculs sérialisables est reconnaissable par un automate fini. Ce modèle est ensuite généralisé dans deux directions: -on affine le critère de sérialisabilité en le définissant à partir d'un ensemble de relations de conflit différentes. Cette nouvelle notion permet de caractériser le problème de l'exclusion mutuelle. - on aborde le problème de la synchronisation de programmes concurrents en considérant les processus comme des ensembles (finis ou infinis) de mots. Après avoir étendu la notion de sérialisabilité à ce nouveau modèle, on montre que le contrôle optimal de tels processus peut également être obtenu à partir d'un automate fini. D'autres algorithmes de synchronisation sont étudiés et l'on montre en particulier l'existence d'un algorithme de sérialisation équitable au sens où les processus du système considéré sont exécutés au terme d'un délai fini

Styles APA, Harvard, Vancouver, ISO, etc.

50

Walczak, Nathalie. « La protection des données personnelles sur l’internet.- Analyse des discours et des enjeux sociopolitiques ». Thesis, Lyon 2, 2014. http://www.theses.fr/2014LYO20052/document.

Texte intégral

Résumé :

Cette thèse, dans le cadre des Sciences de l'Information et de la Communication, aborde la question de la protection des données personnelles sur l’internet à travers l’étude des discours de quatre acteurs concernés par ce sujet : les entreprises de l’internet, les instances régulatrices, la population française et la presse nationale. L’objectif est de comprendre comment, à travers les discours de chacun de ces acteurs, se dessinent la question du brouillage des sphères privée et publique sur l’internet. C’est une question qui prend de l’ampleur avec le développement de l’internet, notamment avec la multiplication des réseaux socionumériques, qui offrent aux internautes différentes possibilités pour afficher leur extimité. La multiplication des dispositifs de mise en relation interpersonnelle s'accompagne alors d'une nouvelle dialectique contemporaine entre le privé et le public, pas toujours maîtrisée par les personnes concernées.Cette interaction entre le public et le privé induit un déplacement de la frontière qui sépare les deux sphères et peut entraîner certaines dérives de la part des entreprises spécialisées, telles Google ou Facebook, par rapport à l'agrégation des données personnelles des internautes. En effet, les bases de données sont au cœur du système économique de ces entreprises et ont acquis une valeur marchande liée à des enjeux essentiels par rapport à leur fonctionnement. Or, l’utilisation commerciale des ces données n’est pas nécessairement connue par l’utilisateur et peut être réalisée sans son accord, du moins de manière explicite. Ce double questionnement lié au brouillage des sphères privée et publique, c'est-à-dire, premièrement, l’aspect individuel où l’internaute est incité à dévoiler de plus en plus d’éléments personnels, et, deuxièmement, l’aspect lié à la marchandisation des données par les entreprises de l’internet, engendre alors la question de la confidentialité des données et des libertés individuelles. Les instances régulatrices, que ce soit à l’échelle de la France ou de l’Union Européenne, tentent d’apporter des réponses afin de protéger l’internaute en mettant en place des actions concernant le droit à l’oubli ou en poursuivant juridiquement Google, par exemple, lorsque l’entreprise ne se conforme pas aux lois en vigueur sur le territoire concerné.Les différents angles d’approche ainsi que la diversité des acteurs étudiés ont nécessité la constitution d’un corpus multidimentionnel afin d’avoir une approche comparative des différents représentations. Ce corpus comprend à la fois des textes inscrits comme les discours politiques, les discours des instances régulatrices, les discours des entreprises de l’internet, plus spécifiquement Google et Facebook ou les discours de presse qui occupent une position méta-discursive puisqu’ils se font l’écho des discours des acteurs précédemment énoncés. Il comprend aussi des discours oraux constitués d’entretiens spécialement réalisés dans le cadre de cette recherche auprès d’individus pris au hasard de la population française. Une analyse quantitative des discours entre 2010 et 2013, période contemporaine à la thèse, a permis d’effectuer un premier tri et de ne sélectionner que les discours les plus pertinents par rapport à nos hypothèses. L’analyse qualitative qui a suivi a été basée sur le cadre théorique précédemment élaboré afin de croiser les représentations des acteurs à propos des données personnelles et mettre en évidence les différentes visions inhérentes à cette question
This thesis, in Communication and Information Sciences, raises the question of the internet personal data protection through the discourses analysis of four actors concerned with this subject: internet companies, authorities regulating, French population and national press. The objective is to understand how, through the discourses of each one of these actors, the question of the jamming of the spheres private and public about the Internet takes shape. It is a question which increases with the development of the Internet, in particular with the multiplication of the social digital network, which gives to the Internet users various opportunities to display their privacy. The multiplication of the interpersonal relationship devices connection is then accompanied by a contemporary dialectical between private and public spheres, not always controlled by concerned people.This interaction between private and public leads to a transfert of the border wich separates the two spheres and can involves some drifts on behalf of specialized companies, such Google and Facebook, toward the aggregation of personal data contents. Indeed, databases are central in the economic system of these companies and gained a commercial value. However, the commercial use as of these data is not necessarily known by the user and can be realized without its agreement, at least in an explicit way. This double questioning related to the jamming of the private and public spheres, i.e., firstly, the individual aspect where the Internet user is incited to reveal personal elements more and more, and, secondly, the related aspect with the selling of the data by the Internet companies, then generates the question of the individual freedom and data confidentiality. The regulating authorities, in France or in European Union, try to provide answers in order to protect the Internet users by setting up actions relating to the right to be forgotten or by prosecuting Google, for example, when the company does not conform to the laws in force on the territory concerned. The various angles of incidence as well as the diversity of the studied actors required the constitution of a multidimentional corpus in order to have a comparative approach of the different representations. This corpus includes texts registered like political discourses, regulating authorities speeches, companies of the Internet speeches, specifically Google and Facebook, or press speeches which occupy a meta-discursive position since they repeat speeches of the actors previously stated. It includes also oral speeches made up of talks especially recorded for this research with some persons taken randomly in the French population. A quantitative analysis of the discourses between 2010 and 2013, contemporary period with the thesis, permit to carry out a first sorting and to select only the most relevant speeches compared to our hypothesis. The qualitative analysis which followed was based on the theoretical framework previously elaborate in order to cross the representations of the actors in connection with the personal data and to highlight the various visions about this question

Styles APA, Harvard, Vancouver, ISO, etc.

Nous offrons des réductions sur tous les plans premium pour les auteurs dont les œuvres sont incluses dans des sélections littéraires thématiques. Contactez-nous pour obtenir un code promo unique!