Academic literature on the topic 'Analyse exploratoire de données multivariées'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Analyse exploratoire de données multivariées.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Analyse exploratoire de données multivariées"

1

Forest, Danielle, Christian Gouriéroux, and Lise Salvas-Bronsard. "D’une analyse de variabilités à un modèle d’investissement des firmes." L’économétrie des firmes et de la finance 73, no. 1-2-3 (February 9, 2009): 331–50. http://dx.doi.org/10.7202/602231ar.

Full text
Abstract:
RÉSUMÉ Nous introduisons une approche du général au spécifique adaptée à des données de panel. Ceci conduit à considérer des décompositions en valeurs singulières menées à partir d’équations d’analyse de la variance multivariées faisant apparaître les effets individuels et temporels. Nous utilisons cette méthodologie pour analyser la présence de contraintes de liquidité comme déterminant de l’investissement des firmes canadiennes.
APA, Harvard, Vancouver, ISO, and other styles
2

Delsart, Aline, and Emmanuèle Auriac-Slusarczyk. "Étude pragmatique de la relation médecin/patient à partir de données orales authentiques." SHS Web of Conferences 78 (2020): 01005. http://dx.doi.org/10.1051/shsconf/20207801005.

Full text
Abstract:
L’étude prend appui sur les données orales du corpus DECLICS2016, concernant des consultations entre médecins et patients en C.H.U. Nous proposons une analyse en deux temps. Premièrement, le corpus de six consultations dans divers services sert d’approche exploratoire pour mettre en évidence l’équilibre interactionnel et certains emplois (régulateurs, marqueurs argumentatifs, répétitions, MSC) contrastant les rôles de médecins et patients. Deuxièmement, à partir de cette étude exploratoire, nous étudions une séquence croisant les principes de l’analyse hiérarchique et fonctionnelle et ceux de la logique interlocutoire. L’étude montre que le médecin doit négocier ses intentions de vérification du diagnostic en intégrant l’expérience du patient. Mots clefs : interaction, consultation médicale, corpus oraux, analyse interlocutoire, négociation.
APA, Harvard, Vancouver, ISO, and other styles
3

Proulx, Monique, Annie Couture, and Carol Gingras. "Étude exploratoire des effets du programme Parents efficaces." Revue des sciences de l'éducation 8, no. 1 (November 2, 2009): 79–90. http://dx.doi.org/10.7202/900358ar.

Full text
Abstract:
Résumé L’article fait état d’une étude exploratoire du programme Parent Effectiveness Training développé aux États-Unis par Thomas Gordon et de plus en plus utilisé en milieu canadien-français. Nous avons comparé auprès d’une quarantaine de parents, les attitudes d’acceptation de leurs enfants, de considération positive, d’attention inconditionnelle, d’empathie et de congurence, à l’aide de mesures administrées avant et après leur participation à ce programme. Une analyse élémentaire des données suggère qu’il s'est produit une modification positive de ces attitudes. Notre démarche se propose surtout de susciter l’intérêt des chercheurs à l’égard d’un programme déjà largement répandu dans notre milieu.
APA, Harvard, Vancouver, ISO, and other styles
4

Bignami-Van Assche, Simona, and Visseho Adjiwanou. "Dynamiques familiales et activité sexuelle précoce au Canada." Articles 38, no. 1 (June 16, 2010): 41–69. http://dx.doi.org/10.7202/039988ar.

Full text
Abstract:
Cette étude explore le rôle de la structure et des dynamiques familiales sur l’entrée précoce des jeunes canadiens dans la vie sexuelle. Elle se fonde sur l’analyse des données de l’Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ), en recourant à la fois à des méthodes descriptives (tables de survie et analyse des séquences) et des méthodes d’analyse de régression (analyse des transitions en temps discret). Les résultats des analyses multivariées montrent que, même s’ils sont importants individuellement, ni la structure familiale à la naissance ni le nombre de changements de situations familiales ne se révèlent comme facteurs significatifs pour expliquer l’entrée précoce des jeunes dans la sexualité au Canada. C’est plutôt la combinaison de ces deux variables dans la dynamique de la structure familiale qui constitue le facteur explicatif le plus important.
APA, Harvard, Vancouver, ISO, and other styles
5

Paindorge, Martine, Jacques Kerneis, and Valérie Fontanieu. "Analyse de données textuelles informatisée : l’articulation de trois méthodologies, avantages et limites." Nouvelles perspectives en sciences sociales 11, no. 1 (April 1, 2016): 65–92. http://dx.doi.org/10.7202/1035933ar.

Full text
Abstract:
Nous nous interrogeons sur les méthodologies à utiliser pour analyser le contenu des programmes et documents d’accompagnement publiés par le ministère de l’Éducation Nationale en France. Ce corpus textuel présente une forme particulière dans la mesure où les paragraphes de texte sont complétés de tableaux et graphismes variés. L’article présente une étude exploratoire et précise d’abord pourquoi et comment nous articulons deux méthodologies d’analyse logicielle (Alceste et Tropes) et une analyse dite « manuelle ». Les résultats obtenus indiquent des fonctions similaires et une complémentarité. Nous précisons enfin les conditions à respecter pour mener à bien ce travail, les avantages et les limites inhérentes.
APA, Harvard, Vancouver, ISO, and other styles
6

Paquette, Mario. "Une recherche exploratoire sur deux expériences de familles d’accueil de réadaptation." Service social 36, no. 1 (April 12, 2005): 148–59. http://dx.doi.org/10.7202/706346ar.

Full text
Abstract:
Une recherche sur les familles d'accueil s'impose au moment où les structures intermédiaires deviennent très populaires auprès de ceux qui favorisent la désinstitutionnalisation. Dans une démarche à caractère exploratoire, on tente de faire le point sur deux expériences de familles d'accueil de réadaptation. Des données, qui ont fait l'objet d'une analyse de contenu qualitative, ont été recueillies auprès de bénéficiaires, de responsables de familles d'accueil, de parents de familles naturelles et de quelques intervenants sociaux. Plusieurs suggestions, visant prioritairement la famille d'accueil, sont énoncées.
APA, Harvard, Vancouver, ISO, and other styles
7

Dulude, Éliane, and Martial Dembélé. "Les enseignants et le renouveau collégial au Québec : analyse interactionniste de la construction et de la négociation du sens d’un changement de pratique prescrit." Éducation et francophonie 40, no. 1 (July 5, 2012): 160–75. http://dx.doi.org/10.7202/1010151ar.

Full text
Abstract:
Le présent article prend appui sur une étude exploratoire visant à comprendre le processus de construction et de négociation du sens d’une réforme par les enseignants d’un département de langues modernes au collégial au Québec. L’article a pour but de mettre en lumière l’influence relative des symboles, du coordonnateur et des interactions sociales dans les changements de pratique. Les données proviennent principalement d’entrevues semi-dirigées avec les enseignants participants, complétées par une analyse de contenu de prescriptions ministérielles. Il ressort de l’analyse des données, entre autres, que l’épreuve synthèse est devenue un objet de prestige dans ce département et exerce une pression constante sur les interactions entre enseignants ainsi que sur les priorités d’action.
APA, Harvard, Vancouver, ISO, and other styles
8

Kozanitis, Anastassis, and Claude Quévillon Lacasse. "Étude exploratoire de l’utilisation des TICE en soutien aux pédagogies actives en contexte d’enseignement universitaire." Médiations et médiatisations 1, no. 1 (October 10, 2018): 50–71. http://dx.doi.org/10.52358/mm.v1i1.57.

Full text
Abstract:
Dans le cadre d’une étude exploratoire, un questionnaire en ligne a été envoyé aux professeur(e)s et chargé(e)s de cours universitaires de différentes universités québécoises afin de dégager un portrait de leur utilisation des TICE en support aux pédagogies actives proposées aux étudiants dans leurs cours. Les données descriptives recueillies chez les participants volontaires (n = 119) ont été analysées, puis complétées au moyen d’une analyse en composantes principales pour affiner les relations qui sont ressorties entre les variables retenues.
APA, Harvard, Vancouver, ISO, and other styles
9

Robin, Monique. "Perception de l’espace résidentiel des mères de jeunes enfants : analyse textuelle du discours." Articles 16, no. 1 (January 6, 2004): 97–119. http://dx.doi.org/10.7202/007344ar.

Full text
Abstract:
Résumé L’objet de cette analyse exploratoire est de dégager, au moyen d’une méthode d’analyse statistique informatisée de données textuelles, les thèmes sous-jacents au discours des femmes sur leur espace résidentiel. Des entrevues ont été recueillies auprès de femmes françaises ayant un premier ou une première enfant de 2 ans et vivant dans un milieu urbain ou suburbain. Pour les mères des deux milieux, le rapport au logement est apparu par référence aux nouvelles attentes déterminées par les changements de la vie familiale et par référence au passé résidentiel récent. Seule la question des contraintes spatiotemporelles liées aux déplacements quotidiens en milieu urbain accompagnées de jeunes enfants a différencié les femmes habitant Paris et celles qui demeurent en banlieue.
APA, Harvard, Vancouver, ISO, and other styles
10

Goupil, Georgette, Michelle Comeau, and Pierre Michaud. "Étude descriptive et exploratoire sur les services offerts aux élèves en difficulté d’apprentissage." Articles 20, no. 4 (October 10, 2007): 645–56. http://dx.doi.org/10.7202/031760ar.

Full text
Abstract:
Résumé Cet article présente une étude menée auprès de 70 directions d'école primaire sur les services offerts aux élèves en difficulté d'apprentissage. Les données, recueillies par entrevue, ont été dépouillées par analyse de contenu. Les résultats obtenus révèlent que les directions jouent un rôle important dans l'attribution des services aux enfants en difficulté d'apprentissage. Ils indiquent aussi que les services d'orthopédagogie sont offerts en général sous forme de dénombrement flottant et non directement dans les classes ordinaires. L'article décrit également les procédures utilisées dans les écoles pour offrir les services : processus de référence, plans d'intervention personnalisés, projets, etc.
APA, Harvard, Vancouver, ISO, and other styles

Dissertations / Theses on the topic "Analyse exploratoire de données multivariées"

1

Verbanck, Marie. "Analyse exploratoire de données transcriptomiques : de leur visualisation à l'intégration d’information extérieure." Rennes, Agrocampus Ouest, 2013. http://www.theses.fr/2013NSARG011.

Full text
Abstract:
Nous proposons de nouvelles méthodologies statistiques exploratoires dédiées au traitement des données transcriptomiques (puce à ADN). Les données transcriptomiques offrent une image du transcriptome qui lui-même est le résultat des phénomènes d'activation ou d'inhibition de l'expression des gènes. Cependant, cette image du transcriptome est bruitée. C'est pourquoi, nous abordons premièrement la problématique de débruitage des données transcriptomiques. Ainsi, nous proposons une version régularisée de l'analyse en composantes principales. Cette version régularisée permet de mieux reconstituer et visualiser le signal sous-jacent de données bruitées. Par ailleurs, nous pouvons nous demander si la connaissance du seul transcriptome est suffisante pour démêler la complexité des relations entre gènes. Nous proposons donc d'intégrer d'autres sources d'information sur les gènes, de façon active, dans l'analyse des données transcriptomiques. Deux grands mécanismes semblent intervenir dans la régulation de l'expression, les protéines régulatrices et les réseaux de régulation d'une part, la localisation chromosomique et l'architecture du génome d'autre part. Premièrement, nous nous focalisons sur la régulation par l'intermédiaire de protéines régulatrices ; nous proposons un algorithme de classification des gènes basé sur l'intégration de connaissances fonctionnelles sur les gènes, fournies par les annotations Gene Ontology. Cet algorithme fournit des clusters de gènes similaires du point de vue de l'expression et des annotations fonctionnelles et qui sont ainsi de meilleurs candidats à l'interprétation. Enfin, nous proposons de relier l'étude des données transcriptomiques à la localisation chromosomique au sein d'une méthodologie développée en collaboration avec des généticiens
We propose new methodologies of exploratory statistics which are dedicated to the analysis of transcriptomic data (DNA microarray data). Transcriptomic data provide an image of the transcriptome which itself is the result of phenomena of activation or inhibition of gene expression. However, the image of the transcriptome is noisy. That is why, firstly we focus on the issue of transcriptomic data denoising, in a visualisation framework. To do so, we propose a regularised version of principal component analysis. This regularised version allows to better estimate and visualise the underlying signal of noisy data. In addition, we can wonder if the knowledge of only the transcriptome is enough to understand the complexity of relationships between genes. That is why we propose to integrate other sources of information about genes, and in an active way, in the analysis of transcriptomic data. Two major mechanisms seem to be involved in the regulation of gene expression, regulatory proteins (for instance transcription factors) and regulatory networks on the one hand, chromosomal localisation and genome architecture on the other hand. Firstly, we focus on the regulation of gene expression by regulatory proteins; we propose a gene clustering algorithm based on the integration of functional knowledge about genes, which is provided by Gene Ontology annotations. This algorithm provides clusters constituted by genes which have both similar expression profiles and similar functional annotations. The clusters thus constituted are then better candidates for interpretation. Secondly, we propose to link the study of transcriptomic data to chromosomal localisation in a methodology developed in collaboration with geneticists
APA, Harvard, Vancouver, ISO, and other styles
2

Béranger, Boris. "Modélisation de la structure de dépendance d'extrêmes multivariés et spatiaux." Thesis, Paris 6, 2016. http://www.theses.fr/2016PA066004/document.

Full text
Abstract:
La prédiction de futurs évènements extrêmes est d’un grand intérêt dans de nombreux domaines tels que l’environnement ou la gestion des risques. Alors que la théorie des valeurs extrêmes univariées est bien connue, la complexité s’accroît lorsque l’on s’intéresse au comportement joint d’extrêmes de plusieurs variables. Un intérêt particulier est porté aux évènements de nature spatiale, définissant le cadre d’un nombre infini de dimensions. Sous l’hypothèse que ces évènements soient marginalement extrêmes, nous focalisons sur la structure de dépendance qui les lie. Dans un premier temps, nous faisons une revue des modèles paramétriques de dépendance dans le cadre multivarié et présentons différentes méthodes d’estimation. Les processus maxstables permettent l’extension au contexte spatial. Nous dérivons la loi en dimension finie du célèbre modèle de Brown- Resnick, permettant de faire de l’inférence par des méthodes de vraisemblance ou de vraisemblance composée. Nous utilisons ensuite des lois asymétriques afin de définir la représentation spectrale d’un modèle plus large : le modèle Extremal Skew-t, généralisant la plupart des modèles présents dans la littérature. Ce modèle a l’agréable propriété d’être asymétrique et non-stationnaire, deux notions présentées par les évènements environnementaux spatiaux. Ce dernier permet un large spectre de structures de dépendance. Les indicateurs de dépendance sont obtenus en utilisant la loi en dimension finie.Enfin, nous présentons une méthode d’estimation non-paramétrique par noyau pour les queues de distributions et l’appliquons à la sélection de modèles. Nous illustrons notre méthode à partir de l’exemple de modèles climatiques
Projection of future extreme events is a major issue in a large number of areas including the environment and risk management. Although univariate extreme value theory is well understood, there is an increase in complexity when trying to understand the joint extreme behavior between two or more variables. Particular interest is given to events that are spatial by nature and which define the context of infinite dimensions. Under the assumption that events correspond marginally to univariate extremes, the main focus is then on the dependence structure that links them. First, we provide a review of parametric dependence models in the multivariate framework and illustrate different estimation strategies. The spatial extension of multivariate extremes is introduced through max-stable processes. We derive the finite-dimensional distribution of the widely used Brown-Resnick model which permits inference via full and composite likelihood methods. We then use Skew-symmetric distributions to develop a spectral representation of a wider max-stable model: the extremal Skew-t model from which most models available in the literature can be recovered. This model has the nice advantages of exhibiting skewness and nonstationarity, two properties often held by environmental spatial events. The latter enables a larger spectrum of dependence structures. Indicators of extremal dependence can be calculated using its finite-dimensional distribution. Finally, we introduce a kernel based non-parametric estimation procedure for univariate and multivariate tail density and apply it for model selection. Our method is illustrated by the example of selection of physical climate models
APA, Harvard, Vancouver, ISO, and other styles
3

Lazar, Cosmin. "Méthodes non supervisées pour l’analyse des données multivariées." Reims, 2008. http://theses.univ-reims.fr/exl-doc/GED00000846.pdf.

Full text
Abstract:
Tous les domaines de la science nécessitent d’analyser des données qu’il s’agisse des sciences humaines ou des sciences exactes et naturelles. Ces données peuvent être de nature différente et dans des nombreuses situations elles représentent plusieurs enregistrements du même phénomène physique, elles sont regroupées dans des bases des données multivariées que l’on cherche à interpréter. Leur interprétation requiert la connaissance du domaine d’application qui sert de guide afin d’extraire l’information utile pour la compréhension des phénomènes étudiés. Une étape essentielle dans ce processus est le regroupement des données ayant des caractéristiques similaires dans des classes ; cette étape est appelée classification non supervisée (ou automatique) ou clustering. Concernant ce domaine d’analyse, des questions restent ouvertes comme la dimension intrinsèque et la réduction de dimension des données multivariées, le choix de la mesure de similarité ou la validation du nombre de classes. Ce travail apporte des contributions aux deux questions précédentes : le choix de la mesure de similarité pour la classification non supervisée et la réduction de dimension de données multivariées. Le phénomène de concentration des métriques est étudié et la pertinence de métriques non euclidiennes comme mesure de similarité dans de problèmes de classification est testée. Des indices prenant en compte la distance interclasse sont proposés pour choisir la métrique optimale si les classes sont gaussiennes. Les méthodes de séparation aveugle de sources sont étudiées dans le contexte de la réduction de dimension ; une méthode de SAS basée sur une interprétation géométrique du modèle de mélange linéaire est proposée. Des méthodes de SAS prenant en compte les contraintes des applications sont utilisées pour la réduction de dimension dans deux applications en imagerie multivariée. Celles-ci permettent la mise en évidence de facteurs physiquement interprétables ainsi que la réduction de la complexité des algorithmes de classification utilisés pour l’analyse. Les travaux sont illustrés sur deux applications sur des données réelles
Many scientific disciplines deal with multivariate data. Different recordings of the same phenomenon are usually embedded in a multivariate data set. Multivariate data analysis gathers efficient tools for extracting relevant information in order to comprehend the phenomenon in study. Gathering data into groups or classes according to some similarity criteria is an essential step in the analysis. Intrinsic dimension or dimension reduction of multivariate data, the choice of the similarity criterion, cluster validation are problems which still let open questions. This work tries to make a step further concerning two of the problems mentioned above: the choice of the similarity measure for data clustering and the dimension reduction of multivariate data. The choice of the similarity measure for data clustering is investigated from the concentration phenomenon of metrics point of view. Non Euclidean metrics are tested as alternative to the classical Euclidian distance as similarity measure. We tested if less concentrated metrics are more discriminative for multivariate data clustering. We also proposed indices which take into account the inter-classes distance (e. G. Davies-Bouldin index) in order to find the optimal metric when the classes are supposed to be Gaussian. Blind Source Separation (BSS) methods are also investigated for dimension reduction of multivariate data. A BSS method based on a geometrical interpretation of the linear mixing model is proposed. BSS methods which take into account application constraints are used for dimension reduction in two different applications of multivariate imaging. These methods allow the extraction of meaningful factors from the whole data set; they also allow reducing the complexity and the computing time of the clustering algorithms which are used further in analysis. Applications on multivariate image analysis are also presented
APA, Harvard, Vancouver, ISO, and other styles
4

Mnassri, Baligh. "Analyse de données multivariées et surveillance des processus industriels par analyse en composantes principales." Phd thesis, Aix-Marseille Université, 2012. http://tel.archives-ouvertes.fr/tel-00749282.

Full text
Abstract:
Ce mémoire de thèse présente une étude fondamentale enrichie par des contributions qui sont articulées autour de la modélisation de processus ainsi qu'un diagnostic de défauts en utilisant l'analyse en composantes principales (ACP).
Dans l'objectif d'un choix optimal du modèle ACP, une étude comparative de quelques critères connus dans la littérature nous a permis de conclure que le problème rencontré est souvent lié à une ignorance des variables indépendantes et quasi-indépendantes. Dans ce cadre, nous avons réalisé deux démonstrations mettant en évidence les limitations de deux critères en particulier la variance non reconstruite (VNR). En s'appuyant sur le principe d'une telle variance, nous avons proposé trois nouveaux critères. Parmi eux, deux ont été considérés comme étant empiriques car seule l'expérience permettra de prouver leur efficacité. Le troisième critère noté VNRVI représente un remède à la limitation du critère VNR. Une étude de sa consistance théorique a permis d'établir les conditions garantissant l'optimalité de son choix. Les résultats de simulation ont validé une telle théorie en prouvant ainsi que le critère VNRVI étant plus efficace que ceux étudiés dans cette thèse.
Dans le cadre d'un diagnostic de défauts par ACP, l'approche de reconstruction des indices de détection ainsi que celle des contributions ont été utilisées. A travers une étude de généralisation, nous avons étendu le concept d'isolabilité de défauts par reconstruction à tout indice quadratique. Une telle généralisation nous a permis d'élaborer une analyse théorique d'isolabilité de défauts par reconstruction de la distance combinée versus celles des indices SPE et T2 de Hotelling en mettant en avant l'avantage de l'utilisation d'une telle distance. D'autre part, nous avons proposé une nouvelle méthode de contribution par décomposition partielle de l'indice SPE. Cette approche garantit un diagnostic correct de défauts simples ayant de grandes amplitudes. Nous avons également étendu une méthode de contribution classiquement connue par la RBC au cas multidimensionnel. Ainsi, la nouvelle forme garantit un diagnostic correct de défauts multiples de grandes amplitudes. En considérant la complexité de défauts, nous avons exploité la nouvelle approche de contribution RBC afin de proposer une nouvelle qui s'appelle RBCr. Cette dernière s'appuie sur un seuil de tolérance pour l'isolation de défauts. Une analyse de diagnosticabilité basée sur la RBCr montre que celle-ci garantit l'identification des défauts détectables. Ces derniers sont garantis isolables si leurs amplitudes satisfont les mêmes conditions d'isolabilité établies pour l'approche de reconstruction des indices.
APA, Harvard, Vancouver, ISO, and other styles
5

Pialot, Daniel Paul Marc. "Analyse des données de milieu en hydrobiologie : apport des techniques d'analyse multivariées." Lyon 1, 1985. http://www.theses.fr/1985LYO11680.

Full text
APA, Harvard, Vancouver, ISO, and other styles
6

Le, Floch Edith. "Méthodes multivariées pour l'analyse jointe de données de neuroimagerie et de génétique." Phd thesis, Université Paris Sud - Paris XI, 2012. http://tel.archives-ouvertes.fr/tel-00753829.

Full text
Abstract:
L'imagerie cérébrale connaît un intérêt grandissant, en tant que phénotype intermédiaire, dans la compréhension du chemin complexe qui relie les gènes à un phénotype comportemental ou clinique. Dans ce contexte, un premier objectif est de proposer des méthodes capables d'identifier la part de variabilité génétique qui explique une certaine part de la variabilité observée en neuroimagerie. Les approches univariées classiques ignorent les effets conjoints qui peuvent exister entre plusieurs gènes ou les covariations potentielles entre régions cérébrales.Notre première contribution a été de chercher à améliorer la sensibilité de l'approche univariée en tirant avantage de la nature multivariée des données génétiques, au niveau local. En effet, nous adaptons l'inférence au niveau du cluster en neuroimagerie à des données de polymorphismes d'un seul nucléotide (SNP), en cherchant des clusters 1D de SNPs adjacents associés à un même phénotype d'imagerie. Ensuite, nous prolongeons cette idée et combinons les clusters de voxels avec les clusters de SNPs, en utilisant un test simple au niveau du "cluster 4D", qui détecte conjointement des régions cérébrale et génomique fortement associées. Nous obtenons des résultats préliminaires prometteurs, tant sur données simulées que sur données réelles.Notre deuxième contribution a été d'utiliser des méthodes multivariées exploratoires pour améliorer la puissance de détection des études d'imagerie génétique, en modélisant la nature multivariée potentielle des associations, à plus longue échelle, tant du point de vue de l'imagerie que de la génétique. La régression Partial Least Squares et l'analyse canonique ont été récemment proposées pour l'analyse de données génétiques et transcriptomiques. Nous proposons ici de transposer cette idée à l'analyse de données de génétique et d'imagerie. De plus, nous étudions différentes stratégies de régularisation et de réduction de dimension, combinées avec la PLS ou l'analyse canonique, afin de faire face au phénomène de sur-apprentissage dû aux très grandes dimensions des données. Nous proposons une étude comparative de ces différentes stratégies, sur des données simulées et des données réelles d'IRM fonctionnelle et de SNPs. Le filtrage univarié semble nécessaire. Cependant, c'est la combinaison du filtrage univarié et de la PLS régularisée L1 qui permet de détecter une association généralisable et significative sur les données réelles, ce qui suggère que la découverte d'associations en imagerie génétique nécessite une approche multivariée.
APA, Harvard, Vancouver, ISO, and other styles
7

Le, floch Edith. "Méthodes multivariées pour l'analyse jointe de données de neuroimagerie et de génétique." Thesis, Paris 11, 2012. http://www.theses.fr/2012PA112214/document.

Full text
Abstract:
L'imagerie cérébrale connaît un intérêt grandissant, en tant que phénotype intermédiaire, dans la compréhension du chemin complexe qui relie les gènes à un phénotype comportemental ou clinique. Dans ce contexte, un premier objectif est de proposer des méthodes capables d'identifier la part de variabilité génétique qui explique une certaine part de la variabilité observée en neuroimagerie. Les approches univariées classiques ignorent les effets conjoints qui peuvent exister entre plusieurs gènes ou les covariations potentielles entre régions cérébrales.Notre première contribution a été de chercher à améliorer la sensibilité de l'approche univariée en tirant avantage de la nature multivariée des données génétiques, au niveau local. En effet, nous adaptons l'inférence au niveau du cluster en neuroimagerie à des données de polymorphismes d'un seul nucléotide (SNP), en cherchant des clusters 1D de SNPs adjacents associés à un même phénotype d'imagerie. Ensuite, nous prolongeons cette idée et combinons les clusters de voxels avec les clusters de SNPs, en utilisant un test simple au niveau du "cluster 4D", qui détecte conjointement des régions cérébrale et génomique fortement associées. Nous obtenons des résultats préliminaires prometteurs, tant sur données simulées que sur données réelles.Notre deuxième contribution a été d'utiliser des méthodes multivariées exploratoires pour améliorer la puissance de détection des études d'imagerie génétique, en modélisant la nature multivariée potentielle des associations, à plus longue échelle, tant du point de vue de l'imagerie que de la génétique. La régression Partial Least Squares et l'analyse canonique ont été récemment proposées pour l'analyse de données génétiques et transcriptomiques. Nous proposons ici de transposer cette idée à l'analyse de données de génétique et d'imagerie. De plus, nous étudions différentes stratégies de régularisation et de réduction de dimension, combinées avec la PLS ou l'analyse canonique, afin de faire face au phénomène de sur-apprentissage dû aux très grandes dimensions des données. Nous proposons une étude comparative de ces différentes stratégies, sur des données simulées et des données réelles d'IRM fonctionnelle et de SNPs. Le filtrage univarié semble nécessaire. Cependant, c'est la combinaison du filtrage univarié et de la PLS régularisée L1 qui permet de détecter une association généralisable et significative sur les données réelles, ce qui suggère que la découverte d'associations en imagerie génétique nécessite une approche multivariée
Brain imaging is increasingly recognised as an interesting intermediate phenotype to understand the complex path between genetics and behavioural or clinical phenotypes. In this context, a first goal is to propose methods to identify the part of genetic variability that explains some neuroimaging variability. Classical univariate approaches often ignore the potential joint effects that may exist between genes or the potential covariations between brain regions. Our first contribution is to improve the sensitivity of the univariate approach by taking advantage of the multivariate nature of the genetic data in a local way. Indeed, we adapt cluster-inference techniques from neuroimaging to Single Nucleotide Polymorphism (SNP) data, by looking for 1D clusters of adjacent SNPs associated with the same imaging phenotype. Then, we push further the concept of clusters and we combined voxel clusters and SNP clusters, by using a simple 4D cluster test that detects conjointly brain and genome regions with high associations. We obtain promising preliminary results on both simulated and real datasets .Our second contribution is to investigate exploratory multivariate methods to increase the detection power of imaging genetics studies, by accounting for the potential multivariate nature of the associations, at a longer range, on both the imaging and the genetics sides. Recently, Partial Least Squares (PLS) regression or Canonical Correlation Analysis (CCA) have been proposed to analyse genetic and transcriptomic data. Here, we propose to transpose this idea to the genetics vs. imaging context. Moreover, we investigate the use of different strategies of regularisation and dimension reduction techniques combined with PLS or CCA, to face the overfitting issues due to the very high dimensionality of the data. We propose a comparison study of the different strategies on both a simulated dataset and a real fMRI and SNP dataset. Univariate selection appears to be necessary to reduce the dimensionality. However, the generalisable and significant association uncovered on the real dataset by the two-step approach combining univariate filtering and L1-regularised PLS suggests that discovering meaningful imaging genetics associations calls for a multivariate approach
APA, Harvard, Vancouver, ISO, and other styles
8

Rigouste, Loïs. "Méthodes probabilistes pour l'analyse exploratoire de données textuelles." Phd thesis, Télécom ParisTech, 2006. http://pastel.archives-ouvertes.fr/pastel-00002424.

Full text
Abstract:
Nous abordons le problème de la classification non supervisée de documents par des méthodes probabilistes. Notre étude se concentre sur le modèle de mélange de lois multinomiales avec variables latentes thématiques au niveau des documents. La construction de groupes de documents thématiquement homogènes est une des technologies de base de la fouille de texte, et trouve de multiples applications, aussi bien en recherche documentaire qu'en catégorisation de documents, ou encore pour le suivi de thèmes et la construction de résumés. Diverses propositions récentes ont été faites de modèles probabilistes permettant de déterminer de tels regroupements. Les modèles de classification probabilistes peuvent également être vus comme des outils de construction de représentations numériques synthétiques d'informations contenues dans le document. Ces modèles, qui offrent des facilités pour la généralisation et l'interprétation des résultats, posent toutefois des problèmes d'estimation difficiles, dûs en particulier à la très grande dimensionnalité du vocabulaire. Notre contribution à cette famille de travaux est double: nous présentons d'une part plusieurs algorithmes d'inférence, certains originaux, pour l'estimation du modèle de mélange de multinomiales; nous présentons également une étude systématique des performances de ces algorithmes, fournissant ainsi de nouveaux outils méthodologiques pour mesurer les performances des outils de classification non supervisée. Les bons résultats obtenus par rapport à d'autres algorithmes classiques illustrent, à notre avis, la pertinence de ce modèle de mélange simple pour les corpus regroupant essentiellement des documents monothématiques.
APA, Harvard, Vancouver, ISO, and other styles
9

Bry, Xavier. "Une méthodologie exploratoire pour l'analyse et la synthèse d'un modèle explicatif : l'Analyse en Composantes Thématiques." Paris 9, 2004. https://portail.bu.dauphine.fr/fileviewer/index.php?doc=2004PA090055.

Full text
APA, Harvard, Vancouver, ISO, and other styles
10

Ghalamallah, Ilhème. "Proposition d'un modèle d'analyse exploratoire multidimensionnelle dans un contexte d'intelligence économique." Toulouse 3, 2009. http://www.theses.fr/2009TOU30293.

Full text
Abstract:
La réussite d'une entreprise est souvent conditionnée par sa capacité à identifier, collecter, traiter et diffuser de l'information à des fins stratégiques. Par ailleurs, les technologies de l'information et de la connaissance apportent des contraintes auxquelles les entreprises doivent s'adapter : un flot continu, une circulation beaucoup plus rapide, des techniques toujours plus complexes. Le risque est d'être submergé par cette information et de ne plus pouvoir distinguer l'essentiel du négligeable. En effet, avec l'avènement de la nouvelle économie dominée par le marché, la problématique industrielle et commerciale de l'entreprise est devenue très complexe. Désormais, pour être compétitive, l'entreprise doit savoir gérer son capital immatériel. L'intelligence économique (IE) est une réponse aux bouleversements de l'environnement global des entreprises et plus largement de toute organisation. Dans une économie où tout se complexifie et bouge rapidement, la gestion stratégique de l'information est devenue l'un des moteurs essentiels de la performance globale des entreprises. L'IE est une démarche et un processus organisationnel qui permet d'être plus compétitif, par la surveillance de son environnement et de sa dynamique. Dans ce contexte, nous avons constaté qu'une grande part de l'information à portée stratégique vient du relationnel : liens entre acteurs du domaine, réseaux sémantiques, alliances, fusions, acquisitions, collaborations, cooccurrences de tous ordres. Nos travaux consistent à proposer un modèle d'analyse multidimensionnelle dédiée à l'IE. Cette approche repose sur l'extraction de connaissances par l'analyse de l'évolution des données relationnelles. Nous proposons un modèle permettant de mieux comprendre l'activité des acteurs d'un domaine donné, leurs interactions mais aussi leur évolution et leur stratégie, ceci dans une perspective décisionnelle. Cette démarche repose sur la conception d'un système d'information générique d'analyse en ligne permettant d'homogénéiser et d'organiser les données textuelles sous forme relationnelle et, de là, en extraire des connaissances implicites dont le contenu et la mise en forme sont adaptés à des décideurs non spécialistes du domaine de l'extraction des connaissances
A successful business is often conditioned by its ability to identify, collect, process and disseminate information for strategic purposes. Moreover, information technology and knowledge provide constraints that companies must adapt : a continuous stream, a circulation much faster techniques increasingly complex. The risk of being swamped by this information and no longer able to distinguish the essential from the trivial. Indeed, with the advent of new economy dominated by the market, the problem of industrial and commercial enterprise is become very complex. Now, to be competitive, the company must know how to manage their intangible capital. Competitive Intelligence (CI) is a response to the upheavals of the overall business environment and more broadly to any organization. In an economy where everything moves faster and more complex, management Strategic Information has become a key driver of overall business performance. CI is a process and an organizational process that can be more competitive, by monitoring its environment and its dynamics. In this context, we found that much information has strategic significance to the relationship: links between actors in the field, semantic networks, alliances, mergers, acquisitions, collaborations, co-occurrences of all kinds. Our work consists in proposing a model of multivariate analysis dedicated to the IE. This approach is based on the extraction of knowledge by analyzing the evolution of relational databases. We offer a model for understanding the activity of actors in a given field, but also their interactions their development and strategy, this decision in perspective. This approach is based on the designing a system of generic information online analysis to homogenize and organize text data in relational form, and thence to extract implicit knowledge of the content and formatting are adapted to non-specialist decision makers in the field of knowledge extraction
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography