Dissertations / Theses on the topic 'Exploitation et exploration des documents'

To see the other types of publications on this topic, follow the link: Exploitation et exploration des documents.

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Exploitation et exploration des documents.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Cordeil, Maxime. "Exploration et exploitation de l’espace de conception des transitions animées en visualisation d’information." Thesis, Toulouse, ISAE, 2013. http://www.theses.fr/2013ESAE0044/document.

Full text
Abstract:
Les visualisations de données permettent de transmettre de l’information aux utilisateurs. Pour explorer et comprendre les données, les utilisateurs sont amenés à interagir avec ces visualisations.Toutefois, l’interaction avec les visualisations modifie le visuel. Pour éviter des changements brusques et garder l’utilisateur focalisé sur les objets graphiques d’intérêt, des transitions visuelles sont nécessaires pour accompagner les modifications de la visualisation. Ces transitions visuelles peuvent être codées sous la forme d’animations, ou de techniques qui permettent de faire des correspondances, ou des liens avec des données représentées sur plusieurs affichages. Le premier objectif de cette thèse était d’étudier les bénéfices et les propriétés des animations pour l’exploration et la compréhension de grandes quantités de données multidimensionnelles. Nous avons établi en conséquence une taxonomie des transitions animées en visualisation d’information basée sur les tâches des utilisateurs. Cette taxonomie a permis de constater qu’il n’existe pas de contrôle utilisateur sur la direction des objets durant l’animation. Nous avons donc proposé des interactions pour le contrôle de la direction des objets graphiques lors d’une transition animée. D’autre part, nous avons étudié une technique de transition animée mettant en jeu une rotation 3D entre visualisations. Nous avons identifié les avantages qu’elle pouvait apporter et en avons proposé une amélioration.Le second objectif était d’étudier les transitions visuelles dans le domaine du Contrôle du Trafic Aérien. En effet, les contrôleurs utilisent de nombreuses visualisations qui comportent des informations étalées et dupliquées sur plusieurs affichages: l’écran Radar, le tableau de strips, des listes spécifiques d’avions (départ, arrivées) etc. Ainsi dans leur activité, les Contrôleurs Aériens réalisent des transitions visuelles en recherchant et en reliant de l’information à travers les différents affichages. Nous avons étudié comment les animations pouvaient être utilisées dans le domaine du contrôle aérien en implémentant un prototype d’image radar regroupant trois visualisations usuelles pour instrumenter l’activité de supervision du trafic aérien
Data visualizations allow information to be transmitted to users. In order to explore and understand the data, it is often necessary for users to manipulate the display of this data. When manipulating the visualization, visual transitions are necessary to avoid abrupt changes in this visualization, and to allow the user to focus on the graphical object of interest. These visual transitions can be coded as an animation, or techniques that link the data across several displays. The first aim of this thesis was to examine the benefits and properties of animated transitions used to explore and understand large quantities of multidimensional data. In order to do so, we created a taxonomy of existing animated transitions. This taxonomy allowed us to identify that no animated transition currently exists that allows the user to control the direction of objects during the transition. We therefore proposed an animated transition that allows the user to have this control during the animation. In addition, we studied an animated transition technique that uses 3D rotation to transition between visualizations. We identified the advantages of this technique and propose an improvement to the current design. The second objective was to study the visual transitions used in the Air Traffic Control domain. Air Traffic Controllers use a number of visualizations to view vast information which is duplicated in several places: the Radar screen, the strip board, airplane lists (departures/arrivals) etc. Air traffic controllers perform visual transitions as they search between these different displays of information. We studied the way animations can be used in the Air Traffic Control domain by implementing a radar image prototype which combines three visualizations typically used by Air Traffic Controllers
APA, Harvard, Vancouver, ISO, and other styles
2

Le, Glatin Mario. "Innover pour décider : Modéliser et expérimenter l'ambidextrie décisionnelle pour gérer les métabolismes de l'organisation innovante." Thesis, Paris Sciences et Lettres (ComUE), 2018. http://www.theses.fr/2018PSLEM039/document.

Full text
Abstract:
Il est devenu courant de développer une organisation ambidextre dans une entreprise pour garantir un avantage compétitif dans son environnement. Cette perspective trouve ses racines dans le modèle de James March (1991) ayant la vocation de soutenir l'apprentissage organisationnel par des mécanismes adaptatifs entre agents. Ce modèle ancré dans la tradition du problem-solving propose une approche comportementaliste palliant les biais et heuristiques de la rationalité limitée. Par opposition avec les modèles de la littérature étudiant l’équilibrage entre les activités d’exploration et d’exploitation (ambidextrie), nous démontrons que l’exploration peut être plus générative si elle utilise les contraintes d’exploitation comme connaissances préalables à la génération de concepts. Ceux-là reposent sur un conditionnement positif par les paramètres des processus décisionnels contribuant à l’exploitation. De nouvelles situations décisionnelles sont ainsi conçues plutôt que de se contenter d’une traditionnelle sélection des explorations. Ce modèle –ambidextrie décisionnelle – permet de réaliser des projets capables d’explorer des conditions dépassant les limites et performances de l’exploitation. Une recherche intervention chez Zodiac Aerospace permet de rendre compte de ce nouveau modèle. Il étend ainsi la notion d’ambidextrie organisationnelle dans l’inconnu, plus adaptée au management et gouvernance de l’innovation, tout en précisant la gestion des métabolismes organisationnels nécessaires aux changements des organisations dans un conglomérat de PMEs
It is now common knowledge to develop an ambidextrous organization in a firm to guarantee a competitive advantage in its environment. Such perspective is rooted in James March’s model (1991) whose purpose is to sustain organizational learning through adaptive mechanisms between agents. This model anchored in the tradition of problem-solving offers a behavioural approach coping with biases and heuristics of bounded rationality. In contrast, with literature models studying the balance between exploration and exploitation activities (ambidexterity), we demonstrate how exploration can be more generative if it uses exploitation constraints as prior knowledge to generate concepts. These rely on positively conditioning them by decision-making parameters contributing to exploitation. New decision situations are designed instead of traditionally selecting explorations. This model - decisional ambidexterity-allows building up projects capable of exploring conditions overcoming limitations and performances of exploitation. A collaborative research conducted at Zodiac Aerospace allowed revealing such new model. It extends organizational ambidexterity into the unknown, more adapted to innovation management & governance, whilst precising how to drive organization metabolisms inducing change among participating organizations in a conglomerate of SMEs
APA, Harvard, Vancouver, ISO, and other styles
3

Lepers, Thomas. "Identification et structuration des champs d'innovation dans une business unit." Thesis, Paris, CNAM, 2016. http://www.theses.fr/2016CNAM1068/document.

Full text
Abstract:
A travers l’étude du cas d’une entité exploratoire, NCA, nous cherchons à comprendre comment identifier et structurer un champ d’innovation. C’est à dire comprendre comment se fait le choix d’un domaine dans lequel mener une activité de conception innovante, et quels mécanismes permettent de mener un travail de conception innovante dans des directions pertinentes. La littérature donne peu d’éléments sur les mécanismes à l’œuvre qui vont permettre d’identifier et de structurer un champ d’innovation, en l’absence de problème spécifique à résoudre, ce qui est la situation de NCA qui s’intéresse en particulier aux innovations d’usages, pour lesquelles il n’existe pas de demande explicite des clients. Nos résultats relatifs aux processus d’innovation montrent que les activités d’exploration menée par NCA conduisent à un renouvellement des routines utilisées pour les produits historiques. L’exploration renouvelle l’exploitation. Par ailleurs, les difficultés principales rencontrées par NCA tiennent moins aux processus spécifiques à mettre en œuvre qu’à des mécanismes inopérants dans l’identification de champs d’innovation.Sur le plan organisationnel, nos résultats montrent que NCA fonctionne selon une forme d’ambidextrie simultanée, sur le plan individuel et au niveau de l’entité NCA elle même. Cela se traduit par un renouvellement de l’exploitation par l’exploration. Nous mettons aussi en lumière la forme organisationnelle originale de NCA, à la fois business unit et entité exploratoire. Cette forme d’organisation facilite le lancement de nouvelles catégories de produits, et le fait que le marché de la BU ne soit pas défini, conduit NCA à maintenir cette activité d’exploration dans le temps
Our case study based on an exploratory entity evolving from a small team to a business unit raise questions related to the identification and structuration of an innovation field. The literature gives few elements with regards to the choice of such a field, and the mechanisms to set priorities within a chosen field. Our results related to innovation processes show that exploratory activities leads to a renewal of exploitation, and also that the difficulties encountered by NCA in exploration activities are less related to the existing processes than to the choice of an innovation field. Our results related to organization show that NCA works in a mode of simultaneous ambidexterity, being able at the same time to launch new product categories and to explore new product categories. This also leads to the renewal of existing routines. The structure of NCA has also some original features, being at the same time a business unit and an exploratory entity. This exploratory business unit seems to be able to launch more easily new products categories, because there is no need to look for a landing zone, as it is the case of organisations solely responsible for exploration
APA, Harvard, Vancouver, ISO, and other styles
4

Letessier, Pierre. "Découverte et exploitation d'objets visuels fréquents dans des collections multimédia." Thesis, Paris, ENST, 2013. http://www.theses.fr/2013ENST0014/document.

Full text
Abstract:
L’objectif principal de cette thèse est la découverte d’objets visuels fréquents dans de grandes collections multimédias (images ou vidéos). Comme dans de nombreux domaines (finance, génétique, . . .), il s’agit d’extraire une connaissance de manière automatique ou semi-automatique en utilisant la fréquence d’apparition d’un objet au sein d’un corpus comme critère de pertinence. Une première contribution de la thèse est de fournir un formalisme aux problèmes de découverte et de fouille d’instances d’objets visuels fréquents. La deuxième contribution de la thèse est une méthode générique de résolution de ces deux types de problème reposant d’une part sur un processus itératif d’échantillonnage d’objets candidats et d’autre part sur une méthode efficace d’appariement d’objets rigides à large échelle. La troisième contribution de la thèse s’attache à construire une fonction de vraisemblance s’approchant au mieux de la distribution parfaite, tout en restant scalable et efficace. Les expérimentations montrent que contrairement aux méthodes de l’état de l’artnotre approche permet de découvrir efficacement des objets de très petite taille dans des millions d’images. Pour finir, plusieurs scénarios d’exploitation des graphes visuels produits par notre méthode sont proposées et expérimentés. Ceci inclut la détection d’évènements médiatiques transmédias et la suggestion de requêtes visuelles
The main goal of this thesis is to discover frequent visual objects in large multimedia collections. As in many areas (finance, genetics, . . .), it consists in extracting a knowledge, using the occurence frequency of an object in a collection as a relevance criterion. A first contribution is to provide a formalism to the problems of mining and discovery of frequent visual objects. The second contribution is a generic method to solve these two problems, based on an iterative sampling process, and on an efficient and scalable rigid objects matching. The third contribution of this work focuses on building a likelihood function close to the perfect distribution. Experiments show that contrary to state-of-the-art methods, our approach allows to discover efficiently very small objects in several millions images. Finally, several applications are presented, including trademark logos discovery, transmedia events detection or visual-based query suggestion
APA, Harvard, Vancouver, ISO, and other styles
5

Jeon, Eui Ju. "Antecedents and Consequences of Exploration and Exploitation Decisions : Evidence from Corporate Venture Capital Investing." Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLH001/document.

Full text
Abstract:
Cette thèse étudie la façon dont l’atteinte ou non des objectifs et la gouvernance influencent la direction du changement organisationnel – en termes d’exploration et d’exploitation - et analyse l’impact de ces effets sur la performance de l’entreprise au fil du temps. Dans un premier temps, je procède à une analyse détaillée de la littérature sur le Corporate Venture Capital afin de positionner mon propre travail de recherche dans le champs considéré et confirmer l’originalité de mes contributions. Ensuite, dans la première étude, j’examine comment la non-atteinte des objectifs fixés influe sur la direction du changement organisationnel mis en oeuvre dans l'entreprise, et étudie la façon dont ces changements sont influencés par la place qu’occupent les actionnaires stables ou passagers dans le capital de l’entreprise. Dans la seconde étude, je vérifie empiriquement la validité des propositions formulées en examinant les investissements de corporate venture capital (CVC) réalisés par un échantillon d’entreprises ayant une forte activité CVC. Enfin, l'équilibre entre exploration et exploitation au fil du temps, ainsi que les caractéristiques des oscillations entre ces deux types d’activités sont examinés dans la troisième étude constituant cette thèse. Les analyses empiriques portent sur les investissements de CVC effectués par 286 entreprises des États-Unis sur la période 1993-2013. Cette thèse contribue à la théorie comportementale de l’entreprise (Behavioral Theory of the Firm) en examinant la façon dont la structure du capital et l’actionnariat influe sur la prise de décisions en matière d’innovation et de changement. En étudiant la façon dont l'inertie organisationnelle et les phases de changement affectent les activités d'exploitation et d'exploration, cette thèse contribue aussi à la recherche sur l’ambidextrie organisationnelle. Pour finir, ce travail participe à la recherche sur le corporate venture capital au travers de l’étude des antécédents et des conséquences des activités d'exploration et d’exploitation dans le cadre de l’investissement CVC
This dissertation addresses unexplored issues on the antecedents, management, and outcomes of corporate venture capital (CVC). More specifically, I examine how negative performance feedback and corporate governance influence the direction of organizational change ˗ in terms of exploration and exploitation ˗ and how balancing such change over time influences firm performance in the CVC context. I first review the extant literature on CVC and lay out the unique contributions of my research. Then, in the first essay, I theorize on how poor firm performance influences the resource allocation decisions on exploration and exploitation and how such decisions are affected by the concentration of dedicated and transient shareholders and by the board of directors' monitoring and advising intensities. In the second essay, I empirically examine how the resource allocation decisions on exploration and exploitation are influenced by dedicated and transient shareholders in the context of CVC investing. In the third essay, I examine how balancing exploration and exploitation over time and the characteristics of oscillation impact firm performance. The empirical analysis in the latter two essays is based on CVC investments made by 286 U.S. companies during 1993-2013. This dissertation contributes to the Behavioral Theory of the Firm and Corporate Governance research by introducing how shareholders and boards influence managerial decision-making in search and change, Ambidexterity research by studying how continuous change and organizational inertia impact temporal spillover between exploration and exploitation, and CVC research by examining the antecedents and consequences of explorative and exploitative initiatives in CVC investing
APA, Harvard, Vancouver, ISO, and other styles
6

Toussaint, Maxime. "Exploitation et exploration de la diversité génétique d’une population naturelle de Streptomyces issue d’un micro-habitat sol." Thesis, Université de Lorraine, 2018. http://www.theses.fr/2018LORR0027/document.

Full text
Abstract:
Les Streptomyces possédent un large arsenal enzymatique ayant des rôles importants dans le sol. Au cours de cette thèse, nous avons exploré leur diversité génétique, fonctionnelle et écologique à partir de collections provenant de sols forestiers. Ainsi, l’exploration du potentiel cellulolytique et la capacité à détecter des sucres libérés lors de l’attaque du bois par des champignons lignivores a permis de créer un biosenseur dont l’exploitation pourrait constituer un nouvel outil normatif pour la détection de la dégradation du bois. Suite à une approche de génomique comparative réalisée entre des isolats sympatriques, nos résultats ont permis de démontrer que des souches phylogénétiquement très apparentées présentaient de grandes différences en termes de présence/absence de gènes, suggérant une vitesse d’évolution rapide du génome accessoire au sein de la population. Ces gènes, souvent associés à des éléments potentiellement transférables, a souligné un rôle important du transfert horizontal pour la diversification de la population. Par une approche d’écologie réverse, la fonction prédite de certains de ces gènes a également pu être corrélée avec un rôle écologique potentiel. Ainsi, l’un des clusters de gènes variables identifié était impliqué dans la production de métabolites secondaires et pourrait constituer un bien commun pour la population. Nos résultats ont confirmé la grande diversité métabolique des Streptomyces (et leur utilité à des fins appliquées), mais indique également qu’une diversification rapide entre souches proches, aurait un rôle écologique important au niveau des populations naturelles de Streptomyces
Streptomyces are known to possess a large enzymatic arsenal which can have important roles in the soil. During this thesis, we explored their genetic, functional and ecological diversity using collections from forest soils. Thus, the exploration of their cellulolytic potential and their ability to detect complex sugars released by wood during lignivorous fungi attacks has led to the creation of a biosensor whose exploitation could constitute a new normative tool for the detection of the degradation of wood. Subsequent to comparative genomic approach carried out between sympatric isolates, our results also demonstrated that phylogenetically highly related strains exhibited large differences in the presence / absence of genes, suggesting a rapid rate of evolution of the population accessory genome. These genes, often associated with potentially transferable elements, underlined important role of horizontal transfer for population diversification. Using a reverse ecology approach, the predicted function of some of these genes could also be correlated with a potential ecological role. Thus, one of the variable gene clusters identified by genome analysis was involved in the production of secondary metabolites and would constitute a common good for the population. All of our results confirm the wide metabolic diversity of Streptomyces (and their utility for applied purposes), but also indicates that this diversification would be rapid between nearby strains and would have an important ecological role in the natural populations of Streptomyces
APA, Harvard, Vancouver, ISO, and other styles
7

Kacioui-Maurin, Elodie. "Exploration et exploitation, les formes d'ambidextrie organisationnelle dans l'innovation de services : le cas des prestataires de services logistiques." Thesis, Aix-Marseille 2, 2011. http://www.theses.fr/2011AIX24013/document.

Full text
Abstract:
La recherche que nous menons s’interroge sur l’organisation des innovations incrémentales et radicales, au niveau intra et inter-entreprise, à la lumière des travaux sur l’ambidextrie organisationnelle (Tushman et O’Reilly, 1996, 1999 ; O’Reilly et Tushman, 2004 ; Birkinshaw et Gibson 2004). En prenant le cas de la prestation de services logistiques, secteur relevant de la problématique de l’innovation intensive (Le Masson, Weil et Hatchuel, 2006), notre recherche vise à étudier les modalités organisationnelles mises en œuvre pour innover, à comprendre et à identifier les facteurs explicatifs du recours aux formes d’ambidextrie organisationnelle. De plus, à notre connaissance, aucune étude n’a encore été conduite sur l’ambidextrie organisationnelle dans le secteur des services. Il s’agit donc aussi d’identifier les spécificités liées à l’organisation de l’innovation dans les entreprises de services. Pour mener à bien notre recherche, 8 études de cas ont été conduites auprès de Prestataires de Services Logistiques (PSL). 49 entretiens ont été réalisés auprès des acteurs participant aux processus d’innovation dans chaque entreprise, des données secondaires (documentation interne, presse professionnelle, etc.) ont également été collectées. Les résultats de notre étude éclairent les chercheurs et les praticiens sur les modalités organisationnelles mises en œuvre pour innover dans les entreprises de services et au sein de réseaux d’entreprises interconnectées. Notre étude identifie également les facteurs explicatifs du recours et de la combinaison des formes d’ambidextrie organisationnelle. Ces facteurs sont liés aux caractéristiques de l’entreprise, aux caractéristiques de l’innovation mais aussi aux relations inter-organisationnelles entretenues entre le prestataire et son client
The research that we carry out examines the organization of incremental and radical innovations, both intra- and inter-enterprise, in the light of organizational ambidextry works (Tushman and O’Reilly, 1996, 1999; O’Reilly and Tushman, 2004; Birkinshaw and Gibson, 2004).Taking the case of logistics service provision, an industry concerned by the extensive innovation dilemma (Le Masson, Weil and Hatchuel, 2006), our research aims to study the organizational modalities implemented to innovate, but also to identify and understand the explanatory factors of the recourse to organizational ambidextry forms. Moreover, to our knowledge, no study has been performed on organizational ambidextry in the service industry. It is therefore, also about the identification of the specificities bound to the organization of innovation on service companies.To successfully achieve our research, case studies were performed with 8 Logistics Service Providers (LSP) companies. 49 interviews were carried out with the actors participating in the innovation process in each company. Secondary data (internal documentation, professional press, etc.) was also collected.The results enlighten the organizational modalities implemented to innovate in service companies and within interconnected companies for both researchers and practitioners. Our study also identifies the explanatory factors of the recourse to, and the combination of, organizational ambidextry forms. These factors are bound to the company’s characteristics as well as the characteristics of the innovation, but also to the inter-organizational relationship between the provider and its costumer
APA, Harvard, Vancouver, ISO, and other styles
8

Laquitaine, Steeve. "Les bases neuronales de l’apprentissage décisionnel au sein des ganglions de la base : étude électrophysiologique et comportementale chez le primate non humain." Thesis, Bordeaux 2, 2010. http://www.theses.fr/2010BOR21743/document.

Full text
Abstract:
Une question fondamentale en neuroscience, ainsi que dans de nombreuses disciplines s’intéressant à la compréhension du comportement, telles que la psychologie, l’Economie, et la sociologie, concerne les processus décisionnels par lesquels les animaux et les humains sélectionnent des actions renforcées positivement ou négativement. Les processus décisionnels ainsi que leur base neuronale demeurent mal compris. D’autre part de nombreuses études ont révélé que les humains ainsi que les animaux prennent souvent des décisions sous-optimales. Notre principal objectif a été de comprendre la raison de ces comportements sous-optimaux. Par ailleurs, l’altération des processus sous-tendant la prise de décision, entraîne des pathologies. La compréhension des mécanismes décisionnels est essentielle au développement de stratégies de traitements plus efficaces. Dans cette étude nous avons proposé une nouvelle approche de l’étude des comportements décisionnels, basée sur l’hétérogénéité des préférences créées au cours de l’apprentissage du choix. Puis nous avons corrélé l’activité du putamen et du globus pallidus interne aux comportements préalablement décrits. Nos résultats montrent que bien que les primates apprennent à identifier la meilleure option et convergent vers une stratégie optimale dans un nombre important de sessions, ils n’arrivent pas en moyenne à optimiser leur comportement. Nous avons montré que ce comportement suboptimal des primates est caractérisé par la création de préférences irrationnelles par ces derniers pour des paramètres non pertinents de l’environnement. Nous avons finalement montré que bien qu’un faible nombre de neurones du putamen encode la valeur de l’action, leur contribution à l’activité de population est faible. L’activité du putamen reflète les futures performances des primates et prédit donc la formation des comportements irrationnels et rationnels
A fundamental question in neuroscience, as well as in various fields such as economics, psychology and sociology, concerns the decision making processes by which animals and humans select actions based on reward and punishment. Both decision making processes and their neural basis are still poorly understood. Also, both human and animals often make suboptimal decisions in many tasks studied. Our first aim is to improve the understanding of why such sub-optimal decisions are made. Also, the alteration of decision making processes causes diseases, the understanding of whose mechanisms is essential in developing better treatment strategies. In this report, we propose a new approach which consists in extracting the neural substrates of choice behavior heterogeneity in between sessions. Our results show that although primates learn on average to identify the best option and converge to an optimal policy in a consequent number of sessions, they fail on average to optimize their behavior. We revealed that this suboptimal behavior was characterized by an unexpected high behavioral heterogeneity during the task that was due to the creation of irrelevant preferences by the monkeys. We finally show that although a few neurons of the putamen encode the action value, their contribution to the overall population activity is weak. Putamen activity rather reflects the futures performances and predicts the creation of rational and irrational behaviors
APA, Harvard, Vancouver, ISO, and other styles
9

Aklil, Nassim. "Apprentissage actif sous contrainte de budget en robotique et en neurosciences computationnelles. Localisation robotique et modélisation comportementale en environnement non stationnaire." Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066225/document.

Full text
Abstract:
La prise de décision est un domaine très étudié en sciences, que ce soit en neurosciences pour comprendre les processus sous tendant la prise de décision chez les animaux, qu’en robotique pour modéliser des processus de prise de décision efficaces et rapides dans des tâches en environnement réel. En neurosciences, ce problème est résolu online avec des modèles de prises de décision séquentiels basés sur l’apprentissage par renforcement. En robotique, l’objectif premier est l’efficacité, dans le but d’être déployés en environnement réel. Cependant en robotique ce que l’on peut appeler le budget et qui concerne les limitations inhérentes au matériel, comme les temps de calculs, les actions limitées disponibles au robot ou la durée de vie de la batterie du robot, ne sont souvent pas prises en compte à l’heure actuelle. Nous nous proposons dans ce travail de thèse d’introduire la notion de budget comme contrainte explicite dans les processus d’apprentissage robotique appliqués à une tâche de localisation en mettant en place un modèle basé sur des travaux développés en apprentissage statistique qui traitent les données sous contrainte de budget, en limitant l’apport en données ou en posant une contrainte de temps plus explicite. Dans le but d’envisager un fonctionnement online de ce type d’algorithmes d’apprentissage budgétisé, nous discutons aussi certaines inspirations possibles qui pourraient être prises du côté des neurosciences computationnelles. Dans ce cadre, l’alternance entre recherche d’information pour la localisation et la décision de se déplacer pour un robot peuvent être indirectement liés à la notion de compromis exploration-exploitation. Nous présentons notre contribution à la modélisation de ce compromis chez l’animal dans une tâche non stationnaire impliquant différents niveaux d’incertitude, et faisons le lien avec les méthodes de bandits manchot
Decision-making is a highly researched field in science, be it in neuroscience to understand the processes underlying animal decision-making, or in robotics to model efficient and rapid decision-making processes in real environments. In neuroscience, this problem is resolved online with sequential decision-making models based on reinforcement learning. In robotics, the primary objective is efficiency, in order to be deployed in real environments. However, in robotics what can be called the budget and which concerns the limitations inherent to the hardware, such as computation times, limited actions available to the robot or the lifetime of the robot battery, are often not taken into account at the present time. We propose in this thesis to introduce the notion of budget as an explicit constraint in the robotic learning processes applied to a localization task by implementing a model based on work developed in statistical learning that processes data under explicit constraints, limiting the input of data or imposing a more explicit time constraint. In order to discuss an online functioning of this type of budgeted learning algorithms, we also discuss some possible inspirations that could be taken on the side of computational neuroscience. In this context, the alternation between information retrieval for location and the decision to move for a robot may be indirectly linked to the notion of exploration-exploitation compromise. We present our contribution to the modeling of this compromise in animals in a non-stationary task involving different levels of uncertainty, and we make the link with the methods of multi-armed bandits
APA, Harvard, Vancouver, ISO, and other styles
10

Gutehrlé, Nicolas. "Information extraction from unstructured documents for the valorisation of historical periodicals : application to the heritage of the Bourgogne Franche-Comté Region in France." Electronic Thesis or Diss., Bourgogne Franche-Comté, 2024. http://www.theses.fr/2024UBFCC006.

Full text
Abstract:
Ces dernières années, les bibliothèques et archives ont entrepris de nombreuses campagnes de numérisation afin d'élargir l'accès du public à leurs collections d'archives. Cependant, le défi de promouvoir le contenu des collections et de rendre ces ressources accessibles reste entier. La numérisation produit souvent un contenu non structuré dans lequel il est difficile de naviguer, tandis que les interfaces qui s'appuient sur des requêtes basées sur des mots clés pour accéder aux documents d'archives peuvent fournir aux utilisateurs des résultats non pertinents. Afin d'exploiter le potentiel des « Big Data of the Past », notion introduite par Kaplan et di Lenardo en 2017, il est essentiel de développer des méthodes et des cadres pour structurer le contenu textuel des documents, dans le but d’en améliorer l’exploration et l’exploitation. Dans ce contexte, la présente thèse de doctorat aborde le problème du traitement des documents historiques numérisés, en se concentrant sur l'extraction des Entités Nommées et des Relations afin de créer des interfaces pour l'exploitation efficace des données textuelles historiques. Premièrement, nous proposons une nouvelle méthode pour déterminer la structure logique des journaux historiques en utilisant une approche à base de règles. Deuxièmement, nous présentons une méthode pour extraire les entités et les relations concernant les personnes et les lieux mentionnés dans les textes. Notre approche s’intitule Extensible, Lightweight and Interpretable Joint Extraction of Relations and Entities (ELIJERE). Elle est basée sur des ressources linguistiques obtenues par supervision distante. Enfin, nous proposons un cadre général pour l'étude de l'expression d’informations spatiales dans les documents, et un autre cadre pour l'application des méthodes de TimeLine Summarisation à des collections de documents. Nous montrons comment ces méthodes peuvent être appliquées pour produire des interfaces sémantiquement riches, telles que des frises chronologiques et des cartes, qui permettent au grand public une lecture proche ou distante de ces collections
In recent years, libraries and archives have undertaken numerous digitisation campaigns to widen public access to their archival collections. However, the challenge of promoting the content of collections and making these resources discoverable remains. Digitisation often produces unstructured content that is difficult to navigate, while interfaces that rely on keyword-based queries to access archival materials can provide users with irrelevant results. In order to exploit the potential of the "Big Data of the Past", notion introduced by Kaplan and di Lenardo in 2017, it is essential to develop methods and frameworks for structuring the textual content of documents, with the aim of improving their exploration and discoverability. In this context, the present Ph.D. thesis addresses the problem of processing digitised historical documents, focusing on the extraction of Named Entities and Relations in order to create interfaces for the efficient exploitation of historical textual data. Firstly, we propose a new method for determining the logical structure of historical newspapers using a rule-based approach. Secondly, we present a method for extracting entities and relations about people and places mentioned in texts. Our approach is called Extensible, Lightweight and Interpretable Joint Extraction of Relations and Entities (ELIJERE). It is based on linguistic resources obtained through distant supervision. Finally, we propose a general framework for studying the expression of spatial information in documents, and another framework for applying TimeLine Summarisation methods to document collections. We show how these methods can be applied to produce semantically rich interfaces, such as timelines and maps, that allow the general public a close and a distant reading of these collections
APA, Harvard, Vancouver, ISO, and other styles
11

Galichet, Nicolas. "Contributions to Multi-Armed Bandits : Risk-Awareness and Sub-Sampling for Linear Contextual Bandits." Thesis, Paris 11, 2015. http://www.theses.fr/2015PA112242/document.

Full text
Abstract:
Cette thèse s'inscrit dans le domaine de la prise de décision séquentielle en environnement inconnu, et plus particulièrement dans le cadre des bandits manchots (multi-armed bandits, MAB), défini par Robbins et Lai dans les années 50. Depuis les années 2000, ce cadre a fait l'objet de nombreuses recherches théoriques et algorithmiques centrées sur le compromis entre l'exploration et l'exploitation : L'exploitation consiste à répéter le plus souvent possible les choix qui se sont avérés les meilleurs jusqu'à présent. L'exploration consiste à essayer des choix qui ont rarement été essayés, pour vérifier qu'on a bien identifié les meilleurs choix. Les applications des approches MAB vont du choix des traitements médicaux à la recommandation dans le contexte du commerce électronique, en passant par la recherche de politiques optimales de l'énergie. Les contributions présentées dans ce manuscrit s'intéressent au compromis exploration vs exploitation sous deux angles spécifiques. Le premier concerne la prise en compte du risque. Toute exploration dans un contexte inconnu peut en effet aboutir à des conséquences indésirables ; par exemple l'exploration des comportements d'un robot peut aboutir à des dommages pour le robot ou pour son environnement. Dans ce contexte, l'objectif est d'obtenir un compromis entre exploration, exploitation, et prise de risque (EER). Plusieurs algorithmes originaux sont proposés dans le cadre du compromis EER. Sous des hypothèses fortes, l'algorithme MIN offre des garanties de regret logarithmique, à l'état de l'art ; il offre également une grande robustesse, contrastant avec la forte sensibilité aux valeurs des hyper-paramètres de e.g. (Auer et al. 2002). L'algorithme MARAB s'intéresse à un critère inspiré de la littérature économique(Conditional Value at Risk), et montre d'excellentes performances empiriques comparées à (Sani et al. 2012), mais sans garanties théoriques. Enfin, l'algorithme MARABOUT modifie l'estimation du critère CVaR pour obtenir des garanties théoriques, tout en obtenant un bon comportement empirique. Le second axe de recherche concerne le bandit contextuel, où l'on dispose d'informations additionnelles relatives au contexte de la décision ; par exemple, les variables d'état du patient dans un contexte médical ou de l'utilisateur dans un contexte de recommandation. L'étude se focalise sur le choix entre bras qu'on a tirés précédemment un nombre de fois différent. Le choix repose en général sur la notion d'optimisme, comparant les bornes supérieures des intervalles de confiance associés aux bras considérés. Une autre approche appelée BESA, reposant sur le sous-échantillonnage des valeurs tirées pour les bras les plus visités, et permettant ainsi de se ramener au cas où tous les bras ont été tirés un même nombre de fois, a été proposée par (Baransi et al. 2014)
This thesis focuses on sequential decision making in unknown environment, and more particularly on the Multi-Armed Bandit (MAB) setting, defined by Lai and Robbins in the 50s. During the last decade, many theoretical and algorithmic studies have been aimed at cthe exploration vs exploitation tradeoff at the core of MABs, where Exploitation is biased toward the best options visited so far while Exploration is biased toward options rarely visited, to enforce the discovery of the the true best choices. MAB applications range from medicine (the elicitation of the best prescriptions) to e-commerce (recommendations, advertisements) and optimal policies (e.g., in the energy domain). The contributions presented in this dissertation tackle the exploration vs exploitation dilemma under two angles. The first contribution is centered on risk avoidance. Exploration in unknown environments often has adverse effects: for instance exploratory trajectories of a robot can entail physical damages for the robot or its environment. We thus define the exploration vs exploitation vs safety (EES) tradeoff, and propose three new algorithms addressing the EES dilemma. Firstly and under strong assumptions, the MIN algorithm provides a robust behavior with guarantees of logarithmic regret, matching the state of the art with a high robustness w.r.t. hyper-parameter setting (as opposed to, e.g. UCB (Auer 2002)). Secondly, the MARAB algorithm aims at optimizing the cumulative 'Conditional Value at Risk' (CVar) rewards, originated from the economics domain, with excellent empirical performances compared to (Sani et al. 2012), though without any theoretical guarantees. Finally, the MARABOUT algorithm modifies the CVar estimation and yields both theoretical guarantees and a good empirical behavior. The second contribution concerns the contextual bandit setting, where additional informations are provided to support the decision making, such as the user details in the ontent recommendation domain, or the patient history in the medical domain. The study focuses on how to make a choice between two arms with different numbers of samples. Traditionally, a confidence region is derived for each arm based on the associated samples, and the 'Optimism in front of the unknown' principle implements the choice of the arm with maximal upper confidence bound. An alternative, pioneered by (Baransi et al. 2014), and called BESA, proceeds instead by subsampling without replacement the larger sample set. In this framework, we designed a contextual bandit algorithm based on sub-sampling without replacement, relaxing the (unrealistic) assumption that all arm reward distributions rely on the same parameter. The CL-BESA algorithm yields both theoretical guarantees of logarithmic regret and good empirical behavior
APA, Harvard, Vancouver, ISO, and other styles
12

Debarbieux, Denis. "Modélisation et requêtes des documents semi-structurés : exploitation de la structure de graphe." Phd thesis, Université des Sciences et Technologie de Lille - Lille I, 2005. http://tel.archives-ouvertes.fr/tel-00619303.

Full text
Abstract:
La notion de données semi-structureées est liée au monde du web. On appelle donnée semi-structurée une donnée dont le schéma n'est pas défini a priori. Par exemple, il peut s'agir d'une page HTML, d'un site Web tout entier ou encore d'un document XML. Cette thèse étudie les requêtes sur les données modélisées par des graphes. Plus précisément, on s'intéresse à différents langages de requêtes associés. Dans le cas des graphes orientés, on utilise des techniques de réécriture et d'automates pour étudier - à des fins d'optimisation de requêtes - les contraintes d'inclusions. Elles portent sur les chemins qui permettent de naviguer dans la donnée. Par ailleurs, on génère un index d'une donnée qui préserve toutes les contraintes d'inclusions. Ensuite, on étend cette étude pour obtenir le concept de requête graphe. Appliqué au cas des documents "XML coloré", elles permettent d'étudier formellement l'expressivité et la complexité de langages de requêtes inspirés de XPath et de XQuery. Enfin, les résultats théoriques sont validés par des expérimentations.
APA, Harvard, Vancouver, ISO, and other styles
13

Eshtiwi, Suaad. "Analyse de la langue et exploitation pédagogique des documents authentiques en classe de langue." Thesis, Artois, 2018. http://www.theses.fr/2018ARTO0004.

Full text
Abstract:
En Libye, le Français Langue Étrangère intervient en tant que langue facultative, et seulement au niveau de l’université. Pourtant, la formation suivie dans les universités libyennes, et plus particulièrement, celle de l’Université de Zawyia ne permet pas aux étudiants – parce que le département de français souffre d’un manque de matériel et de ressources, les professeurs n’ont que rarement reçu une formation continue en didactique du FLE, les modalités d’enseignement transmissives, ne suscitant guère la motivation des apprenants – d’acquérir les compétences principales pour affronter, toute sorte de situations de communication et particulièrement celles liées à la vie quotidienne.Cherchant comment améliorer son enseignement, comment enseigner autrement cette langue étrangère, comment faire exister une langue vivante dans la classe et obtenir un enseignement/apprentissage plus efficace, nous nous sommes orientée vers l’utilisation de documents authentiques, qui, à notre avis, peuvent contribuer à moderniser les modalités d’enseignement/apprentissage de français en Libye et à développer les compétences langagières des apprenants. Nous avons ainsi, dans le département de FLE de l’Université de Zawyia, pu tester la faisabilité d’une introduction de cette méthodologie, et mettre à l’épreuve son efficacité.Cette expérimentation a eu lieu au cours de l’année 2017, avec des apprenants de deuxième année de FLE, ayant un niveau A2+/B1. Une intégration qui s’est avérée convaincante, à nos yeux, aux yeux des apprenants et au vu des résultats, parce qu’elle provoque l’intérêt et la motivation, permet de varier les supports d’enseignement/apprentissage de cette langue étrangère, de rompre avec les pratiques habituels d’enseignement et parce qu’elle développe des compétences linguistique, communicative et interculturelle chez les apprenants
In Lybia, French as a foreign language intervenes as a optional language, and only at the university level. Therefore, the training undertaken in Lybian universities - especially at Zawyia University- doesn’t allow students to acquire the main skills to face any kind of communication situations, especially the ones that have to do with daily life, because the university’s French department suffers from the lack of material and resources, also because teachers frequently didn’t received continuous training in French as a foreign language’s didactic, and finally because the methods concerned with the transmission of information don’t arouse leaners’ motivation. While thinking how to improve its teaching, how to teach differently a foreign language, how to make a foreign language alive in the classroom and lead to a more efficient learning, we decided to choose the use of authentic documents, which – to our opinion – can contribute to the modernization of French teaching methods in Lybia and develop language capabilities of learners. Consequently, we have been piloting the dependability of the introduction of this methodology in the French as a foreign language department of the University of Zawyia and testing its effectiveness. This experiment took place throughout the year 2017 with learners in second year of study of French as a foreign language with A2+/B1 level. In our mind, and based on the learners’ results, the integration turned out to be convincing because it arouses interest and motivation, allows to vary teaching aids of this foreign language, to break with the standard practices of teaching and because it develops language, communicative, and intercultural skills for learners
APA, Harvard, Vancouver, ISO, and other styles
14

Martin, Philippe. "Exploitation de graphes conceptuels et de documents structurés et hypertextes pour l'acquisition de connaissances et la recherche d'informations." Nice, 1996. http://www.theses.fr/1996NICE4992.

Full text
Abstract:
Des taches courantes lors de la realisation d'un systeme a base de connaissances, sont la recherche et la representation d'informations contenues dans des documents (e. G. Des retranscriptions d'interviews d'experts), la creation et la manipulation de documents (e. G. Documentation technique), la recherche et la manipulation de connaissances dans une base de connaissances (e. G. Pour les valider). Afin de faciliter l'execution de telles taches par un cogniticien, nous avons cree un outil logiciel permettant l'utilisation combinee a) des techniques avancees de structuration et de gestion de documents offertes par l'editeur de documents structures et hypertextes thot, et b) de techniques avancees de representation et d'organisation de connaissances permises par le formalisme des graphes conceptuels. Des representations de connaissances peuvent ainsi a) etre stockees, recherchees et gerees dans des documents via l'editeur thot, et b) etre exploitees pour permettre la recherche des informations qu'elles indexent dans des documents. De telles recherches peuvent s'effectuer par navigation ou par requete et permettre la generation de documents qui sont des vues sur des parties de documents ou de la base selectionnees sur des criteres conceptuels. De plus, afin de guider et faciliter le travail du cogniticien dans la representation et la recherche de connaissances et d'informations, nous avons constitue une ontologie comprenant a) des types de relations elementaires usuelles (relations rhetoriques, mereologiques, spatiales, temporelles, mathematiques, etc. ), et b) des types de concepts generaux que nous avons specialises par les 90. 000 types de concepts de la base generale de connaissances terminologique wordnet. Nous montrons comment l'exploitation de cette ontologie par des cogniticiens permet d'ameliorer la coherence, l'extensibilite et la reutilisabilite de leurs representations de connaissances
APA, Harvard, Vancouver, ISO, and other styles
15

Boukacem, Boucif. "Segmentation d'articles mathématiques en vue d'une navigation et d'une meilleure exploitation du document mathématique." Lyon, INSA, 2005. http://theses.insa-lyon.fr/publication/2005ISAL0017/these.pdf.

Full text
Abstract:
Comme dans tous les domaines scientifiques, la production rédactionnelle des chercheurs en mathématiques s'exprime dans des formes relativement contraintes et normalisées. Les documents mathématiques ont des formes d'exposition classiques, dont certaines sont communes à différentes disciplines (présence de parties telles que résumé, conclusion, bibliographie. . . ) et d'autres plus spécifiques aux mathématiques (lemmes, théorèmes, démonstrations,. . . ). Cette discipline utilise de plus un langage symbolique composé de signes qui dans les documents, sont utilisés de différentes manières : soit dans le texte lui-même, soit dans les formules. Dans cette thèse, nous élaborons un travail qui permet de contribuer à l'analyse et la compréhension des contenus des documents mathématiques. Ce travail intervient notamment au niveau de la structure logique des documents pour améliorer leurs exploitations. Nous proposons deux méthodes pour segmenter ces documents mathématiques (la segmentation s'effectue sur des documents textuels et non sur leurs images) en unités autonomes en vue de la recherche d'information et de la navigation pour permettre un accès aux parties les plus pertinentes. Pour mener à bien ce travail, nous constituons un corpus d'articles mathématiques que nous analysons suivant des points de vue différents. Nous examinons plus particulièrement le langage spécifique des mathématiques pour segmenter ces articles en unités autonomes. Enfin, nous proposons différents parcours de navigation dans ce corpus afin de faciliter la recherche d'information
As in every scientific field, the editorial production of researchers in Mathematics is written through relatively rigid and standardized forms. Mathematical documents follow classical norms, some of which are common to various disciplines (presence of parts such as summary, conclusion, bibliography…), and others specific to mathematics (lemmas, theorems, demonstration…). Furthermore, this discipline uses a symbolical language made up of signs, which are used through the document in different ways: either within the text itself, or in the formulas. Through this thesis, our work intends to contribute to the analysis and the understanding of the mathematical document body. This work operates more precisely at the logical structure level of documents in order to improve the processing phase. To segment mathematical documents in autonomous units (only the texts of documents are concerned by segmentation, not their images), we propose two methods that aim at easing the search of information and browsing, through direct access to the most relevant parts of the document. We hence constitute a corpus of mathematical documents that we analyse through different perspectives. To segment these articles in autonomous units, we carefully study the specific language of mathematics. Finally, we propose different paths for browsing through this corpus so as to ease information retrieval
APA, Harvard, Vancouver, ISO, and other styles
16

Boukacem, Boucif Emptoz Hubert Lafouge Thierry. "Segmentation d'articles mathématiques en vue d'une navigation et d'une meilleure exploitation du document mathématique." Villeurbanne : Doc'INSA, 2005. http://docinsa.insa-lyon.fr/these/pont.php?id=boukacem.

Full text
APA, Harvard, Vancouver, ISO, and other styles
17

Bell, Alexander. "Studies on exploration and exploitation : concepts, roles and dynamics." Thesis, Paris Sciences et Lettres (ComUE), 2017. http://www.theses.fr/2017PSLED077.

Full text
Abstract:
L’intensité concurrentielle et les évolutions technologiques n’ont jamais été aussi intenses. Aussi, les entreprises en quête de pérennité sont-elles de plus en plus confrontées à une nécessité d’exploiter leurs activités actuelles et d’explorer des activités futures. Or la gestion de ce double impératif est loin d’être évidente, générant potentiellement d’importantes tensions au sein des entreprises. Bien que la recherche en management ait permis de mieux appréhender cette tension d’Exploration/Exploitation, il reste des zones de contradiction et des espaces non explorés. En particulier, il n’y a pas de consensus sur les définitions des concepts d’exploration et d’exploitation, ne permettant pas ainsi de garantir une certaine cohérence dans la recherche (Birkinshaw & Gupta, 2013). D’autre part, la tension Exploration/Exploitation n’a que très peu été étudiée dans le contexte des jeunes entreprises de croissance - également appelées « scale-up » - qui ont la particularité d’être exposées à de forts enjeux de survie. Ainsi, afin de contribuer à une meilleure compréhension des problématiques que soulève cette tension au sein de celles-ci, un format de thèse sur travaux, comprenant trois études complémentaires, est adopté.Au préalable, afin de cadrer conceptuellement la thèse, je réponds, dans une première étude, à l’appel des chercheurs pour la clarification des concepts d’exploration et d’exploitation en proposant une typologie d’exploration. Puis, par l’intermédiaire d’une approche multi-cas longitudinale menée auprès de huit jeunes entreprises de croissance, j’explore tout d’abord, dans une deuxième étude, les facteurs influençant les orientations stratégiques des entreprises quant à leurs activités d’exploration et d’exploitation. Enfin, dans la troisième étude, je cherche à comprendre comment le fonctionnement des équipes de direction définit les rôles de chacun dans les activités d’exploration et d’exploitation
Competition and technological change have never been as intense as they are today. To survive, companies must increasingly carry out current activities at the same time that they explore future ones. It is no easy task to operate on both of these fronts, and doing so is a potential source of tension and contradiction. Although management research has provided insight into the exploration and exploitation tension, there are still contradictions and unexplored areas. In particular, there is no consensus on the definition of the concepts of exploration and exploitation, which means the research lacks a certain level of consistency. In addition, there has been very little attention paid to the Exploration/Exploitation tension in the context of young, growing “scale-up” companies, which are particularly exposed to threats to their survival. To obtain a better understanding of the situations this tension causes in these companies, we have adopted a multi-paper dissertation consisting of three complementary studies.In the first study, to create a conceptual framework for the thesis, we answer researchers’ call for a clarification of the concepts of exploration and exploitation by proposing a typology of exploration. Then, based on a longitudinal, multi-case approach focused on eight scale-up companies, we first explore, in a second study, the factors influencing firms’ strategic orientations vis-à-vis exploration and exploitation activities. Finally, in the third study, we seek to understand how management teams define their individual roles with respect to exploration and exploitation activities
APA, Harvard, Vancouver, ISO, and other styles
18

Mokhtari, Noureddine. "Extraction et exploitation d'annotations sémantiques contextuelles à partir de texte." Nice, 2010. http://www.theses.fr/2010NICE4045.

Full text
Abstract:
Cette thèse rentre dans le cadre du projet européen SevenPro (Environnement d’ingénierie virtuel sémantique pour la conception des produits) dont le but est d'améliorer le processus d'ingénierie de production dans les entreprises de fabrication, au moyen de l’acquisition, de la formalisation et de l'exploitation des connaissances. Nous proposons une approche méthodologique et logicielle pour générer des annotations sémantiques contextuelles à partir de texte. Notre approche est basée sur des ontologies et sur les technologies du Web sémantique. Dans une première partie, nous proposons une modélisation de la notion de « contexte » pour le texte. Cette modélisation peut être perçue comme une projection des différents aspects du «contexte» abordés par ses définitions dans la littérature. Nous proposons également une modélisation des annotations sémantiques contextuelles, avec la définition des différents types de relations contextuelles pouvant exister dans le texte. Ensuite, nous proposons une méthodologie générique pour la génération d’annotations sémantiques contextuelles basées sur une ontologie du domaine qui exploite au mieux les connaissances contenues dans les textes. L’originalité de la méthodologie est qu’elle utilise des techniques de traitement automatique de la langue ainsi que des grammaires d’extraction (engendrées automatiquement) de relations de domaine, de concepts et de valeurs de propriété afin de produire des annotations sémantiques reliées avec des relations contextuelles. De plus, nous prenons en compte le contexte d’apparition des annotations sémantiques pendant leur génération. Un système supportant cette méthodologie a été implémenté et évalué
This thesis falls within the framework of the European project SevenPro (Semantic Virtual Engineering Environment for Product Design) whose aim is to improve the engineering process of production in manufacturing companies, through acquisition, formalization and exploitation of knowledge. We propose a methodological approach and software for generating contextual semantic annotations from text. Our approach is based on ontologies and Semantic Web technologies. In the first part, we propose a model of the concept of "context" for the text. This modeling can be seen as a projection of various aspects of "context" covered by the definitions in literature. We also propose a model of contextual semantic annotations, with the definition of different types of contextual relationships that may exist in the text. Then, we propose a generic methodology for the generation of contextual semantic annotations based on domain ontology that operates at best with the knowledge contained in texts. The novelty in the methodology is that it uses language automatic processing techniques and grammar extraction (automatically generated) field relations, concepts and values of property in order to produce semantic annotations associated with contextual relations. In addition, we take into account the context of occurrence of semantic annotations for their generation. A system that supports this methodology has been implemented and evaluated
APA, Harvard, Vancouver, ISO, and other styles
19

El, Khelifi Aymen. "Approche générique d’extraction automatique des événements et leur exploitation." Thesis, Paris 4, 2012. http://www.theses.fr/2012PA040189.

Full text
Abstract:
Dans le cadre de notre thèse, nous avons proposé une approche générique d’extraction automatique des événements et de leur exploitation. L’approche est organisée en quatre composantes indépendantes et réutilisables. Une première composante de prétraitement, où les textes sont nettoyés et segmentés. Au cours de la seconde étape, les événements sont extraits en sebasant sur notre algorithme AnnotEC qui dispose d’une complexité polynomiale et qui est associé à des cartes sémantiques et des ressources linguistiques dédiées. Nous avons mis en place deux nouvelles mesures de similarité SimCatégoreille et SimEvent pour regrouper les événementssimilaires dans le cadre de la troisième composante de clustering. Les annotations, ajoutées tout au long des trois premières étapes, sont exploitées au niveau de la dernière composante par le bais des fichiers de synthèse paramétrables par l’utilisateur.L’approche a été évaluée sur un corpus issu du Web 2.0. Nous avons comparé les résultats avec des méthodes d’apprentissage automatique et des méthodes linguistiques par compilation et nous avons obtenu de meilleurs résultats
In the framework of our thesis, we proposed a generic approach for the automatic extraction of events and their exploitation. This approach is divided into four independent and reusable components. The first component of pretreatment, in which texts are cleaned and segmented. During the second stage, events are extracted based on our algorithm AnnotEC which has polynomial complexity. AnnotEC is associated with semantic maps and dedicated linguistic resources. We have proposed two new similarity measures SimCatégoreille and SimEvent to group similar events using clustering algorithms.Annotations, added throughout the first three steps, are used at the last component by summarizing files configurable by users. The approach was evaluated on a corpus of Web 2.0, we compared the obtained results with machine learning methods and linguistic compiling methods and we got good results
APA, Harvard, Vancouver, ISO, and other styles
20

Majid, Rajaa. "Modélisation articulatoire du conduit vocal : exploration et exploitation : fonctions de macro-sensibilité paramétriques et voyelles du français." Grenoble INPG, 1986. http://www.theses.fr/1986INPG0131.

Full text
APA, Harvard, Vancouver, ISO, and other styles
21

Majid, Shihab Rajaa. "Modélisation articulatoire du conduit vocal exploration et exploitation, fonctions de macro-sensibilité paramétriques et voyelles du français." Grenoble 2 : ANRT, 1986. http://catalogue.bnf.fr/ark:/12148/cb37599371k.

Full text
APA, Harvard, Vancouver, ISO, and other styles
22

Farizy, Anne-Sophie Darmont Jérôme. "L'entreposage et la fouille de données complexes." [S.l.] : [s.n.], 2004. http://www.enssib.fr/bibliotheque/documents/dessid/rrbfarizy.pdf.

Full text
Abstract:
Rapport de recherche bibliographique diplôme d'études supérieures spécialisées : Ingénierie documentaire : Villeurbanne, ENSSIB : 2004. Rapport de recherche bibliographique diplôme d'études supérieures spécialisées : Ingénierie documentaire : Lyon 1 : 2004.
APA, Harvard, Vancouver, ISO, and other styles
23

Elasri, Karim. "L'arbitrage dans les stratégies d'innovation entre exploration et exploitation : application aux activités de haute technologie." Aix-Marseille 2, 2009. http://www.theses.fr/2009AIX24010.

Full text
Abstract:
Les problématiques traitant de la dynamique concurrentielle dans les secteurs de haute technologie nécessitent une compréhension des stratégies d’innovation afin de développer des avantages concurrentiels. Les firmes dans un environnement complexe élaborent des stratégies fondées sur l’exploration et sur l’exploitation qu’elles abritent selon la rentabilité de l’innovation et la performance recherchée, et selon la concurrence des autres firmes sur le marché. La stratégie hybride optimale atteinte par les plus dynamiques, les « knowledge makers » est l’ambidextrie qu’elles entretiennent en recourant à des alliances ou des acquisitions pour améliorer leurs performances et leur compétitivité. Le modèle mathématique qui intègre la stratégie d’innovation ambidextre, qui mêle exploration et exploitation, montre comment élever la rentabilité de l’innovation par un équilibre judicieux entre exploration et exploitation
The questions surrounding the dynamic competition in the high-tech sectors require the understanding of the innovation strategies used to develop a competitive advantage. The firms in a complex environment elaborate explorative and exploitative strategies and they make a trade-off between them on the innovation profitability and the resulting performance, and on the competition generated by the other firms on the market. The optimal hybrid strategy achieved by the most dynamic companies, the “knowledge markers”, is the ambidexterity that they sustain thanks to alliances and acquisitions that improve their performances and their competitiveness. The mathematical model which includes the ambidexterity innovation strategy, the involvement in exploration and in exploitation, indicates how to enhance the innovation profitability with a judicious balance between exploration and exploitation
APA, Harvard, Vancouver, ISO, and other styles
24

Atanassova, Iana. "Exploitation informatique des annotations sémantiques automatiques d'Excom pour la recherche d'informations et la navigation." Thesis, Paris 4, 2012. http://www.theses.fr/2012PA040252.

Full text
Abstract:
À partir du moteur d’annotation sémantique Excom, nous avons élaboré un systèmede recherche d’informations qui repose sur des catégories sémantiques issues d’analyses linguistiquesautomatiques afin de proposer une approche de fouille textuelle innovante. Les annotationssont obtenues par la méthode d’Exploration Contextuelle faisant appel à une modélisationdes connaissances linguistiques sous forme de marqueurs et de règles. Le traitement des requêtesselon des points de vue de fouille se trouve au coeur de la stratégie de recherche d’informations.Pour cela, notre approche s’appuie sur des catégories d’annotation organisées en ontologies linguistiquessous forme de graphes. Afin d’offrir à l’utilisateur des résultats pertinents, nous avonsmis en place des algorithmes d’ordonnancement des réponses et de gestion de la redondance.Ces algorithmes reposent principalement sur la structure des ontologies linguistiques utiliséespour l’annotation. Nous avons proposé une évaluation de la pertinence des résultats en tenantcompte de la spécificité de l’approche. Les interfaces que nous avons développées permettent laconstruction de nouveaux produits documentaires tels que les fiches de synthèse offrant une extractiond’informations structurées selon des critères sémantiques. Cee approche a égalementpour vocation de proposer des outils dédiés à la veille stratégique et à l’intelligence économique
Using the Excom engine for semantic annotation, we have constructed an InformationRetrieval System based on semantic categories from automatic language analyses in order topropose a new approach to text search. e annotations are obtained by the Contextual Explorationmethod which is a knowledge based linguistic approach using markers and disambiguationrules. e queries are formulated according to search viewpoints which are at the heart of theInformation Retrieval strategy. Our approach uses the annotation categories which are organisedin linguistic ontologies structured as graphs. In order to provide relevant results to the user,we have designed algorithms for ranking and paraphrase identification. ese algorithms exploitprincipally the structure of the linguistic ontologies for the annotation. We have carriedout an evaluation of the relevance of the system results taking into account the specificity ofour approach. We have developed user interfaces allowing the construction of new informationproducts such as structured text syntheses using information extraction according to semanticcriteria. is approach also aims to offer tools in the field of economic intelligence
APA, Harvard, Vancouver, ISO, and other styles
25

Jouve, Pierre-Emmanuel. "Apprentissage non supervisé et extraction de connaissances à partir de données." Lyon 2, 2003. http://theses.univ-lyon2.fr/documents/lyon2/2003/jouve_pe.

Full text
Abstract:
Les travaux constituant cette dissertation concernent la classification non supervisée. Cette problématique, commune à de multiples domaines (et ainsi connue sous diverses acceptions : apprentissage/classification non supervisé(e) en reconnaissance de formes, taxonomie en sciences de la vie, typologie en sciences humaines. . . ), est ici envisagée selon la perspective Ingénierie des Connaissances et plus spécifiquement dans le cadre de son intégration au sein du processus dExtraction de Connaissances à partir de Données (ECD). D'une part, nos travaux participent à l'amélioration du processus de classification non supervisée, et ce, selon divers axes propres ou non à l'ECD (coût calculatoire et utilisabilité des méthodes, formes et distribution des données traitées, forme des connaissances extraites, sélection de variables pour l'apprentissage non supervisé. . . ) mais aussi à l'évaluation de la qualité d'un processus de classification non supervisée (estimation de la validité des résultats issus du processus). D'autre part ces travaux visent à illustrer le lien très étroit unissant apprentissage non supervisé et apprentissage supervisé et à monter l'intérêt d'une intéraction antre ces deux types de processus. Concrètement, ces divers problèmes sont abordé et présentés au travers d'une nouvelle méthode de classification non supervisée, de deux nouveaux indices et d'une méthodologie dédiés à l'évaluation/comparaison de la validité de classification non superviséé, de méthodes de sélection de variables pour l'apprentissage non supervisé et l'apprentissage supervisé, de plusieurs méthodes pour l'agrégation de classification non supervisée.
APA, Harvard, Vancouver, ISO, and other styles
26

Saad, Motaz. "Fouille de documents et d'opinions multilingue." Electronic Thesis or Diss., Université de Lorraine, 2015. http://www.theses.fr/2015LORR0003.

Full text
Abstract:
L’objectif de cette thèse est d’étudier les sentiments dans les documents comparables. Premièrement, nous avons recueillis des corpus comparables en anglais, français et arabe de Wikipédia et d’Euronews, et nous avons aligné ces corpus au niveau document. Nous avons en plus collecté des documents d’informations des agences de presse locales et étrangères dans les langues anglaise et arabe. Les documents en anglais ont été recueillis du site de la BBC, ceux en arabe du site d’Al-Jazzera. Deuxièmement, nous avons présenté une mesure de similarité cross-linguistique des documents dans le but de récupérer et aligner automatiquement les documents comparables. Ensuite, nous avons proposé une méthode d’annotation cross-linguistique en termes de sentiments, afin d’étiqueter les documents source et cible avec des sentiments. Enfin, nous avons utilisé des mesures statistiques pour comparer l’accord des sentiments entre les documents comparables source et cible. Les méthodes présentées dans cette thèse ne dépendent pas d’une paire de langue bien déterminée, elles peuvent être appliquées sur toute autre couple de langue
The aim of this thesis is to study sentiments in comparable documents. First, we collect English, French and Arabic comparable corpora from Wikipedia and Euronews, and we align each corpus at the document level. We further gather English-Arabic news documents from local and foreign news agencies. The English documents are collected from BBC website and the Arabic documents are collected from Al-jazeera website. Second, we present a cross-lingual document similarity measure to automatically retrieve and align comparable documents. Then, we propose a cross-lingual sentiment annotation method to label source and target documents with sentiments. Finally, we use statistical measures to compare the agreement of sentiments in the source and the target pair of the comparable documents. The methods presented in this thesis are language independent and they can be applied on any language pair
APA, Harvard, Vancouver, ISO, and other styles
27

Letessier, Pierre. "Découverte et exploitation d'objets visuels fréquents dans des collections multimédia." Electronic Thesis or Diss., Paris, ENST, 2013. http://www.theses.fr/2013ENST0014.

Full text
Abstract:
L’objectif principal de cette thèse est la découverte d’objets visuels fréquents dans de grandes collections multimédias (images ou vidéos). Comme dans de nombreux domaines (finance, génétique, . . .), il s’agit d’extraire une connaissance de manière automatique ou semi-automatique en utilisant la fréquence d’apparition d’un objet au sein d’un corpus comme critère de pertinence. Une première contribution de la thèse est de fournir un formalisme aux problèmes de découverte et de fouille d’instances d’objets visuels fréquents. La deuxième contribution de la thèse est une méthode générique de résolution de ces deux types de problème reposant d’une part sur un processus itératif d’échantillonnage d’objets candidats et d’autre part sur une méthode efficace d’appariement d’objets rigides à large échelle. La troisième contribution de la thèse s’attache à construire une fonction de vraisemblance s’approchant au mieux de la distribution parfaite, tout en restant scalable et efficace. Les expérimentations montrent que contrairement aux méthodes de l’état de l’artnotre approche permet de découvrir efficacement des objets de très petite taille dans des millions d’images. Pour finir, plusieurs scénarios d’exploitation des graphes visuels produits par notre méthode sont proposées et expérimentés. Ceci inclut la détection d’évènements médiatiques transmédias et la suggestion de requêtes visuelles
The main goal of this thesis is to discover frequent visual objects in large multimedia collections. As in many areas (finance, genetics, . . .), it consists in extracting a knowledge, using the occurence frequency of an object in a collection as a relevance criterion. A first contribution is to provide a formalism to the problems of mining and discovery of frequent visual objects. The second contribution is a generic method to solve these two problems, based on an iterative sampling process, and on an efficient and scalable rigid objects matching. The third contribution of this work focuses on building a likelihood function close to the perfect distribution. Experiments show that contrary to state-of-the-art methods, our approach allows to discover efficiently very small objects in several millions images. Finally, several applications are presented, including trademark logos discovery, transmedia events detection or visual-based query suggestion
APA, Harvard, Vancouver, ISO, and other styles
28

ROBERT, Laurent. "Annotation et visualisation interactives de documents hypermédias." Phd thesis, Télécom ParisTech, 2001. http://tel.archives-ouvertes.fr/tel-00005631.

Full text
Abstract:
Le développement du multimédia, des capacités de stockage et du matériel de numérisation permet de mettre à disposition sous une forme électronique un nombre toujours croissant de documents " matériels " (journaux, cartes, photographies, peintures, cahiers d'expérimentations, originaux d'œuvres littéraires, rapports, etc.). La numérisation, le stockage et la diffusion de ces matériaux sources ne posent aujourd'hui plus réellement problème. Néanmoins, il s'avère que les utilisateurs ont souvent des difficultés à exploiter ces documents en milieu informatique. Cet état de fait est la conséquence de plusieurs problèmes. Tout d'abord, peu d'outils logiciels permettent aux utilisateurs de réaliser les tâches qu'ils ont l'habitude d‘effectuer avec des documents papiers (annoter, comparer, associer des idées, etc.). Ensuite, l'accès à l'information dans un espace informationnel de vaste envergure s'avère être un problème non trivial. Les utilisateurs éprouvent des difficultés à trouver les données recherchées, à comprendre leur organisation et leurs relations, ainsi qu'à collecter et organiser celles jugées intéressantes afin de pouvoir les retrouver plus rapidement par la suite.
A cette problématique de l'utilisation des documents en milieu informatique, nous proposons deux approches complémentaires issues des domaines de l'interaction homme-machine et de la visualisation d'information.
La première approche repose sur le concept de lecture active qui vise à transformer le " lecteur " en " acteur " en lui permettant d'enrichir interactivement les documents qu'il est en train de lire par un ensemble de signes graphiques (surlignages, cerclages, etc.) et d'informations textuelles (notes, commentaires, etc.). L'idée consiste à permettre aux utilisateurs de construire leur propre système de repérage afin de faciliter la compréhension et la réutilisation des documents. Une attention particulière est portée à la manière d'associer ces méta-données " ajoutées " (que nous nommons, d'une manière générique, " annotations ") aux documents sources au moyen de liens hypertextes, ainsi qu'à leur codage informatique dans un format normalisé (dérivé de XML).
La seconde approche consiste à faciliter l'exploration d'espaces documentaires en exploitant les capacités perceptives et mémorielles humaines au moyen de techniques interactives de visualisation. Nous proposons tout d'abord un système de navigation qui repose sur un fort couplage entre vues globales et vues locales pour aider à trouver les documents. Les vues globales montrent l'organisation de l'espace d'information et en permettent un survol rapide. Elles sont utilisées pour atteindre des zones d'intérêts. Les vues locales présentent le contenu de plusieurs documents en contexte afin d'aider l'utilisateur à les comparer et à choisir celui qu'il va consulter. Nous proposons ensuite un environnement visuel de gestion de bookmarks dans le but de pouvoir retrouver le plus simplement possible les documents préalablement consultés. Les utilisateurs organisent leurs bookmarks de la même manière qu'ils le feraient avec un ensemble de documents papiers sur un bureau. Ils définissent interactivement leur propre organisation conceptuelle de l'espace documentaire en se basant sur des propriétés visuelles et spatiales. Ces propriétés aideront les utilisateurs à retrouver plus efficacement les documents sauvegardés par une stimulation de leurs capacités mémorielles.
APA, Harvard, Vancouver, ISO, and other styles
29

Bernard, Guillaume. "Détection et suivi d’événements dans des documents historiques." Electronic Thesis or Diss., La Rochelle, 2022. http://www.theses.fr/2022LAROS032.

Full text
Abstract:
Les campagnes actuelles de numérisation de documents historiques issus de fonds documentaires du monde entier ouvrent de nouvelles voies aux historiens, historiennes et spécialistes des sciences sociales. La compréhension des événements du passé se renouvelle par l’analyse de ces grands volumes de données historiques : découdre le fil des événements, tracer de fausses informations sont, entre autres, des possibilités offertes par les sciences du numérique. Cette thèse s’intéresse à ces articles de presse historique et propose, à travers deux stratégies que tout oppose, deux processus d’analyse répondant à la problématique de suivi des événements dans la presse. Un cas d’utilisation simple est celui d’une équipe de recherche en humanités numériques qui s’intéresse à un événement particulier du passé. Ses membres cherchent à découvrir tous les documents de presse qui s’y rapportent. L’analyse manuelle des articles est irréalisable dans un temps contraint. En publiant à la fois algorithmes, jeux de données et analyses, cette thèse est un premier jalon vers la publication d’outils plus sophistiqués. Nous permettons à tout individu de fouiller les fonds de presse ancienne à la recherche d’événements, et pourquoi pas, renouveler certaines de nos connaissances historiques
Current campaigns to digitise historical documents from all over the world are opening up new avenues for historians and social science researchers. The understanding of past events is renewed by the analysis of these large volumes of historical data: unravelling the thread of events, tracing false information are, among other things, possibilities offered by the digital sciences. This thesis focuses on these historical press articles and suggests, through two opposing strategies, two analysis processes that address the problem of tracking events in the press. A simple use case is for instance a digital humanities researcher or an amateur historian who is interested in an event of the past and seeks to discover all the press documents related to it. Manual analysis of articles is not feasible in a limited time. By publishing algorithms, datasets and analyses, this thesis is a first step towards the publication of more sophisticated tools allowing any individual to search old press collections for events, and why not, renew some of our historical knowledge
APA, Harvard, Vancouver, ISO, and other styles
30

Bettinger, Alexandre. "Influence indépendante et explicabilité de l’exploration et de l’exploitation dans les métaheuristiques." Electronic Thesis or Diss., Université de Lorraine, 2022. http://www.theses.fr/2022LORR0190.

Full text
Abstract:
La recommandation est le fait de filtrer des informations afin de cibler des éléments (items, ressources) susceptibles d'intéresser un ou plusieurs utilisateurs. Dans le cadre des manuels scolaires numériques, les items sont des ressources éducatives (leçon, exercice, chapitre, vidéo et autres). Cette tâche peut être vue comme le traitement d'un vaste espace de recherche qui représente l'ensemble des recommandations possibles. Selon le contexte de la recommandation, une recommandation peut prendre différentes formes telles que des items, des ensembles d'items (itemsets) ou des séquences d'items. Notons que les environnements de recommandation peuvent être soumis à de nombreux aléas et contraintes de recommandation. Dans ce travail de thèse, nous nous intéressons à la recommandation d'itemsets (également appelés vecteurs ou solutions) par les métaheuristiques. Les problématiques de cette thèse s'intéressent à l'influence de l'exploration et de l'exploitation, à la réduction de données ainsi qu'à l'explicabilité de l'exploration et de l'exploitation
Recommendation is the act of filtering information to target items (resources) that may be of interest to one or more users. In the context of digital textbooks, items are educational resources (lesson, exercise, chapter, video and others). This task can be seen as processing a large search space that represents the set of possible recommendations. Depending on the context of the recommendation, a recommendation can take different forms such as items, itemsets or item sequences.Note that recommender environments can be subject to a number of randomness and recommendation constraints.In this thesis, we are interested in the recommendation of itemsets (also called vectors or solutions) by metaheuristics.The issues of this thesis are interested in the influence of exploration and exploitation, in data reduction and in the explicability of exploration and exploitation
APA, Harvard, Vancouver, ISO, and other styles
31

Ben, Ali Boutheina. "Méthode automatique d’annotations sémantiques et indexation de documents textuels pour l’extraction d’objets pédagogiques." Thesis, Paris 4, 2014. http://www.theses.fr/2014PA040008.

Full text
Abstract:
L'analyse du contenu devient une nécessité pour l'accès et l'utilisation de l'information en particulier dans le domaine de la didactique des disciplines. Nous proposons un système SRIDOP d'annotations sémantiques et d'indexation des documents pédagogiques à partir des annotations, en se basant sur la méthode d'Exploration Contextuelle qui, à un identificateur linguistique d'un concept, associe une annotation d'un segment en tenant compte d'indices contextuels gérés par des règles. SRIDOP est composé de quatre modules consécutifs : (1)Segmentation automatique des documents en paragraphes et phrases ; (2) annotation selon différents points de vue de fouille (exemple: identification de définitions, exemples, exercices, etc.) en se basant sur une ontologie linguistique de concepts associés à un point de vue de fouille (carte sémantique) et de ressources linguistiques (indicateurs de concepts, indices linguistiques et règles d'Exploration Contextuelle) ; (3) extraction d'objets pédagogiques ; (4) constitution de fiches pédagogiques exploitables par les utilisateurs. SRIDOP est évalué et comparé à d'autres systèmes
Content analysis is a need for access and use of information especially in the field of didactics. We propose a system SRIDOP of semantic annotations and indexing of learning objects from these annotations, based on the Contextual Exploration method, that associate annotation of a segment to a linguistic identifier of a concept, taking into account contextual clues managed by rules. SRIDOP is composed of four consecutive modules: (1) Automatic segmentation of documents into paragraphs and sentences; (2) annotation from different points of view of search (eg identification of definitions, examples, exercises, etc..) based on a linguistic ontology of concepts associated with a point of view of search (semantic map) and linguistic resources (indicators of concepts, linguistic clues and contextual exploration rules); (3) extraction of learning objects, (4) establishment of learning sheets exploitable by users. SRIDOP is evaluated and compared to other systems
APA, Harvard, Vancouver, ISO, and other styles
32

Saad, Motaz. "Fouille de documents et d'opinions multilingue." Thesis, Université de Lorraine, 2015. http://www.theses.fr/2015LORR0003/document.

Full text
Abstract:
L’objectif de cette thèse est d’étudier les sentiments dans les documents comparables. Premièrement, nous avons recueillis des corpus comparables en anglais, français et arabe de Wikipédia et d’Euronews, et nous avons aligné ces corpus au niveau document. Nous avons en plus collecté des documents d’informations des agences de presse locales et étrangères dans les langues anglaise et arabe. Les documents en anglais ont été recueillis du site de la BBC, ceux en arabe du site d’Al-Jazzera. Deuxièmement, nous avons présenté une mesure de similarité cross-linguistique des documents dans le but de récupérer et aligner automatiquement les documents comparables. Ensuite, nous avons proposé une méthode d’annotation cross-linguistique en termes de sentiments, afin d’étiqueter les documents source et cible avec des sentiments. Enfin, nous avons utilisé des mesures statistiques pour comparer l’accord des sentiments entre les documents comparables source et cible. Les méthodes présentées dans cette thèse ne dépendent pas d’une paire de langue bien déterminée, elles peuvent être appliquées sur toute autre couple de langue
The aim of this thesis is to study sentiments in comparable documents. First, we collect English, French and Arabic comparable corpora from Wikipedia and Euronews, and we align each corpus at the document level. We further gather English-Arabic news documents from local and foreign news agencies. The English documents are collected from BBC website and the Arabic documents are collected from Al-jazeera website. Second, we present a cross-lingual document similarity measure to automatically retrieve and align comparable documents. Then, we propose a cross-lingual sentiment annotation method to label source and target documents with sentiments. Finally, we use statistical measures to compare the agreement of sentiments in the source and the target pair of the comparable documents. The methods presented in this thesis are language independent and they can be applied on any language pair
APA, Harvard, Vancouver, ISO, and other styles
33

Ben, Messaoud Riadh. "Couplage de l'analyse en ligne et de la fouille de données pour l'exploration, l'agrégation et l'explication des données complexes." Lyon 2, 2006. http://theses.univ-lyon2.fr/documents/lyon2/2006/benmessaoud_r.

Full text
Abstract:
Les entrepôts de données présentent une solution efficace à la gestion des grandes volumétries des données. L'analyse en ligne (OLAP) complète les entrepôts de données en proposant des outils pour la visualisation, la structuration et l'exploration des cubes de données afin d'y découvrir des informations pertinentes. D'un autre côté, la fouille de données emploie des techniques d'apprentissage afin d'induire des modèles de connaissances valides couvrant la description, la classification et l'explication. L'idée de combiner l'analyse en ligne et la fouille de données est une solution prometteuse pour rehausser le processus d'aide à la décision, notamment dans le cas des données complexes. En effet, il s'agit de deux domaines qui peuvent se compléter dans le cadre d'un processus d'analyse unifié. L'objectif de cette thèse est d'avancer de nouvelles approches d'aide à la décision qui reposent sur le couplage de l'analyse en ligne et de la fouille de données. Nous avons mis en place trois principales propositions pour ce problème. La première concerne la visualisation des données éparses. En se basant sur l'analyse des correspondances multiples, nous atténuons l'effet négatif de l'éparsité en réorganisant différemment les cellules d'un cube de données. Notre deuxième proposition fournit une nouvelle agrégation des faits d'un cube de données en se basant sur la classification ascendante hiérarchique. Les nouveaux agrégats obtenus sont sémantiquement plus riches que ceux fournis par l'OLAP classiques. Notre troisième proposition établit une démarche explicative en se basant sur les règles d'association. Nous avons élaboré un nouvel algorithme pour une recherche guidée des règles d'association dans les cubes de données. Nous avons également développé une plateforme logicielle pour concrétiser nos contributions théoriques et proposé un cas d'application à des données complexes afin de valider notre démarche de couplage. Enfin, en se basant sur une algèbre OLAP, nous avons mis en place les premières bases d'un cadre formel général dédié au couplage de l'analyse en ligne et de la fouille de données
Data warehouses provide efficient solutions for the management of huge amounts of data. Online analytical processing (OLAP) is a key feature in data warehouses which enables users with visual tools to explore data cubes. Therefore, users are capable to extract relevant information for their decision-making. On the other hand, data mining offers automatic learning techniques in order to come out with comprehensive knowledge covering descriptions, clusterings and explanations. The idea of combining online analytical processing and data mining is a promising solution to improve the decision-making process, especially in the case of complex data. In fact, OLAP and data mining could be two complementary fields that interact together within a unique analysis process. The aim of this thesis is to propose new approaches for decision support based on coupling online analytical processing and data mining. In order to do so, we have established three main proposals. The first one concerns the visualization of sparse data. According to the multiple correspondence analysis, we have reduced the negative effect of sparsity by reorganizing the cells of a data cube. Our second proposal provides a new aggregation of facts in a data cube by using agglomerative hierarchical clustering. The obtained aggregates are semantically richer than those provided by traditional multidimensional structures. Our third proposal tries to explain possible relationships within multidimensional data by using association rules. We have designed a new algorithm for a guided-mining of association rules in data cubes. We have also developed a software platform which includes our theoretical contributions. In addition, we provided a case study on complex data in order to validate our approaches. Finally, based on an OLAP algebra, we have designed the first principles toward a general formal framework which models the problem of coupling online analytical processing and data mining
APA, Harvard, Vancouver, ISO, and other styles
34

Jalam, Radwan. "Apprentissage automatique et catégorisation de textes multilingues." Lyon 2, 2003. http://theses.univ-lyon2.fr/documents/lyon2/2003/jalam_r.

Full text
Abstract:
Notre travail s'intéresse à l'application de méthodes issues de l'apprentissage automatique à la catégorisation de textes multilingues. Il comporte deux parties. Une première partie donne une présentation générale de la catégorisation de textes : Définitions, objectifs généraux et domaines d'application ; Adaptation des algorithmes d'apprentissage aux spécificités des textes ; La méthode de sélection de termes multivariée ; Le codage en n-grammes et les mots ; Les méthodes d'apprentissage et la mesure de leurs performances ; les texts réalisés pour comparer les algorithmes d'apprentissage sur les textes. La deuxième partie s'intéresse à l'apprentissage de textes multilingues en comparant deux chaînes possibles : Chaîne 1 : reconnaissance de la langue, puis utilisation de règles de classement construites pour chaque langue ; il faut alors avoir construit un modèle adapté à chacune des langues. Chaîne 2 : utilisation de la traduction automatique dans le processus de catégorisation ; cette solution permet d'utiliser un seul ensemble de règles de classement. Ici, il y a deux options : 1. Construire un modèle unique sur l'ensemble d'apprentissage d'une langue donnée ; ensuite, pour classer un nouveau texte, (I) reconnaissance de sa langue, (II) traduction de ce texte vers la langue d'apprentissage, (III) application du modèle de prédiction sur le texte traduit ; ici la phase de traduction n'intervient que dans la phase de classement. 2. Faire intervenir la traduction automatique dès la phase d'apprentissage : à partir d'un ensemble étiqueté de textes en différentes langues, traduction automatique dès la phase d'apprentissage : à partir d'un enemble étiqueté de textes en différentes langues, traduction automatique de tous ces textes vers une langue cible et apprentissage sur cet ensemble de textes traduits ; ensuite, pour classer un nouveau texte, la procédure est la même. Nous testons nos algorithmes sur des corpus multilingues.
APA, Harvard, Vancouver, ISO, and other styles
35

MEULEAU, NICOLAS. "Le dilemme entre exploration et exploitation dans l'apprentissage par renforcement : optimisation adaptative des modeles de decision multi-etats." Caen, 1996. http://www.theses.fr/1996CAEN2038.

Full text
Abstract:
Cette these s'interesse au dilemme entre l'exploration et l'exploitation tel qu'il se pose dans les algorithmes de l'apprentissage par renforcement, c'est-a-dire au probleme du choix de l'action lors de l'optimisation adaptative des modeles de decision multi-etats. Nous nous focalisons sur le cas des processus de decision markoviens. L'apprentissage par renforcement se caracterise par l'utilisation de solutions approchees. Notre recherche vise a ameliorer ces solutions. Dans ce but, nous nous inspirons du travail d'autres communautes comme l'aide a la decision et la commande optimale adaptative. Au travers de la presentation des resultats des differents domaines, nous soulignons les trois difficultes suivantes: 1 l'impossibilite d'obtenir des certitudes sur les parametres inconnus avant un nombre infini d'experimentations, et donc la necessite de choisir entre ne jamais abandonner completement l'exploration et prendre le risque de se focaliser sur une solution sous-optimale ; 2 l'insuffisance des raisonnements a l'echelle locale, c'est-a-dire la necessite de savoir anticiper, depuis un etat du modele, les observations qui pourront etre faites dans les autres etats ; 3 la sensibilite des algorithmes a la representation du probleme utilisee. Beaucoup d'algorithmes de l'apprentissage par renforcement utilisent une approche distribuee qui consiste a representer le probleme de l'apprentissage d'un modele multi-etats, par un ensemble de problemes a un etat appeles problemes de bandit. Nous soulignons quelques limites de cette demarche, et en particulier le fait qu'elle n'est pas satisfaisante au regard du deuxieme des points enonces ci-dessus. Nous proposons de contourner cela en introduisant un mecanisme de retropropagation de l'incertitude mesuree, de maniere a simuler un raisonnement a l'echelle globale. Cela permet de concevoir des algorithmes satisfaisant au regard des trois difficultes soulignees precedemment. Des simulations numeriques sont menees de maniere a mettre en evidence l'interet et les limites des differentes propositions. Pour cela, nous utilisons un ensemble de problemes de decision markoviens extraits de la litterature, ou construit de maniere a couvrir le plus largement la gamme des problemes possibles. La contribution de cette these consiste donc en: la synthese des differentes approches du probleme, l'etude des limites des architectures distribuees de l'apprentissage par renforcement, la proposition d'algorithmes utilisant la retropropagation de l'incertitude, les resultats des simulations numeriques
APA, Harvard, Vancouver, ISO, and other styles
36

Khrouf, Kaïs. "Entrepôts de documents : de l'alimentation à l'exploitation." Toulouse 3, 2004. http://www.theses.fr/2004TOU30109.

Full text
Abstract:
Nous proposons dans le cadre de cette thèse le concept d'entrepôt de documents permettant le stockage de documents hétérogènes, sélectionnés et filtrés, ainsi que leur classification selon des structures logiques génériques (structures communes à un ensemble de documents). Une telle organisation des entrepôts permet de faciliter l'exploitation des informations documentaires intégrées au travers de plusieurs techniques complémentaires : la recherche d'information qui consiste à restituer des granules de documents en réponse à une requête formulée à l'aide de mots-clés (langage libre), l'interrogation des données qui consiste à récupérer des données factuelles (de structure ou de contenu) en utilisant un langage déclaratif, l'analyse multidimensionnelle qui consiste à manipuler les informations de l'entrepôt selon des dimensions non prédéfinies. Pour valider nos propositions, nous avons développé un outil DOCWARE (DOCument WAREhouse) d'aide à l'intégration et à l'analyse de documents
In this thesis, we propose the concept of document warehouse which consists in the storage of heterogeneous, selected and filtered documents, and their classification according to generic logical structures (common structures to a set of documents). Such warehouses organization facilitates the exploitation of the integrated documentary information through several complementary techniques : the information retrieval which consists in the restitution document granules in response to a query formulated with keywords (free language), the data interrogation which consists in the restitution factual data (structure or content) by using a declarative language, the multidimensional analysis which consists in the manipulation of warehouse information according to not-predefined dimensions. To validate our propositions, we developed an aid tool DOCWARE (DOCument WAREhouse) for the integration and the analysis of documents
APA, Harvard, Vancouver, ISO, and other styles
37

Fangseu, Badjio Edwige P. "Evaluation qualitative et guidage des utilisateurs en fouille visuelle de données." Lyon 2, 2005. http://theses.univ-lyon2.fr/documents/lyon2/2005/fangseubadjio_ep.

Full text
Abstract:
Nos travaux s'inscrivent dans le domaine de la fouille visuelle de données (plus précisément en classification) et se fondent sur l'extraction de connaissances dans les données, l'apprentissage automatique, la qualité des interfaces et des logiciels, l'ergonomie des logiciels, le génie logiciel et l'interaction homme machine. L'évaluation de la qualité des modèles obtenus est basée la plupart du temps sur une estimation du taux de mauvaise classification. Cette estimation du taux de mauvaise classification est nécessaire mais pas suffisante pour l'évaluation de la qualité des outils de fouille visuelle de données. En effet, les outils et techniques de ce type utilisent des interfaces, des représentations graphiques, des ensembles de données et nécessitent la participation des utilisateurs finaux. Partant d'un état de l'art sur la visualisation, la fouille visuelle et la qualité des logiciels, nous proposons une méthode d'inspection experte et une méthode de diagnostic pour une analyse et une évaluation qualitative fine qui tient compte des spécificités du domaine abordé. Nous avons développé des guides de style et des critères de qualité pour l'analyse et le diagnostic des outils de fouille visuelle. Du point de vue des utilisateurs, afin d'utiliser les informations relatives à leurs profils et à leurs préférences tout au long du processus de fouille, nous avons aussi proposé un modèle de l'utilisateur final des outils de fouille visuelle. Des études de cas menées avec la méthode de diagnostic proposée nous permettent de relever des problèmes autres que ceux résultant de l'estimation du taux de mauvaise classification. Ce travail présente aussi des solutions apportées à deux problèmes recensés durant l'analyse et le diagnostic des outils de fouille visuelle existants : le choix du meilleur algorithme pour une tâche de classification supervisée et le prétraitement de grands ensembles de données. Nous avons considéré le problème du choix du meilleur algorithme de classification comme un problème de décision multicritères. L'intelligence artificielle permet d'apporter des solutions à l'analyse multicritères. Nous utilisons les résultats issus de ce domaine à travers le paradigme multi-agents et le raisonnement à partir de cas pour proposer une liste d'algorithmes d'efficacité décroissante pour la résolution d'un problème donné et faire évoluer les connaissances de la base de cas. En ce qui concerne le traitement des ensembles de données de très grande taille, les limites de l'approche visuelle concernant le nombre d'individus et le nombre de dimensions sont connues de tous. Pour pouvoir traiter ces ensembles de données, une solution possible est d'effectuer un prétraitement de l'ensemble de données avant d'appliquer l'algorithme interactif de fouille. La réduction du nombre d'individus est effectuée par l'application d'un algorithme de clustering, la réduction du nombre de dimensions se fait par la combinaison des résultats d'algorithmes de sélection d'attributs en appliquant de la théorie du consensus (avec une affectation visuelle des poids). Nous évaluons les performances de nos nouvelles approches sur des ensembles de données de l'UCI et du Kent Ridge Bio Medical Dataset Repository
The research context of these works is the visual data mining domain and more precisely supervised data classification. Other related fields are: knowledge extraction in the data, machine learning, quality of interface, software ergonomic, software engineering and human machine interaction. The result provided by a visual data mining tool is a data model. Generally, in order to access the quality of visual data mining tools, there is an estimation of the rate of bad classification. We believe that, this estimation is necessary but not sufficient for the evaluation of visual data mining tools. In fact, this type of tools use interfaces, graphical representations, data sets and require the participation of the end-users. On the basis of a state of the art on visualization, visual data mining and software quality, we propose two analysis and evaluation methods: an inspection method for experts and a diagnosis method which can be used by end-users for analysis and quality evaluation that takes account of the specificities of the treated domain. We developed guidelines and quality criteria (measures and metrics) for the analysis and the diagnosis of the visual data mining tools. From the users' point of view, in order to use information relating to their profiles and their preferences throughout the mining process, we also proposed a user model of visual data mining tools. Case studies performed with the proposed diagnosis method enable us to raise other problems than those resulting from the estimation of the rate of bad classification. This work presents also solutions brought to two problems listed during the analysis and the diagnosis of some existing visual data mining tools: the choice of the best algorithm to perform for a supervised classification task and the pre-treatment of very large data sets. We considered the problem of the choice of the best classification algorithm as a multi criteria decision problem. Artificial intelligence allows bringing solutions to the multi criteria analysis. We use the results coming from this domain through the multi-agents paradigm and the case based reasoning to propose a list of algorithms of decreasing effectiveness for the resolution of a given problem and to evolve knowledge of the case base. For the treatment of very large data sets, the limits of visual approaches concerning the number of records and the number of attributes are known. To be able to treat these data sets, a solution is to perform a pre-treatment of the data set before applying the interactive algorithm. The reduction of the number of records is performed by the application of a clustering algorithm, the reduction of the number of attributes is done by the combination of the results of feature selection algorithms by applying the consensus theory (with a visual weight assignment tool). We evaluate the performances of our new approaches on data sets of the UCI and the Kent Ridge Bio Medical Dataset Repository
APA, Harvard, Vancouver, ISO, and other styles
38

Safarova, Gunel. "Innovation management and ambidexterity in the US context : the case of family-owned companies." Thesis, Université Paris-Saclay (ComUE), 2019. http://www.theses.fr/2019SACLV055.

Full text
Abstract:
Notre travail de recherche traite des thématiques de l’innovation et de l’ambidextrie dans le management. Notre but est de procéder à une étude comparative des pratiques managériales au sein d’un panel de PME américaines afin d’identifier les déterminants de l’équilibre entre pratiques nouvelles et pratiques ordinaires ou traditionnelles. Notre recherche présente deux intérêts particuliers. D’une part, elle se centre sur le cas des entreprises américaines compte tenu de leurs spécificités en matière d’innovation et de conduite du changement, ce qui permet d’enrichir les connaissances sur certaines formes de management aux États-Unis. D’autre part, nous mobiliserons et croiserons un certain nombre de travaux traitant à la fois du management de l’innovation de manière générale et des facteurs qualitatifs dans les conceptions et pratiques de l’ambidextrie de manière particulière, notamment en lien avec les styles de « leadership ».En ce qui concerne les choix méthodologiques, nous nous sommes orientées vers une démarche abductive, avec des allers-retours entre littérature et terrain. En effet, notre recherche se base sur une approche qualitative avec des études de cas (Yin, Glaser et Strauss, Eisenhardt…), tandis que nos questionnements et notre problématique ont été amenés à s’affiner en fonction des résultats obtenus.Ce travail de recherche nous permet de mieux comprendre le fonctionnement et le management des entreprises américaines, en particulier lorsqu’elles sont familiales, et de mettre en lumière les spécificités de leurs méthodes en matière de management de l’innovation et l’ambidextrie. Il aide à relativiser le concept d’innovation pour montrer les apports potentiels de certaines approches dosées, visant à la fois l’exploitation de l’existant et l’exploration de voies nouvelles. En outre, nos résultats permettent de dégager des recommandations managériales pour les entreprises américaines, mais également pour d’autres organisations ou managers en relation avec le contexte des États-Unis
Our research work deals with the subjects of innovation and ambidexterity in the management. Our goal is to conduct a comparative study of managerial practices with several U.S. SMEs in order to identify the determinants of the balance between new and common or traditional practices. Throughout the research period we keep following our two main purposes. On the one hand, our research work focuses on the case of U.S. companies specifically proactive with regard to innovation and change management. This allows us to widen our knowledge concerning certain forms of management in the United States. On the other hand, we will draw on large number of studies dealing with both innovation management in general and particularly qualitative factors in the in the conceptions and practices of ambidexterity, especially in relation to “leadership” styles.Concerning the methodological choices, we keep up with abductive approach, because there is back and forth between literature and research field. Indeed, our research is based on a qualitative approach with case studies (Yin, Glaser et Strauss, Eisenhardt...), while our research question and problem have been refined according to the obtained results.This research work helps us to better understand business operation and management of U.S. companies, especially when they are family-owned and to highlight the specificities of their methods in terms of innovation management and ambidexterity. It helps to put the concept of innovation in perspective to show the potential contributions of certain measured approaches, aiming both the exploitation of existing and the exploration of new ways. In addition, our results provide managerial recommendations for U.S. companies, but also for other organizations or managers related to the U.S. context
APA, Harvard, Vancouver, ISO, and other styles
39

Legrand, Gaëlle. "Approche méthodologique de sélection et construction de variables pour l'amélioration du processus d'extraction des connaissances à partir de grandes bases de données." Lyon 2, 2004. http://theses.univ-lyon2.fr/documents/lyon2/2004/legrand_g.

Full text
Abstract:
De nos jours, du fait de la présence de grandes bases de données, l'amélioration de la qualité de représentation des données est au centre des préoccupations. Deux types de transformation de variables permettent d'extraire la connaissance pertinente à partir des données. La sélection de variables est un processus qui choisit un sous-ensemble optimal de variables en fonction d'un critère particulier et qui réduit l'espace des variables en supprimant les variables non pertinentes. Cette transformation permet la réduction de l'espace de représentation, l'élimination du bruit et l'élimination de la redondance. Nous proposons une méthode de sélection de variables hybride entre approche enveloppe et approche filtre qui utilise une méthode d'agrégation de préférences. La méthode d'agrégation nous permet d'obtenir une liste triée par ordre d'importance de sous-ensemble de variables grâce à l'agrégation d'un ensemble de critère myope. La construction de variables est un processus qui découvre les informations manquantes dans une relation entre variables et qui augmente l'espace des variables en créant des variables supplémentaires. Lors du processus de construction de variables, un ensemble d'opérateurs est appliqué à un ensemble de variables existantes, débouchant sur la construction d'une ou plusieurs nouvelles variables. Nous proposons de construire de nouvelles variables grâce à la découverte de la structure sous-jacente des données, c'est à dire en travaillant sur les modalités des variables. En effet, Il nous paraît plus pertinent de se concentrer sur les relations existants entre modalités de variables plutôt que sur les relations entre variables elles même
Nowadays, because of the presence of great data bases, the improvement of the data representation quality is very important. Two types of feature transformation make it possible to extract relevant knowledge starting from data. The feature selection is a process which chooses an optimal feature subset according to a particular criterion and which reduces the feature space by removing nonrelevant feature. This transformation allows the reduction of representation space, the elimination of noise and the elimination of redundancy. We propose a method of feature selection between wrapper and filter approach which uses a method of preferences aggregation. The method of aggregation enables us to obtain a feature subset list sorted by order of relevance thanks to the aggregation of results of a set of short-sighted criterion. The feature construction is a process which discovers missing information in a relation between feature and which increases the feature space by creating additional feature. At the time of the process of feature construction, a set of operators is applied to an existing feature set, leading to the construction of one or more new feature. We propose to build new feature thanks to the discovery of the subjacent structure of data. Indeed, It appears more relevant to us to concentrate on the relations existing between modalities of feature rather than on the relations between feature themselves
APA, Harvard, Vancouver, ISO, and other styles
40

Gamra, Miloud. "Innovation, ambidextrie et jeune entreprise technologique." Thesis, Pau, 2019. http://www.theses.fr/2019PAUU2063.

Full text
Abstract:
Cette recherche doctorale porte sur le processus de développement de la jeune entreprise technologique (JET). Elle vise à comprendre les actions clés permettant le passage de l’invention à l’innovation et à déterminer si l’ambidextrie (i.e., l’équilibre entre exploration et exploitation) est associée à une plus grande performance. Les définitions de la JET, l’innovation, l’exploration, l’exploitation et l’ambidextrie, qui sont utilisées dans cette recherche, sont préalablement posées. Une première étude empirique, qui repose sur la cartographie de concepts en groupe, permet d’identifier trois actions comme plus particulièrement importantes et faisables pour passer du prototypage à la commercialisation : être à l’écoute des membres de l’équipe ; communiquer sur le produit en mettant en avant les fonctionnalités qui vont plaire au client ; bien comprendre quels besoins du marché le produit va combler. Une action est identifiée comme plus particulièrement importante et difficilement réalisable : anticiper le financement de la croissance en mobilisant des ressources financières à cet effet dès la création de l’entreprise. Une seconde étude empirique s’intéresse à l’ambidextrie. La littérature permet de distinguer les variables clés nécessaires à la modélisation conceptuelle du phénomène étudié. Il apparaît que l’ambidextrie est potentiellement influencée par un ensemble de facteurs organisationnels et contextuels (équipe entrepreneuriale, environnement économique et institutionnel, ressources financières) ; que l’ambidextrie est susceptible d’influencer la performance, et que la performance peut dépendre directement de certains antécédents de l’ambidextrie. Les hypothèses sont testées à partir des réponses utilisables obtenues auprès de 94 JET, sur la base d’un questionnaire envoyé à 350 entreprises. Les résultats sont les suivants : (i) la cohésion et dans une moindre mesure la complémentarité de l’équipe, le dynamisme de l’environnement et la qualité de l’accompagnement apparaissent comme les principaux antécédents de l’orientation ambidextre ; (ii) l’orientation ambidextre est associée positivement à la performance économique et (iii) les ressources financières n’ont pas d’impact sur l’orientation ambidextre
This research focuses on the development process of the young technology-based firm (YTBF). It aims to understand the key actions that facilitate the transition from invention to innovation and to determine if ambidexterity (i.e., the balance between exploration and exploitation) is associated with greater performance. To begin with, we establish the definitions of the young technology-based firm, innovation, exploration, exploitation and ambidexterity which are used in this research. A first empirical study, based on group concept mapping, identifies three actions that are particularly important and feasible for moving from prototyping to commercialization: listening to team members; communicate about the product by highlighting the features that will please the customer; understand what market needs the product will fill. Anticipating the financing of growth from the inception of the company is identified as particularly important but difficult to achieve. A second empirical study focuses on ambidexterity. We use literature to determine the key variables necessary for the conceptual modeling of ambidexterity: ambidexterity is potentially influenced by a set of organizational and contextual variables (composition of the entrepreneurial team, features of the economic and institutional environment, financial resources); ambidexterity is likely to influence performance; performance may depend directly on some antecedents of ambidexterity. These hypotheses are tested. We use 94 answers obtained from a questionnaire sent to 350 JET. The results are as follows: (i) cohesion and to a lesser extent the complementarity of the entrepreneurial team, the dynamism of the environment and the quality of the technological business incubators are the main antecedents of ambidexterity; (ii) ambidexterity is positively associated with economic performance and (iii) financial resources have no impact on ambidexterity
APA, Harvard, Vancouver, ISO, and other styles
41

MEISSONIER, Régis. "Organisations virtuelles : Conceptualisation, Ingéniérie et pratiques." Phd thesis, Université de la Méditerranée - Aix-Marseille II, 2000. http://tel.archives-ouvertes.fr/tel-00002516.

Full text
Abstract:
Le concept d'organisation virtuelle est souvent associé dans la littérature scientifique, comme dans la presse journalistique, à des entreprises dont l'existence même des activités est liée à celle des Nouvelles Technologies de l'Information et de la Communication (NTIC) : Start-ups sur Internet, sites portails sur le Web, etc. Cette seule perspective institutionnelle est-elle satisfaisante ? Une telle attention accordée aux formes d'organisations virtuelles les plus abouties, ne nous conduit-elle pas à négliger d'autres perspectives plus ingéniériques ? Ne convient-il pas de se demander si un ensemble plus large d'entreprises ne se situerait pas dans une période de transition ? Les travaux menés sur le sujet sont effectivement assez récents (début des années 90) et le manque de recul théorique attire notre attention sur nombre d'ambiguïtés et d'interrogations méritant de sérieux éclairages. Cette recherche vise tout d'abord à définir ce qu'est une organisation virtuelle et en quoi elle représente une forme d'organisation novatrice. L'approche processuelle qui est proposée conduit ensuite à s'interroger sur la mise en œuvre de ce concept dans les entreprise. Quels types d'organisations virtuelles peuvent être distingués ? Peut-on en attendre une meilleure réactivité ? Quels sont les impacts et les facteurs organisationnels qui sont associés à leur mise en œuvre ? La partie empirique aborde, auprès d'une centaine d'entreprises, différentes formes d'organisations virtuelles. En les confrontant afin, d'une part, d'établir certaines comparaisons et, d'autre part, d'analyser les logiques et les contextes organisationnels sous-jacents, elle met en perspective plusieurs inférences théoriques comme managériales, reliées à ce concept émergent en Sciences de Gestion. Les résultats font notamment apparaître qu'il est réducteur qu'une organisation virtuelle se résume à des processus de coordination et de routines inter-firmes rattachés à la valorisation de l'activité courante. Les projets les plus " porteurs " sont ceux qui incluent des tâches témoignant d'une intelligence co-construite de l'évolution de l'environnement et des nouveaux marchés qui s'y dessinent.
APA, Harvard, Vancouver, ISO, and other styles
42

Nguyen, Dang Tuan. "Extraction d'information à partir de documents Web multilingues : une approche d'analyses structurelles." Caen, 2006. http://www.theses.fr/2006CAEN2023.

Full text
Abstract:
Les ressources d'information multilingues sur le Web sont devenues de plus en plus des objets d'études importantes pour différents domaines intervenant au traitement de l'information. Néanmoins, nous constatons que la structure des ressources multilingues est très peu explorée par rapport à l'abondance des méthodes de traitement automatique des langues naturelles. L'ignorance des structures multilingues pourrait être à l’origine de divers problèmes de performance tels que : i) la redondance, si le site propose simultanément des traductions en plusieurs langues, ii) les parcours bruités lors d’un passage d’une langue à une autre via les vignettes (génération de graphes, conceptuellement, non signifiant), iii) la perte de l’information par la négligence de la spécificité structurelle (même implicite) de chaque langue. Le cadre de cette thèse s’insère dans le cadre des travaux de recherche sur l'extraction semi-automatique (interactive) d'information à partir d’un grand nombre de documents électroniques (essentiellement des documents web) hétérogènes structurées ou semi-structurées. Extraire une information dans ce contexte est défini comme un processus de repérage, formalisation et de traitements des structures de données pouvant comporter d’information pertinente. Dans notre approche nous observons que la structure d’un document Web incorpore des informations qui sont indispensables pour toute démarche d’optimisation de la recherche d’information ou des fouilles de sites web. Pour expérimenter et valider notre propos nous avons développé une méthode d’analyses structurelles concrétisée par le réalisation du système Hyperling. L’objectif direct de ce dernier étant de déterminer, sans aucune connaissance linguistique préalable et explicite, les langues dominantes sur un site Web multilingues. Dans cette thèse, nous abordons l’aspect multilinguisme dans un contexte de catégorisation des sites Web multilingues. Nous apportons quelques connaissances « expérimentales » - issues des travaux de développement et d’expérimentation - portant sur la représentation de documents multilingues, la modélisation des données en une structure homogène, la qualité de la recherche d’information dans un contexte multilingues et enfin sur les notions de frontière et de centre de gravité pour départager des langues dominantes sans puiser dans des connaissances linguistiques
Multilingual Web Document (MWD) processing has become one of the major interests of research and development in the area of information retrieval. Therefore, we observed that the structure of the multilingual resources has not been enough explored in most of the research works in this area. We consider that links structure embed crucial information for both hyperdocument retrieving and mining process. Discarding the multilingual information structures could affect the processing performance and generate various problems : i)°Redundancy : if the site proposes simultaneously translations in several languages, ii)° Noisy information: by using labels to shift from language to another, iii)° Loosing information: if the process does not consider the structure specificity of each language. In this context, we wonder to remind that each Web site is considered as a hyper-document that contains a set of Web documents (pages, screen, messages) which can be explored through the links paths. Therefore, detecting the dominant languages, in a Web Site, could be done in a different ways. The framework of this experimental research thesis is structures analysis for information extraction from a great number of heterogeneous structured or semi-structured electronic documents (essentially the Web document). It covers the following aspects : Enumerating the dominants languages, Setting-up (virtual) frontiers between those languages, enabling further processing, Recognizing the dominants languages. To experiment and validate our aim we have developed Hyperling which is a formal, language independent, system dealing with Web Documents. Hyperling proposes a Multilingual Structural Analysis approach to cluster and retrieve Web Document. Hyperling’s fundamental hypothesis is based on the notion of relation-density : The Monolingual relation density: i. E. Links between Web Documents written in the same language, The Interlingual relation density: i. E. Links between Web Documents written in different languages. In a Web document representation we can encounter a high level of monolingual relation density and low level of inter-lingual relation density. Therefore, we can consider a MWD to be represented by a set of clusters. Regarding the density level of each cluster, it may represent a dominant language. This hypothesis has been the core of Hyperling and has been experimented and approved on a real multilingual web documents (IMF, UNDP, UNFPA, UNICEF, WTO)
APA, Harvard, Vancouver, ISO, and other styles
43

Huynh, Cong-Phap. "Des suites de test pour la TA à un système d'exploitation de corpus alignés de documents et métadocuments multilingues, multiannotés et multimédia." Phd thesis, Grenoble, 2010. http://www.theses.fr/2010GRENM024.

Full text
Abstract:
Cette thèse porte sur trois grands défis posés par la conception et la réalisation d'un « système d'exploitation de corpus de traductions », abrégé en « sectra ». Un sectra vise à fournir un support informatique unifié à l'exploitation de corpus de traductions effectuée à la fois par l'humain et par la machine. Le premier défi vise l'aspect de support informatique unifié pour l'évaluation de systèmes de TA. Le deuxième défi concerne l'aspect de support contributif et collaboratif au travail humain sur des corpus variés en contexte multilingue. Enfin, le troisième défi vise au support informatique à l'exploitation de corpus de traductions dans des applications novatrices (comme les iMAG, Notepad++, etc. ). Plusieurs notions émergentes (un segment multilingualisé et contextualité, un corpus de documents « multifichier », etc. ), principes généraux (laproactivité, la délégation, etc. ), et problématiques à dominante conceptuelle (par exemple, définition étendue d'un « contexte» de segment), algorithmique (par exemple, programmabilité du traitement des corpus), et programmatoire (par exemple, traitement de masses de données) ont été abordés et traités pour la conception et la réalisation d'un tel système. Un système appelé SECTra_w a été construit et expérimenté avec succès dans le cadre de plusieurs projets réels pour l'évaluation de TA, la post-édition, et la multilinguïsation de sites Web et des applications
The thesis focuses on three major challenges posed by the conception and implementation of an "operating system of translation corpora", abbreviated as "sectra". A sectra aims to supply a unified software environment to support the exploitation of translation corpora done by both human and machine. The first challenge aims to the aspect of software environment to support the MT evaluation. The second challenge relates to the aspect of collaborative and contributive support for human work on various corpora in multilingual contexts. Finally, the third challenge aims at software environment to enable the exploitation of translation corpora within innovative applications (like the iMAG Gateways, Notepad++, etc. ). Several new notions (such as a multilingualized and contextualized segment, a corpus ofmulti-file documents, etc. ), general principles (pro-activity, delegation of services, etc. ), and problems at the conceptuallevel (for example, the extended definition of a "context" of segment), algorithmic level (for example, programmability of corpora processing), and programmatic level (for example, handling masses of data) have been addressed and dealt with for conceiving and implementing such system. A system called SECTra - w has been built and experimented successfully in the framework of sever real Dfojects of MT evaluation, post-edition, and multilimmalization of websites and applications
APA, Harvard, Vancouver, ISO, and other styles
44

Huynh, Cong-Phap. "Des suites de test pour la TA à un système d'exploitation de corpus alignés de documents et métadocuments multilingues, multiannotés et multimédia." Phd thesis, Grenoble, 2010. http://tel.archives-ouvertes.fr/tel-00548196.

Full text
Abstract:
Cette thèse porte sur trois grands défis posés par la conception et la réalisation d'un « système d'exploitation de corpus de traductions », abrégé en « sectra ». Un sectra vise à fournir un support informatique unifié à l'exploitation de corpus de traductions effectuée à la fois par l'humain et par la machine. Le premier défi vise l'aspect de support informatique unifié pour l'évaluation de systèmes de TA. Le deuxième défi concerne l'aspect de support contributif et collaboratif au travail humain sur des corpus variés en contexte multilingue. Enfin, le troisième défi vise au support informatique à l'exploitation de corpus de traductions dans des applications novatrices (comme les iMAG, Notepad++, etc.). Plusieurs notions émergentes (un segment multilingualisé et contextualité, un corpus de documents « multifichier », etc.), principes généraux (la proactivité, la délégation, etc.), et problématiques à dominante conceptuelle (par exemple, définition étendue d'un « contexte » de segment), algorithmique (par exemple, programmabilité du traitement des corpus), et programmatoire (par exemple, traitement de masses de données) ont été abordés et traités pour la conception et la réalisation d'un tel système. Un système appelé SECTra_w a été construit et expérimenté avec succès dans le cadre de plusieurs projets réels pour l'évaluation de TA, la post-édition, et la multilinguïsation de sites Web et des applications. Mots-clés : Corpus de traductions, exploitation de corpus de traductions, support informatique et collaboratif, évaluation de TA, post-édition.
APA, Harvard, Vancouver, ISO, and other styles
45

Mbarki, Mohamed. "Gestion de l'hétérogénéité documentaire : le cas d'un entrepôt de documents multimédia." Toulouse 3, 2008. http://thesesups.ups-tlse.fr/185/.

Full text
Abstract:
La société de la connaissance est basée sur trois axes : la diffusion et l'usage de l'information via les nouvelles technologies, la déduction des connaissances induites par cette information et les impacts économiques qui peuvent en découler. Proposer aux acteurs et plus particulièrement aux "décideurs" de cette société des outils qui leur permettent d'élaborer de la "connaissance" ou du moins des "éléments de connaissance" à partir de l'information disponible semblent être assez difficile à assurer. Cette difficulté est due au dynamisme de l'environnement et la diversité des facteurs influençant la production, l'extraction et la communication des informations. En effet, ces informations sont englobées dans des documents qui sont collectés à partir des sources disséminées (Internet, Workflow, bibliothèques numériques, etc. ). Ces documents sont ainsi hétérogènes sur le fond et sur la forme (ils peuvent concerner des domaines divers, sont plus ou moins structurés, peuvent être liés à des structures diverses, contiennent plusieurs type de média, sont stockés dans plusieurs type de supports, etc. ). Les défis actuels sont de concevoir de nouvelles applications pour exploiter cette grande masse de documents très hétérogènes. Les travaux présentés dans cette thèse, visent à faire face à ces défis et notamment à proposer des solutions permettant de "gérer et créer de la connaissance" à partir de l'intégration de toute l'information disponible sur les documents hétérogènes. La manipulation des entrepôts de documents multimédia constitue le cadre applicatif de nos propositions. Notre approche s'articuler autour de trois axes complémentaires : (1) la représentation, (2) le stockage (ou l'intégration) et (3) l'exploitation des documents hétérogènes. La représentation des documents concerne la détermination des informations à conserver et la façon selon laquelle elles doivent être organisées pour mieux appréhender et prévoir leurs usages. La solution que nous avons choisie pour répondre à ces besoins se base sur la proposition d'un modèle qui intègre plusieurs niveaux de description imbriqués et complémentaires (une couche générique et une couche spécifique, une description logique et une description sémantique). .
The knowledge society is based on three axes: the diffusion and use of information via new technologies, the deduction of knowledge induced by this information and the economic impacts which can result from this information. To offer to the actors and more particularly to the "decision makers" of this society some tools which enable them to produce and manage "knowledge" or at least "elements of knowledge" seem to be rather difficult to ensure. This difficulty is due to the dynamism of the environment and the diversity of factors influencing the information production, extraction and communication. Indeed, this information is included in documents which are collected from disseminated sources (Internet, Workflow, numerical libraries, etc. ). These documents are thus heterogeneous on the content and on the form (they can be related to various fields, they can be more or less structured, they can have various structures, they contain several type of media, are stored in several type of supports, etc). The current challenges are to conceive new applications to exploit this document heterogeneity. Having in mind these needs, the work presented in my thesis, aims to face these challenges and in particular at proposing solutions in order "to manage and create knowledge" starting from the integration of all information available on the heterogeneous documents. The handling of multimedia documents repositories constitutes the applicative framework of our proposals. Our approach is articulated around three complementary axes: (1) the representation, (2) storage (or integration) and (3) exploitation of the heterogeneous documents. Documents representation is related to the determination of information that must be preserved and the way according to which they must be organized to offer better apprehending and envisaging of their uses. The solution that we chose to meet these needs bases on the proposal for a documents model which integrates several overlapping and complementary levels of description (a generic layer and a specific one, a logical description and a semantic one). .
APA, Harvard, Vancouver, ISO, and other styles
46

Soulerot, Marion. "Planification et ambidextérité : le cas des programmes d'amélioration de la performance." Phd thesis, Université Paris Dauphine - Paris IX, 2008. http://tel.archives-ouvertes.fr/tel-00472392.

Full text
Abstract:
Environnement turbulent, accélération des rythmes d'innovation semblent avoir sonner le glas de la planification stratégique dans les années 1990. Parallèlement, nombreux sont les grands groupes à s'être lancés dans des programmes à moyen terme visant l'amélioration de leur performance opérationnelle. Dans ce contexte, l'objectif de cette thèse est de comprendre à quoi ils servent ? Une revue approfondie de la littérature nous conduit à appréhender ces programmes à travers deux prismes : leur articulation avec les autres dispositifs de planification et la réponse qu'ils apportent au dilemme entre l'exploitation efficiente des ressources et l'exploration de nouvelles ressources. A l'issue d'une étude exploratoire, une grille d'analyse composée de quatre axes est proposée : le degré d'ambidextérité, la structure, le processus de contrôle et la posture des acteurs. Une étude de cas longitudinale permet de mettre en évidence que ces programmes génèrent une rupture dans les repères spatiotemporels des managers. Cette rupture permet de proposer une vision renouvelée de la planification mais suppose également la construction d'une posture managériale ambidextre.
APA, Harvard, Vancouver, ISO, and other styles
47

Omri, Mohamed Ali. "Fiscalité pétrolière : impact sur l'activité exploration-production des hydrocarbures : cas de la Tunisie." Nice, 1995. http://www.theses.fr/1995NICE0020.

Full text
Abstract:
Conscient de la baisse de la production p2troliere du pays, le gouvernement tunisien a pris des mesures fiscales d'incitation en faveur des compagnies pour développer l'activité amont des hydrocarbures. Il est démontré, à l'aide d'un modèle économétrique que la fiscalité n'a pas d'incidence sur l'activité exploration. Par contre au niveau de l'activité production, l'apport de la fiscalité est clairement établi. En effet, les nouvelles dispositions fiscales ont réduit l'écart dans le partage de la rente pétrolière entre l'état et la compagnie et ont permis aussi de développer les gisements marginaux qui étaient en veilleuse
Following the decrease of hydrocarbon production of the country, the tunisian government had taken fiscal measures in order to encourage companies for developping hydrocarbon activities. It is appear, by using an econometric model that the taxation has no significant effect on exploration activity. Otherwise, the taxation effects on production activity is clear by reducing the partition gap between state and company and allowin g the development of marginal discoveries
APA, Harvard, Vancouver, ISO, and other styles
48

Atanasov, Petko. "Exploration, exploitation et management de projet - Ground theory : approche pour une nouvelle conceptualisation de l'analyse et de la gestion de projet : deux études de cas dans l'administration publique." Limoges, 2012. http://www.theses.fr/2012LIMO1006.

Full text
Abstract:
Selon Standish Group ("CHAOS Chronicles" – 2004) le taux d'échec des projets dans les différentes industries varie entre 61 et 92%. Pourquoi un projet peut-il échouer ?. . . L’approche historique du management de projet reposant sur une démarche normative a montré ses limites. A partir des questions d’efficacité du courant normatif de la gestion de projet, nous avons mené une revue de littérature qui nous a conduit à conclure que la discipline a besoin d’une remise à niveau épistémologique et méthodologique. La routinisation de l’interprétation du courant normatif a tendance à obscurcir la déontologie de la discipline. Ainsi, à travers notre première étude, mobilisant la théorie enracinéé, nous avons souhaité dépasser cette vision instrumentaliste. Partis d’une constatation sur les limites des courants de management de projet, nous avons été amenés à analyser un vrai projet (la mission de tramway de Bordeaux) et avons découvert l’importance de la dualité pour un projet, construite sur les dimensions du structurel. La recherche menée auprès de la mission du tramway nous a en effet permis de mettre en évidence l’importance d’une approche basée sur le processus de la structuration. Nous avons ainsi vu émerger deux pôles évoluant conjointement : la structure et l’acteur. Ainsi nous avons pu, par le biais de la démarche enracinée, distinguer quelques théories qui potentiellement peuvent apporter des options supplémentaires dans l’exploration, l’exploitation et le management du projet: la théorie des conventions ; la théorie néo-institutionnelle et la théorie de la structuration. La théorie néo-institutionnelle se réfère principalement à la structure, la théorie des conventions plutôt à l’acteur. Or, la gestion de projet représente la gestion d’une structure particulière qui est soumise aux contraintes contextuelles (le temps et l’espace). Notre choix final s’est donc porté sur la théorie de la structuration plus adaptée à l’étude du anagement du projet avec ses conséquences contraignantes et habilitantes. Nous nous sommes ensuite focalisés sur l’applicabilité de la théorie de la structuration dans une situation concrète du management du projet. Notre objectif était de proposer une démarche structuraliste tout en valorisant l’utilisation d’un raisonnement abductif. Ainsi nous sommes repartis sur le terrain (Service Visa Paie de l’Agence comptable de l’Université Victor Segalen Bordeaux 2) pour créer (et observer) un démarche de recherche-action s’inscrivait dans une mission scientifique dissimulée pour des raisons d’objectivité dans laquelle notre rôle Par ce travail, nous confortons notre idée que l’approche classique (normative) du management de projet restreint l’analyse à des paramètres qui ne tiennent pas compte du contexte dans lequel le projet évolue. Nous penchons vers un management de bon sens qu’il fait appel à la notion de réflexivité des acteurs telle qu’évoquée par Anthony Giddens dans la théorie de la structuration. Cela correspond aux facultés des acteurs de se positionner dans un contexte et agir selon leurs connaissances et compétences, et pas forcement selon les objectifs décidés. Dans le cas de la gestion de projet ceci devient un élément crucial
According to Standish Group (“Chronicles CHAOS” – 2004) the rate of failure of the projects in various industries varies between 61 and 92%. Why a project can fail? … The historical approach of the project management based on a normative approach showed its limits. From the questions of effectiveness of the current normative approach of the project management, we carried out a review of literature which led us to conclude that the discipline needs a handing-over on epistemological and methodological level. The routine way of the interpretation of the current normative approach tends to darken the deontology of the discipline. Thus, through our first tudy, mobilizing the “grounded theory”, we wished to exceed this instrumentalist vision. Started from an observation on the limits of the current project management, we were brought to analyze a true project (the mission of tramway of Bordeaux) and discovered the importance of the duality for a project, built on dimensions of the structural theory. The research undertaken near the mission of the tram indeed allowed us to highlight the importance of an approach based on the process of the structuring. We thus saw emerging two poles evolving jointly: the structure and the actor. Thus we could, by the means of the grounded theory approach, distinguish some theories which potentially can bring additional options in the exploration, the exploitation and the project management: the theory of conventions; the neo-institutional theory and the structuration theory. The neo-institutional theory refers mainly to the structure, the conventions’ theory refers to the actor. However, the project management represents the management of a particular structure which is subjected to the contextual constraints (time and space). Our final choice was thus made on the structuration theory which we consider as more adapted for investigating the project management with its constraining and habilitating consequences. We then focused ourselves on the applicability of the theory of the structuring in a concrete situation of the management of the project. Our objective was to propose a structuralist approach while veloping the use of an abductive reasoning. Thus we went back again on the ground (Service “Payroll” of the accounting department - University Victor Ségalen Bordeaux 2) to create (and observe) a new service in the accounting department, following the passage of the universities to the responsibilities and widened competences (RCE). This ction-research approach fell under a scientific expedition dissimulated for reasons of objectivity in which our role was that of not-declared observer. By this work, we consolidate our idea that the classical approach (normative) of the project management restricts the analysis with parameters which do not take account of the context in which the project evolves. We lean towards a management of good sense which it calls upon the concept of reflexivity of the actors as evoked by Anthony Giddens in the structuration theory. That corresponds to faculties of the actors to position in a context and to act according to their knowledge and competences, and not necessarily according to the decided objectives. In the case of the project management this becomes a crucial factor
APA, Harvard, Vancouver, ISO, and other styles
49

Sy, Mohameth François. "Utilisation d'ontologies comme support à la recherche et à la navigation dans une collection de documents." Thesis, Montpellier 2, 2012. http://www.theses.fr/2012MON20211/document.

Full text
Abstract:
Les ontologies offrent une modélisation des connaissances d'un domaine basée sur une hiérarchie des concepts clefs de ce domaine. Leur utilisation dans le cadre des Systèmes de Recherche d'Information (SRI), tant pour indexer les documents que pour exprimer une requête, permet notamment d'éviter les ambiguïtés du langage naturel qui pénalisent les SRI classiques. Les travaux de cette thèse portent essentiellement sur l'utilisation d'ontologies lors du processus d'appariement durant lequel les SRI ordonnent les documents d'une collection en fonction de leur pertinence par rapport à une requête utilisateur. Nous proposons de calculer cette pertinence à l'aide d'une stratégie d'agrégation de scores élémentaires entre chaque document et chaque concept de la requête. Cette agrégation, simple et intuitive, intègre un modèle de préférences dépendant de l'utilisateur et une mesure de similarité sémantique associée à l'ontologie. L'intérêt majeur de cette approche est qu'elle permet d'expliquer à l'utilisateur pourquoi notre SRI, OBIRS, estime que les documents qu'il a sélectionnés sont pertinents. Nous proposons de renforcer cette justification grâce à une visualisation originale où les résultats sont représentés par des pictogrammes, résumant leurs pertinences élémentaires, puis disposés sur une carte sémantique en fonction de leur pertinence globale. La Recherche d'Information étant un processus itératif, il est nécessaire de permettre à l'utilisateur d'interagir avec le SRI, de comprendre et d'évaluer les résultats et de le guider dans sa reformulation de requête. Nous proposons une stratégie de reformulation de requêtes conceptuelles basée sur la transposition d'une méthode éprouvée dans le cadre de SRI vectoriels. La reformulation devient alors un problème d'optimisation utilisant les retours faits par l'utilisateur sur les premiers résultats proposés comme base d'apprentissage. Nous avons développé une heuristique permettant de s'approcher d'une requête optimale en ne testant qu'un sous-espace des requêtes conceptuelles possibles. Nous montrons que l'identification efficace des concepts de ce sous-espace découle de deux propriétés qu'une grande partie des mesures de similarité sémantique vérifient, et qui suffisent à garantir la connexité du voisinage sémantique d'un concept.Les modèles que nous proposons sont validés tant sur la base de performances obtenues sur des jeux de tests standards, que sur la base de cas d'études impliquant des experts biologistes
Domain ontologies provide a knowledge model where the main concepts of a domain are organized through hierarchical relationships. In conceptual Information Retrieval Systems (IRS), where they are used to index documents as well as to formulate a query, their use allows to overcome some ambiguities of classical IRSs based on natural language processes.One of the contributions of this study consists in the use of ontologies within IRSs, in particular to assess the relevance of documents with respect to a given query. For this matching process, a simple and intuitive aggregation approach is proposed, that incorporates user dependent preferences model on one hand, and semantic similarity measures attached to a domain ontology on the other hand. This matching strategy allows justifying the relevance of the results to the user. To complete this explanation, semantic maps are built, to help the user to grasp the results at a glance. Documents are displayed as icons that detail their elementary scores. They are organized so that their graphical distance on the map reflects their relevance to a query represented as a probe. As Information Retrieval is an iterative process, it is necessary to involve the users in the control loop of the results relevancy in order to better specify their information needs. Inspired by experienced strategies in vector models, we propose, in the context of conceptual IRS, to formalize ontology based relevance feedback. This strategy consists in searching a conceptual query that optimizes a tradeoff between relevant documents closeness and irrelevant documents remoteness, modeled through an objective function. From a set of concepts of interest, a heuristic is proposed that efficiently builds a near optimal query. This heuristic relies on two simple properties of semantic similarities that are proved to ensure semantic neighborhood connectivity. Hence, only an excerpt of the ontology dag structure is explored during query reformulation.These approaches have been implemented in OBIRS, our ontological based IRS and validated in two ways: automatic assessment based on standard collections of tests, and case studies involving experts from biomedical domain
APA, Harvard, Vancouver, ISO, and other styles
50

Pham, Nguyen-Khang. "Analyse factorielle des correspondances pour l'indexation et la recherche d'information dans une grande base de données d'images." Rennes 1, 2009. http://www.theses.fr/2009REN1S067.

Full text
Abstract:
Avec le développement du numérique, le nombre d'images stockées dans les bases de données a beaucoup augmenté. L'indexation des images et la recherche d'information dans les bases d'images sont plus compliquées que dans le cas de documents textuels. Des méthodes d'indexation déjà utilisées en analyse de données textuelles sont proposées pour traiter des images. Pour transférer les résultats de l'analyse de données textuelles aux images, il est nécessaire d'utiliser de nouvelles caractéristiques: les mots visuels et on considère les images comme documents. Nous nous intéressons au problème d'indexation et de recherche d'information dans des grandes bases de données d'images à l'aide de méthodes d'analyse de données, comme l'Analyse Factorielle des Correspondances (AFC). Nous proposons d'abord une utilisation astucieuse des indicateurs de l'AFC pour accélérer la recherche après l'avoir adaptée aux images. Nous nous intéressons ensuite au problème du passage à l'échelle de l'AFC. Pour ce faire, nous proposons un algorithme d'AFC incrémentale pour traiter de grands tableaux de données et la parallélisation de cet algorithme sur processeurs graphiques (GPU). Nous développons aussi une version parallèle de notre algorithme de recherche qui utilise des indicateurs de l'AFC sur GPU. Puis, nous associons l'AFC à d'autres méthodes comme la Mesure de Dissimilarité Contextuelle ou les forêts aléatoires pour améliorer la qualité de la recherche. Enfin, nous présentons un environnement de visualisation, CAViz, pour accompagner les traitements précédents
With the development of the digital world, the number of images stored in databases has significantly increased. Image indexing and information retrieval in image databases are more complicated than in the case of textual documents. Indexing methods already used in textual data analysis are proposed to process images. To transfer the results of the textual data analysis to images, new features are required: visual words and images are considered as documents. We are interested in the problem of indexing and information retrieval in a large database of images using data analysis methods and, more specifically, using Factorial Correspondence Analysis (FCA). First, we propose to use relevant indicators of FCA to speed up the retrieval step after adapting it to images. Next, we study the large scale retrieval with FCA. To this end, we propose an incremental FCA algorithm to deal with large contingency tables, and its parallelization on Graphics Processing Units (GPUs). We also develop a parallel version of our search algorithm using relevant indicators of FCA on GPUs. After that, we combine the use of FCA with other methods such as the Contextual Dissimilarity Measure and random forests in order to improve the retrieval quality. Finally, we present a visualization environment, CAViz, which allows us to display the results
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography