Добірка наукової літератури з теми "Enrichissement de document"

Оформте джерело за APA, MLA, Chicago, Harvard та іншими стилями

Оберіть тип джерела:

Ознайомтеся зі списками актуальних статей, книг, дисертацій, тез та інших наукових джерел на тему "Enrichissement de document".

Біля кожної праці в переліку літератури доступна кнопка «Додати до бібліографії». Скористайтеся нею – і ми автоматично оформимо бібліографічне посилання на обрану працю в потрібному вам стилі цитування: APA, MLA, «Гарвард», «Чикаго», «Ванкувер» тощо.

Також ви можете завантажити повний текст наукової публікації у форматі «.pdf» та прочитати онлайн анотацію до роботи, якщо відповідні параметри наявні в метаданих.

Статті в журналах з теми "Enrichissement de document":

1

Mathieu, Jocelyne. "S’habiller au goût du jour." Les Cahiers des dix, no. 69 (March 14, 2016): 105–34. http://dx.doi.org/10.7202/1035598ar.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Ce texte porte sur la pratique d’une couturière qui a tenu son journal de la période de la Première Guerre mondiale jusqu’à la fin des années 1940. Ce document couvre trente-cinq années relatées presque sans interruptions, pondérées par le cycle saisonnier d’activités quotidiennes et périodiques, de rencontres familiales, d’événements de la vie privée et d’expressions de la sociabilité dans un large réseau. Tout en apprenant beaucoup sur la vie quotidienne et l’activité de couturière à cette époque, ce journal personnel permet d’aborder la confection domestique du point de vue de la pratique féminine privée et semi- professionnelle et de poursuivre nos études sur la mode en région. La production évoquée s’inscrit dans un contexte de modifications nombreuses des pièces de costume existantes, réparation, transformation, enrichissement, remodelage. On a recours à la couturière pour tous types de vêtements et l’on fait appel à elle pour les occasions spéciales telles que les noces et les funérailles. Malgré les pratiques d’une économie de récupération, le journal de cette couturière révèle une cohabitation des lieux d’approvisionnements et par eux la multiplication des possibilités et la diversité des sources d’influences.
2

Corisco, J. A. Gil, and M. C. Vaz Carreiro. "Étude expérimentale sur l'accumulation et la rétention du 134Cs par une microalgue planctonique, Selenastrum capricornutum Printz." Revue des sciences de l'eau 3, no. 4 (April 12, 2005): 457–68. http://dx.doi.org/10.7202/705085ar.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Avec l'objectif de mieux connaître le comportement du césium radioactif et son transfert dans un écosystème naturel d'eau douce, une étude concernant une chaîne trophique du fleuve Tejo a été conduite dans le cadre du contrat (CCE) n° B16-0245-P et aussi du contrat (CCE) n° B16-B-198-P. Ce document présente l'étude de l'interaction eau-producteur primaire, Selenastrum capricomufum Printz, algue planctonique unicellulaire, en présence du 134Cs. Les essais de contamination de la microalgue ont été conduits en utilisant des cultures en milieu confiné et en phase de stabilisation de la croissance. Quand la composition chimique de l'eau de Fratel n'est pas modifiée, sauf en ce qui est de l'addition du radioélément, le facteur de concentration évalué est de (1,6 ±0,2)103 (rapporté au poids sec). Par ailleurs, quand il y a un enrichissement en plusieurs cations par l'addition d'un milieu nutritif, le facteur de concentration baisse à (1,5 ± 0,2)102. Dans tous les cas l'équilibre est atteint dans les premières 24 h. L'étude de la rétention a été réalisée en repiquant des microalgues, préalablement contaminées, dans l'eau du fleuve non radioactive et en les maintenant soit en milieu confiné, soit en milieu renouvelé une seule fois au bout d'un jour, ou plusieurs fois au cours de l'expérience. Comme les résultats obtenus dans ces trois conditions sont semblables, un modèle général exprimant la variation du pourcentage de rétention a pu étre établi : R (t) = 76,7 e-45,0 t + 20,1 e-1,28 t (t exprimé en jours) ce modèle met en évidence l'existence de deux périodes biologiques, respectivement Tb1 = 0,015 jours et Tb2 = 0,54 jours. Compte tenu de la dilution biologique due à la prolifération des algues unicellulaires au cours des expériences, la cinétique de désorption permet de faire l'hypothèse que le 134Cs est d'une part adsorbé sur les surfaces et d'autre part absorbé dans les cellules.
3

Mrabet, Yassine, Nacéra Bennacer, and Nathalie Pernelle. "REISA : enrichissement contrôlé de bases de connaissances à partir de documents annotés." Revue d'intelligence artificielle 28, no. 2-3 (June 30, 2014): 297–320. http://dx.doi.org/10.3166/ria.28.397-320.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
4

Hertig, Michael. "L' enrichissement automatique de l’indexation dans le réseau Renouvaud." Informationswissenschaft: Theorie, Methode und Praxis 6, no. 1 (July 9, 2020): 298–311. http://dx.doi.org/10.18755/iw.2020.16.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Ce travail cherche à décrire l’enrichissement automatique de l’indexation ainsi que les différentes manières de l’appliquer aux données bibliographiques, notamment dans le réseau vaudois de bibliothèques Renouvaud. L’enrichissement automatique de l’indexation consiste à ajouter des informations à une ressource documentaire concernant son contenu. Il s’agit d’une pratique faisant l’objet d’un nouvel intérêt dans les bibliothèques, car elle permet de résoudre des problèmes associés à l’indexation matière utilisant des vocabulaires contrôlés. Il s’agit principalement des problèmes de la masse des documents à indexer et de l’hétérogénéité des référentiels utilisés. Dans un premier temps, l’enrichissement automatique de l’indexation est introduit dans le contexte de remise en question de l’indexation matière et est présenté comme solution à ces deux problèmes. Dans un deuxième temps, ce travail examine la possibilité d’implémenter un système d’enrichissement automatique sur les données du réseau Renouvaud. Un état des lieux de l’indexation est présenté et débouche sur une analyse établissant si l’enrichissement automatique est envisageable. Enfin, l’on présente une tentative d’enrichissement automatique concrète, au moyen du système de gestion Alma utilisé dans Renouvaud.
5

Brabant, Christine, Tristan Donzé, Murielle Favre Perret, and Philipp Bubenzer. "L’instruction en famille en Suisse romande : portrait des familles et motivations parentales." Swiss Journal of Educational Research 43, no. 3 (December 21, 2021): 430–50. http://dx.doi.org/10.24452/sjer.43.3.7.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
L’instruction en famille est une option éducative peu connue, mais qui prend de l’ampleur. Cette première enquête en Suisse romande documente les raisons de ce choix, les pratiques éducatives et le profil sociodémographique de 137 familles. Les raisons exprimées par ces parents sont multiples et variées. Leurs principaux facteurs décisionnels sont d’ordre social ou pédagogique : une critique de la motivation et de la socialisation en contexte scolaire, la recherche d’un enrichissement des relations familiales, un projet éducatif poursuivi sous la responsabilité des parents et une critique des programmes d’études cantonaux et des méthodes pédagogiques de l’école. Les résultats révèlent également des situations de souffrance infantile en milieu scolaire.
6

Emirkanian, Louisette, and Emmanuel Chieze. "Variations morphologiques, syntaxiques, sémantiques et Repérage d’Information sur le Web." Revue québécoise de linguistique 32, no. 1 (February 20, 2006): 135–54. http://dx.doi.org/10.7202/012247ar.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Résumé Le repérage d’information sur le Web présente des défis particuliers, en raison de la grande variété de domaines, genres et styles des documents (ce qui augmente les phénomènes de polysémie, d’homonymie et de synonymie), et des types de requêtes utilisées, en général très courtes. En conséquence, les résultats d’une recherche sont souvent très nombreux et peu pertinents. Il faut donc trouver des approches intermédiaires : nous avons étudié les résultats de cinq requêtes de base et de variantes obtenues par enrichissement morphologique et synonymique, dans le but d’identifier des pistes valables de reformulation de requêtes. Nous avons porté une attention particulière au lien syntaxique entre les termes de la requête dans les documents et à son rapport avec la pertinence de ces termes, et effectivement constaté que la prise en compte de ce lien devrait permettre d’augmenter la précision des requêtes sans trop nuire à leur rappel.
7

Innis, Liam Robert John, and Gordon R. Osinski. "Igneous Rock Associations 24. Near-Earth Asteroid Resources: A Review." Geoscience Canada, July 9, 2019, 85–100. http://dx.doi.org/10.12789/geocanj.2019.46.147.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
The extraction of natural resources located beyond Earth to create products can be described as space resource utilization (SRU). SRU is under active investigation in both the public and private sectors. Near-Earth asteroids (NEAs) are particularly promising early SRU targets due to their relative proximity and enrichments in two key resources: water and platinum group elements (PGEs). Water can be used to create rocket propellant, making it the only resource with significant demand given the current nascent state of the space market. Platinum group elements are valuable enough that their import to the Earth market is potentially economical, making them the other prospective resource in the current embryonic state of SRU. While it is possible to retrieve material from a NEA, doing so on an economical scale will require significant developments in areas such as autonomous robotics and propulsion technology. A parameterization accounting for asteroid size, resource concentration, and accessibility yields just seven and three potentially viable NEA targets in the known population for water and PGEs, respectively. A greater emphasis on spectral observation of asteroids is required to better inform target selection for early prospecting spacecraft. A further complication is the lack of a legal precedent for the sale of extraterrestrial resources. The Outer Space Treaty prohibits the appropriation of celestial bodies but makes no explicit reference to their resources while the U.S.A. and Luxembourg have passed legislation entitling their citizens to own and sell space resources. Whether these laws are a matter of clarification or contradiction is the matter of some debate. RÉSUMÉL'extraction de ressources naturelles situées au-delà de la Terre pour créer des produits peut être décrite comme une utilisation des ressources spatiales (URS). L’URS est actuellement examinée à la fois dans les secteurs public et privé. Les astéroïdes proches de la Terre (NEA) sont des cibles URS particulièrement prometteuses en raison de leur proximité relative et de leur enrichissement en deux ressources clés : l’eau et les éléments du groupe du platine (EGP). L'eau peut être utilisée pour créer des agents de propulsion pour vaisseaux spatiaux, ce qui en fait la seule ressource pour laquelle la demande est importante compte tenu de l’émergence du marché spatial actuel. Les EGP sont suffisamment précieux pour que leur importation sur le marché terrestre soit potentiellement économique, ce qui en fait l’autre ressource potentielle étant donné l’état embryonnaire actuel de l’URS. Bien qu'il soit possible de récupérer des matériaux sur un NEA, le faire à une échelle économique nécessitera des développements importants dans des domaines tels que la robotique autonome et la technologie de propulsion. Un paramétrage tenant compte de la taille des astéroïdes, de la concentration des ressources et de l'accessibilité conduit à seulement sept et trois cibles NEA parmi la population connue, potentiellement exploitables pour l'eau et les EGP, respectivement. Il est nécessaire de mettre davantage l'accent sur l'observation spectrale des astéroïdes afin de mieux documenter la sélection des cibles pour les premiers vaisseaux prospecteurs. L'absence de précédent juridique pour la vente de ressources extraterrestres est une complication supplémentaire. Le Traité sur l’espace interdit l’appropriation des corps célestes mais ne fait aucune référence explicite à leurs ressources, tandis que les États-Unis et le Luxembourg ont adopté une législation autorisant leurs citoyens à posséder et à vendre des ressources spatiales. Que ces lois fassent l’objet de clarification ou de contradiction est sujet à débat.

Дисертації з теми "Enrichissement de document":

1

Decourselle, Joffrey. "Migration et enrichissement sémantique d’entités culturelles." Thesis, Lyon, 2018. http://www.theses.fr/2018LYSE1183/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
De nombreux efforts ont été faits ces dernières années pour faciliter la gestion et la représentation des entités culturelles. Toutefois, il existe encore un grand nombre de systèmes souvent isolés et encore utilisés dans les institutions culturelles reposant sur des modèles non sémantiques qui rendent difficile la validation et l’enrichissement des données. Cette thèse a pour but de proposer de nouvelles solutions pour améliorer la représentation et l’enrichissement sémantique de données culturelles en utilisant les principes du Web Sémantique. Pour ce faire, la recherche est focalisée d’une part sur l’adoption de modèles plus sémantiques comme selon les principes de FRBR qui permet de représenter des familles bibliographiques complexes en utilisant un modèle entités associations avec différents niveaux d’abstraction. Toutefois, la qualité d’une telle transformation est cruciale et c’est pourquoi des améliorations doivent être faites au niveau de la configuration et de l’évaluation d’un tel processus. En parallèle, la thèse cherche à profiter de ces nouveaux modèles sémantiques pour faciliter l’interconnexion des données avec des sources externes comme celles du Linked Open Data ou des sources moins structurées (Sites Web, Flux). Cela doit permettre de générer des bases de connaissances thématiques plus en accord avec les besoins des utilisateurs. Cependant, l’agrégation d’informations depuis des sources hétérogènes implique des étapes d’alignement à la fois au niveau du schéma et au niveau des entités
Many efforts have been done these last two decades to facilitate the management and representation of cultural heritage data. However, many systems used in cultural institutions are still based on flat models and are generally isolated which prevents any reuse or validation of information. This Ph.D. aims at proposing new solutions for enhancing the representation and enrichment of cultural entities using the Semantic Web technologies. This work consists in two major steps to reach this objective. On the one hand, the research is focused on the metadata migration process to transform the schema of existing knowledge catalogs to new semantic models. This study is based on a real-world case study using the concepts from the Functional Requirements for Bibliographic Records (FRBR) which allows to generate graph-based knowledge bases. Yet, the quality of such a migration is the cornerstone for a successful adoption. Thus, several challenges related to the tuning and the evaluation of such a process must be faced. On the other hand, the research aims at taking advantage of these semantic models to facilitate the linkage of information with external and structured sources (e.g., Linked Open Data) and extracting additional information from other sources (e.g., microblogging) to build a new generation of thematic knowledge bases according to the user needs. However, in this case, the aggregation of information from heterogeneous sources requires additional steps to match and merge both correspondences at schema and instance level
2

Veillet, Sébastien. "Enrichissement nutritionnel de l’huile d’olive : entre tradition et innovation." Thesis, Avignon, 2010. http://www.theses.fr/2010AVIG0237/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
L’huile d’olive est un produit ancestral largement reconnu pour ses effets bénéfiques sur la santé humaine. Sa technique de fabrication a beaucoup évolué au cours des siècles, notamment ces dernières années avec l’automatisation croissante des chaînes de production. La première partie de ce manuscrit fait le bilan de ces différentes évolutions, puis la seconde partie détaille l’impact de chacune des étapes de fabrication sur la composition nutritionnelle de l’huile. Nous avons ainsi étudié l’influence du broyage, des séparations liquide-liquide et solide-liquide. L’optimisation de ces étapes permet l’obtention d’une huile enrichit de façon endogène puisque tous les nutriments étaient présents dans l’olive. En complément nous avons également développé des méthodes d’enrichissement exogène de l’huile. Dans ce cas des molécules bioactives issues de plantes ou de légumes sont ajoutées à l’huile d’olive. Afin de limiter les étapes d’extraction et de bannir l’utilisation de solvants organiques, l’huile est utilisée en tant que solvant d’extraction et l’enrichissement se fait de façon directe dans l’huile. Pour accélérer des cinétiques d’extraction qui pourraient être très longues, nous avons utilisé des ultrasons. Les résultats obtenus sont très encourageants et ils permettent d’imaginer un élargissement de la gamme de produits oléicoles disponibles
Olive oil is an ancestral product widely known for its benefic effects on human health. Its processing has changed a lot through centuries, especially these past few years with the increasing automation of the production lines. The first part of this manuscript describes these evolutions while the second part gives details on the influence of each processing step on the nutritional composition of the olive oil. We have studied the influence of the crushing systems, liquid-liquid and solid-liquid separations. The optimization of each of these steps allows the endogenous enrichment of the oil with nutrients extracted from the olive fruit. Then, we have also developed exogenous olive oil enrichment methods by bioactive compounds issued from plants and vegetables. In order to restrain the number of extraction steps and avoid the use of petroleum solvents, the olive oil is used as the extraction solvent so the enrichment is directly performed in the oil. To accelerate extraction kinetics that could be very long we developed ultrasound accelerated extraction techniques. The results obtained in this work are very promising and extensions of olive oil available product ranges are possible
3

Leny, Marc. "Analyse et enrichissement de flux compressés : application à la vidéo surveillance." Thesis, Evry, Institut national des télécommunications, 2010. http://www.theses.fr/2010TELE0031/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Le développement de réseaux de vidéosurveillance, civils ou militaires, pose des défis scientifiques et technologiques en termes d’analyse et de reconnaissance des contenus des flux compressés. Dans ce contexte, les contributions de cette thèse portent sur : - une méthode de segmentation automatique des objets mobiles (piétons, véhicules, animaux …) dans le domaine compressé, - la prise en compte des différents standards de compression les plus couramment utilisés en surveillance (MPEG-2, MPEG-4 Part 2 et MPEG-4 Part 10 / H.264 AVC), - une chaîne de traitement multi-flux optimisée depuis la segmentation des objets jusqu’à leur suivi et description. Le démonstrateur réalisé a permis d’évaluer les performances des approches méthodologiques développées dans le cadre d’un outil d’aide à l’investigation, identifiant les véhicules répondant à un signalement dans des bases de données de plusieurs dizaines d’heures. En outre, appliqué à des corpus représentatifs des différentes situations de vidéosurveillance (stations de métro, carrefours, surveillance de zones en milieu rural ou de frontières ...), le système a permis d’obtenir les résultats suivants : - analyse de 14 flux MPEG-2, 8 flux MPEG-4 Part 2 ou 3 flux AVC en temps réel sur un coeur à 2.66 GHZ (vidéo 720x576, 25 images par seconde), - taux de détection des véhicules de 100% sur la durée des séquences de surveillance de trafic, avec un taux de détection image par image proche des 95%, - segmentation de chaque objet sur 80 à 150% de sa surface (sous ou sur-segmentation liée au domaine compressé). Ces recherches ont fait l’objet du dépôt de 9 brevets liés à des nouveaux services et applications rendus opérationnels grâce aux approches mises en oeuvre. Citons entre autres des outils pour la protection inégale aux erreurs, la cryptographie visuelle, la vérification d’intégrité par tatouage ou l’enfouissement par stéganographie
The increasing deployment of civil and military videosurveillance networks brings both scientific and technological challenges regarding analysis and content recognition over compressed streams. In this context, the contributions of this thesis focus on: - an autonomous method to segment in the compressed domain mobile objects (pedestrians, vehicles, animals …), - the coverage of the various compression standards commonly used in surveillance (MPEG-2, MPEG-4 Part 2, MPEG-4 Part 10 / H.264 AVC), - an optimised multi-stream processing chain from the objects segmentation up to their tracking and description. The developed demonstrator made it possible to bench the performances of the methodological approaches chosen for a tool dedicated to help investigations. It identifies vehicles from a witness description in databases of tens of hours of video. Moreover, while dealing with corpus covering the different kind of content expected from surveillance (subway stations, crossroads, areas in countryside or border surveillance …), the system provided the following results: - simultaneous real time analysis of up to 14 MPEG-2 streams, 8 MPEG-4 Part 2 streams or 3 AVC streams on a single core (2.66 GHz; 720x576 video, 25 fps), - 100% vehicles detected over the length of traffic surveillance footages, with a image per image detection near 95%, - a segmentation spreading over 80 to 150% of the object area (under or over-segmentation linked with the compressed domain). These researches led to 9 patents linked with new services and applications that were made possible thanks to the suggested approaches. Among these lie tools for Unequal Error Protection, Visual Cryptography, Watermarking or Steganography
4

Risch, Jean-Charles. "Enrichissement des Modèles de Classification de Textes Représentés par des Concepts." Thesis, Reims, 2017. http://www.theses.fr/2017REIMS012/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La majorité des méthodes de classification de textes utilisent le paradigme du sac de mots pour représenter les textes. Pourtant cette technique pose différents problèmes sémantiques : certains mots sont polysémiques, d'autres peuvent être des synonymes et être malgré tout différenciés, d'autres encore sont liés sémantiquement sans que cela soit pris en compte et enfin, certains mots perdent leur sens s'ils sont extraits de leur groupe nominal. Pour pallier ces problèmes, certaines méthodes ne représentent plus les textes par des mots mais par des concepts extraits d'une ontologie de domaine, intégrant ainsi la notion de sens au modèle. Les modèles intégrant la représentation des textes par des concepts restent peu utilisés à cause des résultats peu satisfaisants. Afin d'améliorer les performances de ces modèles, plusieurs méthodes ont été proposées pour enrichir les caractéristiques des textes à l'aide de nouveaux concepts extraits de bases de connaissances. Mes travaux donnent suite à ces approches en proposant une étape d'enrichissement des modèles à l'aide d'une ontologie de domaine associée. J'ai proposé deux mesures permettant d'estimer l'appartenance aux catégories de ces nouveaux concepts. A l'aide de l'algorithme du classifieur naïf Bayésien, j'ai testé et comparé mes contributions sur le corpus de textes labéllisés Ohsumed et l'ontologie de domaine Disease Ontology. Les résultats satisfaisants m'ont amené à analyser plus précisément le rôle des relations sémantiques dans l'enrichissement des modèles. Ces nouveaux travaux ont été le sujet d'une seconde expérience où il est question d'évaluer les apports des relations hiérarchiques d'hyperonymie et d'hyponymie
Most of text-classification methods use the ``bag of words” paradigm to represent texts. However Bloahdom and Hortho have identified four limits to this representation: (1) some words are polysemics, (2) others can be synonyms and yet differentiated in the analysis, (3) some words are strongly semantically linked without being taken into account in the representation as such and (4) certain words lose their meaning if they are extracted from their nominal group. To overcome these problems, some methods no longer represent texts with words but with concepts extracted from a domain ontology (Bag of Concept), integrating the notion of meaning into the model. Models integrating the bag of concepts remain less used because of the unsatisfactory results, thus several methods have been proposed to enrich text features using new concepts extracted from knowledge bases. My work follows these approaches by proposing a model-enrichment step using a domain ontology, I proposed two measures to estimate to belong to the categories of these new concepts. Using the naive Bayes classifier algorithm, I tested and compared my contributions on the Ohsumed corpus using the domain ontology ``Disease Ontology”. The satisfactory results led me to analyse more precisely the role of semantic relations in the enrichment step. These new works have been the subject of a second experiment in which we evaluate the contributions of the hierarchical relations of hypernymy and hyponymy
5

Oudni, Amal. "Fouille de données par extraction de motifs graduels : contextualisation et enrichissement." Thesis, Paris 6, 2014. http://www.theses.fr/2014PA066437/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Les travaux de cette thèse s'inscrivent dans le cadre de l'extraction de connaissances et de la fouille de données appliquée à des bases de données numériques ou floues afin d'extraire des résumés linguistiques sous la forme de motifs graduels exprimant des corrélations de co-variations des valeurs des attributs, de la forme « plus la température augmente, plus la pression augmente ». Notre objectif est de les contextualiser et de les enrichir en proposant différents types de compléments d'information afin d'augmenter leur qualité et leur apporter une meilleure interprétation. Nous proposons quatre formes de nouveaux motifs : nous avons tout d'abord étudié les motifs dits « renforcés », qui effectuent, dans le cas de données floues, une contextualisation par intégration d'attributs complémentaires, ajoutant des clauses introduites linguistiquement par l'expression « d'autant plus que ». Ils peuvent être illustrés par l'exemple « plus la température diminue, plus le volume de l'air diminue, d'autant plus que sa densité augmente ». Ce renforcement est interprété comme validité accrue des motifs graduels. Nous nous sommes également intéressées à la transposition de la notion de renforcement aux règles d'association classiques en discutant de leurs interprétations possibles et nous montrons leur apport limité. Nous proposons ensuite de traiter le problème des motifs graduels contradictoires rencontré par exemple lors de l'extraction simultanée des deux motifs « plus la température augmente, plus l'humidité augmente » et « plus la température augmente, plus l'humidité diminue ». Pour gérer ces contradictions, nous proposons une définition contrainte du support d'un motif graduel, qui, en particulier, ne dépend pas uniquement du motif considéré, mais aussi de ses contradicteurs potentiels. Nous proposons également deux méthodes d'extraction, respectivement basées sur un filtrage a posteriori et sur l'intégration de la contrainte du nouveau support dans le processus de génération. Nous introduisons également les motifs graduels caractérisés, définis par l'ajout d'une clause linguistiquement introduite par l'expression « surtout si » comme par exemple « plus la température diminue, plus l'humidité diminue, surtout si la température varie dans [0, 10] °C » : la clause additionnelle précise des plages de valeurs sur lesquelles la validité des motifs est accrue. Nous formalisons la qualité de cet enrichissement comme un compromis entre deux contraintes imposées à l'intervalle identifié, portant sur sa taille et sa validité, ainsi qu'une extension tenant compte de la densité des données.Nous proposons une méthode d'extraction automatique basée sur des outils de morphologie mathématique et la définition d'un filtre approprié et transcription
This thesis's works belongs to the framework of knowledge extraction and data mining applied to numerical or fuzzy data in order to extract linguistic summaries in the form of gradual itemsets: the latter express correlation between attribute values of the form « the more the temperature increases, the more the pressure increases ». Our goal is to contextualize and enrich these gradual itemsets by proposing different types of additional information so as to increase their quality and provide a better interpretation. We propose four types of new itemsets: first of all, reinforced gradual itemsets, in the case of fuzzy data, perform a contextualization by integrating additional attributes linguistically introduced by the expression « all the more ». They can be illustrated by the example « the more the temperature decreases, the more the volume of air decreases, all the more its density increases ». Reinforcement is interpreted as increased validity of the gradual itemset. In addition, we study the extension of the concept of reinforcement to association rules, discussing their possible interpretations and showing their limited contribution. We then propose to process the contradictory itemsets that arise for example in the case of simultaneous extraction of « the more the temperature increases, the more the humidity increases » and « the more the temperature increases, the less the humidity decreases ». To manage these contradictions, we define a constrained variant of the gradual itemset support, which, in particular, does not only depend on the considered itemset, but also on its potential contradictors. We also propose two extraction methods: the first one consists in filtering, after all itemsets have been generated, and the second one integrates the filtering process within the generation step. We introduce characterized gradual itemsets, defined by adding a clause linguistically introduced by the expression « especially if » that can be illustrated by a sentence such as « the more the temperature decreases, the more the humidity decreases, especially if the temperature varies in [0, 10] °C »: the additional clause precise value ranges on which the validity of the itemset is increased. We formalize the quality of this enrichment as a trade-off between two constraints imposed to identified interval, namely a high validity and a high size, as well as an extension taking into account the data density. We propose a method to automatically extract characterized gradual based on appropriate mathematical morphology tools and the definition of an appropriate filter and transcription
6

Ayoub, Oussama. "Enrichissement sémantique non supervisé de longs documents spécialisés pour la recherche d’information." Electronic Thesis or Diss., Paris, HESAM, 2023. http://www.theses.fr/2023HESAC039.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Face à l'accroissement incessant des données textuelles à traiter, les systèmes de Recherche d'Information (RI) doivent faire face à l'adaptation des mécanismes existants pour une sélection pertinente des ensembles documentaires dédiés à un contexte spécifique. Une difficulté prépondérante réside dans la divergence terminologique entre les termes employés dans les requêtes et ceux présents dans les documents. Cette disparité sémantique, particulièrement prononcée pour les termes de sens proches dans les documents issus de domaines spécialisés de grande taille, pose un défi significatif en RI. Face à ces enjeux, de nombreuses études se sont limitées à l'enrichissement de requêtes via des modèles supervisés, une approche qui s'avère inadéquate pour une application industrielle et manque de flexibilité. Cette thèse propose une alternative novatrice avec un système de recherche non supervisé basé sur des méthodes d'Apprentissage Profond. La plateforme LoGE utilise un modèle de langage masqué pour extrapoler des termes associés, enrichissant ainsi la représentation textuelle des documents. Les modèles utilisés sont entraînés préalablement sur de vastes corpus textuels, intégrant des connaissances générales ou spécifiques à un domaine, optimisant ainsi la représentation des documents. L'analyse des extensions générées a révélé un déséquilibre entre le signal (termes pertinents ajoutés) et le bruit (termes non pertinents). Pour pallier ce problème, nous avons développé SummVD, une approche de résumé automatique extractif, utilisant la décomposition en valeurs singulières pour synthétiser l'information contenue dans les documents et identifier les phrases les plus pertinentes. Cette méthode a été adaptée pour filtrer les termes des extensions en fonction du contexte local de chaque document, afin de maintenir la pertinence de l'information tout en minimisant le bruit
Faced with the incessant growth of textual data that needs processing, Information Retrieval (IR) systems are confronted with the urgent need to adopt effective mechanisms for efficiently selecting document sets that are best suited to specific queries. A predominant difficulty lies in the terminological divergence between the terms used in queries and those present in relevant documents. This semantic disparity, particularly pronounced for terms with similar meanings in large-scale documents from specialized domains, poses a significant challenge for IR systems.In addressing these challenges, many studies have been limited to query enrichment via supervised models, an approach that proves inadequate for industrial application and lacks flexibility. This thesis proposes LoGE an innovative alternative with an unsupervised search system based on advanced Deep Learning methods. This system uses a masked language model to extrapolate associated terms, thereby enriching the textual representation of documents. The Deep Learning models used, pre-trained on extensive textual corpora, incorporate general or domain-specific knowledge, thus optimizing the document representation.The analysis of the generated extensions revealed an imbalance between the signal (relevant terms added) and the noise (irrelevant terms). To address this issue, we developed SummVD, an innovative extractive automatic summarization approach, using singular value decomposition to synthesize the information contained in documents and identify the most pertinent phrases. This method has been adapted to filter the terms of the extensions based on the local context of each document, thereby maintaining the relevance of the information while minimizing noise
7

Durighello, Emie. "Nouvelles approches combinant protéomique, immuno-enrichissement et bioinformatique pour la détection de microorganismes." Thesis, Montpellier 1, 2014. http://www.theses.fr/2014MON13514/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Identifier rapidement des microorganismes pathogènes dans des échantillons environnementaux est un enjeu majeur dans le domaine de la biodéfense. Dans ce contexte, la spectrométrie de masse MALDI-TOF peut offrir une réponse simple, rapide et peu coûteuse. L'enjeu de la thèse, dans le cadre du projet ANR franco-allemand GEFREASE, a été de développer des méthodes permettant l'identification des microorganismes pathogènes et notamment de mettre en place des approches ciblées pour la préparation d'échantillon à l'aide d'anticorps en amont de la spectrométrie de masse. Dans un premier temps, l'étude du protéome de la bactérie modèle, Francisella tularensis subsp. holarctica LVS, responsable de la tularémie, a permis d'identifier les protéines et les peptides les plus abondants donnant un signal intense par spectrométrie de masse. Ensuite l'étude protéogénomique de douze protéines cibles a permis de choisir trois biomarqueurs dont le profil des masses par spectrométrie de masse de type MALDI-TOF (approche top-down) est spécifique de l'espèce et de la sous-espèce des bactéries du genre Francisella. Par cette méthode la virulence d'une souche est donc rapidement déterminée puisqu'elle est dépendante de la sous-espèce à laquelle la bactérie appartient. Ce test mis au point présente l'avantage d'être simple et rapide. Dans un deuxième temps, la mise au point d'un protocole d'enrichissement de la bactérie modèle par immunocapture magnétique a permis de montrer qu'il est possible de concentrer des bactéries grâce à des billes magnétiques couplées à des anticorps dirigés contre la bactérie entière. Cette approche a été expérimentée dans le cas de mélanges de bactéries où la bactérie modèle était largement minoritaire et dans des échantillons de matrices alimentaires diverses telles que de l'eau minérale ou du lait. La méthodologie a été validée sur un agent de classe 3, Francisella tularensis subsp. tularensis
The rapid identification of pathogenic microorganisms in environmental samples is a major issue in the biodefense field. MALDI-TOF mass spectrometry can offer a fast, straightforward and inexpensive answer. In the framework of the Franco-German ANR project GEFREASE, the purpose of the thesis was to develop methodologies allowing identification of pathogenic microorganisms and particularly to set up targeted approaches using antibodies for sample preparation beforehand mass spectrometry. First of all, the proteome study of Francisella tularensis subsp. holarctica LVS, responsible for tularemia, allowed us to identify the most abundant proteins and peptides, and for which the most intense signals are observed when using mass spectrometry. The proteogenomic study of twelve of these proteins enable us to choose three biomarkers for which the masses monitored by MALDI-TOF mass spectrometry (top down approach) allow deciphering the Francisella species and subspecies. The interest of this work is being able to conclude on a strain virulence based on the knowledge of the subspecies it belongs. The finalized test is easy and fast. Secondly, the development of a magnetic immunocapture of Francisella tularensis subsp. holarctica LVS allowed us to show that it is possible to concentrate bacteria using magnetic beads coupled to antibodies raised against the entire bacterium. This approach has been experimented in the case of bacterial mixtures where the model bacterium was largely in minority and for samples containing various food matrices such as mineral water or milk. The methodology has been validated on a class 3 agent, Francisella tularensis subsp. tularensis
8

Hadj, salah Marwa. "Désambiguïsation lexicale de l'arabe pour et par la traduction automatique." Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAM089/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Nous abordons dans cette thèse une étude sur la tâche de la désambiguïsation lexicale qui est une tâche centrale pour le traitement automatique des langues, et qui peut améliorer plusieurs applications telles que la traduction automatique ou l'extraction d'informations. Les recherches en désambiguïsation lexicale concernent principalement l'anglais, car la majorité des autres langues manque d'une référence lexicale standard pour l'annotation des corpus, et manque aussi de corpus annotés en sens pour l'évaluation, et plus important pour la construction des systèmes de désambiguïsation lexicale. En anglais, la base de données lexicale wordnet est une norme de-facto de longue date utilisée dans la plupart des corpus annotés et dans la plupart des campagnes d'évaluation.Notre contribution porte sur plusieurs axes: dans un premier temps, nous présentons une méthode pour la création automatique de corpus annotés en sens pour n'importe quelle langue, en tirant parti de la grande quantité de corpus anglais annotés en sens wordnet, et en utilisant un système de traduction automatique. Cette méthode est appliquée sur la langue arabe et est évaluée sur le seul corpus arabe, qui à notre connaissance, soit annoté manuellement en sens wordnet: l'OntoNotes 5.0 arabe que nous avons enrichi semi-automatiquement. Son évaluation est réalisée grâce à la mise en œuvre de deux systèmes supervisés (SVM, LSTM) qui sont entraînés sur les corpus produits avec notre méthode.Grâce ce travail, nous proposons ainsi une base de référence solide pour l'évaluation des futurs systèmes de désambiguïsation lexicale de l’arabe, en plus des corpus arabes annotés en sens que nous fournissons en tant que ressource librement disponible.Dans un second temps, nous proposons une évaluation in vivo de notre système de désambiguïsation de l’arabe en mesurant sa contribution à la performance de la tâche de traduction automatique
This thesis concerns a study of Word Sense Disambiguation (WSD), which is a central task in natural language processing and that can improve applications such as machine translation or information extraction. Researches in word sense disambiguation predominantly concern the English language, because the majority of other languages lacks a standard lexical reference for the annotation of corpora, and also lacks sense annotated corpora for the evaluation, and more importantly for the construction of word sense disambiguation systems. In English, the lexical database wordnet is a long-standing de-facto standard used in most sense annotated corpora and in most WSD evaluation campaigns.Our contribution to this thesis focuses on several areas:first of all, we present a method for the automatic creation of sense annotated corpora for any language, by taking advantage of the large amount of wordnet sense annotated English corpora, and by using a machine translation system. This method is applied on Arabic and is evaluated, to our knowledge, on the only Arabic manually sense annotated corpus with wordnet: the Arabic OntoNotes 5.0, which we have semi-automatically enriched.Its evaluation is performed thanks to an implementation of two supervised word sense disambiguation systems that are trained on the corpora produced using our method. We hence propose a solid baseline for the evaluation of future Arabic word sense disambiguation systems, in addition to sense annotated Arabic corpora that we provide as a freely available resource.Secondly, we propose an in vivo evaluation of our Arabic word sense disambiguation system by measuring its contribution to the performance of the machine translation task
9

Alec, Céline. "Enrichissement et peuplement d’ontologie à partir de textes et de données du LOD : Application à l’annotation automatique de documents." Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLS228/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Cette thèse traite d'une approche, guidée par une ontologie, conçue pour annoter les documents d'un corpus où chaque document décrit une entité de même type. Dans notre contexte, l'ensemble des documents doit être annoté avec des concepts qui sont en général trop spécifiques pour être explicitement mentionnés dans les textes. De plus, les concepts d'annotation ne sont représentés au départ que par leur nom, sans qu'aucune information sémantique ne leur soit reliée. Enfin, les caractéristiques des entités décrites dans les documents sont incomplètes. Pour accomplir ce processus particulier d'annotation de documents, nous proposons une approche nommée SAUPODOC (Semantic Annotation Using Population of Ontology and Definitions of Concepts) qui combine plusieurs tâches pour (1) peupler et (2) enrichir une ontologie de domaine. La phase de peuplement (1) ajoute dans l'ontologie des informations provenant des documents du corpus mais aussi du Web des données (Linked Open Data ou LOD). Le LOD représente aujourd'hui une source prometteuse pour de très nombreuses applications du Web sémantique à condition toutefois de développer des techniques adaptées d'acquisition de données. Dans le cadre de SAUPODOC, le peuplement de l'ontologie doit tenir compte de la diversité des données présentes dans le LOD : propriétés multiples, équivalentes, multi-valuées ou absentes. Les correspondances à établir, entre le vocabulaire de l'ontologie à peupler et celui du LOD, étant complexes, nous proposons un modèle pour faciliter leur spécification. Puis, nous montrons comment ce modèle est utilisé pour générer automatiquement des requêtes SPARQL et ainsi faciliter l'interrogation du LOD et le peuplement de l'ontologie. Celle-ci, une fois peuplée, est ensuite enrichie(2) avec les concepts d'annotation et leurs définitions qui sont apprises grâce à des exemples de documents annotés. Un raisonnement sur ces définitions permet enfin d'obtenir les annotations souhaitées. Des expérimentations ont été menées dans deux domaines d'application, et les résultats, comparés aux annotations obtenues avec des classifieurs, montrent l'intérêt de l'approche
This thesis deals with an approach, guided by an ontology, designed to annotate documents from a corpus where each document describes an entity of the same type. In our context, all documents have to be annotated with concepts that are usually too specific to be explicitly mentioned in the texts. In addition, the annotation concepts are represented initially only by their name, without any semantic information connected to them. Finally, the characteristics of the entities described in the documents are incomplete. To accomplish this particular process of annotation of documents, we propose an approach called SAUPODOC (Semantic Annotation of Population Using Ontology and Definitions of Concepts) which combines several tasks to (1) populate and (2) enrich a domain ontology. The population step (1) adds to the ontology information from the documents in the corpus but also from the Web of Data (Linked Open Data or LOD). The LOD represents today a promising source for many applications of the Semantic Web, provided that appropriate techniques of data acquisition are developed. In the settings of SAUPODOC, the ontology population has to take into account the diversity of the data in the LOD: multiple, equivalent, multi-valued or absent properties. The correspondences to be established, between the vocabulary of the ontology to be populated and that of the LOD, are complex, thus we propose a model to facilitate their specification. Then, we show how this model is used to automatically generate SPARQL queries and facilitate the interrogation of the LOD and the population of the ontology. The latter, once populated, is then enriched (2) with the annotation concepts and definitions that are learned through examples of annotated documents. Reasoning on these definitions finally provides the desired annotations. Experiments have been conducted in two areas of application, and the results, compared with the annotations obtained with classifiers, show the interest of the approach
10

Lunion, Steeve. "Enrichissement environnemental, performances cognitives et neurogenèse hippocampique adulte chez un modèle murin du syndrome de Coffin-Lowry." Thesis, Paris 11, 2014. http://www.theses.fr/2014PA11T034/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Le syndrome de Coffin Lowry est une forme syndromique rare de déficience intellectuelle liée au chromosome X. Ce syndrome est dû à des mutations du gène Rsk2 codant la protéine kinase RSK2 dans la voie de signalisation des MAPK/ERK. La caractérisation phénotypique du modèle murin Rsk2-KO a principalement mis en évidence un retard d’acquisition ainsi qu’un déficit de mémoire spatiale à long terme, suggérant une altération des fonctions hippocampiques. Nous avons montré que les souris Rsk2-KO présentent également des déficits dans une forme d’apprentissage et de mémoire mettant en jeu la fonction de séparation de patterns dépendante du gyrus denté. Plusieurs études montrent que la genèse de nouveaux neurones dans le gyrus denté chez l’adulte constitue une forme de plasticité jouant un rôle important dans l’apprentissage et la mémoire dépendante de l’hippocampe, en particulier dans les tâches spatiales et de séparation de patterns. En raison des déficits observés chez les souris Rsk2-KO, nous nous sommes intéressés à la neurogenèse adulte chez ce modèle murin. Aucune différence de prolifération, de survie ou de maturation n’a été observée dans le gyrus denté des souris Rsk2-KO à l’état basal, ni après une tâche de séparation de patterns. Cependant, nous avons observé un déficit de survie des nouvelles cellules chez les souris Rsk2-KO après apprentissage dans la piscine de Morris. La littérature montre que l’enrichissement environnemental a des effets bénéfiques sur les performances cognitives des rongeurs et est notamment capable d’augmenter la neurogenèse adulte hippocampique. Nous avons donc analysé les effets de l’enrichissement sur les performances comportementales et la neurogenèse adulte des souris Rsk2-KO. Nos résultats montrent qu’un protocole d’enrichissement environnemental de 3 heures par jours durant 24 jours est capable de compenser ou d’améliorer les performances des souris Rsk2-KO dans les tâches de mémoire spatiale et de séparation de patterns et aussi d’augmenter la neurogenèse hippocampique adulte
The Coffin-Lowry Syndrome is a rare syndromic form of X-linked intellectual disability. This syndrome is caused by mutations of the Rsk2 gene that encodes a protein kinase, RSK2, in the MAPK/ERK signaling pathway. Characterization of the behavioural phenotype of Rsk2-KO mice mainly showed that they display delayed acquisition and long-term deficits in a spatial reference memory task, suggesting an alteration in hippocampal function. Here, we show that Rsk2-KO mice are also deficient in a learning and memory task that involves dentate gyrus-dependent pattern separation function. Several studies showed the formation of new neurons in the adult dentate gyrus by neurogenesis is a form of plasticity that plays a significant role in hippocampal-dependent learning and memory, in particular for spatial learning and memory and pattern separation. As these functions are altered in Rsk2-KO mice, we studied hippocampal adult neurogenesis in these mice. No difference in proliferation, survival and maturation of newborn neurons was found in the dentate gyrus of the mutant mice in basal conditions, nor after a pattern separation task. However, we found a deficit in the survival of newborn cells in Rsk2-KO mice submitted to spatial learning and memory in the Morris water maze task. According to several studies, environmental enrichment in rodents has beneficial effects on cognitive performance and is associated with an enhancement of adult hippocampal neurogenesis. Thus, we assessed the potential effect of environmental enrichment on spatial learning and memory performance and adult hippocampal neurogenesis in Rsk2-KO mice. Our results show that an environmental enrichment protocol of 3h per day during 24 days can rescue or ameliorate spatial learning and memory performance and pattern separation function in Rsk2-KO mice and increase adult hippocampal neurogenesis

Частини книг з теми "Enrichissement de document":

1

Calafat, Guillaume. "Un réseau corse entre l’Afrique du Nord et l’Europe. Commerce maritime, institutions et enrichissement au tournant des XVIe et XVIIe siècles." In Atti delle «Settimane di Studi» e altri Convegni, 407–27. Florence: Firenze University Press, 2019. http://dx.doi.org/10.36253/978-88-6453-857-0.21.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
This article describes the activity of a network of Corsican merchants and sailors active in the Western Mediterranean between the sixteenth and the seventeenth century, in particular in Tunis, Marseille, Leghorn and the areas of Corsica under Genoa’s rule. Based on early-seventeenth-century factums and memorials, and notary deeds and documents from the archives of the Record’s Office of the French Consulate in Tunis, this essay describes how several families of Corsican merchants – some naturalised French in Marseille, some converted to Islam in Tunis – were part of the political and economic elites of the Mediterranean area.

До бібліографії