Se connecter

Bibliographies thématiques / Documents semi-structurés (DSS)

Littérature scientifique sur le sujet « Documents semi-structurés (DSS) »

Auteur : Grafiati

Publié le 7 juillet 2024

Créez une référence correcte selon les styles APA, MLA, Chicago, Harvard et plusieurs autres

Choisissez une source :

Sommaire

Articles de revues
Thèses

Consultez les listes thématiques d’articles de revues, de livres, de thèses, de rapports de conférences et d’autres sources académiques sur le sujet « Documents semi-structurés (DSS) ».

À côté de chaque source dans la liste de références il y a un bouton « Ajouter à la bibliographie ». Cliquez sur ce bouton, et nous générerons automatiquement la référence bibliographique pour la source choisie selon votre style de citation préféré : APA, MLA, Harvard, Vancouver, Chicago, etc.

Vous pouvez aussi télécharger le texte intégral de la publication scolaire au format pdf et consulter son résumé en ligne lorsque ces informations sont inclues dans les métadonnées.

Articles de revues sur le sujet "Documents semi-structurés (DSS)"

1

Naji, Meriem, et Rachida Jehouani. « La relation avec l’argent dans l’ère digitale au Maroc et ses conséquences environnementales ». SHS Web of Conferences 175 (2023) : 01022. http://dx.doi.org/10.1051/shsconf/202317501022.

Texte intégral

Résumé :

Le présent document postule que la numérisation a transformé notre relation avec le travail et, par conséquent, notre relation à l’argent. Aujourd’hui, les personnes peuvent s’engager dans une variété d’activités lucratives grâce aux possibilités offertes par la toile. La transformation numérique du travail a également modifié la manière dont les gens interagissent avec l’argent. Le passage à l’ère numérique a radicalement changé nos perceptions et nos attitudes envers le travail et l’argent, en particulier pour ceux qui travaillent en ligne. Un nombre croissant d’individus n’hésitent pas à révéler publiquement leurs revenus provenant de ces activités en ligne. En fait, c’est cette nouvelle relation à l’argent qui mérite d’être interrogée. Cette recherche se focalise précisément sur le domaine du dropshipping pour définir l’aspect virtuel de l’étude. Dans ce cadre, notre objectif est d’analyser la relation avec l’argent des travailleurs numériques au Maroc en utilisant une approche méthodologique qui allie diverses méthodes d’investigation. Nous nous appuyons sur des outils tels que les questionnaires et les entretiens semi-structurés pour obtenir une vue d’ensemble des expériences des personnes impliquées dans le dropshipping et leur lien avec l’argent. En adoptant ces méthodes, nous sondons les perceptions, les habitudes financières et les points de vue des acteurs engagés dans le dropshipping.

Styles APA, Harvard, Vancouver, ISO, etc.

2

Rezende de Almeida, Debora. « RESILIÊNCIA INSTITUCIONAL : para onde vai a participação nos Conselhos Nacionais de Saúde e dos Direitos da Mulher ? » Caderno CRH 33 (27 juillet 2020) : 020004. http://dx.doi.org/10.9771/ccrh.v33i0.33281.

Texte intégral

Résumé :

<p>O presente artigo se propõe a compreender as mudanças na participação política que afetaram a relação entre Estado e sociedade civil nos processos decisórios de políticas públicas desde o impeachment presidencial de 2016 no Brasil. Para isso, o artigo propõe o conceito de resiliência institucional, a partir da combinação de quatro literaturas: estudos sobre resiliência, mudança institucional, participação institucional e repertórios de ação coletiva e interação entre Estado e movimentos sociais. Aponta ainda quais seriam os fatores que contribuem para a resiliência de algumas instituições participativas. O trabalho é baseado em estudo de caso dos Conselhos Nacionais de Saúde e Direitos da Mulher, e no uso de técnicas de pesquisa qualitativas, a saber, entrevistas semiestruturadas, observação participante e análise documental, examinando as mudanças nas estratégias e repertórios de interação com o Estado, internamente e para além dos Conselhos, e levantando questões sobre o futuro da participação institucional no país.</p><p> </p><p>INSTITUTIONAL RESILIENCE: WHERE DOES PARTICIPATION GO IN THE NATIONAL COUNCILS OF HEALTH AND WOMENS’S RIGHTS?</p><p>This article aims to understand the changes in political participation that have affected the relationship between the State and civil society in the public policies decision-making since the 2016 presidential impeachment in Brazil. For this, the article proposes the concept of institutional resilience, based on the combination of four types of literatures: studies dealing with resilience, institutional change, institutional participation and repertoires of collective action and interaction between state and social movements. Furthermore, it points out what are the factors that contribute to the resilience of some participatory institutions, based on the case study of the National Councils of Health and Women’s Rights, and the use of qualitative research techniques, namely, semi-structured interviews, participant observation and content analysis, examining the changes in strategies and repertoires of interaction with the State, inside and beyond the councils, and raising questions about the future of institutional participation in the country.</p><p>Keywords: Intitucional resilience, Institutional participation, National councils, Health, Women’s rights.</p><p> </p><p>RÉSILIENCE INSTITUTIONNELLE : OÙ VA LA PARTICIPATION DANS LES CONSEILS NATIONAUX DE LA SANTÉ ET DES DROITS DES FEMMES?</p><p>Cet article vise à comprendre les changements dans la participation politique qui ont influencié la relation entre l’État et la société civile dans la prise de décision des politiques publiques depuis la destitution présidentielle de 2016 au Brésil. À cette effect, l’article propose le concept de résilience institutionnelle, basé sur la combinaison de quatre objets littéraires: les études sur la résilience, le changement institutionnel, la participation institutionnelle et les répertoires d’action collective et d’interaction entre l’État et les mouvements sociaux. L’article souligne également quels sont les facteurs qui contribuent à la résilience de certaines institutions participatives, basé sur l’étude de cas des conseils nationaux pour la santé et les droits des femmes, et l’utilisation de techniques de recherche qualitative, à savoir, entretiens semi-structurés, l’observation participante et des données secondaires, examinant les changements des stratégies et des répertoires d’interaction avec l’État au sein et au-delà des conseils, et posant des questions sur l’avenir de la participation institutionnelle au Brésil.</p><p>Mots clés: Résilience institutionnelle, Participation institutionnelle, Conseils nationaux, Santé, Droits des femmes.</p>

Styles APA, Harvard, Vancouver, ISO, etc.

3

Rodrigues, Jovenildo Cardoso, Rodrigo Luciano Macedo Machado, Luciano Rocha da Penha et Adolfo Oliveira Neto. « INTERFACES DO RURAL E DO URBANO NA CIDADE DE BARCARENA, AMAZÔNIA PARAENSE ». InterEspaço : Revista de Geografia e Interdisciplinaridade 5, n^o 19 (18 janvier 2020) : 202016. http://dx.doi.org/10.18764/2446-6549.e202016.

Texte intégral

Résumé :

RURAL AND URBAN INTERFACES IN THE CITY OF BARCARENA, PARAENSE AMAZONINTERFACES RURALES ET URBAINES DANS LA VILLE DE BARCARENA, AMAZONIE PARAENSERESUMOAs cidades brasileiras vêm passando por transformações aceleradas como resultado de determinações vinculadas ao avanço dos processos de urbanização do território, estruturação de cidades, conformando um mosaico complexo, diverso e contraditório de múltiplos territórios e territorialidades urbano-rurais. Em escala local, a cidade de Barcarena revela-se como espaço de intensas metamorfoses socioespaciais, enquanto produto de ações do Estado e de novos agentes econômicos na constituição da urbanização extensiva do território paraense, com reverberações nas relações e interfaces do rural e do urbano na referida cidade. O presente artigo objetiva analisar as relações e interfaces do rural e do urbano no município e na cidade de Barcarena, Amazônia paraense, a partir dos anos 2000. Como procedimento metodológico, realizamos levantamento bibliográfico e documental, produção cartográfica, registros fotográficos e entrevistas semiestruturadas com agentes do poder público municipal e moradores de áreas rurais e urbanas. Defendemos a ideia de que o rural e o urbano em Barcarena encontram-se amalgamados enquanto processos que revelam coexistências, resistências, bem como, interfaces imbricadas da relação rural-urbano em Barcarena, conformando um mosaico articulado e conflituoso de espacialidades urbano-rurais.Palavras-chave: Rural-Urbano; Cidade; Amazônia; Barcarena.ABSTRACTBrazilian cities have been undergoing accelerated transformations as a result of determinations linked to the advance of the processes of urbanization of territory, structuring of cities, forming a complex, diverse and contradictory mosaic of multiple territories and urban-rural territorialities. On a local scale, the city of Barcarena reveals itself as a space of intense socio-spatial metamorphoses, as a product of state actions and new economic agents in the constitution of extensive urbanization of Pará territory, with reverberations in the relations and interfaces of rural and urban in that city. This article aims at analyzing the relations and interfaces of rural and urban in the municipality and city of Barcarena, in the Amazon region of Pará, starting in the 2000s. As a methodological procedure, we conducted bibliographic and documentary surveys, cartographic production, photographic records and semi-structured interviews with municipal government agents and residents of rural and urban areas. We defend the idea that the rural and the urban in Barcarena are amalgamated as processes that reveal coexistence, resistance, as well as, imbricated interfaces of the rural-urban relationship in Barcarena, forming an articulated and conflicting mosaic of urban-rural spatialities.Keywords: Rural-Urban; City; Amazon; Barcarena.RÉSUMÉLes villes brésiliennes ont connu des transformations accélérées suite à des déterminations liées à l'avancée des processus d'urbanisation, à la structuration des villes, formant une mosaïque complexe, diverse et contradictoire de multiples territoires et territorialités urbaines-rurales. À l'échelle locale, la ville de Barcarena se révèle être un espace d'intenses métamorphoses socio-spatiales, produit des actions de l'État et des nouveaux agents économiques dans la constitution d'une urbanisation extensive du territoire du Pará, avec des répercussions sur les relations et les interfaces entre le rural et l'urbain dans cette ville. Le présent article vise à analyser les relations et les interfaces entre le rural et l'urbain dans la municipalité et la ville de Barcarena, dans la région amazonienne du Pará, à partir des années 2000. Comme procédure méthodologique, nous avons mené des enquêtes bibliographiques et documentaires, des productions cartographiques, des enregistrements photographiques et des entretiens semi-structurés avec des agents de l'administration municipale et des résidents des zones rurales et urbaines. Nous défendons l'idée que le rural et l'urbain à Barcarena sont amalgamés en tant que processus qui révèlent la coexistence, la résistance, ainsi que les interfaces imbriquées de la relation rural-urbain à Barcarena, formant une mosaïque articulée et conflictuelle de spatialités urbaines-rurales.Mots-Clés: Rural-Urban; Ville; Amazone; Barcarena.

Styles APA, Harvard, Vancouver, ISO, etc.

Thèses sur le sujet "Documents semi-structurés (DSS)"

1

Martin, Stéphane. « Edition collaborative des documents semi-structurés ». Phd thesis, Université de Provence - Aix-Marseille I, 2011. http://tel.archives-ouvertes.fr/tel-00684778.

Texte intégral

Résumé :

Les éditeurs collaboratifs permettent à des utilisateurs éloignés de collaborer à une tâche commune qui va de l'utilisation d'un agenda partagé à la réalisation de logiciels. Ce concept est né avec SCCS en 1972 et connait un engouement récent (ex: Wikipedia). L'absence de centralisation et l'asynchronisme sont des aspects essentiels de cette approche qui relève d'un modèle pair-à-pair (P2P). D'un autre côté, le format XML est devenu une référence pour la manipulation et l'échange de documents. Notre travail vise à la réalisation d'un éditeur collaboratif P2P pour l'édition de documents semi-structurés qui sont une abstraction du format XML. Le problème est difficile et de nombreuses propositions se sont révélées erronées ou ne passant pas à l'échelle. Nous rappelons les concepts et l'état de l'art sur l'édition collaborative, les modèles centralisés et le P2P. Ensuite, nous explorons deux approches différentes : les transformées opérationnelles et le CRDT (Commutative Replicated Data Type) avec différentes structures de données arborescentes. L'objectif est de réaliser les opérations de base (ajout, suppression et ré-étiquetage) tout en garantissant la convergence du processus d'édition. Nous proposons un algorithme générique pour l'approche CRDT basée sur une notion d'indépendance dans la structure de données. Nous avons étendu nos travaux afin de réaliser l'opération de déplacement d'un sous-arbre et de prendre en compte le typage XML. Peu de travaux abordent ces deux points qui sont très utiles pour l'édition de documents. Finalement, nous donnons les résultats expérimentaux obtenus avec un prototype permettant de valider notre approche.

Styles APA, Harvard, Vancouver, ISO, etc.

2

Belhadj, Djedjiga. « Multi-GAT semi-supervisé pour l’extraction d’informations et son adaptation au chiffrement homomorphe ». Electronic Thesis or Diss., Université de Lorraine, 2024. http://www.theses.fr/2024LORR0023.

Texte intégral

Résumé :

Cette thèse est réalisée dans le cadre du projet BPI DeepTech, en collaboration avec la société Fair&Smart, veillant principalement à la protection des données personnelles conformément au Règlement Général sur la Protection des Données (RGPD). Dans ce contexte, nous avons proposé un modèle neuronal profond pour l'extraction d'informations dans les documents administratifs semi-structurés (DSSs). En raison du manque de données d'entraînement publiques, nous avons proposé un générateur artificiel de DSSs qui peut générer plusieurs classes de documents avec une large variation de contenu et de mise en page. Les documents sont générés à l'aide de variables aléatoires permettant de gérer le contenu et la mise en page en respectant des contraintes visant à garantir leur proximité avec des documents réels. Des métriques ont été introduites pour évaluer la diversité des DSSs générés en termes de contenu et de mise en page. Les résultats de l'évaluation ont montré que les jeux de données générés pour trois types de DSSs (fiches de paie, tickets de caisse et factures) présentent un degré élevé de diversité, ce qui permet d'éviter le sur-apprentissage lors de l'entraînement des systèmes d'extraction d'informations. En s'appuyant sur le format spécifique des DSSs, constitué de paires de mots (mots-clés, informations) situés dans des voisinages proches spatialement, le document est modélisé sous forme de graphe où les nœuds représentent les mots et les arcs, les relations de voisinage. Le graphe est incorporé dans un réseau d'attention à graphe (GAT) multi-couches (Multi-GAT). Celui-ci applique le mécanisme d'attention multi-têtes permettant d'apprendre l'importance des voisins de chaque mot pour mieux le classer. Une première version de ce modèle a été utilisée en mode supervisé et a obtenu un score F1 de 96 % sur deux jeux de données de factures et de fiches de paie générées, et de 89 % sur un ensemble de tickets de caisse réels (SROIE). Nous avons ensuite enrichi le Multi-GAT avec un plongement multimodal de l'information au niveau des mots (avec des composantes textuelle, visuelle et positionnelle), et l'avons associé à un auto-encodeur variationnel à graphe (VGAE). Ce modèle fonctionne en mode semi-supervisé, capable d'apprendre à partir des données annotées et non annotées simultanément. Pour optimiser au mieux la classification des nœuds du graphe, nous avons proposé un semi-VGAE dont l'encodeur partage ses premières couches avec le classifieur Multi-GAT. Cette optimisation est encore renforcée par la proposition d'une fonction de perte VGAE gérée par la perte de classification. En utilisant une petite base de données non annotées, nous avons pu améliorer de plus de 3 % le score F1 obtenu sur un ensemble de factures générées. Destiné à fonctionner dans un environnement protégé, nous avons adapté l'architecture du modèle pour son chiffrement homomorphe. Nous avons étudié une méthode de réduction de la dimensionnalité du modèle Multi-GAT. Ensuite, nous avons proposé une approche d'approximation polynomiale des fonctions non-linéaires dans le modèle. Pour réduire la dimension du modèle, nous avons proposé une méthode de fusion de caractéristiques multimodales qui nécessite peu de paramètres supplémentaires et qui réduit les dimensions du modèle tout en améliorant ses performances. Pour l'adaptation au chiffrement, nous avons étudié des approximations polynomiales de degrés faibles aux fonctions non-linéaires avec une utilisation des techniques de distillation de connaissance et de fine tuning pour mieux adapter le modèle aux nouvelles approximations. Nous avons pu minimiser la perte lors de l'approximation d'environ 3 % pour deux jeux de données de factures ainsi qu'un jeu de données de fiches de paie et de 5 % pour SROIE
This thesis is being carried out as part of the BPI DeepTech project, in collaboration with the company Fair&Smart, primarily looking after the protection of personal data in accordance with the General Data Protection Regulation (RGPD). In this context, we have proposed a deep neural model for extracting information in semi-structured administrative documents (SSDs). Due to the lack of public training datasets, we have proposed an artificial generator of SSDs that can generate several classes of documents with a wide variation in content and layout. Documents are generated using random variables to manage content and layout, while respecting constraints aimed at ensuring their similarity to real documents. Metrics were introduced to evaluate the content and layout diversity of the generated SSDs. The results of the evaluation have shown that the generated datasets for three SSD types (payslips, receipts and invoices) present a high diversity level, thus avoiding overfitting when training the information extraction systems. Based on the specific format of SSDs, consisting specifically of word pairs (keywords-information) located in spatially close neighborhoods, the document is modeled as a graph where nodes represent words and edges, neighborhood connections. The graph is fed into a multi-layer graph attention network (Multi-GAT). The latter applies the multi-head attention mechanism to learn the importance of each word's neighbors in order to better classify it. A first version of this model was used in supervised mode and obtained an F1 score of 96% on two generated invoice and payslip datasets, and 89% on a real receipt dataset (SROIE). We then enriched the multi-GAT with multimodal embedding of word-level information (textual, visual and positional), and combined it with a variational graph auto-encoder (VGAE). This model operates in semi-supervised mode, being able to learn on both labeled and unlabeled data simultaneously. To further optimize the graph node classification, we have proposed a semi-VGAE whose encoder shares its first layers with the multi-GAT classifier. This is also reinforced by the proposal of a VGAE loss function managed by the classification loss. Using a small unlabeled dataset, we were able to improve the F1 score obtained on a generated invoice dataset by over 3%. Intended to operate in a protected environment, we have adapted the architecture of the model to suit its homomorphic encryption. We studied a method of dimensionality reduction of the Multi-GAT model. We then proposed a polynomial approximation approach for the non-linear functions in the model. To reduce the dimensionality of the model, we proposed a multimodal feature fusion method that requires few additional parameters and reduces the dimensions of the model while improving its performance. For the encryption adaptation, we studied low-degree polynomial approximations of nonlinear functions, using knowledge distillation and fine-tuning techniques to better adapt the model to the new approximations. We were able to minimize the approximation loss by around 3% on two invoice datasets as well as one payslip dataset and by 5% on SROIE

Styles APA, Harvard, Vancouver, ISO, etc.

3

Harrathi, Rami. « Recherche d'information conceptuelle dans les documents semi-structurés ». Lyon, INSA, 2010. http://theses.insa-lyon.fr/publication/2010ISAL0073/these.pdf.

Texte intégral

Résumé :

Avec l'avènement de XML, comme un format reconnu de représentation et d'échange de documents semi-structurés, de nombreuses approches ont été proposées pour la Recherche d'Information dans les documents semi-Structurés (RIS). Ces approches de RIS présentent des limites à différents niveaux : au niveau de l'appariement élément/requête et au niveau du langage de requêtes. En effet, l'appariement élément/requête vise à attribuer des scores de pertinences aux éléments des documents. La majorité des approches actuelles sont fondées sur des systèmes d'indexation basés sur des mots clés où l'élément d'un document et la requête sont représenté par une liste de mots clés pondérés. Cependant, l'indexation par des mots clés est imprécise et ne prend pas en considération les relations sémantiques entre ces mots. D'autre part, la majorité des langages de requêtes proposés pour l'Interrogation des documents semi-structurés sont des langages textuels. Une limite des langages textuels réside dans le fait qu'Il s'agit de langages inadaptés aux utilisateurs non informaticiens. Ces langages nécessitent de la part de l'utilisateur un apprentissage de leur syntaxe formelle. L'utilisation des langages visuels s'avère être une bonne solution pour remédier aux limites des langages textuels. Dans ce cadre, nos contributions portent principalement sur la proposition d'une approche de RI conceptuelle dans les documents semi-structurés et d'un modèle d'interrogation visuelle. Nos contributions ont été évaluées grâce à la campagne d'évaluation IN EX et à travers le développement d'un prototype
With the advent of XML as the de facto standard for semi-structured document representation and exchange over the Web, several approaches of structured information retrieval (SIR) for semi-structured document have been proposed. These approaches have limitations of RIS at different levels: the matching element/query and query language. The matching element/query consist of assigning a relevance scores of elements in the documents. Most approaches for evaluating the relevance are based on keywords-based indexing systems where the element of a document and the query are represented by a list of weighted keyword. The keywords-based indexing is generally imprecise. This imprecision is due to the problem of semantic ambiguity of words in natural language. To address these limitations, several studies were interested in taking into account the semantic indexing terms. This type of indexing is called semantic or conceptual indexing. These works take into account the notion of concept in place of the notion of word. The query languages allow the user to query semi-structured documents by content and structure. Most query languages which proposed for querying semi-structured documents were textual query languages. The limitation of textual languages lies in the fact that it is unsuitable for users who are novices in computer science. These languages are characterized by a complex formalism. They require training in the formal syntax of the language. The use of visual languages overcomes these limitations. In this context, our contributions focus on the proposal of a conceptual IR approach in semi-structured documents and a model of visual querying. Our contributions are evaluated through the IN EX Evaluation Initiative and the development of a prototype

Styles APA, Harvard, Vancouver, ISO, etc.

4

Debarbieux, Denis. « Modélisation et requêtes des documents semi-structurés : exploitation de la structure de graphe ». Phd thesis, Université des Sciences et Technologie de Lille - Lille I, 2005. http://tel.archives-ouvertes.fr/tel-00619303.

Texte intégral

Résumé :

La notion de données semi-structureées est liée au monde du web. On appelle donnée semi-structurée une donnée dont le schéma n'est pas défini a priori. Par exemple, il peut s'agir d'une page HTML, d'un site Web tout entier ou encore d'un document XML. Cette thèse étudie les requêtes sur les données modélisées par des graphes. Plus précisément, on s'intéresse à différents langages de requêtes associés. Dans le cas des graphes orientés, on utilise des techniques de réécriture et d'automates pour étudier - à des fins d'optimisation de requêtes - les contraintes d'inclusions. Elles portent sur les chemins qui permettent de naviguer dans la donnée. Par ailleurs, on génère un index d'une donnée qui préserve toutes les contraintes d'inclusions. Ensuite, on étend cette étude pour obtenir le concept de requête graphe. Appliqué au cas des documents "XML coloré", elles permettent d'étudier formellement l'expressivité et la complexité de langages de requêtes inspirés de XPath et de XQuery. Enfin, les résultats théoriques sont validés par des expérimentations.

Styles APA, Harvard, Vancouver, ISO, etc.

5

Pinel-Sauvagnat, Karen. « Modèle flexible pour la recherche d'information dans des corpus de documents semi-structurés ». Toulouse 3, 2005. http://www.theses.fr/2005TOU30071.

Texte intégral

Résumé :

L'information structurelle des documents semi-structurés sert à affiner le concept de granule documentaire. Le but pour les "Systèmes de recherche d'information" est alors de retrouver des unités d'information (et non plus de documents) pertinentes à des requêtes utilisateur. Ceci nous conduit à proposer le modèle XFIRM (XML Flexible Information Retrieval Model) reposant sur: (i) Un modèle de représentation des données générique, permettant de modéliser des documents possédant des structures différentes ; (ii) Un langage de requête flexible, permettant à l'utilisateur d'exprimer son besoin selon divers degrés de précision, en exprimant ou non des conditions sur la structure des documents ; (iii) Un modèle de recherche basée sur une méthode de propagation de la pertinence, ayant pour but de trouver les unités d'information les plus exhaustives et spécifiques à la requête. L'évaluation de notre modèle, grâce au prototype que nous avons développé, montre l'intérêt de nos propositions
Structural information contained in semi-structured documents can be used to focus on relevant information. The aim of Information Retrieval System is then to retrieve relevant information units instead of whole documents. We propose here the XFIRM model (XML Flexible Information Retrieval model), which is based on: (i) a generic data representation model, allowing the modelling of documents having heterogeneous structures; (ii) a flexible query language that allows the expression of users needs according to many precision degrees, by expressing (or not) conditions on the documents structure; (iii) a retrieval model based on a relevance propagation method, which aims at finding the most exhaustive and specific information units answering the query. The interest of our propositions has been shown thanks to the prototype we developed

Styles APA, Harvard, Vancouver, ISO, etc.

6

Decoster, Jean. « Programmation logique inductive pour la classification et la transformation de documents semi-structurés ». Thesis, Lille 1, 2014. http://www.theses.fr/2014LIL10046/document.

Texte intégral

Résumé :

L’échange d’informations entre périphériques variés et sur internet soulève de nombreux problèmes par le volume et l’hétéroclisme des données échangées. La plupart de ces échanges utilisent le format XML. Afin de les faciliter, des traitements intelligents, comme la classification et la transformation automatiques, ont été développés. Le but de cette thèse est double : proposer un framework d'apprentissage pour la classification de documents XML et étudier l'apprentissage de transformations de documents XML. Le choix d’utiliser la Programmation Logique Inductive a été fait. Même si les méthodes d'apprentissage ont alors un surcoût algorithmique non négligeable (certaines opérations deviennent NP-dures), la représentation relationnelle semble adaptée aux documents XML de par son expressivité. Notre framework pour la classification fait suite à l'étude de familles de clauses pour la représentation de structures arborescentes. Il repose sur une réécriture des opérations de base de la PLI que sont la theta-subsomption et le moindre généralisé [Plotkin1971]. Nos algorithmes sont polynomiaux en temps dans la taille de leur entrée là où ceux standards sont exponentiels. Ils permettent une identification à la limite [Gold1967] de nos familles de clauses. Notre seconde contribution débute par la modélisation d’une famille de clauses dans la lignée des programmes fonctionnels [Paulson91]. Ces clauses sont une adaptation à la PLI des scripts d'édition et prennent en compte un contexte. Elles permettent la représentation de transformations de documents XML. Leurs apprentissages sont possibles grâce à deux algorithmes de type A*, approche courante en PLI (HOC-Learner [Santos2009])
The recent proliferation of XML documents in databases and web applications rises some issues due to the numerous data exchanged and their diversity. To ease their uses, some smart means have been developed such as automatic classification and transformation. This thesis has two goals:• To propose a framework for the XML documents classification task.• To study the XML documents transformation learning.We have chosen to use Inductive Logic Programming. The expressiveness of logic programs grants flexibility in specifying the learning task and understandability to the induced theories. This flexibility implies a high computational cost, constraining the applicability of ILP systems. However, XML documents being trees, a good concession can be found.For our first contribution, we define clauses languages that allow encoding xml trees. The definition of our classification framework follows their studies. It stands on a rewriting of the standard ILP operations such as theta-subsumption and least general generalization [Plotkin1971]. Our algorithms are polynomials in time in the input size whereas the standard ones are exponentials. They grant an identification in the limit [Gold1967] of our languages.Our second contribution is the building of methods to learn XML documents transformations. It begins by the definition of a clauses class in the way of functional programs [Paulson91]. They are an ILP adaptation of edit scripts and allow a context. Their learning is possible thanks to two A*-like algorithms, a common ILP approach (HOC-Learner [Santos2009])

Styles APA, Harvard, Vancouver, ISO, etc.

7

Naffakhi, Najeh. « Un modèle de recherche d'information agrégée basée sur les réseaux bayésiens dans des documents semi-structurés ». Toulouse 3, 2013. http://thesesups.ups-tlse.fr/2018/.

Texte intégral

Résumé :

Nous proposons un modèle de recherche d'information basé sur les réseaux bayésiens. Dans ce modèle, la requête de l'utilisateur déclenche un processus de propagation pour sélectionner les éléments pertinents. Dans notre modèle, nous cherchons à renvoyer à l'utilisateur un agrégat au lieu d'une liste d'éléments. En fait, l'agrégat formulé à partir d'un document est considéré comme étant un ensemble d'éléments ou une unité d'information (portion d'un document) qui répond le mieux à la requête de l'utilisateur. Cet agrégat doit répondre à trois aspects à savoir la pertinence, la non-redondance et la complémentarité pour qu'il soit qualifié comme une réponse à cette requête. L'utilité des agrégats retournés est qu'ils donnent à l'utilisateur un aperçu sur le contenu informationnel de cette requête dans la collection de documents. Afin de valider notre modèle, nous l'avons évalué dans le cadre de la campagne d'évaluation INEX 2009 (utilisant plus que 2 666 000 documents XML de l'encyclopédie en ligne Wikipédia). Les expérimentations montrent l'intérêt de cette approche en mettant en évidence l'impact de l'agrégation de tels éléments
The work described in this thesis are concerned with the aggregated search on XML elements. We propose new approaches to aggregating and pruning using different sources of evidence (content and structure). We propose a model based on Bayesian networks. The dependency relationships between query-terms and terms-elements are quantified by probability measures. In this model, the user's query triggers a propagation process to find XML elements. In our model, we search to return to the user an aggregate instead of a list of XML elements. In fact, the aggregate made from a document is considered an information unit (or a portion of this document) that best meets the user's query. This aggregate must meet three aspects namely relevance, non-redundancy and complementarity in order to answer the query. The value returned aggregates is that they give the user an overview of the information need in the collection

Styles APA, Harvard, Vancouver, ISO, etc.

8

Sauvagnat, Karen. « Mod`ele flexible pour la Recherched'Information dans des corpus dedocuments semi-structur´es ». Phd thesis, Université Paul Sabatier - Toulouse III, 2005. http://tel.archives-ouvertes.fr/tel-00359579.

Texte intégral

Résumé :

La nature de sources d'information évolue, et les documents numériques
traditionnels ” plats ” ne contenant que du texte s'enrichissent d'information
structurelle et multimédia. Cette ´évolution est accélérée par l'expansion du
Web, et les documents semi-structurés de type XML (eXtensible Markup Language)
tendent à former la majorité des documents numériques mis à disposition
des utilisateurs. Le développement d'outils automatisés permettant un
accès efficace à ce nouveau type d'information numérique apparaît comme une
nécessité. Afin de valoriser au mieux l'ensemble des informations disponibles,
les méthodes existantes de Recherche d'Information (RI) doivent être adaptées.
L'information structurelle des documents peut en effet servir à affiner le concept
de granule documentaire. Le but pour les Systèmes de Recherche d'Information
(SRI) est alors de retrouver des unités d'information (et non plus de documents)
pertinentes à des requêtes utilisateur. Afin de répondre à cette problématique
fondamentale, de nouveaux modèles prenant en compte l'information structurelle
des documents, tant au niveau de l'indexation, de l'interrogation que de
la recherche doivent être construits.
L'objectif de nos travaux est de proposer un modèle permettant d'effectuer des
recherches flexibles dans des corpus de document semi-structurés. Ceci nous
a conduit à proposer le mod`ele XFIRM (XML Flexible Information Retrieval
Model ) reposant sur : (i) Un modèle de représentation des donn´ees générique,
permettant de modéliser des documents possédant des structures différentes ;
(ii) Un langage de requête flexible, permettant à l'utilisateur d'exprimer son
besoin selon divers degrés de précision, en exprimant ou non des conditions
sur la structure des documents ; (iii) Un modèle de recherche bas´ee sur une
m´ethode de propagation de la pertinence. Ce modèle a pour but de trouver les
unités d'information les plus exhaustives et spécifiques répondant à une requête
utilisateur, que celle-ci contienne ou non des conditions de structure. Les documents
semi-structurés peuvent être représentés sous forme arborescente, et
le but est alors de trouver les sous-arbres de taille minimale répondant à la
requête. Les recherches sur le contenu seul des documents sont effectuées en
prenant en compte les importances diverses des feuilles des sous-arbres, et en
plaçant ces derniers dans leur contexte, c'est à dire, en tenant compte de la
pertinence du document. Les recherches portant à la fois sur le contenu et la
structure des documents sont effectuées grâce à plusieurs propagations de pertinence
dans l'arbre du document, et ce afin d'effectuer une correspondance
vague entre l'arbre du document et l'arbre de la requête.
L'´evaluation de notre modèle, grâce au prototype que nous avons d´eveloppé,
montre l'intérêt de nos propositions, que ce soit pour effectuer des recherches
sur le contenu seul des documents que sur le contenu et la structure.

Styles APA, Harvard, Vancouver, ISO, etc.

9

Torjmen, Mouna. « Approches de recherche multimédia dans des documents semi-structurés : utilisation du contexte textuel et structurel pour la sélection d'objets multimédia ». Toulouse 3, 2009. http://thesesups.ups-tlse.fr/673/.

Texte intégral

Résumé :

L'évolution conjointe des besoins utilisateurs et des documents électroniques ne cesse de soulever de nouvelles problématiques dans le domaine de la Recherche d'Information (RI). Si l'on considère la recherche dans des corpus de documents semi-structurés (XML), la structure des documents permet aux Systèmes de Recherche d'Information (SRI) de se focaliser sur le besoin utilisateur en renvoyant non plus des documents entiers mais des parties de document répondant de manière précise au besoin. Parallèlement à l'apparition de l'information structurelle dans les documents, l'insertion de contenus multimedia, et notamment d'images, a également soulevé de nombreuses problématiques. Afin de valoriser au mieux l'ensemble des informations multimedia disponibles, les méthodes existantes de la Recherche Multimedia (RM) doivent être adaptées. Alors que l'exploitation de la structure dans la recherche d'information textuelle a montré son intérêt, peu de travaux ont étudié son utilisation dans la recherche multimedia. La plupart des travaux existants pour la recherche multimedia structurée consistent soit à combiner une recherche XML textuelle et une recherche multimedia basée sur le contenu physique des éléments multimedia, soit à effectuer une recherche XML textuelle et ensuite à filtrer les résultats en gardant seulement ceux répondant aux besoins multimedia. L'objectif de nos travaux est de proposer des méthodes permettant de répondre aux besoins multimedia en tenant compte à la fois de la structure des documents et de la spécificité multimedia. Nos approches peuvent être appliquées à n'importe quel type de media (image, son, video) car elles sont indépendantes du contenu physique des medias, mais nous nous intéressons plus particulièrement à la recherche d'images. Nos méthodes permettent ainsi soit la recherche d'éléments multimedia à travers le contexte textuel et structurel des images; soit la recherche de fragments multimedia (c'est-à-dire d'images et éventuellement de texte). Pour la recherche d'éléments multimedia, l'idée de base est de déterminer le score de pertinence de ces éléments en fonction des autres éléments non-multimedia. Le problème est alors de sélectionner les éléments à utiliser pour évaluer les scores de pertinence des éléments multimedia. . .
The evolution of user needs and electronic documents raises new issues in the Information R(IR) domain. Indeed, when considering semi-structured documents (XML), the document structure allows the Information Retrieval Systems (IRS) to answer more precisely to the user information needs, by returning parts of documents instead of whole documents. With the emergence of structural information in documents, the integration of multimedia content, like images for example, has also raised many issues. To exploit all the multimedia and structural information at best, the existing methods of Multimedia Retrieval (MR) must be adapted. Although the use of the document structure in textual information retrieval has shown its interest, only a few studies have investigated its impact in multimedia retrieval. In the literature, most of the existing works in multimedia structured retrieval consists either of combining XML textual search and content-based multimedia retrieval, or of using an XML textual search and then filtering the results by keeping only those having a multimedia specification. The aim of our work is to propose methods to answer to the multimedia information needs, by taking into account both the document structure and the multimedia specificity. Our approaches can be applied on any type of media (images, audio, video) because they are independent of the physical content of the media. However, we are particularly interested in image retrieval. For multimedia elements (images) retrieval, the basic idea is to determine their relevance score thanks to the other non-multimedia elements scores. At this stage, the challenge is to select the elements used to evaluate the multimedia elements scores. For this purpose, we proposed two approaches: they are respectively based on the implicit and explicit use of textual and structural context. For multimedia fragments retrieval, we use the multimedia elements retrieved by one of the two previous methods to determine the best multimedia fragment to be returned to the user. .

Styles APA, Harvard, Vancouver, ISO, etc.

10

Verdier, Maxime. « Effet de l’orientation et de l’état des surfaces/interfaces sur les propriétés thermiques des semi-conducteurs nano-structurés ». Thesis, Université de Lorraine, 2018. http://www.theses.fr/2018LORR0138/document.

Texte intégral

Résumé :

Ce travail porte sur l'étude du transport de chaleur dans le Silicium cristallin nanostructuré et l’effet de l’amorphisation. La conductivité thermique de diverses nanostructures est calculée à l'aide de deux méthodes numériques : la Dynamique Moléculaire et la résolution de l'équation de transport de Boltzmann par technique Monte Carlo. Les matériaux contenant des nanopores sphériques sont d'abord examinés et l'importance de la densité de surfaces de diffusion est mise en évidence. Puis des nanofilms à pores cylindriques périodiques, souvent appelés cristaux phononiques, sont étudiés. La densité d'états calculée par Dynamique Moléculaire ne montre pas de modifications majeures des propriétés des porteurs de chaleur (phonons). En revanche, les résultats montrent que l'orientation des surfaces, la disposition des pores ou la présence d’une couche de silicium oxydé ou amorphisé peuvent jouer un rôle important pour la dissipation de la chaleur. Ensuite, le transport de chaleur dans les nanofils est étudié, notamment l'évolution radiale de la conductivité thermique. Cette dernière est maximale au centre des nanofils et décroît en s'approchant de la surface du nanofil. Des structures composées de nanofils interconnectés, appelées réseaux de nanofils, sont également étudiées; elles possèdent des conductivités extrêmement basses. Enfin, l'effet de la rugosité et de l'amorphisation des surfaces sur le transport thermique est analysé pour différents types de nanostructures. Ces deux derniers phénomènes contribuent fortement à la réduction de la conductivité thermique, qui peut prendre des valeurs très basses en gardant une fraction cristalline importante. Cela ouvre de nouvelles perspectives pour le contrôle de cette propriété à travers le design des matériaux
This study deals with heat transport in crystalline nanostructured silicon and the impact of amorphization. The thermal conductivity of various nanostructures is computed with two numerical methods: Molecular Dynamics and Monte Carlo resolution of the Boltzmann transport equation. First, materials with spherical nanopores are investigated and the importance of the surface density is highlighted. Then, nanofilms with periodic cylindrical pores, often called phononic crystals, are studied. The density of states computed with Molecular Dynamics does not show major modifications of the heat carriers (phonons) properties. However, results show that the surfaces orientation, the pore distribution and the existence of native oxide or amorphous layers may have an important impact on the thermal conductivity. Then, heat transport in nanowires is studied, in particular the radial evolution of the thermal conductivity. The latter one is maximum at the center of the nanowire and decreases when approaching the nanowire surface. Structures made from interconnected nanowires, called nanowire networks, are also studied; they have an extremely low thermal conductivity. Finally, the impact of the roughness and amorphization of the surfaces on thermal transport is analyzed for different types of nanostructures. The two latter phenomena contribute strongly to the reduction of the thermal conductivity, which can reach very low values while keeping an important crystalline fraction.It opens new perspectives for the control of this property with material designing

Styles APA, Harvard, Vancouver, ISO, etc.

Nous offrons des réductions sur tous les plans premium pour les auteurs dont les œuvres sont incluses dans des sélections littéraires thématiques. Contactez-nous pour obtenir un code promo unique!