Tesi sul tema "Analyse des textes"

Segui questo link per vedere altri tipi di pubblicazioni sul tema: Analyse des textes.

Cita una fonte nei formati APA, MLA, Chicago, Harvard e in molti altri stili

Scegli il tipo di fonte:

Vedi i top-50 saggi (tesi di laurea o di dottorato) per l'attività di ricerca sul tema "Analyse des textes".

Accanto a ogni fonte nell'elenco di riferimenti c'è un pulsante "Aggiungi alla bibliografia". Premilo e genereremo automaticamente la citazione bibliografica dell'opera scelta nello stile citazionale di cui hai bisogno: APA, MLA, Harvard, Chicago, Vancouver ecc.

Puoi anche scaricare il testo completo della pubblicazione scientifica nel formato .pdf e leggere online l'abstract (il sommario) dell'opera se è presente nei metadati.

Vedi le tesi di molte aree scientifiche e compila una bibliografia corretta.

1

Rosmorduc, Serge. "Analyse morpho-syntaxique de textes non ponctués : application aux textes hieroglyphiques". Cachan, Ecole normale supérieure, 1996. http://www.theses.fr/1996DENS0028.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Nous proposons un cadre logiciel pour l'étude linguistique de corpus de textes. Nous développons plus particulièrement un étiqueteur syntaxique robuste, afin de permettre des recherches dans un corpus sur des données grammaticales. L'accent étant mis sur le traitement de textes corrompus et/ou non ponctues, l'analyse utilise deux mécanismes complémentaires : le premier est un analyseur hors contexte structurant le texte selon une grammaire très lâche ; le second est un système de désambigüisation par automates, dont le but est de guider l'analyse en fournissant une représentation de l'usage.
2

Diabate, Mansa Makan. "Transcription et analyse de textes de tradition orale malinke (textes de K'el'emonson Diabat'e)". Grenoble 3, 1990. http://www.theses.fr/1990GRE39010.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Les rares textes de tradition orale malinke conns jusque-la sont soit des adaptations, soit sur le plan de la transcription ou de la traduction, des textes de moins bonne qualite. Ce sont surtout des textes destines aux seuls lettres. Dans notre etude qui porte sur deux recits de kelemonson diabate, nous avons trouve un compromis pour satisfaire a la fois le linguiste specialise et le simple locuteur alphabetise en langue bambara. Ce faisant, apres avoir clarifie certains points de phonologie qui ont ete negliges dans la these de b. Keita, nous presentons le premier texte de facon a ternir compte rigoureusement de toutes les donnees linguistiques : transcription phonetique, representation sous-jacente (travail de morphophonologie), traduction en francais de chaque enonce. Ces etudes font de ce texte un travail exclusivement reserve a l'utilisation des linguistes professionnels. Dans un deuxieme temps, nous presentons ce texte avec un autre dans une graphie inspiree par les etudes susmentionnees ; c'est-a-dire une graphie qui, tout en se voulant parfaitement rigoureuse sur le plan linguistique, repond au souci de rendre la transcription du texte oral accessible aussi aux mandingophones ayant deja une pratique de la lecture dans leur langue et aux specialistes de la litterature orale. Cette transcription est une restitution fidele des enonces effectivement realises, et la traduction (en francais) qui en est donnee, reste le plus pres possible de ce que le conteur dit. Une telle etude a permis de nous rendre compte du fait qu'un narrateur malinke emprunte a d'autres formes de parlers quand il raconte l'histoire ; cela nous a valu
The rare attested texts on malinke oral tradition are either adaptations or of poor quality as concerns their trancription or their translation. Such documents are exclusively for the use of scholared publics. In our study, based no two narrations by kelemonson diabate, a compromise is proposed to satisfy both the specialized linguist ans the simple speaker tautht in bambara. Thus firstly, after clarifying certain phonological points that were ignored in b. Keita's thesis, we propose, for the first text, a presentation that rigorously takes into account all linguistic factors : phonetic transcription, underlying representation (a morphophonological inquiry), literal transcription, french translation of each phrase. Such approaches give this text its technical value reserved exclusively for professional linguists. Secondly, the latter text is presented together with another one in a graphy inspired by the above mentionned approaches ; i. E. A graphy which is rigorous on the linguistic level, but with an oral transcription nonetheless of easy access to mandinka speakers that had prior reading training in their language, and to oral literature specialists. This transcripion is a loyal restitution of the phrases that were actually pronounced, and the given translation (in french) remains as close as possible to the storyteller's version. Such a study has allowed us
3

Boufaden, Narjes. "Analyse syntaxique robuste des textes de dialogues oraux". Thesis, National Library of Canada = Bibliothèque nationale du Canada, 1998. http://www.collectionscanada.ca/obj/s4/f2/dsk2/ftp01/MQ31690.pdf.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
4

Kanoun, Slim. "Identification et analyse de textes arabes par approche affixale". Rouen, 2002. http://www.theses.fr/2002ROUES040.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Les travaux présentés dans ce mémoire abordent les problèmes liés à la différenciation et la reconnaissance de textes en mode hors-ligne dans des documents multilingues arabe et latin. La première partie de ces travaux concerne une méthode de différenciation entre les textes arabes et les textes latins dans les deux natures imprimée et manuscrite. La deuxième partie propose une nouvelle approche, appelée approche affixale, pour la reconnaissance de mots et l'analyse de textes arabes. Cette approche se distingue par la modélisation d'entités morphosyntaxiques (morphèmes de base du mot) en intégrant les aspects morpho-phonologiques du vocabulaire arabe dans le processus de reconnaissance par rapport aux approches classiques qui procèdent par la modélisation d'entités graphiques (mot, lettre, pseudo mot). Les tests réalisés montrent bien l'apport de l'approche au niveau de la simplification de la reconnaissance et la caractérisation morphosyntaxique des mots dans un texte arabe
The presented work in this memory tackles the problems involved in differentiation and text recognition in off-line mode in Arabic and Latin multilingual documents. The first part of this work relates to a method of differentiation between Arabic texts and Latin texts in two natures printed and handwritten. The second part proposes a new approach, called affixal approach, for Arabic word recognition and text analysis. This approach is characterized by modelling from morph-syntactic entities (word basic morphemes) by integrating the morpho-phonological aspects of Arabic vocabulary in the recognition process compared to the traditional approaches which proceed by the modelling of grahic entities (word, letter, pseudo word). The tests carried out show well the contribution of the approach on the recognition simplification and the morph-syntactic categorization of the words in an Arabic text
5

Poibeau, Thierry. "Des mots aux textes. Analyse sémantique pour l'accès à l'information". Habilitation à diriger des recherches, Université Paris-Nord - Paris XIII, 2008. http://tel.archives-ouvertes.fr/tel-00436064.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Pourquoi est-il si difficile de comprendre une langue de manière automatique, même si on ne vise qu'une compréhension limitée, factuelle et orientée vers des faits connus ? La langue, telle qu'elle s'offre à nous, semble trop malléable pour être directement appréhendable par ordinateur. C'est pourtant à ce problème que je me suis intéressé : comment identifier du semblable dans des productions langagières si variées, comment repérer des fragments de signification au milieu d'un océan de textes ? Ce mémoire se compose de quatre chapitres. Je reviens au sein du chapitre 1 sur certains développements récents de la linguistique informatique, pour montrer que la disponibilité de gros corpus a entraîné une forte opérationnalisation du domaine. Cette évolution n'est pas neutre théoriquement : l'apport des corpus et des techniques d'acquisition dynamique de connaissances (notamment par les techniques d'apprentissage) rend tout à fait plausible l'idée d'une sémantique fondée sur l'usage. Les trois chapitres suivants portent chacun sur un niveau d'analyse différent (niveau lexical pour l'annotation sémantique, niveau prédicatif pour l'extraction de relations, niveau textuel pour la modélisation de documents spécialisés). Je défends l'idée d'un continuum entre ces niveaux, du fait notamment que tous partagent des similarités fondamentales, ce qui peut se manifester parfois de manière très visible et influer sur les techniques utilisées. Le chapitre 2 traite du niveau lexical (microsémantique), essentiellement à travers l'analyse des « entités nommées » : ce type de séquences comprend notamment les noms propres, qui sont des éléments essentiels pour une prise de connaissance rapide du contenu des documents. Ces séquences, et plus particulièrement les noms propres, ont été largement étudiées dans le cadre des approches logiques ; mon travail se situe dans un cadre en partie hérité de cette tradition : celui-ci offre bien des avantages applicatifs mais les noms propres, comme le vocabulaire courant, sont soumis aux mêmes phénomènes de variation et de brouillage de sens, du fait des tropes notamment. Le chapitre 3 traite essentiellement des relations prédicatives (mésosémantique) : le repérage de ces séquences est essentiel pour les systèmes d'extraction d'information et de questions-réponses. Ces applications reposent en effet sur la mise en correspondance d'entités autour d'un prédicat. Je détaille différentes techniques permettant d'acquérir automatiquement ces structures à partir de corpus (classes sémantiques, cadres de sous-catégorisation et restrictions de sélection). Je montre que ces catégories sont floues et que les analyses à partir de corpus remettent en cause certaines classifications de la grammaire traditionnelle. Le chapitre 4 traite du contenu et de la structure de textes complexes, essentiellement techniques (macrosémantique). Le texte forme un tout cohérent, marqué par un ensemble de séquences (ou périodes) liées entre elles ; cette architecture textuelle est normée et elle est significative pour la compréhension globale. J'essaie d'étendre ce travail sur l'architecture textuelle à des ensembles de textes cohérents, afin d'aboutir à une typologie. Je montre là aussi le flou et la difficulté à définir des typologies cohérentes et, surtout, fondées linguistiquement. Je reviens, dans la conclusion, sur les similitudes observées entre ces différents paliers : la question de la relation entre mots et concepts, les bords flous des catégories envisagées, leur grande variabilité sur le plan linguistique. Je m'interroge sur le lien entre traitement automatique des langues (TAL) et linguistique, avant de proposer quelques perspectives permettant de poursuivre ce travail par d'autres chemins.
6

Capdevielle, Philippe. "Monnaie et conditions d'existence des fluctuations : une analyse de textes". Université Louis Pasteur (Strasbourg) (1971-2008), 1991. http://www.theses.fr/1991STR1EC01.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'idée centrale de ce travail est que la présence de monnaie, entendue essentiellement comme le moyen de paiement à crédit, est une condition nécessaire d'existence des fluctuations liées à l'innovation réelle, dans le cas où les ressources sont indisponibles. L'innovation réelle doit être entendue au sens que lui accorde J. A. Schumpeter, à savoir comme une nouvelle fonction de production mise en place dans la sphère réelle par un entrepreneur. La démonstration de cette idée se fait en deux temps. Dans un premier temps, après exposition de ce que signifie absence -de monnaie, il est montré que l'absence de monnaie est une condition suffisante d'impossibilité des fluctuations liées à l'innovation réelle, dans le cas évoqué ci-dessus et dans ce cas seulement. Absence de monnaie signifie, en fait, présence implicite de monnaie dans ce qui est l'économie de référence pour cette absence, à savoir l'économie de troc : dans l'économie de troc, les marchandises sont monnaie. En utilisant une terminologie empruntée à K. Polani, elle est appelée économie à monnaie encastrée pour rendre compte de cette présence implicite et l'opposer à l'économie monétaire (économie à monnaie désencastrée) où la présence de monnaie (moyen de paiement à crédit) est explicite. En étudiant les rapports entre monnaie encastrée et fluctuations liées à toutes sortes de phénomènes, il est démontré alors que l'absence d'un mécanisme adéquat d'appropriation des ressources-monnaie encastrée empêche l'entrepreneur de réaliser immédiatement l'innovation, et par conséquent, la survenue des fluctuations qui y sont liées. Cette impossibilité ne vaut que pour ce cas. En d'autres termes, la monnaie désencastrée est une condition nécessaire d'existence des fluctuations liées à l'innovation réelle. Mais, il faut encore qu'elle ne soit que cela, c'est-à-dire qu'elle ne soit pas une condition suffisante. Ainsi, dans un second temps, après avoir cerné les caractéristiques de la monnaie désencastrée, caractéristiques juste suffisantes pour qu'elle joue son rôle de détournement des ressources des emplois existants vers de nouveaux emplois, il est montré que la place que tient la quantité additionnelle de moyen de paiement à 'crédit dans la séquence d'impulsion des fluctuations indique qu'elle n'est jamais que la cause immédiate de l'événement qui la suit et l'effet immédiat de celui qui la précède. Elle n'est donc qu'une condition nécessaire de l'existence des fluctuations liées à l'innovation réelle.
7

Battistelli, Delphine. "Passer du texte a une sequence d'images : analyse spatio-temporelle de textes, modelisation et realisation informatique (systeme spat)". Paris 4, 2000. http://www.theses.fr/1999PA040279.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
8

Zemirli, Zouhir. "Synthèse vocale de textes arabes voyellés". Toulouse 3, 2004. http://www.theses.fr/2004TOU30262.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Nous nous intéressons à l’utilité et l’utilisabilité de la structure visuelle des textes, pour leur transposition à l’oral par des systèmes de synthèse de parole (TTS). Nous proposons la synoptique d’un système qui conduit à une représentation du texte interprétable par un TTS. Nous avons partiellement réalisé le module spécifique aux stratégies d’oralisation, afin de rendre articulables la part signifiante des textes, souvent oubliée. Des spécifications ont été précisées et partiellement intégrées par un partenaire industriel. Des hypothèses prédictives quant à l’impact sur la mémorisation/compréhension de deux stratégies issues de notre modèle d’oralisation par reformulation des textes écrits pour être lus silencieusement, ont été formulées et testées. Ce travail a montré que des fonctions cognitives étaient perdues. Des prototypes, exploitant la notion d’image de page, ont été imaginés à travers des interfaces dans lesquelles la multimodalité a pour rôle de combler cette lacune
The text to speech synthesis consists in creating speech by analysis of a text which is subjected to no restriction. The object of this thesis is to describe the modeling and the taking into account of knowledge in phonetic, phonological, morpho-lexical and syntactic necessary to the development of a complete system of voice synthesis starting from diacritized arab texts. The automatic generation of the prosodico-phonetics sequence required the development of several components. The morphosyntaxic labelling "TAGGAR" carries out grammatical labelling, a marking and a syntactic grouping and the automatic insertion of the pauses. Graphemes to phonemes conversion is ensured by using lexicons, syntactic grammars, morpho-orthographical and phonological rules. A multiplicative model of prediction of the duration of the phonemes is described and a model of generation of the prosodic contours based on the accents of the words and the syntactic group is presented
9

Seddiki, Zakari. "La notion de "šahîd" en Islam : présentation et analyse des textes". Paris, EPHE, 2011. http://www.theses.fr/2011EPHE5015.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Dans la pensée musulmane, le « šahîd » (martyr) décrit par les textes fondateurs de l’islam s’est vu progressivement disparaître pour ne céder la place qu’à un seul genre, le « šahîd al-macraka » (martyr du combat). Plusieurs facteurs ont favorisé ce glissement sémantique, le shiisme du début de l’islam, les conquêtes, les sectes politiques et ésotériques. Le rôle du droit musulman n’a visé qu’à structurer cette réalité inconnue afin qu’elle ne s’oppose pas aux textes et au sens premier de témoignage que revêt le terme « šahîd ». L’œuvre des juristes a donc fait de l’interprétation le moyen par lequel s’est installée la cohérence entre les sources musulmanes d’une part et les nouvelles situations politiques, sociologiques et économiques d’autre part. C’est à travers ces contextes spécifiques, qu’ils soient anciens ou contemporains, que des figures de martyre vont attirer plus l’attention que d’autres. L’objectif étant, pour ceux qui mettent en avant ces personnages, d’augmenter leur légitimité et leur audience auprès des masses populaires musulmanes. Malgré une stabilité de la définition de la notion du martyre durant une certaine période de l’histoire de l’islam, les « nouveaux cas » de « šahîd » pose encore la problématique de savoir qui, dans la religion musulmane, peut être considéré comme martyr
In the muslim thought, the shahid (martyr) describes by texts founders of the islam saw gradually disappearing to give up the place only to a single kind the sahid al ma'raka (martyr of the fight). Several factors facilitated this semantic sliding : the shcisme of the beginning of the Islam, the conquests, the political and esoteric sects. The role of the muslim right aimed only at structuring this unknown reality so that it does not oppose to texts and to first sense of testimony which dresses (takes on) the sahid term. The work of the jurist made of the interpretation the means by which settles down the coherence between the muslim sources on one hand and the new political, sociological, and economic situations on the other hand. It is through these specific contexts, that they are former or contemporary, that martyr's faces are more going to draw the attention thatn the others. The being objective, for those who advance these characters, to increase their legitimacy and their audience with the muslim popular masses. In spite of a stability of the definition of the notion of martyr during a certain period of the islam history, the "new cases" of shahid still puts the problem to know whi, in the muslim religion, can be considered as martyr
10

Jalam, Radwan Chauchat Jean-Hugues. "Apprentissage automatique et catégorisation de textes multilingues". Lyon : Université Lumière Lyon 2, 2003. http://demeter.univ-lyon2.fr/sdx/theses/lyon2/2003/jalam_r.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
11

Jalam, Radwan. "Apprentissage automatique et catégorisation de textes multilingues". Lyon 2, 2003. http://theses.univ-lyon2.fr/documents/lyon2/2003/jalam_r.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Notre travail s'intéresse à l'application de méthodes issues de l'apprentissage automatique à la catégorisation de textes multilingues. Il comporte deux parties. Une première partie donne une présentation générale de la catégorisation de textes : Définitions, objectifs généraux et domaines d'application ; Adaptation des algorithmes d'apprentissage aux spécificités des textes ; La méthode de sélection de termes multivariée ; Le codage en n-grammes et les mots ; Les méthodes d'apprentissage et la mesure de leurs performances ; les texts réalisés pour comparer les algorithmes d'apprentissage sur les textes. La deuxième partie s'intéresse à l'apprentissage de textes multilingues en comparant deux chaînes possibles : Chaîne 1 : reconnaissance de la langue, puis utilisation de règles de classement construites pour chaque langue ; il faut alors avoir construit un modèle adapté à chacune des langues. Chaîne 2 : utilisation de la traduction automatique dans le processus de catégorisation ; cette solution permet d'utiliser un seul ensemble de règles de classement. Ici, il y a deux options : 1. Construire un modèle unique sur l'ensemble d'apprentissage d'une langue donnée ; ensuite, pour classer un nouveau texte, (I) reconnaissance de sa langue, (II) traduction de ce texte vers la langue d'apprentissage, (III) application du modèle de prédiction sur le texte traduit ; ici la phase de traduction n'intervient que dans la phase de classement. 2. Faire intervenir la traduction automatique dès la phase d'apprentissage : à partir d'un ensemble étiqueté de textes en différentes langues, traduction automatique dès la phase d'apprentissage : à partir d'un enemble étiqueté de textes en différentes langues, traduction automatique de tous ces textes vers une langue cible et apprentissage sur cet ensemble de textes traduits ; ensuite, pour classer un nouveau texte, la procédure est la même. Nous testons nos algorithmes sur des corpus multilingues.
12

Barry, Cherno Omar. "School and literature : analyse des textes littéraires dans le système éducatif gambien". Limoges, 2011. http://www.theses.fr/2011LIMO2002.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Tout enfant africain de la période avant le 21e siècle peut se vanter de mémoriser des pièces entières de Shakespeare, de discuter les points de vu de Gorges Orwell, Charles Dickens, et Mark Twain ou de citer des philosophies projetées par des écrivains grecs ou des philosophes occidentaux. Il n’y aurait aucun mal dans tout cela s'il n'y avait pas de défauts dans le processus. Le défaut majeur de la plupart de ces pays africains est le manque de reconnaissance de leurs propres écrivains au sein de leur système d'éducation. La Gambie a une histoire particulière par rapport à ses homologues anglophones de l’Afriqueubsaharienne. Elle était gouvernée de loin (de la Sierra Leone), elle accueillit les Africains libérés de la Sierra Leone, et l’islam a une forte emprise sur ce pays avant que l'éducation occidentale ait commencé à être introduite au début du 19e siècle. L'éducation n'a pas réussi aussi bien que prévu et cela allait contrarier les décideurs de l'époque. Par conséquent, lorsque le programme d'examen a été partagé entre quatre à cinq pays, la Gambie jouera un faible rôle dans le processus. La décision de recommander des livres, tels que les manuels de langue et les oeuvres littéraires, dépendait entièrement aux autres pays. Dans le processus, la littérature nationale n’a pas la présence escomptée dans le syllabus
Every African child of the pre-twenty-first century can boast of memorizing whole plays of Shakespeare, argue views of Gorge Orwell, Charles Dickens, and Mark Twain or cite philosophies projected by Greek writers or western philosophers. None of these would matter if there were no flaws in the process. The major flaw for most of these countries is the lack of recognition of their own writers within their systems of education. The Gambia has a peculiar history compared to its Anglophone counterparts in sub-Saharan Africa. It was governed from afar (from Sierra Leone), it accommodated the liberated Africans from Sierra Leone, and it has strongly been influenced by Islam by the time western education began to be introduced in the early 19th century. Education did not succeed as much as expected and this will frustrate policy makers of the time. Consequently, when the examination syllabus was shared between four to five countries, The Gambia will receive a weak role in the process. Decisions to recommend books, such as language textbooks and literature books lied entirely on the other countries. In the process, the national literature was present as expected in the syllabus
13

Nam, Hyeonsook. "Analyse linguistique de textes économiques en français en vue d'un traitement automatique". Nice, 1996. http://www.theses.fr/1996NICE2033.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Le présent travail est une étude terminologique sur le domaine de la finance, en vue d'un traitement automatique. On y analyse les formes dérivées et composées d'un corpus, mettant évidence sur la relation syntactico-sémantique qu'entretiennent leurs constituants, dans le but de déterminer quels formants sont productifs dans la langue économique. Les expressions idiomatiques ou récurrentes du corpus sont également traitées. L'étude met également en contraste, dans le dernier temps, les termes économiques du coréen et ceux du français en vue de proposer une aide à la rédaction et à la traduction
The present study is a terminological analysis of the financial domain, in a natural language processing perspective. The derived and compounded forms of a corpus are analysed, emphasis being put on the syntactic and semantic relations between their elements, in order to pick out the constituents that are most productive in the economical language. The research also includes the idiomatic and recurrent expressions of the corpus. As a conclusion, korean and french economical terms are contrasted, so as to supply the translater with an editing and translation toolbox
14

Issogui, Ombango Anicet Symphorien. "Textes et écritures africains et antillais : une analyse sémiotique des données sociolinguistiques". Perpignan, 2007. http://www.theses.fr/2007PERP0782.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Les textes de Ahmadou Kourouma ainsi que ceux de Patrick Chamoiseau représentent un parcours original dans le bilinguisme. En fait ils sont un formidable témoignage de la richesse que peut constituer la rencontre des langues malinke et créole avec le français. Le travail fait sur la langue française consiste en une stratégie double : exprimer son identité africaine ou antillaise et subvertir la langue française. Les approches sociolinguistiques et sémiotiques demeurent des outils complémentaires pour analyser et tenter de rendre la créativité de ces énoncés doubles
The text and the writing of Ahamadou Kourouma and Patrick Chamoiseau are the result of bilinguism. The encounter between malinke and creole on one hand and french on the other hand reveals all the richness of the authors language. They want to express their own identity through their speech. They also assert that they can create a new french language. That is why we used the semiotic and sociolinguistic approaches to intend to show all creativity of these authors
15

Morsi, Youcef Ihab. "Analyse linguistique et extraction automatique de relations sémantiques des textes en arabe". Thesis, Bourgogne Franche-Comté, 2020. http://www.theses.fr/2020UBFCC019.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Cette recherche porte sur le développement d’un outil de traitement automatique de la langue arabe standard moderne, au niveau morphologique et sémantique, avec comme objectif final l’extraction d’information dans le domaine de l’innovation technologique en entreprise. En ce qui concerne l’analyse morphologique, notre outil comprend plusieurs traitements successifs qui permettent d’étiqueter et de désambiguïser les occurrences dans les textes : une couche morphologique (Gibran 1.0), qui s’appuie sur les schèmes arabes comme traits distinctifs ; une couche contextuelle (Gibran 2.0), qui fait appel à des règles contextuelles ; et une troisième couche (Gibran 3.0) qui fait appel à un modèle d’apprentissage automatique. Notre méthodologie est évaluée sur le corpus annoté Arabic-PADT UD treebank. Les évaluations obtiennent une F-mesure de 0,92 et 0,90 pour les analyses morphologiques. Ces expérimentations montrent, entre autres, la possibilité d’améliorer une telle ressource par les analyses linguistiques. Cette approche nous a permis de développer un prototype d’extraction d’information autour de l’innovation technologique pour la langue arabe. Il s’appuie sur l’analyse morphologique et des patrons syntaxico-sémantiques. Cette thèse s’inscrit dans un parcours docteur-entrepreneur
This thesis focuses on the development of a tool for the automatic processing of Modern Standard Arabic, at the morphological and semantic levels, with the final objective of Information Extraction on technological innovations. As far as the morphological analysis is concerned, our tool includes several successive processing stages that allow to label and disambiguate occurrences in texts: a morphological layer (Gibran 1.0), which relies on Arabic pattern as distinctive features; a contextual layer (Gibran 2.0), which uses contextual rules; and a third layer (Gibran 3.0), which uses a machine learning model. Our methodology is evaluated using the annotated corpus Arabic-PADT UD treebank. The evaluations obtain an F-measure of 0.92 and 0.90 for the morphological analyses. These experiments demontrate the possibility of improving such a corpus through linguistic analyses. This approach allowed us to develop a prototype of information extraction on technological innovations for the Arabic language. It is based on the morphological analysis and syntaxico-semantic patterns. This thesis is part of a PhD-entrepreneur course
16

Charanek, Nagham. "Analyse linguistiques de textes médicaux en langue arabe relatifs à la pneumologie". Nice, 1996. http://www.theses.fr/1996NICE2040.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
C'est d'abord la conviction que la TA peut donner de bons résultats lorsqu'elle est appliquée à des domaines "limites" en langue arabe qui nous a amené à travailler sur le langage de la pneumologie en arabe. A partir d'un corpus constitué par un ensemble de textes de pneumologie, nous nous sommes engagés dans un travail de formalisation de l'ensemble des structures nominales extraites du corpus donc nous avons dégagé toutes les informations lexicales caractéristiques. Le premier étant celui de l'unité lexicale, où nous avons étudié les mots simples et composés, sans oublier les problèmes terminologiques liés à la néologie. Au deuxième niveau, les critères distributionnels, ainsi qu'un modèle de représentation formelle ont été adopté pour montrer comment les éléments du syntagme nominal sont reliés entre eux sur la base du principe que tout syntagme nominal ou prépositionnel est constitué par "tête" et par un ou plusieurs "compléments" et "ajouts"
Initially, it is the conviction that automatic translation can give good results, when applied to "restricted" fields in arabic that has driven us to work on the pneumology language in arabic. From a corpus constituted by entire texts on pneumology, we have undertaken a fromalization of the whole nominal structures taken from the corpus and then we have extracted all the particular lexical information. Our analysis has been undolded at two levels : - the first is the lexical unity, where we have analysed the simple and composed nouns, without forgetting terminlogical problems related to neology; - at the second level, distributional criteria as well as a formal representation pattern have been adopted in order to show how elements of the noun phrase are linked between them, on the basis that each noun or prepositional phrase is composed by a "head" and by one or several "complements" and "additions"
17

Muñoz, Agustín. "La production poétique chilienne : période 1973-1983 : analyse sociologique de textes poétiques". Paris 4, 1986. http://www.theses.fr/1986PA040062.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'objectif de cette recherche est d'étudier la production poétique publiée pendant le régime militaire et d'analyser le contenu et la forme. Sont analyses les textes poétiques d'écrivains qui vivent au chili et en exil. Les résultats de la recherche montrent : - qu'il s'agit d'une poésie ouvertement politique - que les thèmes développés sont en rapport avec la répression et avec l'absence de liberté d'expression. - que le texte poétique devient instrument de lutte contre la dictature. - que les thèmes "classiques" de la poésie sont très minoritaires et traites d'une manière différente. - qu'il n'existe pas une coupure entre la poésie de l'intérieur et la poésie de l'exil. Les problématiques sont les mêmes. L'étude montre aussi les formes diverses d'organisation pour pouvoir publier au chili. Les limitations imposées par la censure et analyse la politique anti culturelle du régime militaire. Apres avoir rendu compte de l'opinion de douze écrivains chiliens sur la poésie, la dictature et l'exil, la recherche s'achève avec une anthologie poétique de l'actuel. L'étude analyse sociologiquement les textes de 46 poètes chiliens.
18

Clément, Julien. "Algorithmes, mots et textes aléatoires". Habilitation à diriger des recherches, Université de Caen, 2011. http://tel.archives-ouvertes.fr/tel-00913127.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Dans ce mémoire, j'examine différents aspects d'un objet simple mais omniprésent en informatique: la séquence de symboles (appelée selon le contexte mot ou chaîne de caractères). La notion de mot est au carrefour de domaines comme la théorie de l'information et la théorie des langages. S'il est simple, il reste fondamental: nous n'avons, au plus bas niveau, que cela à disposition puisqu'il arrive toujours un moment où une donnée doit être encodée en symboles stockables en mémoire. La quantité d'information croissante de données mise à disposition et qu'on peut stocker, par exemple des génomes d'individus ou des documents numérisés, justifie que les algorithmes et les structures de données qui les manipulent soient optimisés. En conséquence, les besoins d'analyse se font sentir pour guider le choix et la conception des programmes qui manipulent ces données. L'analyse en moyenne est ici particulièrement adaptée puisque les données atteignent une variété et des volumes tellement importants que c'est le cas typique qui traduit le mieux la complexité et non pas le cas le pire. Cela évidemment pose le problème de la modélisation de données qui reste encore très épineux. En effet on souhaite deux choses contradictoires: un modèle au plus près des données, qui traduise vraiment leurs spécificités, mais aussi un modèle permettant de donner des résultats, c'est-à-dire de prédire les performances (et on comprend vite que le modèle doit donc rester relativement simple pour qu'il subsiste un espoir de le traiter!). Les méthodes sont le plus souvent celles de la combinatoire analytique et font appel à un objet mathématique, les séries génératrices, pour mener les analyses à bien.
19

Saint-Germain, Isabelle. "Le passage de l'article scientifique au texte vulgarisé analyse de la structure, du contenu et de la rhétorique des textes". Mémoire, Université de Sherbrooke, 2004. http://savoirs.usherbrooke.ca/handle/11143/2361.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Les différents contextes de diffusion et de présentation d'un article scientifique et d'un article de vulgarisation scientifique nous ont amenée, dans le cadre de ce mémoire, à nous pencher sur le passage du texte scientifique au texte vulgarisé. Plus précisément, nous nous sommes demandée quelles sont les transformations, tant dans la structure des textes que dans leur contenu, et quels sont les effets rhétoriques que le processus de vulgarisation peut entraîner. Les questions Qui? Quoi? Où? Quand? Pourquoi? qu'on pose habituellement trouvent facilement leur réponse, mais afin de comprendre les transformations subies par le texte scientifique pour trouver sa forme vulgarisée, nous nous sommes principalement arrêtée au Comment ?, à savoir, comment les textes sont-ils rédigés dans les deux cas. Nous avons donc comparé un texte scientifique et un texte vulgarisé traitant exactement du même sujet et rédigés par le même auteur, de manière à sous-peser leurs caractéristiques globales."--Résumé abrégé par UMI.
20

Saint-Germain, Isabelle. "Le passage de l'article scientifique au texte vulgarisé : analyse de la structure, du contenu et de la rhétorique des textes". Sherbrooke : Université de Sherbrooke, 2004.

Cerca il testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
21

Nakamura-Delloye, Yayoi. "Alignement automatique de textes parallèles Français-Japonais". Phd thesis, Université Paris-Diderot - Paris VII, 2007. http://tel.archives-ouvertes.fr/tel-00266261.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'alignement automatique consiste à trouver une correspondance entre des unités de textes parallèles. Nous nous intéressons plus particulièrement à la réalisation d'un système qui procède à l'alignement au niveau des propositions, unités profitables dans beaucoup d'applications.
La présente thèse est constituée de deux types de travaux : les travaux introducteurs et ceux constituant le noyau central. Ce dernier s'articule autour de la notion de proposition syntaxique.
Les travaux introducteurs comprennent l'étude des généralités sur l'alignement ainsi que des travaux consacrés à l'alignement des phrases. Ces travaux ont conduit à la réalisation d'un système d'alignement des phrases adapté au traitement des textes français et japonais.
Le noyau de la thèse est composé de deux types de travaux, études linguistiques et réalisations informatiques. Les études linguistiques se divisent elles-mêmes en deux sujets : la proposition en français et la proposition en japonais. Le but de nos études sur la proposition française est de définir une grammaire pour la détection des propositions. Pour cet effet, nous avons cherché à définir une typologie des propositions, basée sur des critères uniquement formels. Dans les études sur le japonais, nous définissons d'abord la phrase japonaise sur la base de l'opposition thème-rhème. Nous tentons ensuite d'élucider la notion de proposition.
Les réalisations informatiques comportent trois tâches composant ensemble au final l'opération d'alignement des propositions, incarnées par trois systèmes informatiques distincts : deux détecteurs de propositions (un pour le français et un pour le japonais), ainsi qu'un système d'alignement des propositions.
22

Sánchez, Pérez F. Javier. "Recherches méthodologiques sur les conduites opérationnelles alternées en analyse relationnelle informatique des textes". Paris 8, 1992. http://www.theses.fr/1992PA080620.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Notre principale preoccupation a ete d'acceder le plus parfaitement possible aux systemes de relation qui sous-tendent la creation du langage. Or, au plan linguistique, l'analyse devient veritablement difficile si l'on veut explorer le texte non seulement du point de vue structurel mais egalement du point de vue syntaxique. C'est pourquoi les propositions methodologiques que nous presentons s'integrent a notre problematique de l'analyse relationnelle informatique des textes. Ainsi les evolutions technologiques nous ont permis de progresser dans l'elaboration d'une methodologie de recherche centree sur l'analyse en double contextualite : structurelle et syntaxique. Nous nous sommes donc achemines vers des procedures permettant, par alternances d'outils informatiques, a realiser des descriptions textuelles performantes
This research within their theoretical context, a set of precedures for the entry of complex texts on to micro-computers. This methodology wich takes the speaker and the context of speech into account is based on relational definition of forms and on a self-evolving dialectique. Among the possibilities it provides is the creation of data-banks which can lead to the drawing up of high performance textgenerating grammars
23

Lafourcade, Mathieu. "Lexique et analyse sémantique de textes - structures, acquisitions, calculs, et jeux de mots". Habilitation à diriger des recherches, Université Montpellier II - Sciences et Techniques du Languedoc, 2011. http://tel.archives-ouvertes.fr/tel-00649851.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'analyse sémantique de textes nécessite en préalable la construction d'objets relevant de la sémantique lexicale. Les vecteurs d'idées et les réseaux lexicaux semblent de bons candidats et constituent ensemble des structures complémentaires. Toutefois, faut-il encore être capable dans la pratique de les construire. Les vecteurs d'idées peuvent être calculés à partir de corpus de définitions de dictionnaires, de thésaurus ou encore de textes. Ils peuvent se décliner en des vecteurs conceptuels, des vecteurs anonymes ou des vecteurs lexicaux - chaque type présentant un équilibre différent entre précision, couverture et praticité. Quant aux réseaux lexicaux, ils peuvent être acquis efficacement via des jeux, et c'est précisément l'objet du projet JeuxDeMots. L'analyse sémantique peut être abordée par l'analyse thématique, et ainsi servir de moyen de calcul à des vecteurs d'idées (bouclage). Nous pouvons modéliser l'analyse comme un problème d'activation et de propagation. La multiplicité des critères pouvant intervenir dans une analyse sémantique, et la difficulté inhérente à définir une fonction de contrôle satisfaisante, nous amène à explorer l'usage de métaheuristiques bio-inspirées. Plus précisément, nous introduisons un modèle d'analyse par colonies de fourmis artificielles. A partir d'un texte, l'analyse vise a construire un graphe contenant les objets du texte (les mots), des objets identifiés comme pertinents (des syntagmes, des concepts) ainsi que des relations pondérées et typées entre ces objets.
24

Tassinari, Carlo Andrea. "Les nouvelles frontières du développement : l'idéologie durable, une analyse sémiotique des textes onusiens". Thesis, Toulouse 2, 2019. http://www.theses.fr/2019TOU20108.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
La thèse propose une généalogie du concept de « développement durable » par une analyse sémiotique de l’archive onusien. Le but est de dégager les contraintes idéologiques du discours juridique et parajuridique sur le « durable », à partir d’une typologie des discours des Sommets de la Terre de 1972 à 2012. Articulée en trois parties, la recherche s’ouvre sur la construction conjointe de la problématique des crises écologiques actuelles et du développement corrélatif du droit international de l’environnement : elle montre que les crises écologiques sont définies non pas comme des crises de la « nature en soi », mais d’abord comme des crises de la catégorie du « naturel » par opposition au « culturel » ; et qu’une telle catégorisation a orienté la formation des concepts théoriques et pratiques à la base du droit international de l’environnement. Dans la seconde partie, la thèse met en place les outils théoriques et méthodologiques pour l’analyse du corpus. À partir d’un état des lieux de la sémiotique juridique – ayant pris historiquement pour objet les textes et les interactions – la recherche aborde le corpus des Sommets dans la perspective plus large d’une sémiotique des cultures fondée sur l’unité d’étude de la « formation sémiotique ». De dérivation foucaldienne, le concept de formation met en évidence les liens entre discours, technologies et pratiques, permettant ainsi de retracer les logiques de contamination entre droit, science, politique et environnement donnant lieu à l’élaboration du concept de « développement durable ». En retraçant ces dérivations, la recherche met en évidence les tendances du droit international de l’environnement à une époque marquée par l’hybridation croissante entre humains et non-humains. La troisième partie propose une analyse ponctuelle des documents onusiens qui attestent les articulations généalogiques majeures du concept de « durable ». Tout en ayant un rôle de premier plan dans l’intégration juridico-politique des enjeux écologiques, cette notion résout la tension environnement/développement par la construction juridique d’un marché d’éthique environnementale, permettant de pérénniser le souci de la croissance par la traduction d’une limite écologique en valeur économique. C’est ce qui en fait une « idéologie durable », c’est-à-dire l’histoire d’un marché conçu pour durer, contre tout récit catastrophiste
This work provide a semiotic analysis on the evolution of international environmental law based on the concept of sustainable development as United Nations define it in the EarthSummit. In order to do so, the thesis organize the corpus of the Earth Summit records following the idea that they are bound together by a coherent strategy which deploys from 1972 to 2012, and found a typology of ONU's documents, encompassing directive and normative discourse. In the firs part, the work elaborate on the necessity of the semiotic account for a better understanding of both legal discourse and ecological tensions, which are both takled as practices of meaning construction. The second part provides a state of the art of the juridical semiotics, with particular emphasis to the problem of ideology in legal texts. Building on that, it elaborates on models for diachronic analysis and for the individualization of emerging tendencies in law. Starting from the concept of « discursive formation » by Foucault, it discuss the idea of « juridical formations » in the framework of a semiotic of « semiotic formations ». Finally, in the third part, th work provides a diachronic analysis of the way the concept of « sustainable development » has influenced United Nation legal production, as well as of how the ideological bias that impede the translation of the concept of « sustainable development » in effective legal rules. In conclusion, we will sketch the semantics paths that sustainable ideology didn't thematize, narrowed by the semiotic constraints that defines it : sustainable development maintains an idea of environmental law as a strategy to take economical advantage from limitation of pollution, new technology development and green economy, in brief, of object that we can dispose of. The juridical construction of an international market of environmental ethics thus opposes the idea of an ecological catastrophe by the identification of economic growth and ecological purposes : that’s precisely the ideological orientation defined as « durable » (« sustainable ») ideology. This perspective totally ignores the raising of a minor discourse which recongnizes that ecological objects have "interests", intertwined with the human ones, and that can be legally recognized seeking a mediations between humans and non-human actors in a project of cohabitation that has yet to be found
25

Ould, Abdel Vetah Mohamed. "Apprentissage automatique appliqué à l'extraction d'information à partir de textes biologiques". Paris 11, 2005. http://www.theses.fr/2005PA112133.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Dans le cadre de cette thèse nous nous sommes intéressés à l'extraction d'informations à partir de données textuelles. Dans ce domaine, deux grandes approches co-existent. La première, qui consiste en un traitement statistique superficiel présente l'avantage d'avoir une mise en oeuvre facile. En revanche, l'information extraite est souvent imprécise, de nature incomplète et bruitée. La deuxième voie, consiste à privilégier des techniques plus profondes d'analyse et de normalisation textuelles ainsi que l'exploitation des techniques d'apprentissage automatique pour acquérir les ressources nécessaires à la tâche. Ce type d'approche, complexe et dont la mise en oeuvre est difficile permet une meilleure prise en compte de la diversité des formulations dans le texte. Il permet également un gain de temps appréciable quand il s'agit d'adapter les ressources, notamment quand la tâche d'extraction change. Dans cette thèse, nous avons contribué à la mise en place d'une chaîne complète d'extraction des interactions géniques à partir de résumés scientifique issus de MedLine basée sur cette seconde famille d'approches. Dans la première partie de notre travail, nous avons mis au point un module de filtrage de phrases, disponible en ligne et déjà utilisé par les biologistes, permettant d'identifier automatiquement les phrases parlant d'interactions. Dans un deuxième temps, nous avons proposé une méthode originale d'acquisition de règles d'extraction basée sur une abstraction de l'analyse syntaxique Les résultats préliminaires obtenus sont prometteurs et montrent que cette abstraction permet d'obtenir une bonne représentation pour l'apprentissage des règles d'extraction
This thesis is about information extraction from textual data. Two main approaches co-exist in this field. The first approach is based on shallow text analysis. These methods are easy to implement but the information they extract is often incomplete and noisy. The second approach requires deeper structural linguistic information. Compared to the first approach, it has the double advantage of being easily adaptable and of taking into account the diversity of formulation which is an intrinsic characteristic of textual data. In this thesis, we have contributed to the realization of a complete information extraction tool based on this latter approach. Our tool is dedicated to the automatic extraction of gene interactions described in MedLine abstracts. In the first part of the work, we develop a filtering module that allows the user to identify the sentences referring to gene interactions. The module is available on line and already used by biologists. The second part of the work introduces an original methodology based on an abstraction of the syntactic analysis for automatical learning of information extraction rules. The preliminary results are promising and show that our abstraction approach provides a good representation for learning extraction rules
26

Hankach, Pierre. "Génération automatique de textes par satisfaction de contraintes". Paris 7, 2009. http://www.theses.fr/2009PA070027.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Nous nous intéressons dans cette thèse à la construction d'un système de génération automatique - un logiciel informatique capable de transformer une représentation formelle de l'information en un texte en langage naturel. Dans notre approche, nous définissons la génération comme un problème de satisfaction de contraintes (CSP). Le système résultant garantit un traitement intégré des opérations de la génération car les différentes dépendances sont prises en compte et aucune priorité n'est donnée à un type d'opération par rapport aux autres. Pour définir le problème de satisfaction de contraintes, nous représentons les opérations de construction du texte par des variables de décision. Les opérations individuelles qui réalisent un même type d'expressions minimales dans le texte sont groupées ensemble et constituent une tâche de la génération. Nous classons les variables de décision selon les types d'opérations qu'elles représentent (e. G. Variables de sélection du contenu, variables de structuration du document. . . ). Les règles linguistiques régissant les opérations sont représentées par des contraintes sur les variables. Une contrainte peut être définie sur des variables d'un ou plusieurs type(s), marquant la dépendance entre les opérations correspondantes. La production d'un texte consiste en la résolution du système global des contraintes, c'est-à-dire trouver une affectation complète des variables qui ne viole pas les contraintes. Dans le cadre de la définition de la grammaire de contraintes, nous formulons notamment la partie qui régit les opérations de structuration du document. Nous modélispns par des contraintes la structure rhétorique développée par la SORT afin d'aboutir à des textes cohérents à la sortie du générateur. Auparavant, afin d'augmenter les capacités de génération de notre système, nous étendons cette structure rhétorique pour couvrir les textes non canoniques. En plus de la définition de ces contraintes pour la cohérence, nous formulons un ensemble de contraintes qui permettent de façonner la macrostructure en fonction des buts communicatifs afin de favoriser leur réalisation. Enfin, nous proposons une solution au problème de la complexité de calcul de la génération de textes de grande taille. Cette solution repose sur la génération de ces textes par paquet de propositions. Le problème de génération du texte global est ainsi défini comme plusieurs problèmes de génération de parties du texte. Ces parties sont de taille limitée et la complexité associée à leur génération reste raisonnable. Le partitionnement proposé est motivé par des considérations linguistiques
We address in this thesis the construction of a natural language generation System - computer software that transforms a formal representation of information into a text in natural language. In our approach, we define the generation problem as a constraint satisfaction problem (CSP). The implemented System ensures an integrated processing of generation operations as their different dependencies are taken into account and no priority is given to any type of operation over the others. In order to define the constraint satisfaction problem, we represent the construction operations of a text by decision variables. Individual operations that implement the same type of minimal expressions in the text form a generation task. We classify decision variables according to the type of operations they represent (e. G. Content selection variables, document structuring variables. . . ). The linguistic rules that govern the operations are represented as constraints on the variables. A constraint can be defined over variables of the same type or different types, capturing the dependency between the corresponding operations. The production of a text consists of resolving the global System of constraints, that is finding an evaluation of the variables that satisfies all the constraints. As part of the grammar of constraints for generation, we particularly formulate the constraints that govern document structuring operations. We model by constraints the rhetorical structure of SORT in order to yield coherent texts as the generator's output. Beforehand, in order to increase the generation capacities of our System, we extend the rhetorical structure to cover texts in the non-canonical order. Furthermore, in addition to defining these coherence constraints, we formulate a set of constraints that enables controlling the form of the macrostructure by communicative goals. Finally, we propose a solution to the problem of computational complexity of generating large texts. This solution is based on the generation of a text by groups of clauses. The problem of generating a text is therefore divided into many problems of reduced complexity, where each of them is concerned with generating a part of the text. These parts are of limited size so the associated complexity to their generation remains reasonable. The proposed partitioning of generation is motivated by linguistic considerations
27

Nguyen, Thi Minh Huyen. "Outils et ressources linguistiques pour l'alignement de textes multilingues français-vietnamiens". Phd thesis, Université Henri Poincaré - Nancy I, 2006. http://tel.archives-ouvertes.fr/tel-00105592.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Le travail présenté dans ce mémoire porte sur la construction des outils et ressources linguistiques pour les tâches fondamentales de traitement automatique de la langue vietnamienne, dans un contexte monolingue ainsi que multilingue. Nous présentons pour cette langue encore peu étudiée des solutions possibles aux problèmes d'annotation morpho-syntaxique (définition de descripteurs lexicaux « de référence », construction d'un lexique avec ces descriptions, des outils de segmentation et d'étiquetage lexical), d'analyse syntaxique (première tentative de modélisation de la grammaire vietnamienne en employant le formalisme TAG, cadre de construction de ressources pour l'analyse syntaxique) et d'alignement multilingue (constitution d'un corpus multilingue, développement d'un système d'alignement multilingue). Afin d'assurer la réutilisabilité des travaux réalisés, et dans l'espoir de les voir stimuler le développement du TAL au Vietnam, nous avons apporté une attention particulière aux questions de normalisation de la gestion des ressources linguistiques.
28

Nakamura, Delloye Yayoi. "Alignement automatique de textes parallèles français - japonais". Paris 7, 2007. http://www.theses.fr/2007PA070054.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'alignement automatique consiste à trouver une correspondance entre des unités de textes parallèles. Nous nous intéressons plus particulièrement à la réalisation d'un système qui procède à l'alignement au niveau des propositions, unités profitables dans beaucoup d'applications. La présente thèse est constituée de deux types de travaux : les travaux introducteurs et ceux constituant le noyau central. Ce dernier s'articule autour de la notion de proposition syntaxique. Les travaux introducteurs comprennent l'étude des généralités sur l'alignement ainsi que des travaux consacrés à l'alignement des phrases. Ces travaux ont conduit à la réalisation d'un système d'alignement des phrases adapté au traitement des textes français et japonais. Le noyau de la thèse est composé de deux types de travaux, études linguistiques et réalisations informatiques. Les études linguistiques se divisent elles-mêmes en deux sujets : la proposition en français et la proposition en japonais. Le but de nos études sur la proposition française est de définir une grammaire pour la détection des propositions. Pour cet effet, nous avons cherché à définir une typologie des propositions, basée sur des critères uniquement formels. Dans les études sur le japonais, nous définissons d'abord la phrase japonaise sur la base de l'opposition thème-rhème. Nous tentons ensuite d'élucider la notion de proposition. Les réalisations informatiques comportent trois tâches composant ensemble au final l'opération d'alignement des propositions, incarnées par trois systèmes informatiques distincts : deux détecteurs de propositions (un pour le français et un pour le japonais), ainsi qu'un système d'alignement des propositions
Automatic alignment aims to match elements of parallel texts. We are interested especially in the implementation of a System which carries out alignment at the clause level. Clause is a beneficial linguistic unit for many applications. This thesis consists of two types of works: the introductory works and those that constitute the thesis core. It is structured around the concept of syntactic clause. The introductory works include an overview of alignment and studies on sentence alignment. These works resulted in the creation of a sentence alignment System adapted to French and Japanese text processing. The thesis core consists of two types of works: linguistic studies and implementations. The linguistic studies are themselves divided into two topics: French clause and Japanese clause. The goal of our French clause studies is to define a grammar for clause identification. For this purpose, we attempted to define a typological classification of clauses, based on formal criteria only. In Japanese studies, we first define the Japanese sentence on the basis of the theme-rheme structure. We then try to elucidate the notion of clause. Implementation works consist of three tasks which finally constitute the clause alignment processing. These tasks are carried out by three separate tools: two clauses identification Systems (one for French texts and one for Japanese texts) and a clause alignment System
29

Ben, Hazez Slim. "Un modèle d'exploration contextuelle du contenu des documents textuels : conception et réalisation d'un système informatique SEMANTEXT de filtrage et de structuration des textes". Paris 4, 2002. http://www.theses.fr/2002PA040088.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Le travail présenté dans cette thèse se focalise sur le développement de technique d'accès aux information textuelles selon différents points de vue. Dans cette optique, nous proposons un modèle un modèle en trois niveaux d'exploration contextuelle du contenu des textes. Ce modèle à pour bue de décrire d'une manière compacte et intuitive des données linguistiques et des opérations premier niveau est constitué d'un langage de description de motifs linguistiques. Le deuxième propose une algèbre d'expressions de repérage contextuel (ou ERC). Le dernier consiste en un langage de description de règles d'exploration contextuelle. Ces composants permettent de décrire divers phénomène linguistiques et textuels de surface et de spécifier des opérations de sélection qui portent sur différents niveaux d'organisation du texte. Ils forment le noyau de bases du système SEMAN'TEXT dont l'architecture s'articule autour d'un modèle dynamique du texte représenté sous forme d'un graphe décoré. L'architecture adoptée permet de réaliser et de mettre en interaction plusieurs tâches d'extraction. Ce travail s'appuie sur notre première expérience dans le développement du système CONTEXTO
This work outlines the development of technical means to research textual data from several point of view. In this framework, we propose a model with three levels of contextual exploration of content of textual documents. This models aims to describe linguistic data and textual operations which are dedicated to several extracting and labelling tasks of textual objects. The first level is a linguistic pattern matching language. The second one puts forward an algebra of describing expressions of contextual text searching. The last one is a language of contextual exploration rules. These components provide means to describe several linguistic and textual shallow regularities and to specify operations of contextual text searching. These components are the kermel of SEMAN'TEXT. The architecture of semantext permits the development and the interaction of several extracting tasks through a dynamic text model (represented by a decorated graph). This work relies on my first study acquired in the framework of the design of CONTEXTO
30

Smail, Nabila. "Contribution à l'analyse et à la recherche d'information en texte intégral : application de la transformée en ondelettes pour la recherche et l'analyse de textes". Phd thesis, Université Paris-Est, 2009. http://tel.archives-ouvertes.fr/tel-00504368.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'objet des systèmes de recherche d'informations est de faciliter l'accès à un ensemble de documents, afin de permettre à l'utilisateur de retrouver ceux qui sont pertinents, c'est-à-dire ceux dont le contenu correspond le mieux à son besoin en information. La qualité des résultats de la recherche se mesure en comparant les réponses du système avec les réponses idéales que l'utilisateur espère recevoir. Plus les réponses du système correspondent à celles que l'utilisateur espère, plus le système est jugé performant. Les premiers systèmes permettaient d'effectuer des recherches booléennes, c'est à dire, des recherches ou seule la présence ou l'absence d'un terme de la requête dans un texte permet de le sélectionner. Il a fallu attendre la fin des années 60, pour que l'on applique le modèle vectoriel aux problématiques de la recherche d'information. Dans ces deux modèles, seule la présence, l'absence, ou la fréquence des mots dans le texte est porteuse d'information. D'autres systèmes de recherche d'information adoptent cette approche dans la modélisation des données textuelles et dans le calcul de la similarité entre documents ou par rapport à une requête. SMART (System for the Mechanical Analysis and Retrieval of Text) [4] est l'un des premiers systèmes de recherche à avoir adopté cette approche. Plusieurs améliorations des systèmes de recherche d'information utilisent les relations sémantiques qui existent entre les termes dans un document. LSI (Latent Semantic Indexing) [5], par exemple réalise ceci à travers des méthodes d'analyse qui mesurent la cooccurrence entre deux termes dans un même contexte, tandis que Hearst et Morris [6] utilisent des thésaurus en ligne pour créer des liens sémantiques entre les termes dans un processus de chaines lexicales. Dans ces travaux nous développons un nouveau système de recherche qui permet de représenter les données textuelles par des signaux. Cette nouvelle forme de représentation nous permettra par la suite d'appliquer de nombreux outils mathématiques de la théorie du signal, tel que les Transformées en ondelettes et jusqu'a aujourd'hui inconnue dans le domaine de la recherche d'information textuelle
31

Garcia, Daniela. "Analyse automatique des textes pour l'organisation causale des actions : réalisation du système informatique COATIS". Paris 4, 1998. http://www.theses.fr/1998PA040048.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Le système de COATIS met en oeuvre une méthode opérationnelle pour passer des textes à des représentations sémantiques impliquant la notion de causalité. Il analyse des textes d'un domaine technique quelconque pour élaborer, à partir de connaissances linguistiques sur l'expression de la notion de causalité en français, une structuration des connaissances causales repérées dans les documents. L'intérêt d'une telle méthodologie est double. Ce traitement informatique de textes en français s'affranchit d'une analyse syntaxique exhaustive des phrases et il ne fait pas appel à des connaissances du domaine étudié (comme par exemple des terminologies, des thesaurus ou des ontologies). C'est ainsi que COATIS est très robuste et qu'il est bien adapté au processus d'acquisition de connaissances causales par exploration de textes
The approach adopted to build COATIS system aims at finding an operational method for constructing representations from a text, taking into account the causality notion. The system processes technical texts of any domain to elaborate, from linguistic knowledge on the expression of the notion of causality as it is expresses in French, a model of the causal knowledge detected in the documents. .
32

Zucchiatti, Marie Line <1964&gt. "La traduction des textes de théatre. Analyse comparée des réalités contemporaines française et italienne". Doctoral thesis, Alma Mater Studiorum - Università di Bologna, 2011. http://amsdottorato.unibo.it/4174/1/zucchiatti_marieline_tesi.pdf.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
The aim of the present study is to address contemporary drama translation by comparing two different scenarios, namely France and Italy. For each country, the following areas are described: publications of translated drama texts, their promotion and dissemination, the legal framework concerning copyright in publication and performance contracts. Moreover, the analysis highlights that the translation process of drama texts is part of a working cycle networking different professional figures, such as dramatic authors, directors, actors and publishers. Within this cycle, the translator is in a middle and central position at the same time, a sort of border zone between different contexts, i.e. the source language and culture and the target language and culture. As regards translation-related issues, on the basis of theoretical approaches that can be applied to drama translation, a number of translators’ opinions, statements, positions and practices are compared, thus highlighting an idea of drama translation wavering between translation and adaptation. Drama translators seem to follow these two orientations simultaneously, in compliance with translation ethics and the functional needs of target texts. Such ambivalence is due to the desire and difficulty of translating the specific nature of drama texts, i.e. translating textual elements that are linked, eventually, to stage performance. Indeed, the notion of text or form fidelity is replaced by the notion of fidelity to the theatrical value of a text, in terms of fidelity to its theatrical nature and rhythmical tension. The analysis reveals that drama translators work together with theatre operators, and that in many cases translators are authors, directors or actors themselves. These drama skills enable translators to apply relevant strategies when translating elements that generate rhythm, thus choosing from deleting, reproducing or recreating.
33

Zucchiatti, Marie Line <1964&gt. "La traduction des textes de théatre. Analyse comparée des réalités contemporaines française et italienne". Doctoral thesis, Alma Mater Studiorum - Università di Bologna, 2011. http://amsdottorato.unibo.it/4174/.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
The aim of the present study is to address contemporary drama translation by comparing two different scenarios, namely France and Italy. For each country, the following areas are described: publications of translated drama texts, their promotion and dissemination, the legal framework concerning copyright in publication and performance contracts. Moreover, the analysis highlights that the translation process of drama texts is part of a working cycle networking different professional figures, such as dramatic authors, directors, actors and publishers. Within this cycle, the translator is in a middle and central position at the same time, a sort of border zone between different contexts, i.e. the source language and culture and the target language and culture. As regards translation-related issues, on the basis of theoretical approaches that can be applied to drama translation, a number of translators’ opinions, statements, positions and practices are compared, thus highlighting an idea of drama translation wavering between translation and adaptation. Drama translators seem to follow these two orientations simultaneously, in compliance with translation ethics and the functional needs of target texts. Such ambivalence is due to the desire and difficulty of translating the specific nature of drama texts, i.e. translating textual elements that are linked, eventually, to stage performance. Indeed, the notion of text or form fidelity is replaced by the notion of fidelity to the theatrical value of a text, in terms of fidelity to its theatrical nature and rhythmical tension. The analysis reveals that drama translators work together with theatre operators, and that in many cases translators are authors, directors or actors themselves. These drama skills enable translators to apply relevant strategies when translating elements that generate rhythm, thus choosing from deleting, reproducing or recreating.
34

Le, Roux Estelle. "Extraction d'information dans des textes libres guidée par une ontologie : faciliter l'indexation du rendu audiovisuel d'un événement par l'indexation conceptuelle de textes relatant cet événement". Paris 10, 2003. http://www.theses.fr/2003PA100027.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'INA a besoin pour que ses archives audiovisuelles puissent être utilisées de bien connaître le contenu de ses documents. Les documentalistes doivent alors visionner ces documents et les indexer. Afin d'apporter une aide aux documentalistes, nous avons créé un système d'extraction d'information s'appliquant sur des articles de presse écrite. Nous partons de l'hypothèse q'un même événement est, à la fois, décrit dans la presse écrite et visible à la télévision. Nous avons alors conçu notre système en nous servant d'une ontologie du domaine pour créer un dictionnaire sémantique et des patrons syntaxico-sémantiques. Nous obtenons, en sortie, des index conceptuels qui pourront être utilisés par les documentalistes lors de l'indexation. Les résultats obtenus sont mitigés : la grande variabilité de la langue dans les articles entra^inent la création d'un nombre important de patrons mais la presse écrite permet d'extraire des informations pertinentes pour l'INA
INA needs so that its audio-visual files can be used to know the contents of its documents well. The documentalists must then view these documents and index them. In order to bring a help to the documentalists, we created an information extraction system while being useful to us of an ontology to create a semantic dictionary and syntaxical and semantic patterns. At the end, we obtain conceptual indices which could be used by the documentalists at the time of indexing. The results obtained are mitigated : the great variability of the language in the articles involves the creation of a significant number of patterns but the newspaper makes it possible to extract relevant information for INA
35

Kosawat, Krit. "Méthodes de segmentation et d'analyse automatique de textes thaï". Phd thesis, Université Paris-Est, 2003. http://tel.archives-ouvertes.fr/tel-00626256.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Ce travail de thèse a pour objectif de concevoir et réaliser un module informaticolinguistique apte à effectuer des analyses automatiques de textes thaï sous le système INTEX © . Basé fondamentalement sur les langues indo-européennes écrites avec l'alphabet latin, INTEX © rencontre quelques difficultés pour travailler sur une langue très différente comme le thaï. Le problème crucial est la segmentation en mots et en phrases, étant donné que le thaï n'a pas de séparateur de mot : une phrase est écrite en une séquence de lettres continues, et les séparateurs de phrase sont fréquemment ambigus. Aussi avons-nous développé et évalué deux méthodes de segmentation en mots, par expressions rationnelles et par transducteurs à nombre fini d'états, qui découpent respectivement des textes thaï en lettres et en syllabes. Nous avons également créé les dictionnaires électroniques du thaï qui servent à la fois à reconnaître les mots à partir des lettres ou des syllabes et à les étiqueter avec les codes syntaxiques et sémantiques. Deux méthodes de segmentation en phrases thaï, par la ponctuation et par mots-clés, sont également proposées et évaluées. Nous montrons enfin que, grâce à notre travail, INTEX © est capable d'analyser des documents thaï, malgré toutes les difficultés.
36

Roussarie, Laurent. "Un modele theorique d'inference de structures semantiques et discursives dans le cadre de la generation automatique de textes". Paris 7, 2000. http://www.theses.fr/2000PA070059.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Cette these est consacree au probleme de la structuration du discours dans la perspective de la ge♭ neration automatique de textes. De nombreux travaux abordent cette operation en montrant qu'elle doit intervenir des les premieres etapes du processus de generation. Il est courant, egalement, de constater que les modeles de structuration de discours proposes jusqu'ici tiennent pour acquise et predeterminee la notion de proposition, c'est-a-dire une classe d'objets qui sont deja de nature lin♭ guistique. Nous commencons par souligner le paradoxe que ce type d'approches peut induire : un generateur produit du texte a partir de donnees supposees independantes de la langue ; or d'une part la structuration du discours consiste habituellement a agencer des lots de propositions et d'autre part ledecoupage et le dosage de l'information dans des formes propositionnelles ressortissent deja a la mise en discours, c'est-a-dire a la mise en langue. Notre etude propose alors un modele theorique de generation profonde systematique qui, par hy♭ pothese, prend en entree des donnees codees sous forme mathematique pour les affranchir de tout prejuge linguistique. Le champ d'etude est delimite en s'appliquant au cas des recits portant sur des phenomenes spatio-temporels, et l'objectif central est de produire toutes les paraphrases discursives possibles pour relater un meme episode. Le modele consiste en un jeu d'inferences logiques qui parcourt un systeme de representations stratifie. Plusieurs ensembles de regles permettent tour a tour d'inferer d'abord des formulations logiques elementaires, puis des schemas d'evenements, puis des propositions minimales et enfin des plans de discours structures par des relations rhetoriques et qui s'inscrivent dans le cadre de la sdr. T (segmented discourse representation theory). Nous insistons egalement sur la necessite de gerer rigoureusement des phenomenes semantiques comme les inferences implicites ou les presuppositions.
37

Babou, Igor Compte Carmen Cheveigné Suzanne de. "Science, télévision et rationalité : Analyse du discours télévisuel à propos du cerveau". [S.l.] : [s.n.], 1999. http://w4.ens-lsh.fr/e-textes/theses/1999/babou-i.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
38

Rodriguez, Suarez Sabine. "L'évaluation de la compréhension de textes narratifs en fin d'école primaire". Thesis, Sorbonne Paris Cité, 2017. http://www.theses.fr/2017USPCB224/document.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'évaluation d'un objet est intrinsèquement liée à la définition que l'on pose de celui-ci. Si à un certain niveau de généralité, ce qu'est comprendre un texte semble aller de soi, une recension des travaux en psychologie cognitive, du développement, en didactique, en sociolinguistique, montre au contraire le caractère polymorphe de cet objet qu'on peine à définir. Dès lors, comment évaluer ce que l'on peine à circonscrire, même par exclusion ? Toujours dans le but de cerner ce qu'on entend par compréhension, nous avons mené quatre enquêtes. La première repose sur des entretiens avec des enseignants autour d'une épreuve (texte + questions), en vue de décrire leur manière de se représenter la compréhension et ses difficultés. La deuxième, centrée sur l'analyse des questions repose sur la constitution et une première analyse d'un corpus d'environ 200 questions proposées lors d'évaluations nationales sur la compréhension de textes narratifs. Analyser les questions ne pouvant se faire sans prendre en compte l'activité de réponse, nous avons proposé ensuite deux expériences. La première procède d'une sorte de raisonnement par « l'absurde »: peut-on répondre à des questionnaires de compréhension sans le texte y afférant ? La seconde a pour but de cerner les spécificités des épreuves, en proposant aux mêmes élèves quatre tâches (rappel, reconnaissance, jugement d'importance et QCM) sur deux textes différents. Ces analyses convergent pour montrer que chaque tâche donne un portrait différent de la compréhension et que l'on passe parfois rapidement d'une compréhension d'un texte à la compréhension de textes
The evaluation of an object is intrinsically linked to the way one defines it. In seeking to define narrative texts comprehension, we have educed multiple facets of this process: cognitiv psychology, psychology of development, didactics, sociolinguistics, which each in their way clarifies an aspect of texts comprehension. This being the case, how can an object so polymorphous be evaluated? To properly understand the functioning of MCQs, the most common method for evaluating texts comprehension, we have undertaken four separate investigations. The first was based on interviews with teachers about a given examination (text plus questions), with the aim of being able to formulate how one depicts texts comprehension and its difficulties. The second investigation, centered on the analysis of questions, was based on the constitution of a corpus of about 200 questions used in nationwide tests of narrative texts comprehension , and a first-level analysis. Analyzing questions necessitates taking into consideration the activity of replying to questions, so we developed two further experiments. The first proceeded from a sort of "reasoning by the absurd": can one reply to questions without cognizance of the corresponding text? The second aimed to identify the specificities of tests, by proposing to the same students four tasks (recall, recognition, relative importance judgments and QMCs) for two different texts. These analyses converge to demonstrate that each kind of task generates a specific profile view of texts comprehension, and that sometimes one passes rapidly from the comprehension of a given text to the general texts comprehension reading competencies
39

Weber, Stefanie Stricker Der. "Strickers "Karl der Grosse" Analyse der Überlieferungsgeschichte und Edition des Textes auf Grundlage von C". Hamburg Kovač, 2010. http://d-nb.info/1003268536/04.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
40

Denoyelle, Corinne. "Le dialogue dans les textes courtois des XIIe et XIII siècles : analyse pragmatique et narratologique". Paris 3, 2006. http://www.theses.fr/2006PA030081.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
À partir d’un corpus de récits courtois, longs ou brefs, en vers ou en prose des XIIe et le XIIIe siècles, cette thèse analyse la complexification des dialogues. Celle-ci est liée au développement du contexte spatio-temporel, non verbal et paraverbal qui les entoure et à l’augmentation du nombre de locuteurs. Elle entraîne la recherche d’effets prosodiques et pragmatiques et l’invention de répliques sans rôle dramatique pour mimer l’improvisation de la parole. Les enchaînements privilégiés d’actes de langage sont étoffés pour représenter des péripéties ou la stagnation d’une conversation. On compare les dialogues romanesques à des conversations authentiques par le biais des actes de langage du compliment et du reproche et avec les modèles possibles des dialogues judiciaires, religieux ou universitaires. L’étude de leurs fonctions dramatique, descriptive, émotive et idéologique montre l’importance qu’ils prennent dans la prose arthurienne où ils servent l’illusion d’un monde complet
Fictional dialogues become more complicates during the twelfth and the thirteenth centuries in verse or prose courtly novels or short stories. This comes through the development of the spatiotemporal or non verbal and paraverbal context and through the increasing speakers number. It brings about the search of prosodic and pragmatical effects and the invention of lines without any narrative interest in order to copy natural movements of conversations. Privileged speech acts linking are filled out to represent the fact that the discussion is not making any progress or is dealing with events. Fictional dialogues are compared to authentic ones through the analysis of the speech acts of congratulations or reproaches and through the institutional models of judiciary, religious or scholarship colloquies. Their narrative, characterizing, emotional or ideological functions show the increasing importance they have in Arthurian prose where they contribute to create an illusive whole world
41

Le, Deley Eric. "L'intemporalité des principes de négociation, analyse comparée des textes anciens et récents sur la négociation". Thesis, Reims, 2011. http://www.theses.fr/2011REIME006/document.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
L'intemporalité des principes de négociation, analyse comparée des textes anciens et récents sur la négociation. [Pas de résumé transmis]
The timelessness of the principles of negociation, comparative analysis of ancient texts and recent negociations. [Pas de résumé transmis]
42

Krylyschin, Marina. "Propositions pour une analyse de discours en situation de réception : textes d'exposition et livres d'or". Thesis, Paris 5, 2014. http://www.theses.fr/2014PA05H030.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
À partir de l’analyse d’une situation d’énonciation singulière, celle d’un espace d’exposition artistique, nous avons entrepris d’observer et de décrire la prégnance de la connaissance et des représentations dans la réception artistique. Notre objet de recherche comporte plusieurs aspects : le premier concerne la réception de la connaissance artistique (en analysant les discours sources –textes d’exposition – et les traces de leur réception dans les livres d’or); le second cherche à décrire sur le plan linguistique l’expression de l’expérience ou de l’émotion esthétique. La description des discours s’effectue à partir d’un corpus constitué des textes de trois expositions (La fabrique des images et Tarzan ! au musée du quai Branly, Renoir au XXe siècle au Grand Palais) ainsi que de leurs livres d’or. Le cadre d’analyse est celui de l’analyse de discours telle qu’elle se pratique dans les pays francophones, qui associe analyse linguistique du sens et description formelle des énoncés. Toutefois la nature de notre corpus et de notre objet empirique (l’espace d’exposition) nous a amenée à envisager un cadre théorique et méthodologique de l’analyse des discours de la réception artistique davantage orienté vers les notions de perception et de subjectivité. Au travers du concept opératoire de « contexte perçu » nous pourrons analyser les représentations que les scripteurs des livres d’or ont de l’exposition, de l’artiste ou de l’œuvre exposée. Les expériences esthétiques seront observées à l’aune de ces représentations et de la connaissance reçue
From the analysis of a singular enunciation, more precisely that of an artistic exhibition space, we have undertaken to observe and describe the knowledge's and representations' influence in the artistic reception. Our research consists of several aspects: the first one concerns the artistic knowledge's reception (by analyzing the sources speeches -Exhibitions' texts- and the traces of their reception in the “Livres d'or”); the second one looks for in a linguistically speaking, the expression of the experience or the aesthetic emotion. The speeches' description is made from a corpus constituted of three exhibitions' texts (La fabrique des images and Tarzan! at the Quai branly museum, and Renoir au Xxe siècle at the Grand Palais) as well as their “Livres d'or”. The analysis' framework is the speech's analysis as spoken in the French-speaking countries, which associate linguistic's analysis of the line and formal descrption of terms. However the type of our corpus and our empirical object (Exhibition's space) has led us to consider a theoretical and methodological framework of reception's speeches' analysis more oriented toward to the notion of perception and subjectivity. Through the working concept “Contexte perçu”, we will be able to analyse the representations that the “livres d'or” 's writers have of the exhibition, the artist or of the exposed painting. Aesthetic experiences will be observed in accordance with these representations and the received knowledge
43

Vinot, Romain. "Classification automatique de textes dans des catégories non thématiques". Phd thesis, Télécom ParisTech, 2004. http://pastel.archives-ouvertes.fr/pastel-00000812.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
La classification automatique de textes était jusqu'à présent employée pour l'indexation documentaire. À travers quatre exemples, nous présentons quelques caractéristiques de nouveaux contextes applicatifs ainsi que leurs conséquences pour les algorithmes existants. Nous mettons en évidence le fait que Rocchio, d'ordinaire peu performant, est particulièrement adapté aux corpus bruités et à une utilisation semi-automatique mais très désavantagé avec des classes définies par plusieurs thèmes. Nous proposons une extension de Rocchio, Rocchio Multi-Prototypes, pour gérer les classes multi-thématiques en adaptant la complexité de son modèle d'apprentissage. RMP utilise un algorithme de classification faiblement supervisée qui détecte des sous-classes et sélectionne les plus utiles pour la catégorisation. Nous proposons aussi un algorithme de détection de changements de concepts dans des corpus à flux temporel à partir du calcul du taux d'activité des sous-classes.
44

Cotto, Daniel. "Traitement automatique des textes en vue de la synthèse vocale". Toulouse 3, 1992. http://www.theses.fr/1992TOU30225.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Ce travail se situe dans le cadre du traitement automatique du langage naturel. Nous nous interessons plus particulierement a la synthese de texte quelconque. Notre objectif est d'ameliorer la qualite des synthetiseurs vocaux actuellement commercialises pour, d'une part, offrir aux handicapes visuels une interface d'entree-sortie de substitution plus conviviale et, d'autre part, faire en sorte qu'un jour la synthese vocale soit consideree comme une interface complementaire aux entrees-sorties standards. Nous exposons la problematique de la synthese vocale a partir de texte ainsi que diverses methodes permettant d'effectuer une analyse linguistique des textes. Cette etude nous a conduit au developpement de deux outils de pretraitement linguistiques: texor et texorplus. Le developpement de texorplus a ete effectue sous l'environnement de assp egalement realise durant cette these. Texor est un environnement parametrable pour synthetiser des textes quelconques en se fixant comme priorite un temps de reponse reduit. Il se compose d'un module metatextuel et d'un module textuel pour notamment prendre en compte les traits de presentation et les inattendus (sigles, abreviations,. . . ). Texorplus a pour but de prendre en compte les textes quelconques en se fixant comme priorite une prosodie de qualite. Il effectue a l'aide de assp une analyse syntaxique des phrases pour positionner des marqueurs prosodiques. Assp est un analyseur linguistique pouvant prendre en compte certains aspects syntaxiques, semantiques voire pragmatiques du langage. Pour realiser l'analyse, celui-ci combine les formalismes bases sur l'unification aux reseaux de transition augmentes
45

Maya, Fatima. "L'élaboration d'un récit écrit par des élèves de cinquième à partir de textes-sources : son interprétation : aspects syntaxiques, sémantiques et textuels". Paris 5, 1998. http://www.theses.fr/1998PA05H072.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Le fil conducteur est la notion d'interprétation de texte. En partant de la perspective dialogique de Bakhtine selon laquelle le sujet comme le texte (discours) sont traverses par une irréductible altérite, notre but est de montrer que l'interprétation (notion inscrite dans celle de circulation discursive) du texte ne vise pas à découvrir le "sens" cache d'un objet mais plutôt de modifier le "sens" de cet objet en le plaçant dans un autre cadre. A partir d'un corpus de 12 textes d'élèves de 5eme sur deux thèmes, notre étude vise à tester leur créativité (des élèves) comme dialogue et à concevoir leur créativité comme mélange. Les indices de l'analyse utilisent dans la 3ème et les 4ème parties sont liés à la notion de genre et à celle de sous-genre. La créativité par mélange apparaitra comme illustrant le "style" du sujet racontant qui n'est pas ce qui pourrait être traduit mais ce qui est manifeste dans l'organisation même du discours, et dans les changements de genres, de sources. . . A la fin de l'analyse de chaque tache on réfléchit sur les ressemblance-différences des histoires racontées au niveau des contenus, des organisateurs dominants, et des rapports aux textes originaux
In this thesis, the text interpretation is the guiding notion. We use the Bakhtine dialogic perspective. Following this perspective, an indomitable "alterité" is present into the "subject" and into the text (discourse). We want to show the aim of the text interpretation (notion included into the discursive circulation) is not the discovery of a hidden meaning but it is to modify the meaning of an object by placing it into an other setting. From twelve texts written by pupils in a class of 5th, on two themes, the aim of our study is to test the pupils creativity as dialogue and to conceiv their creativity as a mixing. The analysis indices used in the 3th and 4th parts are related to the notions of genus and subgenus. The creativity by mixing will become apparent to be an illustration of the "style" of the (talking subject) which is not the translatable thing but it is the showed one into the discourse organization, and into the change of genus, the change of sources. . . After the analysis of each piecework, we think about the similarities-differences in the narrated stories concerning the contents, the dominant organizer, and the relation to the original texts
46

Nguyen, Minh Tien. "Détection de textes générés automatiquement". Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAM025/document.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Le texte généré automatiquement a été utilisé dans de nombreuses occasions à des buts différents. Il peut simplement passer des commentaires générés dans une discussion en ligne à une tâche beaucoup plus malveillante, comme manipuler des informations bibliographiques. Ainsi, cette thèse introduit d'abord différentes méthodes pour générer des textes libres ayant trait à un certain sujet et comment ces textes peuvent être utilisés. Par conséquent, nous essayons d'aborder plusieurs questions de recherche. La première question est comment et quelle est la meilleure méthode pour détecter un document entièrement généré.Ensuite, nous irons un peu plus loin et montrer la possibilité de détecter quelques phrases ou un petit paragraphe de texte généré automatiquement en proposant une nouvelle méthode pour calculer la similarité des phrases en utilisant leur structure grammaticale. La dernière question est comment détecter un document généré automatiquement sans aucun échantillon, ceci est utilisé pour illustrer le cas d'un nouveau générateur ou d'un générateur dont il est impossible de collecter des échantillons dessus.Cette thèse étudie également l'aspect industriel du développement. Un aperçu simple d'un flux de travail de publication d'un éditeur de premier plan est présenté. À partir de là, une analyse est effectuée afin de pouvoir intégrer au mieux notre méthode de détection dans le flux de production.En conclusion, cette thèse a fait la lumière sur de multiples questions de recherche importantes concernant la possibilité de détecter des textes générés automatiquement dans différents contextes. En plus de l'aspect de la recherche, des travaux d'ingénierie importants dans un environnement industriel réel sont également réalisés pour démontrer qu'il est important d'avoir une application réelle pour accompagner une recherche hypothétique
Automatically generated text has been used in numerous occasions with distinct intentions. It can simply go from generated comments in an online discussion to a much more mischievous task, such as manipulating bibliography information. So, this thesis first introduces different methods of generating free texts that resemble a certain topic and how those texts can be used. Therefore, we try to tackle with multiple research questions. The first question is how and what is the best method to detect a fully generated document.Then, we take it one step further to address the possibility of detecting a couple of sentences or a small paragraph of automatically generated text by proposing a new method to calculate sentences similarity using their grammatical structure. The last question is how to detect an automatically generated document without any samples, this is used to address the case of a new generator or a generator that it is impossible to collect samples from.This thesis also deals with the industrial aspect of development. A simple overview of a publishing workflow from a high-profile publisher is presented. From there, an analysis is carried out to be able to best incorporate our method of detection into the production workflow.In conclusion, this thesis has shed light on multiple important research questions about the possibility of detecting automatically generated texts in different setting. Besides the researching aspect, important engineering work in a real life industrial environment is also carried out to demonstrate that it is important to have real application along with hypothetical research
47

Marteau, Hubert. "Une méthode d'analyse de données textuelles pour les sciences sociales basée sur l'évolution des textes". Tours, 2005. http://www.theses.fr/2005TOUR4028.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Le but est d'apporter aux sociologues un outil informatique permettant l'analyse d'entretiens ouverts semi-directifs. Le traitement est en deux étapes : une indexation des entretiens suivi d'une classification. Les méthodes d'indexation habituelles reposent sur une analyse statistiques plus adaptées à des textes de contenu et de structure (textes littéraires, scientifiques,. . . ) marqués qu'à des entretiens limités à l'usage de peu de mots (1000 mots pour des textes de discussion). Partant de l'hypothèse que l'appartenance sociologique induit fortement la forme du discours, nous évaluons la structure et l'évolution des textes en proposant de nouvelles représentations des textes (image, signal) qui conduisent à l'extraction de valeurs indexant le texte, mesures statiques ou liées à l'évolution du texte. La classification choisie est arborée (NJ). Elle repose sur ces caractéristiques par sa faible complexité et son respects des distances, elle fournit une aide à la classification
This PhD Thesis aims at bringing to sociologists a data-processing tool wich allows them to analyse of semi-directing open talks. The proposed tool performs in two steps : an indexation of the talks followed by a classification. Usually, indexing methods rely on a general stastistical analysis. Such methods are suited for texts having contents and structure ( literary texts, scientific texts,. . . ). These texts have more vocabulary and structure than talks (limitation to 1000 words for suche texts). On the basis of the assumption that the sociological membership strongly induces the form of the speech, we propose various methods to evaluate the structure and the evolution of the texts. The methods attempt to find new representations of texts (image, signal) and to extract values from these new representations. Selected classification is a classification by trees (NJ). It has a low complexity and it respects distances, then this method is a good solution to provide a help to classification
48

Albert, Florence. "Analyse technique, textuelle et paléographique d'un Livre des morts inédit conservé au Musée du Vatican (Inv. n 38603)". Thesis, Montpellier 3, 2010. http://www.theses.fr/2010MON30004.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Le papyrus du Vatican n° inv. 38603 est un Livre des morts hiératique daté de l’époque tardive, provenant vraisemblablement de la ville de Thèbes et contenant un certain nombre d’originalités iconographiques et textuelles. Son étude exhaustive est entreprise à l’aide d’une présentation détaillée, d’une traduction complète, d’un commentaire de chacun des textes qui le composent, d’une mise en contexte au sein de la documentation tardive du genre et d’une paléographie. Ces éléments permettent de mettre en valeur divers aspects des croyances funéraires des égyptiens de cette époque. D’autre part, ils autorisent à resserrer la datation du papyrus autour de 300 av. J.-C. et à replacer le document dans un contexte précis en forte relation avec la religion et les cultes osiriens qui se développent à Thèbes à partir de laTroisième Période intermédiaire
The Papyrus Vatican inv. No 38603 is a hieratic Book of the Dead dated of the late period, coming probably from the city of Thebes and containing a number of textual and iconographic peculiarities. His comprehensive study is undertaken using a detailed presentation, a complete translation, a commentary on each of its component texts, a contextualization within the late documentation of the type and a paleography. These elements can highlight various aspects of Egyptian funerary beliefs of that time. On the other hand, they allow for closer dating of papyrus around 300 BC. and put the document in a specific context in strong relationship with religion and cults of Osiris that develop at Thebes since the Third Intermediate Period
49

Guibert, Gaëll. "Méthodes linguistiques utilisées dans l'analyse des textes : analyse épistémologique et propositions en vue d'un traitement formel". Paris 4, 2003. http://www.theses.fr/2003PA040060.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
Les sciences du langage étudient des textes. Nous prenons pour exemple le domaine de l'analyse des textes bibliques, qui utilise aujourd'hui des méthodes telles que la linguistique ou la sémiotique. La question de la méthode permettant de passer du texte (discours) à son interprétation (méta-discours), est abordée d'un point de vue épistémologique. Nous analysons le raisonnement du processus interprétatif. Trois bilans sont réalisés: l'apport de ces méthodes, le discours qu'elles ont généré, l'apport de la linguistique et de l'informatique jusqu'ici. Quel est l'apport de l'utilisation des techniques et possibilités d'analyse les plus avancées, au niveau logique, linguistique et informatique ? Afin de le déterminer, nous réalisons des formalisations à deux niveaux : celui des commentaires de l'étude des textes bibliques existants, et celui des textes eux-mêmes. Ces formalisations auront pour but de faire apparaître d'éventuelles contradictions, et surtout une logique propre des discours et des textes étudiés. Nous proposerons un cadre théorique et une méthode susceptibles de contribuer à la résolution de problèmes d'analyse de textes. Un formalisme proche des langues naturelles pourrait être appliqué, en étudiant les possibilités de cette formalisation, ainsi qu'en mesurant sa contribution possible à l'analyse de textes en langue naturelle. Nous verrons si un formalisme logique peut constituer un moyen d'aborder un texte, en le considérant comme un " objet-texte multiple " ; nous proposerons une application de ce formalisme et mesurerons quel est son apport par rapport aux autres méthodes étudiées et déjà appliquées dans le domaine cité en exemple
Sciences of languages study texts. We give in exemple the analysis of biblical texts domain, which use today linguistics and semiotics methods. The questions of method, which permits a link between text (discourse) and text interpretation (meta-discourse), is treated from an epistemological point of view. We analyse the reasonnment of interpretation process. Three statements are realised: advantages of these methods, the discourse they have built, advantages of use linguistics and informatics before today. What is the result of use technical and analysis possibilities the more advanced, in logics, linguistics and informatics ? To clear this fact, we realise formal analysis on two distincts levels: biblical text, and biblical text interpretation. This analysis take as ojective to show contradictions in texts interpretation, and at least an internal and proper logic of texts and texts interpretation. We propose an theorical model and a method to contribute solving problems of texts analysis. A formal analysis, near natural languages, can be study on texts, to examine possibilities of this formalisation, and measure his contribution to text analysis in natural languages. We see how a logic approach can study a text like an 'multiple-text-object' and propose application of formalism. We finaly measure the advantage of the theorical model and method proposed, in comparison with other methods aldready applied in the domain treated in exemple
50

Treignier, Jacques. "Le discours d'une institution : Rapports des inspecteurs et textes officiels : école maternelle". Rouen, 1995. http://www.theses.fr/1995ROUEL211.

Testo completo
Gli stili APA, Harvard, Vancouver, ISO e altri
Abstract (sommario):
La thèse analyse deux types de discours : les instructions officielles et les rapports d'inspection d’école maternelle dans la période 1970-1991. Cette analyse énonciative s'attache à étudier les fonctions et fonctionnements de la personne dans le cadre d'une théorie praxématique de l'interaction. L’étude se veut comparative entre les deux jeux d'instructions officielles de 1977 et 1986, entre les rapports d'inspection antérieurs à 1977, postérieurs à 1986 et intermédiaires entre 1978 et 1985, entre les rapports d'inspection et les instructions officielles. L'analyse fait apparaître, en concordance avec l’hypothèse première que ces deux discours injonctifs définissent outre des contenus, des places sociales et locutoires d'agents d’exécution dépossédés à la fois de la parole et de l'initiative. L'injonction apparaît de façon particulièrement forte pour les instructions officielles, plus comme une fin en elle-même que comme un moyen. Une scission s’opère néanmoins, entre les instructions officielles de 1977 et celles de 1986. Les premières tiennent un discours plus professionnel, plus complexe, dans lequel le discours des sciences de l'enfant est rapporté sans être toutefois identifié. La connivence culturelle entre l’énonciateur et l'énonciataire y est donc grande. Pour les secondes, en 1986, le discours se veut simple d’évidence, destiné à la fois aux parents et aux enseignants. Ce faisant, il abandonne le terrain de la professionnalisation pour celui de la vulgarisation. La visée est celle du rétablissement des relations traditionnelles de hiérarchie au sein de l’école, et d’autorité confiante avec les partenaires de celle-ci. Le leitmotiv "le maître. . . " Scande littéralement le discours. Les rapports d'inspection, contrairement à l’hypothèse de départ, n’évoluent pas en
The thesis analyses two types of discourses : instructions officielles (official instructions) and inspection reports about nursery schools (écoles maternelles) for the period from 1970 to 1991. This enunciative analysis aims at studying functions and functionings of the person markers in the scope of a praxematic theory of interaction. (Robert Lafont, Françoise Gardes-Madray, 1976, Introduction à l'analyse textuelle, Université de Montpellier). The study consists in a comparison of two sets of official instructions of 1977 versus 1986, the inspection reports published before 1977, versus after 1986 and versus those intermediary between 1978 and 1985, as well as the inspection reports versus the official instructions. The analysis shows, in agreement with the first hypothesis, that these two types of injunction discourses, define, apart from contents, social and speaking places of executioner agents, deprived of both speech and initiative. The injunction appears particularly strong for the official instructions, more as an end than as a means. A scission occurs however between the official instructions of 1977 and those of 1986. The former present a more professional and more complex discourse, in which the discourse concerning childhood sciences is being reported without really being identified. The cultural connivance between the locuter and the adresse is therefore important (in that discourse). For the latter, in 1986, the discourse becomes easy and evident, intended

Vai alla bibliografia