Academic literature on the topic 'Catégorisation de documents'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Catégorisation de documents.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Catégorisation de documents"

1

Gardarin, Georges, Huaizhong Kou, and Karine Zeitouni. "DocCat : un composant logiciel de catégorisation de documents et de marquage sémantique XML." Ingénierie des systèmes d'information 8, no. 3 (June 24, 2003): 33–54. http://dx.doi.org/10.3166/isi.8.3.33-54.

Full text
APA, Harvard, Vancouver, ISO, and other styles
2

Forest, Dominic. "Vers une nouvelle génération d’outils d’analyse et de recherche d’information." Documentation et bibliothèques 55, no. 2 (March 12, 2015): 77–89. http://dx.doi.org/10.7202/1029091ar.

Full text
Abstract:
Les récents efforts visant à favoriser la diffusion et la circulation de l’information en format numérique ont contribué au phénomène de l’infobésité (information overload). Il est désormais important de concevoir des outils de recherche d’information plus adaptés aux besoins des utilisateurs afin de leur permettre de récupérer les documents pertinents répondant à leurs besoins informationnels. Dans cet article, nous ferons état, dans un premier temps, de certaines observations sur les conséquences découlant des limites des outils traditionnels en recherche d’information numérique. Dans un deuxième temps, nous exposerons les concepts et les techniques de base du domaine de la fouille de textes, en insistant sur les opérations de classification et de catégorisation automatiques. Finalement, nous montrerons comment certaines techniques de fouille de textes peuvent contribuer au développement d’une nouvelle génération d’outils de recherche d’information.
APA, Harvard, Vancouver, ISO, and other styles
3

Moirand, Sophie. "L'impossible clôture des corpus médiatiques: la mise au jour des observables entre catégorisation et contextualisation." Travaux neuchâtelois de linguistique, no. 40 (June 1, 2004): 71–92. http://dx.doi.org/10.26034/tranel.2004.2599.

Full text
Abstract:
With a view to analyzing the way the mass media deal with specific "discourse moments" (such as the debates on GMO's), two stages are drawn up. First, a survey is made of the descriptive categories that prove necessary to extract "observables", which are located along texts and documents, and also to set up the "sub-corpora" they bring up. But in the purpose of contextualizing these data, we need to make use of the operating notion of dialogism, with its various forms of actualization. Thus, in a second stage, it is shown how the first exploratory corpus can be expanded to interdiscourses, which come up as reminders of previous discourses and facts: this interdiscursive memory bank, built up by the media and within the media, takes us back to the history of the relations between science, nature and society.
APA, Harvard, Vancouver, ISO, and other styles
4

Demidov, Andrey, and Sara Svensson. "Local cross-border cooperation at the European Union's external border The meaning of local in the European Neighbourhood Policy." Regions and Cohesion 3, no. 2 (June 1, 2013): 22–46. http://dx.doi.org/10.3167/reco.2013.030202.

Full text
Abstract:
The article examines a key priority in European Union policy toward the east and south: the effort to turn the external border areas into secure, stable, and prospering regions via support for cross-border cooperation. This features highly in a range of policies brought together under the European Neighbourhood Policy and in the partnership with Russia. The main question asked by the article is if these policies live up to the goal of involving local actors. Based on a content analysis of program documents and a categorization of project partners by actor type, the article argues that the notion of "local" can be subject to various understandings, but if we understand local versus regional along the lines of the European Nomenclature of Territorial Units for Statistics (NUTS) classification, the policy in practice is undoubtedly tilted toward regional rather than local cross-border cooperation. In addition, the article argues that the four objectives of the European Neighbourhood and Partnership Instrument-Cross Border Cooperation (ENPI-CBC) do not match what could realistically be achieved with the resources available. Spanish El artículo examina una prioridad clave en la política de la Unión Europea hacia el este y el sur: el esfuerzo de convertir las zonas fronterizas exteriores en regiones seguras, estables y prósperas a través del apoyo a la cooperación transfronteriza. Este tema es fundamental en una serie de políticas públicas reunidas en la Política Europea de Vecindad y en la asociación con Rusia. La principal cuestión planteada en el texto es si estas políticas alcanzan el objetivo de involucrar a los actores locales. Con base en un análisis de contenido de los documentos del programa y en una categorización de los socios del proyecto por tipo de actor, el artículo sostiene que la noción de "local" puede ser objeto de diversas interpretaciones, pero si entendemos lo local frente a lo regional en la clasificación NUTS (Nomenclatura de las Unidades Territoriales Estadísticas) Europea, en la práctica la política está indudablemente inclinada hacia la cooperación transfronteriza regional más que a la local. Además, el artículo sostiene que los cuatro objetivos del IEVA-CT (Instrumento Europeo de Vecindad y Asociación - Cooperación transfronteriza) no coinciden con lo que realísticamente se puede lograr con los recursos disponibles. French Cet article examine une priorité clé dans la politique de l'Union européenne vis-à-vis de l'Est et du Sud: l'effort de transformer les zones frontalières extérieures en régions sûres, stables et prospères via un soutien à la coopération transfrontalière. Cet objectif figure au centre des priorités de la Politique européenne de voisinage et de partenariat avec la Russie. La principale question posée dans ce texte est celle de savoir si ces politiques sont en mesure de faire participer les acteurs locaux. Fondé sur l'analyse des documents et du contenu des programmes, ainsi que sur la catégorisation des projets de partenariat et du type d'acteurs, l'article affirme que la notion de «local» peut être sujette à diverses interprétations, mais que si nous analysons le terme à l'échelle régionale suivant les critères dé finis par la nomenclature européenne NUTS (Nomenclature des unités territoriales statistiques), nous verrons que dans la pratique, la politique européenne semble plus axée vers la coopération transfrontalière régionale que locale. En outre, l'article affirme que les quatre objectifs du IEVP-CTF (Instrument Européen de Voisinage et de Partenariat- Coopération transfrontalière) ne cadrent pas réellement avec les ressources disponibles.
APA, Harvard, Vancouver, ISO, and other styles
5

Gambier, Yves. "La langue de l’autre ou l’expulsion des hôtes ?" Meta 59, no. 3 (February 11, 2015): 481–93. http://dx.doi.org/10.7202/1028653ar.

Full text
Abstract:
Les documents sur les rapports entre minorités et États sont encore souvent basés sur des catégorisations rigides et dichotomiques, maintes fois en contradiction avec les mobilités liées à la mondialisation. Dans les changements en cours, les langues demeurent un sujet tabou dont le refoulement laisse place au recours à une lingua franca. Les tensions contemporaines appellent à une redéfinition des droits et des minorités linguistiques. Comment une politique linguistique établie il y a plusieurs décennies peut-elle assumer les défis des minorités et des migrants, sans oublier celui des expatriés ? Les Roms (minorité fabriquée) et l’évolution de la Finlande bilingue (minorité historique des suédophones) serviront d’exemples pour tenter de mieux appréhender les situations présentes et repenser le concept de minorité.
APA, Harvard, Vancouver, ISO, and other styles
6

Metzger, Jean-Paul, and Seyed Mohammad Mahmoudi. "Propositions Pour Une Reconnaissance Automatique des Syntagmes Nominaux du Persan." Lingvisticæ Investigationes. International Journal of Linguistics and Language Resources 20, no. 2 (January 1, 1996): 381–418. http://dx.doi.org/10.1075/li.20.2.06met.

Full text
Abstract:
RÉSUMÉ L'objet de cet article réside dans la conception globale d'un analyseur morpho-syntaxique du persan pour 1'indexation automatique. L'analyseur se limite donc à la recherche des Syntagmes Nominaux (SN), considérés comme les éléments les plus informatifs, dans le contexte d'une recherche documentaire, pour l'analyse du contenu d'un texte. La mise au point d'un tel analyseur nécessite, au préalable, une segmentation et une catégorisation correcte de toute forme lexico-syntaxique. Nous présentons très brièvement un aperçu général du traitement automatique des langues naturelles (TAL) et certaines caractéristiques de la langue persane. Puis nous essayons de donner quelques solutions générales pour la construction des règies de réécriture nécessaires pour la reconnaissance automatique des SN en persan. Les règies de réécriture ainsi élaborées sont transcrites en un programme en langage Prolog. SUMMARY The aim of this paper is the conception and realisation of a morpho-syntactic parser of persian designed for applications to automatic indexing and computer-assisted instruction of the language (CAT). One of the chief extensions to this research is the automatic processing of natural language by means of artificial intelligence systems. The main interest of this contribution is to study the automatic recognition of noun phrases in Persian. In the case of automatic indexing, the recognition of the noun phrases would allow the apprehension of the content of the document. Automatic indexing, just as manual indexing, consists of selecting in every document the most informative elements which actually are descriptors or noun phrases (NP). The setting up or conception of such a parser demands, primarily, a correct segmentation and categorisation of any lexico-syntactic forms in the corpus. After having established all the transcription rules needed for the recognition of NP, we shall then transcribe every phase of the analysis by a program in Prolog language. All the lexical data necessary for the categorisation of morpho-syntactic forms are presented as clauses of Prolog in a data-base.
APA, Harvard, Vancouver, ISO, and other styles
7

Ben Romdhane, Samar. "La parole en action selon la méthodologie de la théorisation enracinée." Approches inductives 4, no. 1 (April 12, 2017): 20–50. http://dx.doi.org/10.7202/1039509ar.

Full text
Abstract:
Il semble difficile d’avoir accès à un document qui donne des repères clairs et précis quant au déroulement d’une méthodologie par théorisation enracinée à partir d’un corpus de discours conversationnels. Un tel manque risque de décourager toute recherche aspirant à faire de la théorisation enracinée à partir de données qui ne correspondent pas aux points de vue des acteurs, mais plutôt à leurs échanges et interactions. D’où l’originalité de la démarche décrite dans ce texte qui propose une illustration concrète de l’utilisation de la méthodologie de la théorisation enracinée dans le but de mieux comprendre le processus des acteurs sociaux (individuels et collectifs) qui rendent publiques leurs prises de position à propos d’une question éthico-politique. Nous explicitons dans la première partie de cet article l’exercice de réflexion qui nous a permis d’interroger les enjeux posés par la méthodologie adoptée. Dans la deuxième partie, nous abordons deux aspects qui nous ont permis d’explorer l’expérience discursive de la confrontation de points de vue antagonistes : la sélection d’un site (les auditions publiques en commission parlementaire) et l’échantillonnage à l’intérieur de ce site (les cas analysés). Enfin, nous exposons les opérations de codage et de catégorisation conduites à l’aide du logiciel d’aide à l’analyse de données qualitatives QSR NVivo pour montrer ce que l’exploitation de ce logiciel a apporté à notre démarche en permettant d’établir des liens entre des données de l’ordre de la parole publique où sont confrontés des points de vue opposés et en les organisant pour progressivement en arriver à une théorisation.
APA, Harvard, Vancouver, ISO, and other styles
8

Borri-Anadon, Corina, and Kelly Russo. "L’évaluation des besoins des élèves autochtones: défis pour une recherche décoloniale." Revista Educação, Pesquisa e Inclusão 1 (December 22, 2020): 16. http://dx.doi.org/10.18227/2675-3294repi.v1i0.6675.

Full text
Abstract:
Alors que diverses initiatives récentes situent l’accès aux services spécialisés par les élèves autochtones comme un outil de l’égalité réelle en matière de santé, de services sociaux et d’éducation pour les enfants des Premières Nations au Canada, nous présentons ici une réflexion issue d’un projet de recherche visant à articuler les savoirs issus du milieu académique et détenus par deux communautés atikamekw à l’égard de l’évaluation des besoins des élèves autochtones. À la lumière de la surreprésentation de ces élèves dans les programmes d’éducation spécialisés et des travaux s’inscrivant dans les Disability Critical Race Studies, un écart entre les principaux constats émanant d’une métasynthèse descriptive de 82 écrits et des diverses activités réalisées auprès d’acteurs scolaires impliqués dans l’évaluation des besoins des élèves au sein de ces communautés est documenté. Ce dernier rappelle l’importance de dépasser la posture d’instrumentalisation du chercheur et de considérer, dans la réflexion sur l'intersection entre éducation spécialisée et peuples autochtones, l’interdépendance du capacitisme et du racisme dans la catégorisation des élèves autochtones « en difficulté ». AVALIANDO AS NECESSIDADES DOS ESTUDANTES INDÍGENAS: DESAFIOS PARA A PESQUISA DECOLONIALEmbora várias iniciativas recentes situem o acesso a serviços especializados por estudantes indígenas como uma ferramenta para a igualdade substantiva em saúde, serviços sociais e educação para crianças das Primeiras Nações no Canadá, apresentamos aqui uma reflexão resultante de um projeto de pesquisa que visou combinar o conhecimento acadêmico com o de duas comunidades Atikamekw no que diz respeito à avaliação das necessidades dos estudantes autóctones. À luz da super-representação desses estudantes em programas de educação especializada e dos estudos críticos sobre a deficiência, percebemos a existência de uma discrepância entre as principais descobertas retiradas de uma metassíntese descritiva de um conjunto de 82 trabalhos acadêmicos analisados e as expectativas dos atores escolares envolvidos na avaliação das necessidades dos alunos nessas comunidades autóctones. Essa discrepância aponta para a importância de se superar a posição de instrumentalização do pesquisador e reconhecer, na interseção entre educação especial e povos indígenas, a interdependência entre o capacitismo e o racismo na categorização dos estudantes indígenas como “deficientes”.PALAVRAS CHAVES: Povos Indígenas; Avaliação de estudantes; Necessidades educativas especiais; Colonialismo.ASSESSING THE NEEDS OF INDIGENOUS STUDENTS: CHALLENGES FOR DECOLONIAL RESEARCHWhile various and recent initiatives have presented access to specialized services by indigenous students as a tool for reaching real equality in health, social services and education for First nations children in Canada, our paper presents a reflection from a research project aimed at articulating scientific and lay knowledge of two atikamekw communities on special needs assessment processes of these students. Considering the over-representation of these students in specialized education programs and critical studies on disability, we documented a discrepancy between the main findings of our descriptive metasynthesis of 82 academic publications analysed and the expectations of school actors involved in assessing students’ needs in these indigenous communities. This discrepancy highlights the importance of overcoming the instrumentalization position of the researcher and to recognize, in the intersection between special education and indigenous peoples, the interdependence of ableism and racism in categorizing indigenous students as “disabled”.KEYWORDS: Indigenous people; Student’ assessment; Special educational needs; Colonialism.
APA, Harvard, Vancouver, ISO, and other styles
9

Yi, Kwan, and Jamshid Beheshti. "A Comparative Study on Feature Selection of Text Categorization for Hidden Markov Models." Proceedings of the Annual Conference of CAIS / Actes du congrès annuel de l'ACSI, October 15, 2013. http://dx.doi.org/10.29173/cais341.

Full text
Abstract:
In document representation for digitalized text, feature selection refers to the selection of the terms of representing a document and of distinguishing it from other documents. This study probes different feature selection methods for HMM learning models to explore how they affect the model performance, which is experimented in the context of text categorization task.Dans la représentation documentaire des textes numérisés, la sélection des caractéristiques se fonde sur la sélection des termes représentant et distinguant un document des autres documents. Cette étude examine différents modèles de sélection de caractéristiques pour les modèles d’apprentissage MMC, afin d’explorer comment ils affectent la performance du modèle, qui est observé dans le contexte de la tâche de catégorisation textuelle.
APA, Harvard, Vancouver, ISO, and other styles
10

N’Diaye, Marième. "Comment saisir la production du genre par le droit ? Réflexions à partir d’une triangulation de données qualitatives sur les juridictions familiale et pénale à Dakar." Bulletin of Sociological Methodology/Bulletin de Méthodologie Sociologique, April 28, 2021, 075910632199572. http://dx.doi.org/10.1177/0759106321995727.

Full text
Abstract:
A Dakar, la mise en œuvre du droit par les juridictions familiales (conséquences du divorce) et pénales (répression de l’homosexualité) participe à la consolidation d’un ordre social hétérosexuel et patriarcal qui conforte les inégalités de genre. L’article propose un retour sur le déroulé de l’enquête et sur les méthodes mobilisées qui ont conduit à ces résultats. L’articulation de différentes méthodes qualitatives - étude d’archives (jurisprudence, documents juridiques, débats parlementaires), entretiens et observations - a permis d’opérer une triangulation des données dont la portée heuristique réside dans la capacité à dévoiler les processus de catégorisation de genre qui s’opèrent dans la mise en œuvre du droit.
APA, Harvard, Vancouver, ISO, and other styles

Dissertations / Theses on the topic "Catégorisation de documents"

1

Koch, Guillaume. "Catégorisation automatique de documents manuscrits : Application aux courriers entrants." Rouen, 2006. http://www.theses.fr/2006ROUES033.

Full text
Abstract:
Les travaux présentés concernent la spécification, le développement et l’évaluation d’un système de catégorisation de documents manuscrits faiblement contraints tels que des courriers entrants. Nous démontrons qu’un système développé pour la catégorisation de documents électroniques peut être adapté à la catégorisation de documents manuscrits. Afin d’extraire les seuls mots clés nécessaires à la catégorisation, nous avons mis en place un système d’extraction de mots clés dans les documents manuscrits. Ce système d’extraction est appliqué sur chaque ligne de texte et fait appel à un moteur de reconnaissance de mots manuscrits isolés afin de réaliser conjointement la segmentation de mots et leur reconnaissance. L’intégration d’un modèle de rejet dans le système permet de prendre en compte les éléments hors-lexique lors de la reconnaissance de la ligne. Nous démontrons que malgré les performances en extraction de mots clés très en-dessous de celles des OCR, les performances en catégorisation de documents manuscrits ne sont que très peu dégradées
The work described in this document deals with the design, the development and the evaluation of a system of categorization of unconstrained handwritten documents such as handwritten incoming mails. We demonstrate that a system developed for electronic document categorization can be adapted for handwritten document categorization
APA, Harvard, Vancouver, ISO, and other styles
2

Bertrand, Annick. "Compréhension et catégorisation dans une activité complexe : l'indexation de documents scientifiques." Toulouse 2, 1993. http://www.theses.fr/1993TOU20042.

Full text
Abstract:
La tache d'indexation consiste a reperer dans un document les idees importantes representant soncontenu et a les transformer en termes d'indexation issus d'un vocabulaire controle. Le constat d'une variabilite dans le choix des termes affectes par plusieursindexeurs a un meme document souleve deux questions : quels sont les traitements effectues par les indexeurs pour structurer et condenser l'information contenue dans l'ouvrage et pour categoriser les idees retenues en termes d'indexation ? quels sont les facteure intervenant dans ces traitements ? une situation d'observation reproduisant les caracteristiques de la situation teelle de travail a ete construite. Vingt-cinq sujets ont indexe onze ouvrages en notant les termes representant les idees principales et les termes d'indexation retenus du langage rameau. Deux categories de variables ont ete manipulees : le contenu textuel (trois domaines et deux langues) et les caracteristiques des indexeurs (expertise dans l'indexation, pratique de rameau et familiarite avec le domaine). Les resultats revelent l'existence de trois strategies d'indexation se distinguant par, d'une part, la nature des connaissances invoquees et le type d'objectifs poursuivies et, d'autre part, la mise en oeuvre privilegiee de processus soit ascendants guides par des indices textuels, soit descendants guides par des connaissances. La difference essentielle est liee au niveau d'analyse du document : les indexeurs pratiquants rameau ont adopte le niveau d'analyse requis par ce langage, les non pratiquants ont effectue une description 'fine' et les debutants sont restes a un niveau general
Indexing consists in identifying the main ideas of a document and in converging them into indexing terms chosen among a controlled vocabulary. An important variability among indexers has been shown and thereby raises two questions : what processing are made by indexers to structure and to reduce the information contained into a document and to categorize the ideas into indexing terms ? what factors step in these processing ? a situation reproducing the characteristics of the actual work has been built up. Twenty-five subjects have indexed eleven books ; they had to write the terms presenting the main ideas and the indexing terms retained from the documenting language rameau. Two classes of variables have been manipulated : the textual content (three topics and two languages) and the operators' characteristics (expertise in indexing, practice of rameau and familiarity with the scientific domain). The results reveal three indexing strategies that can vbe distinguished, on the one hand, by the nature of knowledge involved and the objectives pursued, on the other hand, by the preferential use of either bottom-up processes driven by the knowledge. The major difference depends on the level of analysis of the document : those who pratice rameau carried the level of analysisrequired by this language, the unexperienced in the language carried out a 'specific' description and the beginner indexers have chosen a general level of analysis to access quickly to the language
APA, Harvard, Vancouver, ISO, and other styles
3

Peña, Saldarriaga Sebastián. "Approches textuelles pour la catégorisation et la recherche de documents manuscrits en-ligne." Phd thesis, Université de Nantes, 2010. http://tel.archives-ouvertes.fr/tel-00483684.

Full text
Abstract:
L'évolution technologique des dispositifs électroniques de capture de l'écriture manuscrite se traduit par l'apparition d'une grande quantité de documents manuscrits en-ligne. Cela pose la question de l'accès à l'information contenue dans ces données. Ce travail s'intéresse à l'accès à l'information textuelle contenue dans des documents qui se présentent sous la forme d'une séquence temporelle de points (x,y). Deux tâches principales ont été étudiées : la première concerne le développement d'un système de catégorisation de documents, tandis que la seconde s'intéresse à la recherche d'information dans des bases documentaires manuscrites. En amont, une première étape importante a consisté à collecter un corpus manuscrit de référence pour la validation expérimentale de cette étude. L'utilisation d'un système de reconnaissance de l'écriture étant l'élément transversal des approches proposées, une partie de notre travail a consisté à analyser le comportement de ces approches face aux erreurs de reconnaissance. La catégorisation est effectuée en enchaînant un système de reconnaissance à un système de catégorisation basé sur des méthodes d'apprentissage statistique. Pour la recherche d'information, deux approches ont été proposées. La première tire parti de la diversité des résultats restitués par des algorithmes de recherche différents, l'idée étant que la combinaison des résultats peut pallier leurs faiblesses respectives. La seconde approche exploite les relations de proximité thématique entre les documents. Si deux documents proches ont tendance à répondre au même besoin d'information, alors ces mêmes documents doivent avoir des scores de pertinence proches.
APA, Harvard, Vancouver, ISO, and other styles
4

Réhel, Simon. "Catégorisation automatique de textes et cooccurrence de mots provenant de documents non étiquetés." Thesis, Université Laval, 2005. http://www.theses.ulaval.ca/2005/22376/22376.pdf.

Full text
Abstract:
Ayant pour objectif de rendre un programme informatique capable d’assigner de façon autonome des documents textuels à leur classe d’appartenance, la catégorisation automatique de textes est rendue possible grâce à l’apprentissage supervisé. Un entraînement du programme est effectué sur un ensemble de documents auxquels des étiquettes de catégorie ont déjà été assignées par des humains. Or, la constitution de cet ensemble d’entraînement se révèle un processus long et coûteux. Ce mémoire propose une façon d’améliorer la capacité d’un classificateur à bien accomplir sa tâche dans des situations où un entraînement sur un nombre suffisant de textes n’aura pas été possible. L’approche suggérée consiste à étudier une forme d’association, la cooccurrence, entre les mots provenant d’un ensemble de textes libellés et ceux provenant d’un ensemble de textes non libellés, plus volumineux. On espère ainsi augmenter à faible coût le vocabulaire utile à la classification de textes, en minimisant le nombre de documents à étiqueter.
Automated text categorization consists of developing computer programs able to autonomously assign texts to predefined categories, on the basis of their content. Such applications are possible thanks to supervised learning, which implies a training phase on manually labeled documents. However, the construction of a training set is long and expensive. This study suggests a way to assist text classifiers in the gathering of the vocabulary when the size of the training set is limited. So, it is proposed to analyze word cooccurrence inside a text collection of many non-labeled documents, to augment the vocabulary produced by the analysis of the labeled texts. The representation of new documents to classify can then be modified in order to better match the vocabulary used by the classifier. What is expected, of course, is an improvement of its ability to categorize texts.
APA, Harvard, Vancouver, ISO, and other styles
5

Jaillet, Simon. "Catégorisation automatique de documents textuels : D'une représentation basée sur les concepts aux motifs séquentiels." Montpellier 2, 2005. http://www.theses.fr/2005MON20030.

Full text
APA, Harvard, Vancouver, ISO, and other styles
6

Jalam, Radwan. "Apprentissage automatique et catégorisation de textes multilingues." Lyon 2, 2003. http://theses.univ-lyon2.fr/documents/lyon2/2003/jalam_r.

Full text
Abstract:
Notre travail s'intéresse à l'application de méthodes issues de l'apprentissage automatique à la catégorisation de textes multilingues. Il comporte deux parties. Une première partie donne une présentation générale de la catégorisation de textes : Définitions, objectifs généraux et domaines d'application ; Adaptation des algorithmes d'apprentissage aux spécificités des textes ; La méthode de sélection de termes multivariée ; Le codage en n-grammes et les mots ; Les méthodes d'apprentissage et la mesure de leurs performances ; les texts réalisés pour comparer les algorithmes d'apprentissage sur les textes. La deuxième partie s'intéresse à l'apprentissage de textes multilingues en comparant deux chaînes possibles : Chaîne 1 : reconnaissance de la langue, puis utilisation de règles de classement construites pour chaque langue ; il faut alors avoir construit un modèle adapté à chacune des langues. Chaîne 2 : utilisation de la traduction automatique dans le processus de catégorisation ; cette solution permet d'utiliser un seul ensemble de règles de classement. Ici, il y a deux options : 1. Construire un modèle unique sur l'ensemble d'apprentissage d'une langue donnée ; ensuite, pour classer un nouveau texte, (I) reconnaissance de sa langue, (II) traduction de ce texte vers la langue d'apprentissage, (III) application du modèle de prédiction sur le texte traduit ; ici la phase de traduction n'intervient que dans la phase de classement. 2. Faire intervenir la traduction automatique dès la phase d'apprentissage : à partir d'un ensemble étiqueté de textes en différentes langues, traduction automatique dès la phase d'apprentissage : à partir d'un enemble étiqueté de textes en différentes langues, traduction automatique de tous ces textes vers une langue cible et apprentissage sur cet ensemble de textes traduits ; ensuite, pour classer un nouveau texte, la procédure est la même. Nous testons nos algorithmes sur des corpus multilingues.
APA, Harvard, Vancouver, ISO, and other styles
7

Guernine, Taoufik. "Classification hiérarchique floue basée sur le SVM et son application pour la catégorisation des documents." Mémoire, Université de Sherbrooke, 2010. http://savoirs.usherbrooke.ca/handle/11143/4838.

Full text
Abstract:
La croissance exponentielle des moyens de communication durant ces dernières années et en particulier l'Internet a contribué à l'augmentation du volume de données traitées via les réseaux informatiques. Cette croissance a poussé les chercheurs à penser à la meilleure façon de structurer ces données pour faciliter leur accès et leur classification. À ce problème de classification, plusieurs techniques ont été proposées. Dans la pratique, nous constatons deux grandes familles de problèmes de classification, les problèmes binaires et les problèmes multi-classes. Le premier constat ayant attiré notre attention est l'existence du problème de confusion de classes lors de la classification. Ce phénomène rend les résultats ambigus et non interprétables. Le deuxième constat est la difficulté de résoudre ces problèmes par les méthodes existantes surtout dans le cas où les données ne sont pas linéairement séparables. En outre, les méthodes existantes souffrent des problèmes de complexité en temps de calcul et d'espace mémoire. Afin de remédier à ces problèmes, nous proposons une nouvelle méthode de classification qui s'articule autour de trois principaux concepts: la classification hiérarchique, la théorie de la logique floue et la machine à vecteur de support (SVM). À cet égard et vu l'importance accordée au domaine de classification des textes, nous adaptons notre méthode pour faire face au problème de la catégorisation des textes. Nous testons la méthode proposée sur des données numériques et des données textuelles respectivement. Les résultats expérimentaux ont démontré une performance considérable comparativement à certaines méthodes de classification.
APA, Harvard, Vancouver, ISO, and other styles
8

Moulin, Christophe. "Modélisation de documents combinant texte et image : application à la catégorisation et à la recherche d'information multimédia." Phd thesis, Université Jean Monnet - Saint-Etienne, 2011. http://tel.archives-ouvertes.fr/tel-00630438.

Full text
Abstract:
L'exploitation des documents multimédias pose des problèmes de représentation des informations textuelles et visuelles contenues dans ces documents. Notre but est de proposer un modèle permettant de représenter chacune de ces informations et de les combiner en vue de deux tâches : la catégorisation et la recherche d'information. Ce modèle représente les documents sous forme de sacs de mots nécessitant la création de vocabulaires spécifiques. Le vocabulaire textuel, généralement de très grande taille, est constitué des mots apparaissant dans les documents. Le vocabulaire visuel est quant à lui construit en extrayant des caractéristiques de bas niveau des images. Nous étudions les différentes étapes de sa création et la pondération tfidf des mots visuels dans les images, inspirée des approches classiquement utilisées pour les mots textuels. Dans le contexte de la catégorisation de documents textuels, nous introduisons un critère qui sélectionne les mots les plus discriminants pour les catégories afin de réduire la taille du vocabulaire sans dégrader les résultats du classement. Nous présentons aussi dans le cadre multilabel, une méthode permettant de sélectionner les différentes catégories à associer à un document. En recherche d'information, nous proposons une approche analytique par apprentissage pour combiner linéairement les résultats issus des informations textuelles et visuelles, permettant d'améliorer significativement la recherche. Notre modèle est validé pour ces différentes tâches en participant à des compétitions internationales telles que XML Mining et ImageCLEF et sur des collections de taille conséquente
APA, Harvard, Vancouver, ISO, and other styles
9

Maumigny-Garban, Bénédicte de. "Démarche autobiographique et formation : modélisation historique et essai de catégorisation fonctionnelle." Lyon 2, 2003. http://theses.univ-lyon2.fr/documents/lyon2/2003/demaumigny_b.

Full text
Abstract:
La démarche autobiographique apparaît comme filière d'exploration et de construction personnelle. Sous l'Antiquité Chrétienne, les Confessions de Saint Augustin offrent l'exemple d'un moi qui se place tout entier devant Dieu pour comprendre sa vie. L'écriture renvoie à un ordre de transcendance. A l'Age des Lumières, la question fondamentale n'est plus celle de Dieu, mais celle de l'homme. Jean-Jacques Rousseau fait apparaître l'acte autobiographique comme révélation d'une nature individuelle. Il montre dans ses Confessions comment se réapproprier sa vie. Au XIXe siècle, George Sand dans Histoire de ma vie, Marie d'Agoult dans Mémoires, souvenirs et journaux, cherchent à faire évoluer les moeurs et à réformer l'éducation des filles. Au XXe siècle, les formes littéraires de vécu personnel laissent la place aux histoires de vie. La démarche autobiographique ne s'impose plus comme expression formative mais se constitue en instrument scientifique de formation
The autobiographical approach appears as a path to exploration and personal construction. During the Christian Antiquity, the "Confessions" by Saint Augustain offer the example of a self totally turned towards God in order to understand life. Writing recalls transcendence. In the Age of Enlightenment, the fundamental interrogation is not about God but about Man. Jean-Jacques Rousseau makes the autobiographical narrative appears as the revelation of a distinctive person. He explains in his "Confessions" how to take over one's life. In the 19th century, George Sand in "The story of my life" and Marie d'Agoult in her "Memoirs, memories and diaries" try to change people's mores and the education of girls. In the 20th century, the various literary forms taken on by personal experience are replaced by stories of lives. The autobiographical approach is not formative experience any more becomes a scientific means of training
APA, Harvard, Vancouver, ISO, and other styles
10

Boughaba, Gisèle. "L'exogamie libanaise : catégorisation religieuse et stratégies identitaires dans le couple mixte." Lyon 2, 2007. http://theses.univ-lyon2.fr/documents/lyon2/2007/boughaba_g.

Full text
Abstract:
L'Homme a connu de multiples systèmes religieux à partir desquels il a organisé son environnement : du dieu du Soleil jusqu'aux religions monothéistes. Les lois religieuses ont été utilisées comme des règles sociales. Aujourd'hui, beaucoup de sociétés adoptent ou s'inspirent d'un système laïc selon la formule suivante : séparer le sacré du profane. En revanche, dans certaines sociétés, les religions dominent toujours en inspirant les lois sociales. Le Liban, pays multiconfessionnel du Moyen-Orient, pourrait en être un parfait exemple : 18 confessions religieuses vivent sur le même sol libanais. Chaque communauté gère ses propres affaires dont la gestion des affaires matrimoniales. Par conséquent, le mariage mixte interreligieux devient une réalité complexe. Le couple mixte subit des pressions sociales et familiales qui risquent de peser énormément sur sa vie privée. Ainsi, il essaie aujourd'hui de trouver ses propres stratégies identitaires pour mieux assurer sa continuité. Et si ce couple "pas comme les autres" devenait un lien et un lieu de discussion privilégiés pour la découverte de l'Autre et pour l'avancée vers une société plus interculturelle ?
Man has known various religious systems that he used to organize his environment : starting with the Sun god to monotheistic religions. Religious laws have been used as social rules. Today, many societies adopt or are inspired from a laisictic system using the following formula : separate the sacred from the profane. However, in some societies, religions still dominate while still inspiring social laws. Lebanon, a multiconfessional country in the Middle-East, could be a perfect exemple : 18 religions denominations live on the same lebanese soil. Each community manages its own business of which the management of matrimonal affairs. In consequence, mixed interreligious marriage becomes a complex reality. The mixed couple bears social and family pressure that may weigh heavily on their private life. Thus, they try to find nowadays their own identity strategie in order to ensure their continuity in a better manner. And if this couple "unidentical to all others" became a link and a place for priviliged discussions in order to discover the other and to move on towards a more intercultural society
APA, Harvard, Vancouver, ISO, and other styles

Book chapters on the topic "Catégorisation de documents"

1

"La catégorisation des documents visuels." In Images en mouvement, 9–20. Presses de l'Université du Québec, 2011. http://dx.doi.org/10.2307/j.ctv18pgsgh.5.

Full text
APA, Harvard, Vancouver, ISO, and other styles
2

Baillargeon, Diane. "La catégorisation des actifs informationnels, élément structurant de la sécurité de l’information." In Typologie des documents des organisations, 2e édition, 25–40. Presses de l'Université du Québec, 2019. http://dx.doi.org/10.2307/j.ctv10qqxr3.8.

Full text
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography