Dissertationen: „Guerre pour la reconnaissance“

1

Shtembari, Arber. „Après la guerre : Mobilisations et luttes pour la reconnaissance. Contribution à une analyse sociohistorique de la construction de l'Etat au Kosovo (1945-2012)“. Thesis, Limoges, 2016. http://www.theses.fr/2016LIMO0057.

Der volle Inhalt der Quelle

Annotation:

Cette thèse est consacrée conjointement aux mobilisations et luttes de classement des groupes issus de la guerre de 1998-1999 au Kosovo et aux modalités d'accès à leur reconnaissance légale et légitime, ainsi qu'à l'étude du processus de construction de l’État au Kosovo et de la production de ses formes symboliques de consécration. Deux objectifs orientent ce travail : Le premier est de rompre avec certaines évidences et d'apporter de nouvelles pistes de réflexion sur la formation, l'identification, l'existence et la définition des groupes sociaux issus de la guerre (les victimes civiles, les anciens combattants, les prisonniers de guerre, les familles des personnes disparues, etc.). Le second est d'examiner les relations complexes entre le travail de domination symbolique de l’État au Kosovo et les luttes que mènent les groupes sociaux issus de la guerre pour pouvoir maintenir leur position dans l'espace social
This thesis examines jointly, the mobilizations and the classification struggles of the post-war groups in Kosovo after 1999, focusing on the access procedures toward their legal and legitimate recognition. It also analyzes the State formation process in Kosovo and the production of its symbolic forms of consecration. Two main contributions of this work are: First, it highlights a number of issues on post-war groups formation, identification, lifestyles and definition (civils victims, war veterans, war prisoners, families of missing persons, etc.) needing reflection and it questions the conventional wisdom. Second, it examines the complex relationships between the symbolic domination work of the State in Kosovo and the struggles of post-war groups in freeing from their social condition

APA, Harvard, Vancouver, ISO und andere Zitierweisen

2

Parenteau, Danic. „La guerre pour l'Esprit hégélien“. Thesis, National Library of Canada = Bibliothèque nationale du Canada, 1998. http://www.collectionscanada.ca/obj/s4/f2/dsk2/tape15/PQDD_0008/MQ28451.pdf.

Der volle Inhalt der Quelle

APA, Harvard, Vancouver, ISO und andere Zitierweisen

3

Masse, Henri. „Une guerre pour les Malouines“. Metz, 1997. http://docnum.univ-lorraine.fr/public/UPV-M/Theses/1997/Masse.Henri.LMZ9710.pdf.

Der volle Inhalt der Quelle

Annotation:

Le conflit des Malouines (Falklands - Malvinas) de 1982: les îles malouines, leur colonisations, les contentieux sur leur souveraineté, leur rôle dans l'histoire maritime et navale (contrôle de détroits - bataille des Falklands de 1914 - croisière du Graf Spee de 1939) - le diffèrent anglo-argentin et son évolution - la crise de mars 1982 - débarquements argentins et réactions britanniques - la force d'intervention : moyens navals, aériens et terrestres - le flux logistique - zones d'exclusion et blocus - bombardements et forces spéciales britanniques - débarquement à San Carlos et riposte argentine percée vers le sud (goose green) - encerclement de Stanley - bataille finale et reddition argentine - bilans et suites de la guerre - enseignements et retombées annexes sur les avions, les navires et les armements - le transport aérien lourd les navires civils britanniques employés aux malouines - bibliographie
The malouines (falklands - malvinas) war of 1982 : the falklands islands, their colonizations, disputes about soveraignty, importance of these islands in maritime and naval history (battle of 1914 cruise of the graf spee in 1939). The angle-argentine dispute, from the british occupations of 1833 to the crisis of 1982, argentine landings, british reations, the task force, naval, air ans ground forces and operations, blocus and exclusion zones, british bombings and presence of special forces, landing in san carlos and argentine surrender looses balance and aftermath of the war. Technical figures and historical elements about aircrafts, ships and armaments, the heavy air transport, the british marchant ships in the falklands war, bibliography

APA, Harvard, Vancouver, ISO und andere Zitierweisen

4

Thalineau, Alain. „La lutte inégale pour la reconnaissance“. Habilitation à diriger des recherches, Université Paris VIII Vincennes-Saint Denis, 2005. http://tel.archives-ouvertes.fr/tel-00818248.

Der volle Inhalt der Quelle

Annotation:

Mon parcours de recherche a pour point de départ deux constats effectués lors de mes travaux de thèse sur les allocataires du R.M.I.. D'une part, l'attente d'une reconnaissance sociale des chômeurs n'est pas systématiquement une attente de reconnaissance par l'emploi. D'autre part, les moins qualifiés d'entre eux attendent plus une reconnaissance de la part de leurs proches que d'autruis généralisés, une attente qui n'est pas uniquement construite en référence à l'emploi. L'objectif a été désormais de repérer les liens pouvant exister entre ces deux constats et de saisir comment les différentes attentes de reconnaissance des chômeurs sont compatibles ou non avec les façons d'agir des intervenants sociaux.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

5

Grondin, François. „Reconnaissance de locuteurs pour robot mobile“. Mémoire, Université de Sherbrooke, 2012. http://savoirs.usherbrooke.ca/handle/11143/1632.

Der volle Inhalt der Quelle

Annotation:

L'audition artificielle est de plus en plus utilisée en robotique mobile pour améliorer l'interaction humain-robot. La reconnaissance de la parole occupe présentement une place importante tandis qu'un intérêt particulier se développe pour la reconnaissance de locuteurs. Le système ManyEars permet actuellement à un robot mobile de localiser, suivre et séparer plusieurs sources sonores. Ce système utilise un ensemble de huit microphones qui sont disposés en cube. Ce mémoire porte sur la conception et l'évaluation d'un système de reconnaissance de locuteurs, baptisé WISS (Who IS Speaking), couplé au système ManyEars. Le système de reconnaissance de locuteurs conçu est robuste au bruit ambiant et au changement d'environnement. Une technique de combinaison de modèle parallèle (parallel model combination (PMC)) et des masques sont utilisés pour améliorer le taux d'identification dans un milieu bruité. Un indice de confiance est également introduit pour pondérer les identifications obtenues. La simplicité du système proposé fait en sorte qu'il est possible d'exécuter en temps réel l'algorithme sur un processeur généraliste ( General Purpose Processor (GPP)). Les performances du système sont établies à l'aide de plusieurs scénarios. Dans un premier lieu, des enregistrements sont diffusés dans des haut-parleurs pour un ensemble de vingt locuteurs. Le système est ainsi caractérisé en fonction des positions angulaires et radiales des sources sonores. Le taux de reconnaissance est affecté par la qualité du signal (i.e. diminution du rapport signal sur bruit ( Signal-to-Noise Ratio (SNR))) : il passe de 95.6% à 84.3% en moyenne lorsque le SNR passe d'environ 16 dB à 2 dB lorsque le locuteur se situe à 1.5 mètres des microphones. Par la suite, un scénario dit statique est vérifié à l'aide de quatre locuteurs qui récitent chacun leur tour des phrases à un volume de voix naturel. Finalement, un scénario dynamique dans lequel un groupe de quatre locuteurs ont une conversation naturelle avec des chevauchements entre les segments de paroles est étudié. Le taux de reconnaissance varie entre 74.2% et 100.0% (avec une moyenne de 90.6%) avec le scénario statique, et entre 42.6% et 100.0% avec le scénario dynamique (avec des moyennes de 58.3%, 72.8% et 81.4% pour des segments de 1, 2 et 3 secondes respectivement). Des solutions sont identifiées afin d'améliorer les performances lors de travaux futurs. Au meilleur de notre connaissance, il n'existe aucun système qui effectue une reconnaissance de locuteurs dans un environnement contaminé simultanément par des bruits convolutif et additif. De plus, l'utilisation de masques pour estimer ces bruits est un nouveau concept. Ces masques sont d'ailleurs généralement employés pour la reconnaissance de la parole et leur utilisation dans un contexte de reconnaissance de locuteur est une première. De plus, une caractérisation complète du système qui inclue les SNRs est proposée en fonction de la position du locuteur, ce qui est rarement disponible dans la littérature en audition artificielle pour les robots.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

6

Manh, Anne-Gaëlle. „Modèles déformables pour la reconnaissance d'adventices“. Montpellier 2, 2001. http://www.theses.fr/2001MON20208.

Der volle Inhalt der Quelle

APA, Harvard, Vancouver, ISO und andere Zitierweisen

7

Kulikova, Maria. „Reconnaissance de forme pour l'analyse de scène“. Phd thesis, Université de Nice Sophia-Antipolis, 2009. http://tel.archives-ouvertes.fr/tel-00477661.

Der volle Inhalt der Quelle

Annotation:

Cette thèse est composée de deux parties principales. La première partie est dédiée au problème de la classification d'espèces d'arbres en utilisant des descripteurs de forme, en combainison ou non, avec ceux de radiométrie ou de texture. Nous montrons notamment que l'information sur la forme améliore la performance d'un classifieur. Pour ce faire, dans un premier temps, une étude des formes de couronnes d'arbres extraites à partir d'images aériennes, en infrarouge couleur, est eectuée en utilisant une méthodologie d'analyse de formes des courbes continues fermées dans un espace de formes, en utilisant la notion de chemin géodésique sous deux métriques dans des espaces appropriés : une métrique non-élastique en utilisant la reprèsentation par la fonction d'angle de la courbe, ainsi qu'une métrique élastique induite par une représentation par la racinecarée appelée q-fonction. Une étape préliminaire nécessaire à la classification est l'extraction des couronnes d'arbre. Dans une seconde partie, nous abordons donc le problème de l'extraction d'objets de forme complexe arbitraire, à partir d'images de télédétection à très haute résolution. Nous construisons un modèle fondé sur les processus ponctuels marqués. Son originalité tient dans sa prise en compte d'objets de forme arbitraire par rapport aux objets de forme paramétrique, e.g. ellipses ou rectangles. Les formes sélectionnées sont obtenues par la minimisation locale d'une énergie de type contours actifs avec diérents a priori sur la forme incorporé. Les objets de la configuration finale (optimale) sont ensuite sélectionnés parmi les candidats par une dynamique de naissances et morts multiples, couplée à un schéma de recuit simulé. L'approche est validée sur des images de zones forestières à très haute résolution fournies par l'Université d'Agriculture de Suède.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

8

Boulay, Bernard. „Reconnaissance de postures pour l'interprétation d'activité humaine“. Phd thesis, Université de Nice Sophia-Antipolis, 2007. http://tel.archives-ouvertes.fr/tel-00311741.

Der volle Inhalt der Quelle

Annotation:

Durant cette thèse nous avons proposé une approche temps réel, générique et fonctionnelle pour reconnaître la posture des personnes filmées par une caméra statique. Notre approche est conçue pour être complètement automatique et indépendante du point de vue de la caméra. La reconnaissance de posture à partir de séquence vidéo est un problème difficile. Ce problème s'inscrit dans le champ de recherche plus général de l'interprétation de séquence vidéo. L'approche proposée prend en entrée des informations provenant d'algorithmes de vision telles que la silhouette de la personne observée (une image binaire où une couleur représente la personne et l'autre le fond) ou sa position dans la scène. La première contribution est la modélisation d'un avatar 3D de posture. Un avatar 3D de posture est composé d'un modèle 3D humain (définissant les relations entre les différentes parties du corps), d'un ensemble de paramètre (définissant les positions des différentes parties du corps) et d'un ensemble de primitive (définissant l'aspect visuel des parties du corps). La seconde contribution est la proposition d'une approche hybride combinant l'utilisation de modèles 3D et de techniques 2D. Les avatars 3D de postures sont utilisés dans le processus de reconnaissance pour avoir une certaine indépendance du point de vue de la caméra. Les techniques 2D représentent les silhouettes des personnes détectées pour garder un temps réel de calcul. Cette thèse montre comment les avatars 3D peuvent être utilisés pour obtenir une approche générique et fonctionnelle pour reconnaître les postures. Cette approche est composée de deux parties : la détection de postures qui reconnaît la posture de la personne détectée en utilisant seulement l'information calculée sur l'image considérée, et le filtrage temporel de posture qui reconnaît la posture en utilisant l'information provenant des images précédentes. Une troisième contribution a été faite en comparant différentes représentations 2D des silhouettes au niveau du temps de calcul nécessaire et de leur dépendance à la qualité de la silhouette. Quatre représentations ont été retenues : une représentation combinant différentes valeurs géométriques, les moment de Hu, la skeletonisation et les projections horizontale et verticale. Une quatrième contribution est la caractérisation des cas ambigus. Des ambiguïtés au niveau de la reconnaissance peuvent se produire en utilisant seulement une caméra statique. Une posture ambiguë est définie par plusieurs postures vii qui ont des silhouettes visuellement similaires. Des données de synthèse sont générées pour évaluer l'approche proposée pour différents points de vue. Ainsi, les postures ambiguës sont identifiées en considérant la posture et son orientation. L'approche est aussi évaluée pour des données réelles en proposant un modèle de vérité terrain pour la reconnaissance de posture. Une cinquième contribution a été proposée en appliquant le résultat de notre approche à la reconnaissance d'action. Une méthode utilisant des machines à états finis a ainsi été proposée pour reconnaître des actions faisant intervenir une seule personne. Chaque état de la machine est composé d'une ou plusieurs postures. Cette méthode est appliquée avec succès pour détecter les chutes et la marche. Bien que notre approche donne de très bon taux de reconnaissance, il subsiste quelques limitations. La principale limitation de l'approche est qu'elle est limitée en nombre de postures d'intérêt pour des raisons de temps de calcul et de discrimination entre les postures considérées. La seconde limitation est le temps nécessaire à la génération des silhouettes des avatars 3D de posture. En utilisant l'information sur le déplacement de la personne dans la scène, l'algorithme de reconnaissance de posture traite entre 5 et 6 images par seconde. Des améliorations peuvent être faites pour résoudre ces limitations. En particulier, nous pourrions adapter automatiquement l'ensemble des postures d'intérêt au cas considéré, en utilisant par exemple la posture reconnue précédemment pour restreindre les postures 3D dont nous voulons extraire les silhouettes.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

9

Pietropaoli, Bastien. „Reconnaissance de contexte stable pour l'habitat intelligent“. Phd thesis, Université Rennes 1, 2013. http://tel.archives-ouvertes.fr/tel-00917776.

Der volle Inhalt der Quelle

Annotation:

L'habitat intelligent est l'objet de nombreux travaux de recherche. Il permet d'assister des personnes âgées ou handicapées, d'améliorer le confort, la sécurité ou encore d'économiser de l'énergie. Aujourd'hui, l'informatique ubiquitaire se développe et s'intègre dans l'habitat intelligent notamment en apportant la sensibilité au contexte. Malheureusement, comprendre ce qui se passe dans une maison n'est pas toujours facile. Dans cette thèse, nous explicitons comment le contexte peut permettre de déployer des services adaptés aux activités et aux besoins des habitants. La compréhension du contexte passe par l'installation de capteurs mais aussi par l'abstraction des données brutes en données intelligibles facilement exploitables par des humains et des services. Nous mettons en avant une architecture multi-couches de fusion de données permettant d'obtenir des données contextuelles de niveaux d'abstraction différents. La mise en place des couches basses y est présentée en détail avec l'application de la théorie des fonctions de croyance pour l'abstraction de données brutes issues de capteurs. Enfin, sont présentés le déploiement d'un prototype nous ayant permis de valider notre approche, ainsi que les services déployés.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

10

Duchenne, Olivier. „Alignement élastique d'images pour la reconnaissance d'objet“. Phd thesis, Ecole Normale Supérieure de Paris - ENS Paris, 2012. http://tel.archives-ouvertes.fr/tel-01063352.

Der volle Inhalt der Quelle

Annotation:

The objective of this thesis is to explore the use of graph matching in object recognition systems. In the continuity of the previously described articles, rather than using descriptors invariant to misalignment, this work directly tries to find explicit correspondences between prototypes and test images, in order to build a robust similarity measure and infer the class of the test images. In chapter 2, we will present a method that given interest points in two images tries to find correspondences between them. It extends previous graph matching approaches [Leordeanu and Hebert, 2005a] to handle interactions between more than two feature correspondences. This allows us to build a more discriminative and/or more invariant matching method. The main contributions of this chapter are: The introduction of an high-order objective function for hyper-graph matching (Section 2.3.1). The application of the tensor power iteration method to the high-order matching task, combined with a relaxation based on constraints on the row norms of assignment matrices, which is tighter than previous methods (Section 2.3.1). An l1-norm instead of the classical l2-norm relaxation, that provides solutions that are more interpretable but still allows an efficient power iteration algorithm (Section 2.3.5). The design of appropriate similarity measures that can be chosen either to improve the invariance of matching, or to improve the expressivity of the model (Section 2.3.6). The proposed approach has been implemented, and it is compared to stateof-the-art algorithms on both synthetic and real data. As shown by our experiments (Section 2.5), our implementation is, overall, as fast as these methods in spite of the higher complexity of the model, with better accuracy on standard databases. In chapter 3, we build a graph-matching method for object categorization. The main contributions of this chapter are: Generalizing [Caputo and Jie, 2009; Wallraven et al., 2003], we propose in Section 3.3 to use the optimum value of the graph-matching problem associated with two images as a (non positive definite) kernel, suitable for SVM classification. We propose in Section 3.4 a novel extension of Ishikawa's method [Ishikawa, 2003] for optimizing MRFs which is orders of magnitude faster than competing algorithms (e.g., [Kim and Grauman, 2010; Kolmogorov and Zabih, 2004; Leordeanu and Hebert, 2005a]) for the grids with a few hundred nodes considered in this article). In turn, this allows us to combine our kernel with SVMs in image classification tasks. We demonstrate in Section 3.5 through experiments with standard benchmarks (Caltech 101, Caltech 256, and Scenes datasets) that our method matches and in some cases exceeds the state of the art for methods using a single type of features. In chapter 4, we introduce our work about object detection that perform fast image alignment. The main contributions of this chapter are: We propose a novel image similarity measure that allows for arbitrary deformations of the image pattern within some given disparity range and can be evaluated very efficiently [Lemire, 2006], with a cost equal to a small constant times that of correlation in a sliding-window mode. Our similarity measure relies on a hierarchical notion of parts based on simple rectangular image primitives and HOG cells [Dalal and Triggs, 2005a], and does not require manual part specification [Felzenszwalb and Huttenlocher, 2005b; Bourdev and Malik, 2009; Felzenszwalb et al., 2010] or automated discovery [Lazebnik et al., 2005; Kushal et al., 2007].

APA, Harvard, Vancouver, ISO und andere Zitierweisen

11

Boumaza, Rachid. „Perception multisensorielle pour la reconnaissance d'objets tridimensionnels“. Toulouse 3, 1994. http://www.theses.fr/1994TOU30098.

Der volle Inhalt der Quelle

Annotation:

Cette these porte sur la reconnaissance et la localisation de deux familles d'objets 3d, la premiere est celle des objets non-polyedriques, composes essentiellement de facettes planes, cylindriques et spheriques. La deuxieme famille est celle des objets articules. Le systeme de perception est compose d'une camera et d'un telemetre laser. L'utilisation de plusieurs capteurs a montre son efficacite dans le domaine de la robotique mobile et particulierement dans la tache d'interpretation des scenes, cette technique est connue par le terme: perception multisensorielle. La fusion multisensorielle permet d'ameliorer la precision des donnees capteurs, ou d'adjoncter l'ensemble des informations, nous parlerons dans le premier cas de la fusion numerique et dans le deuxieme cas de la fusion symbolique. Nos travaux sont repartis en trois etapes: la premiere est consacree aux procedures de segmentation suivies pour representer une scene acquise avec un systeme de perception multisensoriel. Nous nous interessons a la fusion numerique, nous montrons comment nous accordons des poids aux mesures des capteurs. La deuxieme etape decrit separement la reconnaissance d'objets rigides non-polyedriques et d'objets articules. Les objets a reconnaitre sont declares dans des modeles obtenus par des outils c. A. O. Le point essentiel dans la modelisation d'objets articules est le potentiel de vision, il est equivalent au graphe d'aspects pour les objets rigides. Les strategies de reconnaissance utilisees pour reconnaitre les deux familles d'objets sont differentes, la methode de generation-verification d'hypotheses est utilisee pour reconnaitre les objets rigides et une methode exhaustive est appliquee pour reconnaitre les objets articules. Dans cette these, nous discutons sur le choix de ces deux methodes. Des scores probabilistes et heuristiques sont utilises pour la selection de la bonne hypothese. Une methode de localisation optimale d'objets articules sera proposee. Enfin, nous presentons un systeme de reconnaissance global dont l'architecture est modulable et fonction a la fois de la complexite des primitives de la scene et de celle des modeles d'objets

APA, Harvard, Vancouver, ISO und andere Zitierweisen

12

Hizem, Walid. „Capteur intelligent pour la reconnaissance de visage“. Evry, Institut national des télécommunications, 2009. http://www.theses.fr/2009TELE0003.

Der volle Inhalt der Quelle

Annotation:

La variation d’illumination est l’un des facteurs les plus influent sur les performances d’un système de reconnaissance de visage spécialement dans un contexte de mobilité où l’opérateur n’a pas le contrôle de l’éclairage. Nous présentons dans ce travail, un nouveau capteur atténuant l’illumination ambiante ; l’image en sortie est alors plus stable vis-à-vis aux variations de l’éclairage ambiant. Ce capteur se base sur la réduction de temps de pose pour ne capturer qu’une faible quantité de la lumière ambiante, et on active durant la période d’exposition un flash délivrant une lumière en proche infrarouge. L’image de sortie est alors dépendante de l’éclairement du flash. Une seconde caractéristique de ce capteur, est la délivrance en simultané d’une image en proche infrarouge et d’une image normale acquise avec la lumière ambiante. En vue d’une future implémentation de notre approche, nous avons construit une méthode de détection de points caractéristiques sur les images proche infrarouge. Cet algorithme repose sur des opérateurs simples qui ont été implémentés. Si on pouvait construire une méthode simple c’est bien grâce à la stabilité des images par rapport à l’illumination. En utilisant les points caractéristiques détectés et l’image de contours, nous avons construit un algorithme de reconnaissance de visage s’inspirant de l’elastic graph matching pour construire un modèle du visage. Les performances de notre système sont aussi comparées avec les algorithmes de reconnaissance de visage de base. Et on obtient de meilleurs de performance de reconnaissance que l’elastic graph matching classique
Illumination variation is one of the factors that has the greatest impact on the performance of a facial recognition system, especially in a mobility situation where the operator cannot control lighting. In this work, we present a new sensor that reduces ambient light; the resulting image shows greater stability in relation to changes in ambient light. This sensor relies on a reduction of exposure time, so as to capture only a small quantity of ambient light, and during the exposure, a flash emitting a near-infrared light is activated. The resulting image is therefore dependent upon the luminance of the flash. A second characteristic of this sensor is the simultaneous production of a near-infrared image and a normal image acquired in ambient light. Besides this new sensor, we also aimed in among this and in view of a future implementation of our approach, we elaborated a method to detect landmarks in near-infrared images. This algorithm is based on the use of simple operators that has been implemented. The stability of the images in relation to the lighting changes allowed us to elaborate a simple method. Using the landmarks detected and the edge image, we constructed a face-recognition algorithm, inspired by elastic graph matching, in order to build a model of the face. We compared the performance of our system to that of basic face-recognition algorithms, and achieved recognition levels equal to those of classic elastic graph matching

APA, Harvard, Vancouver, ISO und andere Zitierweisen

13

Fua, Pascal. „Une approche variationnelle pour la reconnaissance d'objets“. Paris 11, 1989. http://www.theses.fr/1989PA112357.

Der volle Inhalt der Quelle

Annotation:

Dans cette thèse, nous proposons une formulation variationnelle du problème de la reconnaissance d'objets qui nous permet, d'une part, d'unifier les différents éléments de notre approche dans un même cadre théorique et, d'autre part, de développer des méthodes de calcul réalistes pour le traitement d'images complexes. Nous décrivons les objets en termes d'un langage qui inclut les contraintes tant photométriques que géométriques ou sémantiques auxquelles ces objets et leur apparence dans l'image sont soumis. Nous définissons un critère de nature statistique qui mesure la qualité d'une telle description; reconnaître les objets équivaut alors à trouver la description optimale de l'image en termes de notre langage. Nous avons validé notre approche dans le cadre de la reconnaissance de routes et bâtiments dans des images aériennes et avons implémenté un système qui identifie avec succès la majorité des objets cible dans des images difficiles. Dans le premier chapitre nous introduisons et motivons notre approche. Nous présentons ensuite des articles qui documentent son évolution. Dans le dernier chapitre, nous décrivons en détail notre fonction (objectif) ? et les procédures d'optimisation que nous avons implémentées.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

14

Delépine, Anne-Sophie. „Polyamines pour la reconnaissance d'anions d'intérêt biologique“. Brest, 2009. http://www.theses.fr/2009BRES2009.

Der volle Inhalt der Quelle

Annotation:

Les propriétés physico-chimiques complexantes des polyamines cycliques et linéaires sont maintenant clairement établies. Elles forment en effet des complexes très stables avec les cations métalliques et peuvent interagir avec des substrats anioniques en milieu aqueux lorsque les atomes d’azote deviennent accepteurs d’électrons après protonation. Si la complexation des anions s’est développée plus lentement que celles des cations, elle est devenue un domaine de recherche à part entière dès lors que l’importance des complexes des espèces chargées négativement a été reconnue tant au niveau biologique qu’écologique. Notre travail s’inscrit dans ce contexte, et a consisté en l’étude de la complexation de polyphosphates inorganiques et organiques, plus particulièrement le triphosphate et l‘adénosine triphosphate (ATP), par des ligands di- et tri-topiques dérivés d’une tétramine cyclique, le cyclen, et de deux tétramines linéaires, la N,N’-bis(2-aminoéthyl)-l,3-propanediamine et la triéthylènetétramine, présentant un espaceur rigide aromatique de type benzène ou pyridine. Le mémoire reprend la synthèse des deux premières familles de ligands déjà connues au laboratoire. Pour notre part, l’élaboration d’une méthode de monoalkylation sélective de la triéthylènetétramine basée sur l’outil bis-aminal a permis d’élargir la gamme des dérivés polytopiques étudiés. Nous avons ensuite évalué l’effet de la basicité et de la géométrie des ligands sur la complexation de polyphosphates inorganiques et organiques ciblés par potentiométrie et RMN. Les études ont permis d’identifier les diverses forces qui régissent l’interaction ligand-substrat. Nous avons notamment pu souligner l’apport sur la coordination d’interactions η- η entre l’espaceur aromatique du ligand et l’adénine de l’ATP et le rôle d’un point d’ancrage supplémentaire constitué par l’atome d’azote du lien pyridine
Physico-chernicalproperties of cyclic and linear polyamines are now well known since they are recognized to form highly stable complexes with metallic cations, and to interact with anionic substrates in aqueous medium aller protonation of the nitrogen atoms. As for cation complexation, there is a growing interest in the molecular recognition of anionic species because of their potential applications in environmental, industrial and health-related areas. Phosphate-type anions are ubiquitous as well in human activity effluents as in biological structures. 0ur work was then devoted to the study of inorganic and organic polyphosphates complexation, especially triphosphate and adénosine triphosphate (ATP), by di- et tri-topic ligands derived from a cyclic tetraamine (cyclen), and two linear tetraamines (N,N’-bis(2-aminoethyl)-l,3-propanediamine and triethylenetetramine), linked by rigid benzyl or pyridinyl spacer. We fisrtly report the synthesis of two families of ligands previously developed in ow group, as well and we describe a third class of ligands obtained by a new easy to run selective mono-Nalkylation of triethylenetetraamine using the bisaminal tool. The effect of both basicity and geometry of these ligands on the complexation of inorganic and organic polyphosphates were then investigated using potentiometry and NMR spectroscopy. These studies allowed a better understanding of the key features governing the ligand-substrate interactions. Among them, η-stacking interactions between the aromatic spacer of the ligand and the adenine ring of ATP, and the importance of the nitrogen atom of the pyridyl spacer as additional anchoring point were proved to stabilize efficiently the host-guest complexes

APA, Harvard, Vancouver, ISO und andere Zitierweisen

15

Pietropaoli, Paoli. „Reconnaissance de contexte stable pour l'habitat intelligent“. Thesis, Rennes 1, 2013. http://www.theses.fr/2013REN1S148/document.

Der volle Inhalt der Quelle

Annotation:

L'habitat intelligent est l'objet de nombreux travaux de recherche. Il permet d'assister des personnes âgées ou handicapées, d'améliorer le confort, la sécurité ou encore d'économiser de l'énergie. Aujourd'hui, l'informatique ubiquitaire se développe et s'intègre dans l'habitat intelligent notamment en apportant la sensibilité au contexte. Malheureusement, comprendre ce qui se passe dans une maison n'est pas toujours facile. Dans cette thèse, nous explicitons comment le contexte peut permettre de déployer des services adaptés aux activités et aux besoins des habitants. La compréhension du contexte passe par l'installation de capteurs mais aussi par l'abstraction des données brutes en données intelligibles facilement exploitables par des humains et des services. Nous mettons en avant une architecture multi-couches de fusion de données permettant d'obtenir des données contextuelles de niveaux d'abstraction différents. La mise en place des couches basses y est présentée en détail avec l'application de la théorie des fonctions de croyance pour l'abstraction de données brutes issues de capteurs. Enfin, sont présentés le déploiement d'un prototype nous ayant permis de valider notre approche, ainsi que les services déployés
Smart home is a major subject of interest. It helps to assist elderly or disabled people, improve comfort, safety, and also save energy. Today, ubiquitous computing is developed and integrated into the smart home providing context-awareness. Unfortunately, understanding what happens in a home is not always easy. In this thesis, we explain how context can be used to deploy services tailored to the activities and needs of residents. Understanding context requires the installation of sensors but also the abstraction of raw data into easily understandable data usable by humans and services. We present a multi-layer architecture of data fusion used to obtain contextual information of different levels of abstraction. The implementation of the lower layers is presented in detail with the application of the theory of belief functions for the abstraction of raw sensor data. Finally, are presented the deployment of a prototype that allowed us to validate our approach and the deployed services

APA, Harvard, Vancouver, ISO und andere Zitierweisen

16

Ben, Ameur Rihab. „Fusion multimodale pour la reconnaissance d'espèces d'arbres“. Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAA005/document.

Der volle Inhalt der Quelle

Annotation:

Les systèmes de fusion d’informations permettent de combiner des données issues de différentes sources d’informations tout en tenant compte de leur qualité. La combinaison de données issues de sources hétérogènes permet de profiter de la complémentarité des données et donc d’avoir potentiellement des performances plus élevées que celles obtenues en utilisant une seule source d’informations. L’utilisation de ces systèmes s’avère intéressante dans le cadre de la reconnaissance d’espèces d’arbres à travers la fusion d’informations issues de deux modalités : les feuilles et les écorces.Une seule modalité représente éventuellement différentes sources d’informations décrivant chacune une des caractéristiques les plus pertinentes. Ceci permet de reproduire la stratégie adoptée par les botanistes qui se basent sur ces même critères lors de la reconnaissance. L’adoption de cette stratégie entre dans la mise en valeur de l’aspect éducatif. Dans ce cadre, un système de fusion est envisageable afin de combiner les données issues d’une même modalité ainsi que les différentes modalités disponibles. Dans le contexte de la reconnaissance d’espèces d’arbres, il s’agit d’un problème réel où les photos des feuilles et des écorces sont prises en milieu naturel. Le traitement de ce type de données est compliqué vue leurs spécificités dues d’une part à la nature des objets à reconnaître (âge, similarité inter-espèces et variabilité intra-espèce) et d’autre part à l’environnement.Des erreurs peuvent s’accumuler tout au long du processus précédant la fusion. L’intérêt de la fusion est de prendre en compte toutes les imperfections pouvant entacher les données disponibles et essayer de bien les modéliser. La fusion est d’autant plus efficace que les données sont bien modélisées. La théorie des fonctions de croyance représente l’un des cadres théoriques les plus aptes à gérer et représenter l’incertitude, l’imprécision, le conflit, etc. Cette théorie tire son importance de sa richesse en termes d’outils permettant de gérer les différentes sources d’imperfections ainsi que les spécificités des données disponibles. Dans le cadre de cette théorie, il est possible de modéliser les données à travers la construction de fonctions de masse. Il est également possible de gérer la complexité calculatoire grâce aux approximations permettant de réduire le nombre d’éléments focaux. Le conflit étant l’une des sources d’imperfections les plus présentes, peut être traité à travers la sélection de la règle de combinaison la mieux adaptée.En fusionnant des sources d’informations ayant des degrés de fiabilité différents, il est possible que la source la moins fiable affecte les données issues de la source la plus fiable. Une des solutions pour ce problème est de chercher à améliorer les performances de la source la moins fiable. Ainsi, en la fusionnant avec d’autres sources, elle apportera des informations utiles et contribuera à son tour à l’amélioration des performances du système de fusion. L’amélioration des performances d’une source d’informations peut s’effectuer à travers la correction des fonctions de masse. Dans ce cadre, la correction peut se faire en se basant sur des mesures de la pertinence ou de la sincérité de la source étudiée. Les matrices de confusion présentent une source de données à partir desquelles des méta-connaissances caractérisant l’état d’une source peuvent être extraites.Dans ce manuscrit, le système de fusion proposé est un système de fusion hiérarchique mis en place dans le cadre de la théorie des fonctions de croyance. Il permet de fusionner les données issues des feuilles et des écorces et propose à l’utilisateur une liste des espèces les plus probables tout en respectant l’objectif éducatif de l’application. La complexité calculatoire de ce système de fusion est assez réduite permettant, à long termes, d’implémenter l’application sur un Smart-phone
Information fusion systems allow the combination of data issued from different sources of information while considering their quality. Combining data from heterogeneous sources makes it possible to take advantage of the complementarity of the data and thus potentially have higher performances than those obtained when using a single source of information.The use of these systems is interesting in the context of tree species recognition through the fusion of information issued from two modalities : leaves and barks. A single modality may represent different sources of information, each describing one of its most relevant characteristics. This makes it possible to reproduce the strategy adopted by botanists who base themselves on these same criteria. The adoption of this strategy is part of the enhancement of the educational aspect. In this context, a merger system is conceivable in order to combine the data issued from one modality as well as the data issued from different modalities. In the context of tree species recognition, we treat a real problem since the photos of leaves and bark are taken in the natural environment. The processing of this type of data is complicated because of their specificities due firstly to the nature of the objects to be recognized (age, inter-species similarity and intra-species variability) and secondly to the environment.Errors can be accumulated during the pre-fusion process. The merit of the fusion is to take into account all the imperfections that can taint the available data and try to model them well. The fusion is more effective if the data is well modeled. The theory of belief functions represents one of the best theoretical frameworks able to manage and represent uncertainty, inaccuracy, conflict, etc. This theory is important because of its wealth of tools to manage the various sources of imperfections as well as the specificities of the available data. In the framework of this theory, it is possible to model the data through the construction of mass functions. It is also possible to manage the computational complexity thanks to the approximations allowing to reduce the number of focal elements. Conflict being one of the most present sources of imperfections, can be dealt through the selection of the best combination rule.By merging sources of information with different degrees of reliability, it is possible that the least reliable source affects the data issued from the most reliable one. One of the solutions for this problem is to try to improve the performances of the least reliable source. Thus, by merging with other sources, it will provide useful information and will in turn contribute in improving the performance of the fusion system.The performance improvement of an information source can be effected through the correction of mass functions. In this context, the correction can be made based on measures of the relevance or sincerity of the studied source. The confusion matrices present a data source from which meta-knowledge characterizing the state of a source can be extracted. In this manuscript, the proposed fusion system is a hierarchical fusion system set up within the framework of belief function theory. It allows to merge data from leaves and barks and provides the user with a list of the most likely species while respecting the educational purpose of the application. The computational complexity of this fusion system is quite small allowing, in the long term, to implement the application on a Smart-phone

APA, Harvard, Vancouver, ISO und andere Zitierweisen

17

Saxena, Shreyas. „Apprentissage de représentations pour la reconnaissance visuelle“. Thesis, Université Grenoble Alpes (ComUE), 2016. http://www.theses.fr/2016GREAM080/document.

Der volle Inhalt der Quelle

Annotation:

Dans cette dissertation, nous proposons des méthodes d’apprentissage automa-tique aptes à bénéficier de la récente explosion des volumes de données digitales.Premièrement nous considérons l’amélioration de l’efficacité des méthodes derécupération d’image. Nous proposons une approche d’apprentissage de métriques locales coordonnées (Coordinated Local Metric Learning, CLML) qui apprends des métriques locales de Mahalanobis, puis les intègre dans une représentation globale où la distance l2 peut être utilisée. Ceci permet de visualiser les données avec une unique représentation 2D, et l’utilisation de méthodes de récupération efficaces basées sur la distance l2. Notre approche peut être interprétée comme l’apprentissage d’une projection linéaire de descripteurs donnés par une méthode a noyaux de grande dimension définie explictement. Cette interprétation permet d’appliquer des outils existants pour l’apprentissage de métriques de Mahalanobis à l’apprentissage de métriques locales coordonnées. Nos expériences montrent que la CLML amé-liore les résultats en matière de récupération de visage obtenues par les approches classiques d’apprentissage de métriques locales et globales.Deuxièmement, nous présentons une approche exploitant les modèles de ré-seaux neuronaux convolutionnels (CNN) pour la reconnaissance faciale dans lespectre visible. L’objectif est l’amélioration de la reconnaissance faciale hétérogène, c’est à dire la reconnaissance faciale à partir d’images infra-rouges avec des images d’entraînement dans le spectre visible. Nous explorerons différentes stratégies d’apprentissage de métriques locales à partir des couches intermédiaires d’un CNN, afin de faire le rapprochement entre des images de sources différentes. Dans nos expériences, la profondeur de la couche optimale pour une tâche donnée est positivement corrélée avec le changement entre le domaine source (données d’entraînement du CNN) et le domaine cible. Les résultats montrent que nous pouvons utiliser des CNN entraînés sur des images du spectre visible pour obtenir des résultats meilleurs que l’état de l’art pour la reconnaissance faciale hétérogène (images et dessins quasi-infrarouges).Troisièmement, nous présentons les "tissus de neurones convolutionnels" (Convolutional Neural Fabrics) permettant l’exploration de l’espace discret et exponentiellement large des architectures possibles de réseaux neuronaux, de manière efficiente et systématique. Au lieu de chercher à sélectionner une seule architecture optimale, nous proposons d’utiliser un "tissu" d’architectures combinant un nombre exponentiel d’architectures en une seule. Le tissu est une représentation 3D connectant les sorties de CNNs à différentes couches, échelles et canaux avec un motif de connectivité locale, homogène et creux. Les seuls hyper-paramètres du tissu (le nombre de canaux et de couches) ne sont pas critiques pour la performance. La nature acyclique du tissu nous permet d’utiliser la rétro-propagation du gradient durant la phase d’apprentissage. De manière automatique, nous pouvons donc configurer le tissu de manière à implémenter l’ensemble de toutes les architectures possibles (un nombre exponentiel) et, plus généralement, des ensembles (combinaisons) de ces modèles. La complexité de calcul et de taille mémoire du tissu évoluent de manière linéaire alors qu’il permet d’exploiter un nombre exponentiel d’architectures en parallèle, en partageant les paramètres entre architectures. Nous présentons des résultats à l’état de l’art pour la classification d’images sur le jeu de données MNIST et CIFAR10, et pour la segmentation sémantique sur le jeu de données Part Labels
In this dissertation, we propose methods and data driven machine learning solutions which address and benefit from the recent overwhelming growth of digital media content.First, we consider the problem of improving the efficiency of image retrieval. We propose a coordinated local metric learning (CLML) approach which learns local Mahalanobis metrics, and integrates them in a global representation where the l2 distance can be used. This allows for data visualization in a single view, and use of efficient ` 2 -based retrieval methods. Our approach can be interpreted as learning a linear projection on top of an explicit high-dimensional embedding of a kernel. This interpretation allows for the use of existing frameworks for Mahalanobis metric learning for learning local metrics in a coordinated manner. Our experiments show that CLML improves over previous global and local metric learning approaches for the task of face retrieval.Second, we present an approach to leverage the success of CNN models forvisible spectrum face recognition to improve heterogeneous face recognition, e.g., recognition of near-infrared images from visible spectrum training images. We explore different metric learning strategies over features from the intermediate layers of the networks, to reduce the discrepancies between the different modalities. In our experiments we found that the depth of the optimal features for a given modality, is positively correlated with the domain shift between the source domain (CNN training data) and the target domain. Experimental results show the that we can use CNNs trained on visible spectrum images to obtain results that improve over the state-of-the art for heterogeneous face recognition with near-infrared images and sketches.Third, we present convolutional neural fabrics for exploring the discrete andexponentially large CNN architecture space in an efficient and systematic manner. Instead of aiming to select a single optimal architecture, we propose a “fabric” that embeds an exponentially large number of architectures. The fabric consists of a 3D trellis that connects response maps at different layers, scales, and channels with a sparse homogeneous local connectivity pattern. The only hyperparameters of the fabric (the number of channels and layers) are not critical for performance. The acyclic nature of the fabric allows us to use backpropagation for learning. Learning can thus efficiently configure the fabric to implement each one of exponentially many architectures and, more generally, ensembles of all of them. While scaling linearly in terms of computation and memory requirements, the fabric leverages exponentially many chain-structured architectures in parallel by massively sharing weights between them. We present benchmark results competitive with the state of the art for image classification on MNIST and CIFAR10, and for semantic segmentation on the Part Labels dataset

APA, Harvard, Vancouver, ISO und andere Zitierweisen

18

Vazquez, Rodriguez Juan Fernando. „Transformateurs multimodaux pour la reconnaissance des émotions“. Electronic Thesis or Diss., Université Grenoble Alpes, 2023. http://www.theses.fr/2023GRALM057.

Der volle Inhalt der Quelle

Annotation:

La santé mentale et le bien-être émotionnel ont une influence significative sur la santé physique et sont particulièrement importants pour un viellissement en bonne santé. Les avancées continues dans le domaine des capteurs et de la microélectronique en général ont permis l’avènement de nouvelles technologies pouvant être déployées dans les maisons pour surveiller la santé et le bien-être des occupants. Ces technologies de captation peuvent être combinées aux avancées récentes sur l’apprentissage automatique pour proposer des services utiles pour vieillir en bonne santé. Dans ce cadre, un système de reconnaissance automatique d’émotions peut être un outil s’assurant du bien-être de personnes fragiles. Dès lors, il est intéressant de développer un système pouvant déduire des informations sur les émotions humaines à partir de modalités de captation multiples, et pouvant être entrainé sans requérir de larges jeux de données labellisées d’apprentissage.Cette thèse aborde le problème de la reconnaissance d’émotions à partir de différents types de signaux qu’un environnement intelligent peut capter, tels que des signaux visuels, audios, et physiologiques. Pour ce faire, nous développons différents modèles basés sur l’architecture extit{Transformer}, possédant des caractéristiques utiles à nos besoins comme la capacité à modéliser des dépendances longues et à sélectionner les parties importantes des signaux entrants. Nous proposons en premier lieu un modèle pour reconnaitre les émotions à partir de signaux physiologiques individuels. Nous proposons une technique de pré-apprentissage auto-supervisé utilisant des données physiologiques non-labellisées, qui améliore les performances du modèle. Cette approche est ensuite étendue pour exploiter la complémentarité de différents types de signaux physiologiques. Nous développons un modèle qui combine ces différents signaux physiologiques, et qui exploite également le pré-apprentissage auto-supervisé. Nous proposons une méthode de pré-apprentissage qui ne nécessite pas un jeu de données unique contenant tous les types de signaux utilisés, pouvant au contraire être pré-entrainé avec des jeux de données différents pour chaque type de signal.Pour tirer parti des différentes modalités qu’un environnement connecté peut offrir, nous proposons un modèle multimodal exploitant des signaux vidéos, audios, et physiologiques. Ces signaux étant de natures différentes, ils capturent des modes distincts d’expression des émotions, qui peuvent être complémentaires et qu’il est donc intéressant d’exploiter simultanément. Cependant, dans des situations d’usage réelles, il se peut que certaines de ces modalités soient manquantes. Notre modèle est suffisamment flexible pour continuer à fonctionner lorsqu’une modalité est manquante, mais sera moins performant. Nous proposons alors une stratégie d’apprentissage permettant de réduire ces baisses de performances lorsqu’une modalité est manquante.Les méthodes développées dans cette thèse sont évaluées sur plusieurs jeux de données. Les résultats obtenus montrent que nos approches de extit{Transformer} pré-entrainé sont performantes pour reconnaitre les émotions à partir de signaux physiologiques. Nos résultats mettent également en lumière les capacités de notre solution à aggréger différents signaux multimodaux, et à s’adapter à l’absence de l’un d’entre eux. Ces résultats montrent que les approches proposées sont adaptées pour reconnaitre les émotions à partir de multiples capteurs de l’environnement. Nos travaux ouvrent de nouvelles pistes de recherche sur l’utilisation des extit{Transformers} pour traiter les informations de capteurs d’environnements intelligents et sur la reconnaissance d’émotions robuste dans les cas où des modalités sont manquantes. Les résultats de ces travaux peuvent contribuer à améliorer l’attention apportée à la santé mentale des personnes fragiles
Mental health and emotional well-being have significant influence on physical health, and are especially important for healthy aging. Continued progress on sensors and microelectronics has provided a number of new technologies that can be deployed in homes and used to monitor health and well-being. These can be combined with recent advances in machine learning to provide services that enhance the physical and emotional well-being of individuals to promote healthy aging. In this context, an automatic emotion recognition system can provide a tool to help assure the emotional well-being of frail people. Therefore, it is desirable to develop a technology that can draw information about human emotions from multiple sensor modalities and can be trained without the need for large labeled training datasets.This thesis addresses the problem of emotion recognition using the different types of signals that a smart environment may provide, such as visual, audio, and physiological signals. To do this, we develop different models based on the Transformer architecture, which has useful characteristics such as their capacity to model long-range dependencies, as well as their capability to discern the relevant parts of the input. We first propose a model to recognize emotions from individual physiological signals. We propose a self-supervised pre-training technique that uses unlabeled physiological signals, showing that that pre-training technique helps the model to perform better. This approach is then extended to take advantage of the complementarity of information that may exist in different physiological signals. For this, we develop a model that combines different physiological signals and also uses self-supervised pre-training to improve its performance. We propose a method for pre-training that does not require a dataset with the complete set of target signals, but can rather, be trained on individual datasets from each target signal.To further take advantage of the different modalities that a smart environment may provide, we also propose a model that uses as inputs multimodal signals such as video, audio, and physiological signals. Since these signals are of a different nature, they cover different ways in which emotions are expressed, thus they should provide complementary information concerning emotions, and therefore it is appealing to use them together. However, in real-world scenarios, there might be cases where a modality is missing. Our model is flexible enough to continue working when a modality is missing, albeit with a reduction in its performance. To address this problem, we propose a training strategy that reduces the drop in performance when a modality is missing.The methods developed in this thesis are evaluated using several datasets, obtaining results that demonstrate the effectiveness of our approach to pre-train Transformers to recognize emotions from physiological signals. The results also show the efficacy of our Transformer-based solution to aggregate multimodal information, and to accommodate missing modalities. These results demonstrate the feasibility of the proposed approaches to recognizing emotions from multiple environmental sensors. This opens new avenues for deeper exploration of using Transformer-based approaches to process information from environmental sensors and allows the development of emotion recognition technologies robust to missing modalities. The results of this work can contribute to better care for the mental health of frail people

APA, Harvard, Vancouver, ISO und andere Zitierweisen

19

Saeed, Usman. „Analyse des lèvres pour reconnaissance des personnes“. Phd thesis, Télécom ParisTech, 2010. http://pastel.archives-ouvertes.fr/pastel-00005849.

Der volle Inhalt der Quelle

Annotation:

Dans cette thèse nous nous concentrons sur une caractéristique locale du visage humain que sont les lèvres en termes de pertinence et influence sur la reconnaissance de la personne. Une étude détaillée est réalisée à l'égard de différentes étapes, telles que la détection, l'évaluation, la normalisation et les applications liées de la bouche. Au départ, on présente un algorithme de détection des lèvres en fusionnant deux méthodes indépendantes. La première méthode est basée sur la détection de contours et la deuxième orientée sur la segmentation. On exploite leurs points forts en combinant les deux méthodes par fusion. Ensuite, on extrait les caractéristiques qui modélisent l'aspect comportemental du mouvement des lèvres lorsque la personne parle afin de les exploiter pour la reconnaissance des personnes. Les caractéristiques du comportement incluent des caractéristiques statiques, et des caractéristiques dynamiques en fonction du flux optique. Ces caractéristiques sont utilisées pour construire le modèle du client par une Mixture de Gaussiennes et enfin la classification est réalisée en utilisant une règle de décision bayésienne. Enfin, on propose une méthode de normalisation temporelle pour le traitement des variations du mouvement des lèvres pendant le discours. Étant donné plusieurs vidéos où une personne répète la même phrase plusieurs fois, nous étudions le mouvement des lèvres dans l'une de ces vidéos et on sélectionne certaines images clés comme images de synchronisation. Après, on synchronise le reste des vidéos par rapport au images clés de la première vidéo. Enfin toutes les vidéos sont normalisées temporellement par interpolation à l'aide de "morphing".

APA, Harvard, Vancouver, ISO und andere Zitierweisen

20

Saeed, Usman. „Analyse des lèvres pour reconnaissance des personnes“. Phd thesis, Paris, Télécom ParisTech, 2010. https://pastel.hal.science/pastel-00005849.

Der volle Inhalt der Quelle

Annotation:

Dans cette thèse nous nous concentrons sur une caractéristique locale du visage humain que sont les lèvres en termes de pertinence et influence sur la reconnaissance de la personne. Une étude détaillée est réalisée à l'égard de différentes étapes, telles que la détection, l'évaluation, la normalisation et les applications liées de la bouche. Au départ, on présente un algorithme de détection des lèvres en fusionnant deux méthodes indépendantes. La première méthode est basée sur la détection de contours et la deuxième orientée sur la segmentation. On exploite leurs points forts en combinant les deux méthodes par fusion. Ensuite, on extrait les caractéristiques qui modélisent l'aspect comportemental du mouvement des lèvres lorsque la personne parle afin de les exploiter pour la reconnaissance des personnes. Les caractéristiques du comportement incluent des caractéristiques statiques, et des caractéristiques dynamiques en fonction du flux optique. Ces caractéristiques sont utilisées pour construire le modèle du client par une Mixture de Gaussiennes et enfin la classification est réalisée en utilisant une règle de décision bayésienne. Enfin, on propose une méthode de normalisation temporelle pour le traitement des variations du mouvement des lèvres pendant le discours. Étant donné plusieurs vidéos où une personne répète la même phrase plusieurs fois, nous étudions le mouvement des lèvres dans l'une de ces vidéos et on sélectionne certaines images clés comme images de synchronisation. Après, on synchronise le reste des vidéos par rapport au images clés de la première vidéo. Enfin toutes les vidéos sont normalisées temporellement par interpolation à l'aide de "morphing"
In this doctoral dissertation we focus on a local feature of the human face namely the lip and analyse it for its relevance and influence on person recognition. In depth study is carried out with respect to various steps involved, such as detection, evaluation, normalization and the applications of the human lip motion. Initially we present a lip detection algorithm that is based on the fusion of two independent methods. The first method is based on edge detection and the second one on region segmentation, each having distinct characteristics and thus exhibit different strengths and weaknesses. We exploit these strengths by combining the two methods using fusion. Next we extract features which model the behavioural aspect of lip motion during speech and exploit them for person recognition. The behavioural features include static features and dynamic features based on optical flow. These features are used to build client model by Gaussian Mixture Model (GMM) and finally the classification is achieved using a Bayesian decision rule. Lastly we propose a temporal normalization method for handling the variation caused by lip motion during speech. Given a group of videos for a person uttering the same sentence multiple times we study the lip motion in one of the videos and select certain key frames as synchronization frames. We then synchronize these frames from the first video with the remaining videos of the same person. Finally all the videos are normalized temporally by interpolation using lip morphing

APA, Harvard, Vancouver, ISO und andere Zitierweisen

21

Idan, Yizhak. „Contribution à l'étude des réseaux de neurones formels pour la reconnaissance des formes : application pour la reconnaissance de chiffres manuscrits /“. Paris : École nationale supérieure des télécommunications, 1993. http://catalogue.bnf.fr/ark:/12148/cb35579882x.

Der volle Inhalt der Quelle

APA, Harvard, Vancouver, ISO und andere Zitierweisen

22

Barrat, Sabine. „Modèles graphiques probabilistes pour la reconnaissance de formes“. Phd thesis, Université Nancy II, 2009. http://tel.archives-ouvertes.fr/tel-00530755.

Der volle Inhalt der Quelle

Annotation:

La croissance rapide d'Internet et de l'information multimédia a suscité un besoin en développement de techniques de recherche d'information multimédia, et en particulier de recherche d'images. On peut distinguer deux tendances. La première, appelée recherche d'images à base de texte, consiste à appliquer des techniques de recherche d'information textuelle à partir d'images annotées. Le texte constitue une caractéristique de haut-niveau, mais cette technique présente plusieurs inconvénients : elle nécessite un travail d'annotation fastidieux. De plus, les annotations peuvent être ambiguës car deux utilisateurs peuvent utiliser deux mots-clés différents pour décrire la même image. Par conséquent, plusieurs approches ont proposé d'utiliser l'ontologie Wordnet, afin de réduire ces ambiguïtés potentielles. La seconde approche, appelée recherche d'images par le contenu, est plus récente. Ces techniques de recherche d'images par le contenu sont basées sur des caractéristiques visuelles (couleur, texture ou forme), calculées automatiquement, et utilisent une mesure de similarité afin de retrouver des images. Cependant, les performances obtenues ne sont pas vraiment acceptables, excepté dans le cas de corpus spécialisés. De façon à améliorer la reconnaissance, une solution consiste à combiner différentes sources d'information : par exemple, différentes caractéristiques visuelles et/ou de l'information sémantique. Or, dans de nombreux problèmes de vision, on dispose rarement d'échantillons d'apprentissage entièrement annotés. Par contre, il est plus facile d'obtenir seulement un sous-ensemble de données annotées, car l'annotation d'un sous-ensemble est moins contraignante pour l'utilisateur. Dans cette direction, cette thèse traite des problèmes de modélisation, classification et annotation d'images. Nous présentons une méthode pour l'optimisation de la classification d'images naturelles, en utilisant une approche de classification d'images basée à la fois sur le contenu des images et le texte associé aux images, et en annotant automatiquement les images non annotées. De plus, nous proposons une méthode de reconnaissance de symboles, en combinant différentes caractéristiques visuelles. L'approche proposée est dérivée de la théorie des modèles graphiques probabilistes et dédiée aux deux tâches de classification d'images naturelles partiellement annotées, et d'annotation. Nous considérons une image comme partiellement annotée si son nombre de mots-clés est inférieur au maximum de mots-clés observés dans la vérité-terrain. Grâce à leur capacité à gérer les données manquantes et à représenter d'éventuelles relations entre mots-clés, les modèles graphiques probabilistes ont été proposés pour représenter des images partiellement annotées. Par conséquent, le modèle que nous proposons ne requiert pas que toutes les images soient annotées : quand une image est partiellement annotée, les mots-clés manquants sont considérés comme des données manquantes. De plus, notre modèle peut étendre automatiquement des annotations existantes à d'autres images partiellement annotées, sans intervention de l'utilisateur. L'incertitude autour de l'association entre un ensemble de mots-clés et une image est représentée par une distribution de probabilité jointe sur le vocabulaire des mots-clés et les caractéristiques visuelles extraites de nos bases d'images. Notre modèle est aussi utilisé pour reconnaître des symboles en combinant différents types de caractéristiques visuelles (caractéristiques discrètes et continues). De plus, de façon à résoudre le problème de dimensionnalité dû à la grande dimension des caractéristiques visuelles, nous avons adapté une méthode de sélection de variables. Enfin, nous avons proposé un modèle de recherche d'images permettant à l'utilisateur de formuler des requêtes sous forme de mots-clés et/ou d'images. Ce modèle intègre un processus de retour de pertinence. Les résultats expérimentaux, obtenus sur de grandes bases d'images complexes, généralistes ou spécialisées, montrent l'intérêt de notre approche. Enfin, notre méthode s'est montrée compétitive avec des modèles de l'état de l'art.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

23

Defretin, Joseph. „Stratégies de vision active pour la reconnaissance d'objets“. Phd thesis, École normale supérieure de Cachan - ENS Cachan, 2011. http://tel.archives-ouvertes.fr/tel-00696044.

Der volle Inhalt der Quelle

Annotation:

Cette thèse, réalisée en coopération avec l'ONERA, concerne la reconnaissance active d'objets 3D par un agent autonome muni d'une caméra d'observation. Alors qu'en reconnaissance passive les modalités d'acquisitions des observations sont imposées et génèrent parfois des ambiguïtés, la reconnaissance active exploite la possibilité de contrôler en ligne ces modalités d'acquisition au cours d'un processus d'inférence séquentiel dans le but de lever l'ambiguïté. L'objectif des travaux est d'établir des stratégies de planification dans l'acquisition de l'information avec le souci d'une mise en œuvre réaliste de la reconnaissance active. Le cadre de l'apprentissage statistique est pour cela mis à profit. La première partie des travaux se consacre à apprendre à planifier. Deux contraintes réalistes sont prise en compte : d'une part, une modélisation imparfaite des objets susceptible de générer des ambiguïtés supplémentaires - d'autre part, le budget d'apprentissage est coûteux (en temps, en énergie), donc limité. La deuxième partie des travaux s'attache à exploiter au mieux les observations au cours de la reconnaissance. La possibilité d'une reconnaissance active multi-échelles est étudiée pour permettre une interprétation au plus tôt dans le processus séquentiel d'acquisition de l'information. Les observations sont également utilisées pour estimer la pose de l'objet de manière robuste afin d'assurer la cohérence entre les modalités planifiées et celles réellement atteintes par l'agent visuel.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

24

Roy, Patrice C. „Modèle possibiliste pour la reconnaissance d'activités habitat intelligent“. Thèse, Université de Sherbrooke, 2012. http://savoirs.usherbrooke.ca/handle/11143/5171.

Der volle Inhalt der Quelle

Annotation:

Le vieillissement actuel de la population provoque un accroissement de problèmes dans les systèmes de santé, dont une pénurie de personnel médical pour les soins à domicile. Le vieillissement de la population a également pour effet d'augmenter le nombre de personnes avec troubles cognitifs. Les comportements incohérents induits par les symptômes des troubles cognitifs limitent la capacité de ces personnes à réaliser leurs activités de la vie quotidienne (AVQ). L'un des axes de recherche prometteurs de cette problématique est l'amélioration et le maintien de la qualité de vie des personnes avec troubles cognitifs dans leurs domiciles. Pour répondre à cette problématique, plusieurs laboratoires de recherche, dont le laboratoire de DOmotique et d'informatique Mobile de l'Université de Sherbrooke (DOMUS), explorent les différents moyens de soutenir, à l'intérieur d'un habitat intelligent, un occupant avec troubles cognitifs dans l'accomplissement de ses AVQ. Cette approche s'inscrit dans le récent courant de pensée issu de l'intelligence ambiante, qui fait référence à une tendance où les environnements sont enrichis avec des technologies (capteurs, effecteurs et autres dispositifs interconnectés par un réseau), dans le but de concevoir un système pouvant planifier une assistance ponctuelle aux occupants en fonction des informations recueillies et de l'historique des données accumulées. L'une des difficultés majeures inhérentes à ce contexte est la reconnaissance et la prédiction des comportements anormaux lorsque les occupants effectuent leurs AVQ à l'intérieur d'un habitat intelligent. Cette thèse vise à contribuer à l'amélioration du processus de reconnaissance de comportements d'un occupant avec troubles cognitifs. Notre proposition consiste en une approche de reconnaissance et prédiction de comportements fondée sur une formalisation des actions basée sur la théorie des possibilités, une alternative à la théorie des probabilités. Les actions sont inférées à partir de l'état actuellement observé de l'habitat intelligent obtenu grâce aux évènements envoyés par les capteurs présents dans l'appartement, lesquelles peuvent fournir une information incomplète et imparfaite. À partir de la séquence d'actions observées plausibles, l'approche proposée utilise une formalisation des activités en structure de plans d'actions pour inférer le comportement observé de l'occupant. Cette approche est en mesure de considérer les comportements erronés, où l'occupant effectue de façon erronée certaines activités tandis que d'autres peuvent être effectuées de façon cohérente, et les comportements cohérents, où l'occupant effectue une ou plusieurs activités de façon cohérente. Les hypothèses sur le comportement observé sont ensuite utilisées pour déterminer les opportunités d'assistance que l'habitat intelligent peut offrir. L'approche proposée a été implémentée et validée au sein de l'infrastructure du projet"Ambient Intelligence for Home-based Elderly Care" à l'"Institute for Infocomm Research" de Singapour et présente des résultats prometteurs pour des scénarios de cas réels effectués dans l'infrastructure. Le développement d'un habitat intelligent capable de maintenir et d'améliorer la qualité de vie des personnes avec troubles cognitifs permettrait de diminuer le fardeau des aidants naturels et professionnels, facilitant le choix des ces personnes de rester à domicile. Ce type de technologie pourrait constituer une solution viable aux problèmes des systèmes de santé associés au vieillissement de la population. De plus, ce type d'approche peut également être utilisé dans des contextes où les comportements anormaux et les situations à risque doivent être évités comme, par exemple, dans le domaine de l'aviation.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

25

Bazeille, Stéphane. „Vision sous-marine monoculaire pour la reconnaissance d'objets“. Brest, 2008. http://www.theses.fr/2008BRES2023.

Der volle Inhalt der Quelle

Annotation:

Dans le contexte sous-marin, et à l’inverse du capteur sonar qui reste le plus employé à grande distance pour la détection et la classification, la caméra vidéo est efficace à faible portée lors des phases d’approche, de reconnaissance d’objets et d’intervention. Elle dispose en effet d’atouts notables comme une haute résolution, une facilité d’interprétation on encore un faible coût. Aujourd’hui presque tous les véhicules sous-marins scientifiques, industriels ou militaires en sont équipés. Ils sont actuellement plutôt télé-opérés par un opérateur et on y trouve associés des traitements automatiques que très rarement. Ces traitements automatiques sont pourtant des technologies essentielles pour les développements émergents des robots autonomes sous-marins très prisés aujourd’hui dans un contexte d’expansion des marchés liés à la sécurité et à l’exploitation des ressources maritimes. Ces travaux de thèse visent à apporter les innovations nécessaires, et à promouvoir l’emploi du capteur vidéo dans le domaine sous-marin. L’étude proposée concerne le développement des traitements automatiques de reconnaissance d’objets en vidéo sous-marine, avec une attention particulière apportée aux objets manufacturés. Les scènes sous-marines observées sont classiquement plus simples et plus limitées en profondeur d’observation que les scènes urbaines ou que l’intérieur d’un bâtiment. Toutefois, ce contexte présente des difficultés spécifiques telles que les variations d’éclairage et la turbidité de l’eau qui limitent la visibilité et dégradent fortement les images. Ceci a pour conséquence de rendre les traitements difficiles et nécessite donc la création de nouveaux algorithmes de vision robotique
In underwater context, traditional sensing methods like sonar are used at large range for detection and classification of objects. For a few years, the sonar sensor has been complemented by a vision sensor more efficient at short range for the approach, the object recognition and the intervention phases. Indeed, the camera has noticeable advantages like for example high resolution, simple interpretation or low cost. Today, it equips nearly any scientific, industrial or military underwater vehicles. Currently, underwater vehicles are rather distance controlled by a manipulator, and automatic processing is really uncommon. However, automatic processing is an essential technology for the AUV development. These kinds of vehicles are very popular today with the expansion of the market related to the security and the exploitation of the marine resources. This thesis aims at supplying the required advances and promoting the use of video technologies. The proposed study addresses the problem of automatic processing for underwater objects recognition, with a particular focus on man-made objects. Observed underwater scenes are traditionally simpler but more limited in depth than urban scenes or inside building scenes. Nevertheless, this context presents very specific difficulties like lighting variations and water turbidity which limit visibility and degrade considerably images. As a consequence processing is difflcult and require the development of new robotic vision algorithms

APA, Harvard, Vancouver, ISO und andere Zitierweisen

26

CANAMERO, MATESANZ DOLORES. „Replace : un modele pour la reconnaissance de plans“. Paris 11, 1995. http://www.theses.fr/1995PA112516.

Der volle Inhalt der Quelle

Annotation:

La reconnaissance de plans consiste a interpreter le comportement d'un agent en situation. Nous abordons ce theme sous l'angle de la resolution de problemes, dans le cadre de l'acquisition des connaissances dirigee par les modeles. Ceci est rendu possible par une conception de la resolution de problemes comme un processus d'elaboration d'un modele particularise du probleme qui guide la resolution et qui montre au cours de celle-ci ce que le resolveur connait sur le probleme. Nous proposons un modele au niveau epistemologique de la reconnaissance de plans non cooperative du comportement d'un agent dans un environnement dynamique a partir de sequences de donnees de bas niveau, dont le but est de fournir du conseil pour l'aide a la decision. Ce modele propose un cadre generique coherent, independant de toute implementation, qui rationalise cette activite et permet une resolution de problemes efficace. Le processus de reconnaissance est base sur la recuperation et l'evaluation incrementales de plans prototypiques representes sous forme de schemas, et tient compte du role des schemas dans le guidage de l'activite. Ces schemas contiennent divers types de connaissances concernant des plans d'action prototypiques dans des situations donnees suivant aussi bien une hierarchie de raffinement qu'une hierarchie de mise en uvre ; ils indexent aussi d'autres plans representant des modes de realisation alternatifs, non standard. Les plans sont organises dans une hierarchie comportant plusieurs types de relations, permettant la recherche d'hypotheses interpretatives aussi specifiques que possible, leur raffinement en termes des diverses composantes de l'action, et l'evaluation et reevaluation de leur etat de realisation, au fur et a mesure que de nouveaux donnees arrivent au systeme. L'interpretation du comportement de l'agent que ces hypotheses permettent de faire est revisee et mise a jour chaque fois que des nouveaux donnees sur le probleme sont disponibles.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

27

Lebourgeois, Frank. „Approche mixte pour la reconnaissance des documents imprimes“. Lyon, INSA, 1991. http://www.theses.fr/1991ISAL0013.

Der volle Inhalt der Quelle

Annotation:

L'étude présente un système de reconnaissance multifonte pour documents imprimés, utilisant des informations contextuelles concernant la typographie, la structure du document et la syntaxe. Tout d'abord une méthode ascendante rapide a été réalisée pour séparer le texte des images et reconnaître la structure logique du document. Une approche mixte est utilisée pour reconnaître les caractères isolés. Le premier étage réalise une préclassification automatique des formes identiques de caractères à l' a. Ide d'une construction dynamique d'une bibliothèque de formes. La forte redondance des images des caractères imprimés justifie cette approche. Le second étage reconnaît structurellement les modèles de caractères construits précédemment. Un étage à la fois syntaxique et statistique permet un taux de reconnaissance élevé
A recognition system for multi font printed documents using contextual informations about typography, structure of document and syntax, has been developed. First, a quick bottom up method to separate text from image and recognize logical structure of documents has been achieved. A mixed approach has been used to recognize individual characters. A first stage realizes a compaction at the character level compared to a dynamically built librairy of shapes. The high redundancy of character's image in printed document justifies this approach. A second stage structurally recognizes the previously built models of characters. A mixed syntaxic and statistic stage is used simultanous. It o perform a high recognition rate

APA, Harvard, Vancouver, ISO und andere Zitierweisen

28

Sur, Frédéric. „Décision à contrario pour la reconnaissance de formes“. Paris 9, 2004. https://portail.bu.dauphine.fr/fileviewer/index.php?doc=2004PA090048.

Der volle Inhalt der Quelle

Annotation:

La reconnaissance de formes est un domaine de la vision par ordinateur qui a de nombreuses applications pratiques. Elle aborde le problème de la recherche d'une forme requête dans une base de formes, selon certaines invariances. La plupart des méthodes de reconnaissance classent simplement les formes dans la base par rapport à une mesure de similarité à la requête. Leur talon d'Achille est l'étape de décision, qui devrait permettre de donner une réponse claire et précise à la question : "ces deux formes se ressemblent-elles ?". La solution proposée dans cette thèse consiste à borner le "nombre de fausses alarmes" de la forme requête parmi les formes de la base. Une étape de groupement permet d'atteindre un plus grand degré de confiance dans les détections obtenues. Tout au long de cette thèse, des décisions a contrario sont prises : un modèle de fond est construit, et plus un événement est rare pour le modèle, plus il est considéré comme significatif
Shape recognition is a field of computer vision which has many applications. It addresses the problem of finding out whether a query shape lies or not in a shape database, up to a certain invariance. Most shape recognition methods simply sort shapes from the database along some similarity measure to the query shape. Their Achilles' heel is the decision stage, which should aim at giving a clear-cut answer to the question: "do these two shapes look alike"? In this PhD thesis, the proposed solution consists in bounding the "number of false alarms" of the query shape among the database shapes. A grouping stage improves the level of confidence in the obtained detections. All along the thesis, a contrario decisions are made: a background model is designed, then the rarer an event is for this model, the more significant it ought to be considered

APA, Harvard, Vancouver, ISO und andere Zitierweisen

29

Camus, Matthieu. „Identification audio pour la reconnaissance de la parole“. Paris 5, 2011. http://www.theses.fr/2011PA05S014.

Der volle Inhalt der Quelle

Annotation:

Cette thèse de doctorat se place dans le cadre de la reconnaissance de la parole dans des documents audio. Le but de ce travail est d’adapter les principes de l’identification audio pour la reconnaissance de la parole ainsi que concevoir et développer des techniques d’identification robustes. Les systèmes d’identification audio par empreinte (audio fingerprinting) sont conçus pour l'indexation d’extraits de musique mais ne traitent pas des spécificités du signal de parole. Dans un premier temps, différentes méthodes d’identification audio par empreinte sont étudiées ainsi qu’un premier travail d’adaptation à la reconnaissance de la parole. Ce travail est poursuivi par le développement d’un système d’identification audio par empreinte dédié à la tâche de décodage acoustico-phonétique. De nouveaux types de sousempreinte basés sur des paramètres usuels de la parole sont alors proposés. Dans un second temps, les différents types de variabilité du signal de parole sont décrits ainsi que les principaux paramètres de représentation acoustique du signal de parole. La robustesse de différents types de sous-empreinte à la variabilité extrinsèque et à la variabilité intrinsèque est évaluée. En présence de perturbations liées à l’environnement et aux conditions de transmission du signal de parole (CTIMIT), un type de sous-empreinte issu de l’identification audio s’avère alors le plus robuste
This PhD thesis takes place within the framework of the speech recognition in audio contents. The purpose of this work is to adapt the principles of audio identification to speech recognition as well as to design and to develop robust identification techniques. Audio identification systems by audio fingerprinting are designed to music track indexation but do not handle the specificities of the speech signal. At first, various methods of audio identification by fingerprint are studied as well as a first work of adaptation to speech recognition. This work is followed by the development of an audio identification system by fingerprint dedicated to the ask of acoustic-phonetic decoding. New types of subfingerprint based on usual speech parameters are then proposed. Secondly, the various types of variability of the speech signal are described as well as the main parameters of acoustic representation of the speech signal. The robustness of various types of subfingerprint in extrincic variability and in intrinsic variability is estimated. In the presence of disturbances related to the environment and to the conditions of transmission of the speech signal (CTIMIT), a type of subfingerprint stemming from the audio identification turns out then the most robust

APA, Harvard, Vancouver, ISO und andere Zitierweisen

30

Das, Srijan. „Mécanismes d'attention spatio-temporels pour la reconnaissance d'activité“. Thesis, Université Côte d'Azur, 2020. https://tel.archives-ouvertes.fr/tel-03177892.

Der volle Inhalt der Quelle

Annotation:

Cette thèse vise la reconnaissance des actions humaines dans les vidéos. La reconnaissance des actions est une tâche compliquée dans le domaine de la vision par ordinateur en raison de ses défis complexes et élevés. Avec l'émergence de l'apprentissage en profondeur et des ensembles de données à grande échelle provenant de sources Internet, des améliorations substantielles ont été apportées à la compréhension vidéo. Par exemple, des réseaux convolutifs 3D de pointe comme I3D pré-formés sur d'énormes ensembles de données comme Kinetics ont réussi à accroître la reconnaissance des actions des vidéos Internet. Mais, ces réseaux à noyaux rigides appliqués sur l'ensemble du volume espace-temps ne peuvent pas relever les défis présentés par les activités de la vie quotidienne (ADL).Nous sommes particulièrement intéressés par la représentation vidéo discriminante pour ADL. Outre les défis des vidéos génériques, ADL présente - (i) des actions à grain fin avec des mouvements courts et subtils comme verser du grain et verser de l'eau, (ii) des actions avec des modèles visuels similaires différant par des modèles de mouvement comme se frotter les mains et applaudir, et enfin ( iii) de longues actions complexes comme la cuisine. Afin de relever ces défis, nous avons apporté des contributions.La première contribution comprend - une stratégie de fusion multimodale pour prendre en compte les avantages des modalités multiples pour classer les actions. Cependant, la question demeure: comment combiner plusieurs modalités de bout en bout? Comment pouvons-nous utiliser les informations 3D pour guider les réseaux RVB de pointe actuels pour la classification des actions? À cette fin, nous proposons des mécanismes articulés d'attention axée sur la pose pour la classification des actions. Nous proposons trois variantes de mécanismes d'attention spatio-temporelle exploitant les modalités de pose RVB et 3D pour relever les défis susmentionnés (i) et (ii) pour des actions courtes. Notre troisième contribution principale est un modèle temporel en plus de notre modèle basé sur l'attention. La représentation vidéo conservant des informations temporelles denses permet au modèle temporel de modéliser de longues actions complexes, ce qui est crucial pour ADL.Nous avons évalué notre première contribution sur trois ensembles de données publics à petite échelle: CAD-60, CAD-120 et MSRDailyActivity3D. D'un autre côté, nous avons évalué nos deux contributions restantes sur quatre ensembles de données publics: un ensemble de données sur l'activité humaine à grande échelle: NTU-RGB + D 120, son sous-ensemble NTU-RGB + D 60, un ensemble de données sur l'activité humaine difficile dans le monde réel: Toyota Smarthome et un ensemble de données d'interaction homme-objet à petite échelle Northwestern UCLA. Nos expériences montrent que les méthodes proposées dans cette thèse surpassent les résultats de pointe
This thesis targets recognition of human actions in videos. Action recognition is a complicated task in the field of computer vision due to its high complex challenges. With the emergence of deep learning and large scale datasets from internet sources, substantial improvements have been made in video understanding. For instance, state-of-the-art 3D convolutional networks like I3D pre-trained on huge datasets like Kinetics have successfully boosted the recognition of actions from internet videos. But, these networks with rigid kernels applied across the whole space-time volume cannot address the challenges exhibited by Activities of Daily Living (ADL). We are particularly interested in discriminative video representation for ADL. Besides the challenges in generic videos, ADL exhibits - (i) fine-grained actions with short and subtle motion like pouring grain and pouring water, (ii) actions with similar visual patterns differing in motion patterns like rubbing hands and clapping, and finally (iii) long complex actions like cooking. In order to address these challenges, we have made three key contributions. The first contribution includes - a multi-modal fusion strategy to take the benefits of multiple modalities into account for classifying actions. However the question remains, how to combine multiple modalities in an end-to-end manner? How can we make use of the 3D information to guide the current state-of-the-art RGB networks for action classification? To this end, we propose articulated pose driven attention mechanisms for action classification. We propose, three variants of spatio-temporal attention mechanisms exploiting RGB and 3D pose modalities to address the aforementioned challenges (i) and (ii) for short actions. Our third main contribution is a Temporal Model on top of our attention based model. The video representation retaining dense temporal information enables the temporal model to model long complex actions which is crucial for ADL.We have evaluated our first contribution on three small-scale public datasets: CAD-60, CAD-120 and MSRDailyActivity3D. On the other hand, we have evaluated our remaining two contributions on four public datasets: a large scale human activity dataset: NTU-RGB+D 120, its subset NTU-RGB+D 60, a real-world challenging human activity dataset: Toyota Smarthome and a small scale human-object interaction dataset Northwestern UCLA. Our experiments show that the methods proposed in this thesis outperform the state-of-the-art results

APA, Harvard, Vancouver, ISO und andere Zitierweisen

31

Brassard, Louis. „Reconnaissance visuelle pour un robot-cueilleur de tomates“. Thèse, Chicoutimi : Université du Québec à Chicoutimi, 1990. http://theses.uqac.ca.

Der volle Inhalt der Quelle

APA, Harvard, Vancouver, ISO und andere Zitierweisen

32

Hiyadi, Hajar. „Reconnaissance 3D de gestes pour l'interaction homme-système“. Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLE052/document.

Der volle Inhalt der Quelle

Annotation:

Le but des applications visées par l’interaction homme-système est de parvenir à une interaction naturelle qui simule l’interaction homme-homme.Comme dans la communication homme-homme,les gestes sont aussi très utilisés dans la communication homme-système. Cette thèse porte sur la reconnaissance de gestes pour l’interaction naturelle homme-système basée sur les gestes. L’objectif des travaux menés durant cette thèse est de proposer des approches de reconnaissance de différents types de geste dynamiques : gestes simples et gestes composés. Tous d'abord, nous avons proposé un nouveau descripteur 3D de gestes calculé par les angles des articulations du corps humain à partir d’un flux de profondeur fourni par le capteur Kinect. Ensuite, nous avons proposé deux approches pour la reconnaissance de gestes dynamiques : a)une approche de reconnaissance des gestes simples,b) une approche de reconnaissance des gestes composés.La première approche est basée sur les Modèles de Markov Cachés. Un modèle MMC pour chaque geste a été réalisé. La variation des angles entre les articulations est utilisée comme entrée des Modèles de Markov Cachés. Cette méthode a été combinée avec la méthode de la Déformation Temporelle Dynamique (Dynamic Time Warping) pour éliminer les mauvaises classifications. La deuxième approche traite le cas des gestes composés et successifs dans une même séquence. Cette approche combine la méthode de la Déformation Temporelle Dynamique avec une fenêtre glissante adaptative d’où le nom de l’approche: Adaptive Dynamic TimeWarping. Deux versions de cette approche ont été proposées : version Forward et version Backward pour la reconnaissance en ligne et hors ligne
The goal of Human System Interaction(HSI) research is to increase the performance of human system interaction in order to make it similarto human-human interaction. As for communication between humans, gestural communication is also widely used in human system interaction. This thesis is about gesture recognition for natural human system interaction based on gestures. The objectif of works conducted in this thesis is to propose recognition approches for different kind of dynamic gesture: simple gesture and composed gesture. First of all, we proposed a novel 3D gesture descriptor computed by human body joints angles provided by Kinect sensor. Second, we proposed two dynamic gestures recognition approaches: a) simple gestures recognition approach, b) composed gestures recognition approach. The first approach is based on Hidden Markov Models (HMM). One HMM was created for each gesture. The joints angles variations have been used as input for HMMs. Then,this method has been combined with the Dynamic Time Warping algorithm in order to eliminate bad classification. The second approach treats the case of composed and successive gestures in the same sequence. This approach combines Dynamic Time Warping method with an adaptative window, hence the name: Adaptive Dynamic Time Warping. Two versions have been proposed: Forward and Backward version for online and offline recognition

APA, Harvard, Vancouver, ISO und andere Zitierweisen

33

Klaser, Alexander. „Apprentissage pour la reconnaissance d'actions humaines en vidéo“. Phd thesis, Grenoble, 2010. http://tel.archives-ouvertes.fr/tel-00514814.

Der volle Inhalt der Quelle

Annotation:

Cette thèse s'intéresse à la reconnaissance des actions humaines dans des données vidéo réalistes, tels que les films. À cette fin, nous développons des algorithmes d'extraction de caractéristiques visuelles pour la classification et la localisation d'actions.

Dans une première partie, nous étudions des approches basées sur les sacs-de-mots pour la classification d'action. Dans le cas de vidéo réalistes, certains travaux récents qui utilisent le modèle sac-de-mots pour la représentation d'actions ont montré des résultats prometteurs. Par conséquent, nous effectuons une comparaison approfondie des méthodes existantes pour la détection et la description des caractéristiques locales. Ensuite, nous proposons deux nouvelles approches pour la descriptions des caractéristiques locales en vidéo. La première méthode étend le concept d'histogrammes sur les orientations de gradient dans le domaine spatio-temporel. La seconde méthode est basée sur des trajectoires de points d'intérêt détectés spatialement. Les deux descripteurs sont évalués avec une représentation par sac-de-mots et montrent une amélioration par rapport à l'état de l'art pour la classification d'actions.

Dans une seconde partie, nous examinons comment la détection de personnes peut contribuer à la reconnaissance d'actions. Tout d'abord, nous développons une approche qui combine la détection de personnes avec une représentation sac-de-mots. La performance est évaluée pour la classification d'actions à plusieurs niveaux d'échelle spatiale. Ensuite, nous explorons la localisation spatio-temporelle des actions humaines dans les films. Nous étendons une approche de suivi de personnes pour des vidéos réalistes. En outre, nous développons une représentation d'actions qui est adaptée aux détections de personnes. Nos expériences suggèrent que la détection de personnes améliore significativement la localisation d'actions. De plus, notre système montre une grande amélioration par rapport à l'état de l'art actuel.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

34

Klaser, Alexander. „Apprentissage pour la reconnaissance d'actions humaines en vidéo“. Phd thesis, Grenoble, 2010. http://www.theses.fr/2010GRENM039.

Der volle Inhalt der Quelle

Annotation:

Cette thèse s'intéresse à la reconnaissance des actions humaines dans des données vidéo réalistes, tels que les films. À cette fin, nous développons des algorithmes d'extraction de caractéristiques visuelles pour la classification et la localisation d'actions. Dans une première partie, nous étudions des approches basées sur les sacs-de-mots pour la classification d'action. Dans le cas de vidéo réalistes, certains travaux récents qui utilisent le modèle sac-de-mots pour la représentation d'actions ont montré des résultats prometteurs. Par conséquent, nous effectuons une comparaison approfondie des méthodes existantes pour la détection et la description des caractéristiques locales. Ensuite, nous proposons deux nouvelles approches pour la descriptions des caractéristiques locales en vidéo. La première méthode étend le concept d'histogrammes sur les orientations de gradient dans le domaine spatio-temporel. La seconde méthode est basée sur des trajectoires de points d'intérêt détectés spatialement. Les deux descripteurs sont évalués avec une représentation par sac-de-mots et montrent une amélioration par rapport à l'état de l'art pour la classification d'actions. Dans une seconde partie, nous examinons comment la détection de personnes peut contribuer à la reconnaissance d'actions. Tout d'abord, nous développons une approche qui combine la détection de personnes avec une représentation sac-de-mots. La performance est évaluée pour la classification d'actions à plusieurs niveaux d'échelle spatiale. Ensuite, nous explorons la localisation spatio-temporelle des actions humaines dans les films. Nous étendons une approche de suivi de personnes pour des vidéos réalistes. En outre, nous développons une représentation d'actions qui est adaptée aux détections de personnes. Nos expériences suggèrent que la détection de personnes améliore significativement la localisation d'actions. De plus, notre système montre une grande amélioration par rapport à l'état de l'art actuel
This dissertation targets the recognition of human actions in realistic video data, such as movies. To this end, we develop state-of-the-art feature extraction algorithms that robustly encode video information for both, action classification and action localization. In a first part, we study bag-of-features approaches for action classification. Recent approaches that use bag-of-features as representation have shown excellent results in the case of realistic video data. We, therefore, conduct an extensive comparison of existing methods for local feature detection and description. We, then, propose two new approaches to describe local features in videos. The first method extends the concept of histograms over gradient orientations to the spatio-temporal domain. The second method describes trajectories of local interest points detected spatially. Both descriptors are evaluated in a bag-of-features setup and show an improvement over the state-of-the-art for action classification. In a second part, we investigate how human detection can help action recognition. Firstly, we develop an approach that combines human detection with a bag-of-features model. The performance is evaluated for action classification with varying resolutions of spatial layout information. Next, we explore the spatio-temporal localization of human actions in Hollywood movies. We extend a human tracking approach to work robustly on realistic video data. Furthermore we develop an action representation that is adapted to human tracks. Our experiments suggest that action localization benefits significantly from human detection. In addition, our system shows a large improvement over current state-of-the-art approaches

APA, Harvard, Vancouver, ISO und andere Zitierweisen

35

Vables, Jean. „Les titres de combattants et la reconnaissance de la nation“. Montpellier 1, 1995. http://www.theses.fr/1995MON10007.

Der volle Inhalt der Quelle

Annotation:

Crees par l'etat au lendemain de la premiere guerre mondiale, puis au cours des conflits successifs auxquels la france a ete confrontee, les titres de combattants sont aussi, a l'epoque contemporaine, attribues dans le cadre des missions humanitaires ou de maintien de la paix. Ce faisant, l'octroi de ces titres etatiques a connu une grande evolution dont temoignent les criteres multiples et varies dont ils dependent. Cette heterogeneite rend difficiles, d'un point de vue juridique, l'expose et la conciliation entre l'hommage national du aux combattants et le respect de l'egalite des generations du feu. Cependant, l'etude des titres de combattants montre que la cristallisation qui s'est faite autour des ces brevets de patriotisme represente un symbole puissant a partir duquel s'est constitue ce qu'il est convenu d'appeler le monde combattant. Cette communaute,forte de plusieurs millions de citoyens, est tres attachee a l'office national des anciens combattants et victimes de guerre qui doit son rayonnement a son statut d'etablissement public et dont la representation est assuree sur l'ensemble du territoire de la republique
Created by the french state after the first world war, then during the successive fightsfrance had to pass through, the titles of fighters are, nowadays, alloted as well within humanitarian aid or peace keeping missions. Trough the years, the grant of these titles given by the state has gone through a lot fo changes which appear in the different assumptions that that define them. This heterogeneity entails, in the juridic point of view, difficult statement and reconciliation between the national homage due to the fighters, and the respect of the equality of the generations of the fight. However, the study of the titles of fighters shows that the crystallisation among these patents of patriotism represents a powerful symbol from which was born what should be called the world of the fighters. This several millions citizens community is setting much value upon the office national des anciens combattants et victimes de guerre which spreading out is due to its status of national institution, and that is represented on the hole territory of the republic

APA, Harvard, Vancouver, ISO und andere Zitierweisen

36

Ritchie, David. „Algorithmes Haute-Performance pour la Reconnaissance de Formes Moléculaires“. Habilitation à diriger des recherches, Université Henri Poincaré - Nancy I, 2011. http://tel.archives-ouvertes.fr/tel-00587962.

Der volle Inhalt der Quelle

Annotation:

Ce mémoire résume ma contribution aux problèmes de la représentation et de la comparaison des formes et propriétés chimiques de molécules au moyen de nouvelles techniques de transformées de Fourier rapides (FFT). Les trois principaux domaines abordés ici sont le clustering et la classification des formes de macromolécules protéiques, le docking ou amarrage protéine-protéine visant à modéliser la conformation structurale de deux partenaires susceptible d'exister in vivo, et enfin la comparaison rapide de nombreuses petites molécules pour le criblage virtuel de potentiels inhibiteurs thérapeutiques. Les techniques basées sur la FFT sont largement utilisées dans de nombreux domaines de la science. Par ailleurs, les approches conventionnelles basées sur les grilles cartésiennes de FFT peuvent accélérer les calculs d'appariement moléculaire dans seulement trois des six degrés de liberté (ceux de translation) du corps rigide. Le thème principal de mon travail repose sur l'idée que la comparaison des formes complexes en trois dimensions (3D) de molécules est en grande partie un problème de rotation, dès lors les molécules peuvent efficacement être représentées par des systèmes de coordonnées polaires afin de pouvoir les comparer à l'aide de FFT rotationelles. Dans ce mémoire, je montre qu'en représentant les molécules par des développements orthogonaux en harmoniques sphériques et des polynômes de Gauss-Laguerre et en n'utilisant que des techniques classiques de calcul, leurs formes peuvent être mises en rotation et translatées analytiquement. Les paires de formes peuvent alors être comparées ou amarrées de façon très efficace en utilisant une série de 1D, 3D, ou même 5D FFT de rotation. Même si une grande partie des fondamentaux théoriques sont bien connue dans les domaines de la chimie ou de la physique, l'approche globale est originale dans le contexte de l'appariement de formes moléculaires, du docking de protéines et plus généralement de la reconnaissance d'objets 3D. La dernière partie de ce mémoire ouvre sur les perspectives futures visant à étendre ces différentes approches aux défis actuels posés par la biologie systémique et structurale tels que le criblage virtuel à haut-débit, l'intégration de la flexibilité des protéines lors de leur complexation mais aussi l'assemblage de structures macromoléculaires multi-composants.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

37

Portet, François. „Pilotage d'algorithmes pour la reconnaissance en ligne d'arythmies cardiaques“. Phd thesis, Université Rennes 1, 2005. http://tel.archives-ouvertes.fr/tel-00011942.

Der volle Inhalt der Quelle

Annotation:

L'objectif de cette thèse est la réalisation du système de monitorage cardiaque intelligent IP-Calicot capable, grâce à un module de pilotage d'algorithmes, d'utiliser les informations du contexte courant pour modifier sa chaîne de traitements afin d'obtenir un diagnostic médical fiable même en milieu bruité. À partir d'un électrocardiogramme (ECG), le système extrait en ligne, par traitement du signal, les informations qui vont permettre d'établir un diagnostic d'arythmie cardiaque modélisé par un réseau temporel (chronique). En utilisant le contexte courant, constitué du bruit de ligne et du diagnostic médical, le module de pilotage agit dynamiquement à trois niveaux~: il sélectionne et paramètre les algorithmes de traitement du signal, il choisit les éléments à extraire du signal, décrivant ainsi l'ECG dans un langage plus ou moins précis, et sélectionne le langage de description à utiliser pour établir le diagnostic en ligne. Le pilote est représenté par un système expert qui agit sur la chaîne de traitements grâce à des règles de pilotage acquises par expertises et déduites d'études statistiques. Le système a été validé sur des ECG bruités typiques de situations cliniques. Les résultats démontrent l'intérêt et la faisabilité du pilotage proposé.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

38

Erdogmus, Nesli. „Utilisation des données 3D pour la reconnaissance du visage“. Phd thesis, Télécom ParisTech, 2012. http://pastel.archives-ouvertes.fr/pastel-00982374.

Der volle Inhalt der Quelle

Annotation:

Avec l'augmentation des applications de sécurité, un sujet particulier a attiré plus d'attention que de nombreux autres domaines en reconnaissance de formes : la biométrie - la reconnaissance des personnes en fonction de leur physique et/ou de leurs traits comportementaux. Parmi ces traits, le visage se distingue par un compromis favorable entre accessibilité et fiabilité. Dans cette thèse, nous avons principalement travaillé sur une modalité relativement plus récente en reconnaissance du visage : la forme 3D. Plus avantageuse que son homologue en 2D, car intrinsèquement invariant aux changements d'illumination de pose, l'analyse 3D du visage se heurte encore à des défis majeurs tels que les déformations de surface du visage dues aux expressions ou occultations. En conséquence, une étude approfondie est effectuée sur ce sujet incluant le prétraitement des données 3D du visage, l'annotation automatique, la simulation d'altération et d'expressions en 3D, l'extraction de caractéristiques 3D et l'analyse locale de surface.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

39

Poinsot, Audrey. „Traitements pour la reconnaissance biométrique multimodale : algorithmes et architectures“. Thesis, Dijon, 2011. http://www.theses.fr/2011DIJOS010.

Der volle Inhalt der Quelle

Annotation:

Combiner les sources d'information pour créer un système de reconnaissance biométrique multimodal permet d'atténuer les limitations de chaque caractéristique utilisée, et donne l'opportunité d'améliorer significativement les performances. Le travail présenté dans ce manuscrit a été réalisé dans le but de proposer un système de reconnaissance performant, qui réponde à des contraintes d'utilisation grand-public, et qui puisse être implanté sur un système matériel de faible coût. La solution choisie explore les possibilités apportées par la multimodalité, et en particulier par la fusion du visage et de la paume. La chaîne algorithmique propose un traitement basé sur les filtres de Gabor, ainsi qu’une fusion des scores. Une base multimodale réelle de 130 sujets acquise sans contact a été conçue et réalisée pour tester les algorithmes. De très bonnes performances ont été obtenues, et ont été confirmées sur une base virtuelle constituée de deux bases publiques (les bases AR et PolyU). L'étude approfondie de l'architecture des DSP, et les différentes implémentations qui ont été réalisées sur un composant de type TMS320c64x, démontrent qu'il est possible d'implanter le système sur un unique DSP avec des temps de traitement très courts. De plus, un travail de développement conjoint d'algorithmes et d'architectures pour l'implantation FPGA a démontré qu'il était possible de réduire significativement ces temps de traitement
Including multiple sources of information in personal identity recognition reduces the limitations of each used characteristic and gives the opportunity to greatly improve performance. This thesis presents the design work done in order to build an efficient generalpublic recognition system, which can be implemented on a low-cost hardware platform. The chosen solution explores the possibilities offered by multimodality and in particular by the fusion of face and palmprint. The algorithmic chain consists in a processing based on Gabor filters and score fusion. A real database of 130 subjects has been designed and built for the study. High performance has been obtained and confirmed on a virtual database, which consists of two common public biometric databases (AR and PolyU). Thanks to a comprehensive study on the architecture of the DSP components and some implementations carried out on a DSP belonging to the TMS320c64x family, it has been proved that it is possible to implement the system on a single DSP with short processing times. Moreover, an algorithms and architectures development work for FPGA implementation has demonstrated that these times can be significantly reduced

APA, Harvard, Vancouver, ISO und andere Zitierweisen

40

Besacier, Laurent. „Un modèle parallèle pour la reconnaissance automatique du locuteur“. Avignon, 1998. http://www.theses.fr/1998AVIG0119.

Der volle Inhalt der Quelle

Annotation:

Ce travail concerne l'introduction d'un modèle parallèle pour l'identification automatique du locuteur. Le choix d'une telle approche réside dans l'hypothèse que des reconnaisseurs travaillant indépendamment sur différents sous-ensembles de paramètres acoustiques sont plus robustes qu'un seul reconnaisseur utilisant l'espace acoustique dans sa globalité. Cette robustesse est cependant conditionnée par de nombreux facteurs qui sont étudiés, ici, dans le cas particulier d'un système multibandes. Le choix de l'architecture multibandes est tout d'abord discuté et nous mettons en évidence les bandes de fréquence les plus utiles pour l'identification automatique du locuteur. Cependant, il ne ressort pas de cette étude préliminaire une configuration optimale (taille et nombre de sous-bandes, recouvrement entre les bandes) permettant d'aborder le problème de la fusion des reconnaisseurs avec une architecture fixée une fois pour toutes. Le choix d'une stratégie pour combiner les scores ou les décisions issus de chaque sous-bande fréquentielle est donc abordé sachant que architecture et fusion sont intimement liées. Nous traitons le problème de la recombinaison dans le cadre théorique de la fusion de multiples reconnaisseurs. Les trois aspects, à notre avis essentiels, du processus de fusion sont abordés : homogénéisation des scores à recombiner ; pondération et critères d'apprentissage des poids ; choix de l'opérateur de fusion numérique. Les principaux opérateurs de fusion numérique sont réunis sous un formalisme commun et une étude théorique sur la sensibilité aux erreurs de ces opérateurs est proposée. Enfin, nous abordons le problème de l'accumulation des scores de recombinaison obtenus sur plusieurs segments temporels, permettant de prendre une décision pour la totalité d'un signal de test. Ce problème dépasse le cadre de notre architecture multibandes car il se pose également pour tout système de reconnaissance ou une décision finale doit être prise avec une série de scores de vraisemblance obtenus en ligne. Cette étape d'accumulation peut être traitée de façon similaire à un problème de fusion multi-reconnaisseurs. Ainsi, nous avons envisagé de remplacer la double phase recombinaison / accumulation par un module unique d'accumulation de scores préalablement normalisés, indépendamment du segment temporel ou de la sous-bande fréquentielle dont ils proviennent. A cet effet, une approche conjointe d'élagage temporel et fréquentiel est formalisée puis experimentée. Les résultats expérimentaux montrent que certains opérateurs de fusion permettent d'obtenir des performances équivalentes à une approche conventionnelle sur des signaux de parole propres. Dans le cas de la parole partiellement bruitée, notre approche multibandes se révèle beaucoup plus robuste, quels que soient les opérateurs de fusion utilisés. La procédure d'élagage temps-fréquence conduit quant à elle à une réduction du taux d'erreur significative sur timit et ntimit (jusqu'à 41% de réduction du taux d'erreur d'identification sur timit) pour des durées courtes d'apprentissage et de test

APA, Harvard, Vancouver, ISO und andere Zitierweisen

41

ALANE, ABDELNASSER. „Graphes d'aspects pour la reconnaissance d'objets polyedriques : approche compilee“. Paris 6, 1992. http://www.theses.fr/1992PA066384.

Der volle Inhalt der Quelle

Annotation:

Le probleme etudie dans cette these est celui de la reconnaissance d'objets par leurs modeles en vision artificielle. Nous avons developpe une approche deductive permettant de produire automatiquement, a partir d'une description minimale de l'objet polyedrique, la structure de decision qui l'identifie sur une image en niveaux de gris. Cette approche denommee compilation de modeles prend en entree l'objet decrit par ses faces et aretes (representation c. A. O. ) et delivre un arbre de decision optimise. L'interpretation 3d se fait par le biais des aspects selon une strategie de prediction verification. Dans la 1#e#r#e partie, nous construisons une representation de l'objet sous forme de predictions. Une prediction consiste en une caracteristique du modele, sa probabilite d'apparition et une valeur metrique invariante sous projection centrale. La construction passe par 2 phases: le calcul des aspects et leur analyse. Les aspects sont calcules exhaustivement apres une parametrisation de l'espace des vues basee sur la detectabilite d'indices visuels. La 2#e#m#e partie organise de maniere optimale les predictions sous forme de nuds d'un arbre de decisions. Les probabilites des predictions sont utilisees dans une fonction de l'entropie calculee pour chaque nud. L'optimisation est globale. La convergence vers les aspects est rapide et il est possible de reconnaitre un objet partiellement occulte. Le systeme a ete teste avec succes sur des images reelles d'un objet simple. Dans tous les cas, la reconnaissance est systematique

APA, Harvard, Vancouver, ISO und andere Zitierweisen

42

Avila, Manuel. „Optimisation de modèles markoviens pour la reconnaissance de l'écrit“. Rouen, 1996. http://www.theses.fr/1996ROUES034.

Der volle Inhalt der Quelle

Annotation:

Cette thèse traite de l'optimisation de modèles markoviens dédiés à la reconnaissance de textes manuscrits, dans le cas particulier d'une application à vocabulaire réduit : la lecture des montants littéraux de chèques. Le premier chapitre décrit brièvement les techniques utilisées pour la reconnaissance de l'écrit. Nous présentons également les descriptions des mots que nous avons utilisées. Le second chapitre présente les modèles de Markov cache. Nous présentons notamment les différents niveaux de représentation du problème de la lecture de l'écrit dans le cas de modélisations markoviennes : les niveaux phrase, mot et lettre. Finalement, nous présentons les algorithmes couramment utilisés pour exploiter des modèles de Markov : les algorithmes de Viterbi et de Baum-welch, avec des variantes que nous avons adaptées à nos besoins. Dans le troisième chapitre, nous traitons du problème d'une optimisation des descriptions des mots. Nous donnons trois méthodes de représentation des mots. Nous présentons ensuite une méthode de recherche de l'ordre optimal d'un processus de Markov basée sur la minimisation de critères d'information de type Akaike soit AIC, BIC etc. Finalement, nous comparons les résultats des trois alphabets pour les ordres de 1 à 3. Ceci nous permet de valider le choix de la description des mots et de l'ordre du modèle de Markov correspondant. Nous réutilisons ces résultats au chapitre 4. Dans ce chapitre, trois approches sont proposées pour la reconnaissance des mots : la première est une approche globale qui par définition ne s'attache pas à l'identification des lettres, la seconde est une approche analytique basée sur une modélisation complètement explicitée, la troisième méthode est une approche pseudo-analytique intermédiaire entre les deux approches précédentes. Elle modélise le mot de manière analytique en utilisant des modèles globaux de lettres. Finalement, les résultats de ces trois méthodes sont ensuite fusionnés : chapitre 5. Ce chapitre traite de l'identification des montants littéraux de chèques. La stratégie développée se décompose en trois parties : validation de la segmentation des mots, identification des mots et reconstitution de la phrase. A chaque partie correspond une modélisation markovienne adaptée.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

43

EUDE, VIRGINIE. „Modelisation spatio-temporelle floue pour la reconnaissance d'activites militaires“. Paris 6, 1998. http://www.theses.fr/1998PA066120.

Der volle Inhalt der Quelle

APA, Harvard, Vancouver, ISO und andere Zitierweisen

44

Aberbour, Mourad. „Architecture d'un systeme heterogene pour la reconnaissance de formes“. Paris 6, 1999. http://www.theses.fr/1999PA066005.

Der volle Inhalt der Quelle

Annotation:

Les traitements impliques en vision artificielle sont lourds en calcul. Ils necessitent une acceleration materielle et une miniaturisation pour les applications embarquees. Les avancees des technologies d'integration rendent possible l'implantation de systemes complexes a plusieurs dizaines de millions de transistors sur une meme puce. Le travail effectue dans cette these concerne l'etude algorithmique et architecturale d'un systeme de reconnaissance de formes temps reel base sur un modele de la vision biologique. Le systeme doit repondre a des contraintes d'invariance multiples dans une scene complexe. Nous nous sommes bases sur des algorithmes existants pour proposer une methode de reconnaissance de formes adaptee a une integration vlsi. Notre choix s'est fixe sur l'analyse par ondelettes de gabor, suivie par l'extraction de caracteristiques avec les algorithmes de salience introduits par clark et finalement un reseau de neurones rbf-dda pour l'apprentissage et la classification. Le choix de ces differents algorithmes et les modifications apportees ont ete guides par l'integration vlsi. Il a fallu modifier les algorithmes pour une adequation a une architecture realisable. Nous avons donc propose une methodologie repondant aux exigences de la conception. L'etude des differentes architectures existantes, tant pour le traitement d'images que pour les reseaux de neurones, nous a conduit a proposer une structure materielle/logicielle heterogene pour l'implantation du systeme. Un processeur risc est associe a des coprocesseurs dedies pour accelerer certaines parties du traitement. L'etude de differentes solutions est facilitee par l'utilisation d'un simulateur cycle precis de systemes materiel/logiciel. Les coprocesseurs ont ete etudies pour offrir les meilleures performances avec des degres de parametrisation leur permettant d'etre reutilisables dans d'autres contextes. Nous nous sommes alors bases sur un environnement de conception implantant le concept de generateur parametrable de macro-fonctions projetables sur differentes technologies cibles.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

45

BEASSE, CHRISTOPHE. „Approche perceptuelle pour la reconnaissance de formes sur images“. Rennes 1, 1993. http://www.theses.fr/1993REN10123.

Der volle Inhalt der Quelle

Annotation:

Nous presentons ici une approche originale pour la reconnaissance de formes sur images qui s'inspire des etudes menees par m. Wertheimer sur la vision humaine, ainsi que des travaux realises par d. G. Lowe, r. Nevatia et l. Herault dans le domaine de la reconnaissance. La technique utilisee consiste a rechercher, a partir de la representation contour de la forme, un ensemble de structures particulieres, appelees groupes perceptuels (bases sur des proprietes de proximite, de continuite, de similarite, de fermeture, de symetrie et de familiarite) qui permettent de schematiser l'image et donc de simplifier les mecanismes ulterieurs de reconnaissance. Nous decrivons deux methodes complementaires: la premiere qui cherche a extraire de la scene les points contour appartenant a des structures perceptuelles importantes est qualifiee d'implicite par opposition a la deuxieme qui regroupe explicitement les points contour selectionnes sous forme de primitives synthetiques, telles que des segments de droite, des arcs de cercle etc. . . Caracteristiques des proprietes perceptuelles considerees. L'ensemble des operateurs developpes, integres dans le systeme de traitement d'image allegory, nous permet de decrire graphiquement des requetes perceptuelles correspondant a la recherche de structures particulieres. Ces requetes ont fait l'objet de nombreux tests sur des images variees, de type industrielles, satellitaires ou aeriennes qui nous ont permis de definir experimentalement les valeurs des parametres utilises

APA, Harvard, Vancouver, ISO und andere Zitierweisen

46

Andriès, Julien. „De nouveaux acétylures métalliques pour la reconnaissance moléculaire : Chimie“. Rennes 1, 2004. http://www.theses.fr/2004REN10145.

Der volle Inhalt der Quelle

Annotation:

Située dans le cadre général de l'élaboration de complexes organométalliques pour l'optoélectronique, cette thèse est plus particulièrement orientée vers un nouveau domaine d'application des complexes métalliques à ligand acétylure : celui des capteurs chimiques moléculaires. De nouveaux systèmes donneur-accepteur ont été élaborés pour la reconnaissance d'anions, à partir d'un centre métallique ruthénium-acétylure riche en électrons connecté à des groupements électroattracteurs sensibles aux accepteurs de liaisons hydrogène (barbiturique, rhodanine, thiazolidinedione). Des études spectrophotométriques et électrochimiques ont mis en évidence la grande sensibilité de ces systèmes à certains anions inorganiques. De très bons résultats ont été obtenus pour la détection de l'anion fluorure en milieu organique. L'utilisation de nouveaux dérivés flavonoïdes associés à un motif ruthénium-acétylure a également été envisagée pour l'obtention de systèmes de détection de cations métalliques lourds.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

47

Portet, François. „Pilotages d'algorithmes pour la reconnaissance en ligne d'arythmies cardiaques“. Rennes 1, 2005. https://tel.archives-ouvertes.fr/tel-00011942v2.

Der volle Inhalt der Quelle

Annotation:

L'objectif de cette thèse est la réalisation du système de monitoring cardiaque intelligent IP-Calicot, capable grâce à un module de pilotage d'algorithmes de modifier dynamiquement sa chaîne de traitement afin d'obtenir un diagnostic médical fiable même en milieu bruité. Le système extrait d'un électrocardiogramme (ECG) les informations servant à diagnostiquer une arythmie cardiaque. Le contexte courant, constitué du bruit de ligne et du diagnostic médical, permet un pilotage à trois niveaux par sélection des algorithmes de traitement du signal, des éléments à extraire de l'ECG, le décrivant ainsi dans un langage plus ou moins précis, et sélection du langage de description à utiliser pour établir le diagnostic. Le pilote agit sur la chaîne de traitement grâce à des règles de pilotage acquises par expertises et déduites d'études statistiques. Les tests effectués sur des ECG pathologiques bruités typiques de situations cliniques montrent l'intérêt et la faisabilité de cette approche.

APA, Harvard, Vancouver, ISO und andere Zitierweisen

48

Hérault, Romain. „Vision et apprentissage statistique pour la reconnaissance d'items comportementaux“. Compiègne, 2007. http://www.theses.fr/2007COMP1715.

Der volle Inhalt der Quelle

Annotation:

Ce travail consiste en la détection d'items comportementaux permettant la prévention de l'hypovigilance du conducteur au volant. Nous disposons de vidéos prises depuis l'habitacle d'une voiture, chaque image de ces vidéos a été caractérisée par six items comportementaux; notre travail vise à retrouver ces items comportementaux, image par image. L'étude a été décomposée en deux phases : 1) Le suivi du visage et des gestes faciaux sur les vidéos. Nous avons appliqué une méthode de suivi d'objets déformables en vision 3D auquel nous avons inclus un modèle d'apparence basé sur un modèle de mélange. 2) La détection d'items comportementaux à partir des données extraites de ce suivi. Nous avons proposé l'utilisation d'un nouveau critère sensible aux coûts de mauvaise classification afin de résoudre le problème des déséquilibres lié aux items comportementaux. Ce critère est appliqué à la détection des items comportementaux à travers l'utilisation de MLPs et de IOHMMs
This work consists in the detection of behavioral items in order to prevent driver drowsiness. Videos were shot from within a car, and each picture of the video was characterized by six behavioral items. Our work consists in the retrieval of these items, picture by picture. The study was decomposed into two phases: 1) A Head and facial action tracking. A framework to 3D head pose and facial action tracking with an adaptive appearance model based on a mixture model is proposed to deal with face occlusion ; 2) A recognition of the behavioral items based on data retrieved from the tracking. We propose a new criterion leading to an adaptation of maximum likelihood estimation. The model outputs proper conditional probabilities into a user-defined interval. This criterion is applied to MLPs and IOHMMs for the recognition of the behavioral items

APA, Harvard, Vancouver, ISO und andere Zitierweisen

49

Verdot, Alexandra. „Le réseau de professions libérales : plaidoyer pour une reconnaissance“. Aix-Marseille 3, 2009. http://www.theses.fr/2009AIX32041.

Der volle Inhalt der Quelle

Annotation:

Depuis quelques années, le phénomène réseau a pris un essor considérable. Il n’a pas omis de toucher les professions libérales. Face à la complexification des demandes et à la spécialisation des champs professionnels, le réseau est apparu aux praticiens libéraux comme un moyen efficace de répondre aux attentes de leurs clients ainsi qu’à leurs propres souhaits de nature professionnel et économique. Le réseau a permis de remplir l’objectif d’interdisciplinarité désiré en proposant aux professionnels un nouveau moyen d’exercice en groupe et en commun et en offrant aux clients une prise en charge globale de leurs intérêts. Il a cependant posé le problème de la déontologie applicable à l’exercice dispensé, notamment lorsqu’il revêt une dimension interprofessionnelle. Le droit a alors dû l’appréhender. Mais le législateur n’est venu régir cette entité que de manière parcellaire et ne lui a pas conféré un véritable statut. Ce n’est pas pour autant qu’il ne peut pas bénéficier d’une existence juridique autonome. Au regard de son importance dans la pratique libérale et sur la modification de l’exercice professionnel qu’il modernise, le réseau s’analyse comme une structure distincte de la personne de ceux qui la constitue. Sa détermination comme membre et acteur de la profession libérale permettent de retenir la valeur économique et professionnelle qu’il engendre
For several years now, the networking has significantly expended. The liberal professions are highly concerned by this phenomenon. Due to the complexification of the clients requests and the specialization of the professional areas, the network appeared to be an efficient way to meet both the practitioners economical and professional expectations and the ones of their clients. The network allows to reach the objective of multidisciplinarity by allowing the practitioners to practice their activity as part of a group and by offering to the clients a global approach of their needs. Nevertheless, the network of professions raises the issue of the ethics regarding the profession, especially when it takes the form of an interprofessional network. Hence, the legislator had to define a legal frame for the network. But instead of creating a thorough legal status, the legislator had only dealt with some aspects of the subject. However, this state of the law doesn’t imply the impossibility for the network to have a legal existence per se. Considering it is increasingly used by the liberal profession and the fact that it has allowed a modernization of the professions, the network of professions has to be analyzed like an independent structure from the people who compose it. Qualifying the network of professions as a member and as an actor of the liberal profession enhances the economical and professional extra value that it generates

APA, Harvard, Vancouver, ISO und andere Zitierweisen

50

BAILLET-JACQUOT, STEPHANIE. „Synthese d'oligonucleotides modifies pour la reconnaissance de sequences d'adn“. Université Louis Pasteur (Strasbourg) (1971-2008), 1994. http://www.theses.fr/1994STR13062.

Der volle Inhalt der Quelle

Annotation:

Deux oligonucleotides modifies ont ete synthetises: le premier doit etre capable de s'apparier a une double helice d'adn sans provoquer de changement conformationnel et gagner en stabilite sur le triplex ainsi forme. Apres etude des parametres geometriques d'appariement ainsi que l'examen de modeles moleculaires, nous avons entrepris la synthese de l'oligonucleotide modifie. La synthese a ete realisee a partir de la thymidine que nous avons d'abord protege en oh 5 par un groupement trityle puis soumis a un traitement basique oxydant degradant. La ribosyl formamide ainsi obtenue est phosphorylee en oh 3 pour former le derive phosphoramidite lui-meme utilise pour la synthese d'un decamere. Le deuxieme oligonucleotide a ete concu pour former un reseau d'hydratation intramoleculaire (donc un duplex d'adn plus stable) grace a un groupement hydroxyle, introduit sur le methylene remplacant l'oxygene du ribose de l'analogue carbocyclique de la 2-desoxyadenosine. La synthese d'un decamere de cet analogue est realisee a partir du 5-(6-amino-purine-9-yl)-3-benzyloxy-2-(benzyloxymethyle)-t-butyle-dimethylsilyloxycyclopentane. L'etude des proprietes de ces deux oligonucleotides sont en cours

APA, Harvard, Vancouver, ISO und andere Zitierweisen

Dissertationen zum Thema „Guerre pour la reconnaissance“

Geben Sie eine Quelle nach APA, MLA, Chicago, Harvard und anderen Zitierweisen an