Dissertations / Theses on the topic 'Segmentation d'objets en mouvement'

To see the other types of publications on this topic, follow the link: Segmentation d'objets en mouvement.

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Segmentation d'objets en mouvement.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Devevey, Christophe. "Etude du mouvement sur des séquences d'images échographiques : : poursuite de cibles rigides et segmentation, par une approche connexionniste du champ, des vitesses d'objets déformables." Lyon, INSA, 1993. http://www.theses.fr/1993ISAL0006.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Ce mémoire est consacré à l'exploitation de l'information mouvement dans des séquences d'images échographiques. Dans la première partie. Les performances de quatre techniques de poursuite de cibles rigides sont comparées en termes de temps de calcul et de précision. Puis, l'algorithme optimal est appliqué au suivi temps réel de lithiases rénales ou biliaires afin de faciliter leur destruction par lithotritie. La seconde partie décrit deux réseaux connexionnistes destinés à l'estimation et à la paramétrisation du flux optique produit entre deux images ultrasonores consécutives. La segmentation du mouvement est alors réalisée en classant les paramètres du champ des vitesses à l'aide de la méthode des nuées dynamiques. L’application de cette technique à l'analyse des déplacements des parois. Du myocarde sur des séquences d images echocardiographiques facilite le diagnostic de certaines pathologies cardiaques
The purpose of this study is the exploitation of the motion information generated in ultrasonic image sequence. In the first section, the performances of four tracking techniques is first compared in terms of accuracy and processing time. The best algorithm. Based on correlation is then used to track gallstones or urinary stones in order to enhance the efficiency of extracorporeal lithotripsy. In the second part of this work. The optical flow is estimated and parametrized using two neural networks. The classification of the vector field parameters by clustering is then used for motion segmentation. The computer analysis of heart motion from two-dimensional echocardiograms using this technique can facilitate the diagnosis of cardiac pathology
2

Bonnaud, Laurent. "Schémas de suivi d'objets vidéo dans une séquence animée : application à l'interpolation d'images intermédiaires." Phd thesis, Université Rennes 1, 1998. http://tel.archives-ouvertes.fr/tel-00070533.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Le cadre général de cette étude est le traitement numérique du signal, appliqué
aux séquences d'images, pour des applications multimédia. Ce travail est
divisé en deux contributions principales~: un algorithme de segmentation
d'images en objets vidéo en mouvement, et une méthode d'interpolation
temporelle opérant sur ces objets.

La segmentation de la séquence est effectuée par un algorithme de suivi
temporel. Un algorithme de segmentation spatio-temporelle est utilisé
initialement pour obtenir des régions dans la première image de la séquence.
Cette partition est ensuite suivie par une technique de contours actifs, qui
opère sur une nouvelle représentation de la segmentation, composée des
frontières ouvertes séparant les régions. L'algorithme estime à la fois le
mouvement des frontières et celui des régions. Il est capable de suivre
plusieurs objets simultanément et de traiter les occultations entre eux. Des
résultats, obtenus sur des séquences d'images réelles, montrent que cet
algorithme permet une bonne stabilité temporelle de la segmentation et une
bonne précision des frontières.

Le but de l'algorithme d'interpolation est de reconstruire des images
intermédiaires entre deux images de la séquence. Il s'agit d'un algorithme de
faible complexité qui peut être utilisé à la fin d'une chaîne codeur/décodeur.
L'interpolation est compensée en mouvement et utilise le mouvement des régions,
estimé pendant la phase de suivi. Il est aussi basé objets, dans le sens où il
utilise la segmentation pour prédire correctement les zones d'occultation. Cet
algorithme peut être utilisé pour trois applications différentes~: le codage
interpolatif (où des images de la séquence sont prédites par interpolation),
l'adaptation de la fréquence de la séquence à la fréquence d'affichage du
terminal de visualisation dans une transmission multipoints et la
reconstruction d'images manquantes (où l'on calcule des images non observées).
Des résultats expérimentaux pour la première application montrent que pour une
qualité de reconstruction donnée, la taux de compression moyen sur un groupe
d'images est plus élevé en utilisant l'interpolation qu'avec une prédiction
causale.
3

Pérez, Rúa Juan Manuel. "Hierarchical motion-based video analysis with applications to video post-production." Thesis, Rennes 1, 2017. http://www.theses.fr/2017REN1S125/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Nous présentons dans ce manuscrit les méthodes développées et les résultats obtenus dans notre travail de thèse sur l'analyse du contenu dynamique de scène visuelle. Nous avons considéré la configuration la plus fréquente de vision par ordinateur, à savoir caméra monoculaire et vidéos naturelles de scène extérieure. Nous nous concentrons sur des problèmes importants généraux pour la vision par ordinateur et d'un intérêt particulier pour l'industrie cinématographique, dans le cadre de la post-production vidéo. Les problèmes abordés peuvent être regroupés en deux catégories principales, en fonction d'une interaction ou non avec les utilisateurs : l'analyse interactive du contenu vidéo et l'analyse vidéo entièrement automatique. Cette division est un peu schématique, mais elle est en fait liée aux façons dont les méthodes proposées sont utilisées en post-production vidéo. Ces deux grandes approches correspondent aux deux parties principales qui forment ce manuscrit, qui sont ensuite subdivisées en chapitres présentant les différentes méthodes que nous avons proposées. Néanmoins, un fil conducteur fort relie toutes nos contributions. Il s'agit d'une analyse hiérarchique compositionnelle du mouvement dans les scènes dynamiques. Nous motivons et expliquons nos travaux selon l'organisation du manuscrit résumée ci-dessous. Nous partons de l'hypothèse fondamentale de la présence d'une structure hiérarchique de mouvement dans la scène observée, avec un objectif de compréhension de la scène dynamique. Cette hypothèse s'inspire d'un grand nombre de recherches scientifiques sur la vision biologique et cognitive. Plus précisément, nous nous référons à la recherche sur la vision biologique qui a établi la présence d'unités sensorielles liées au mouvement dans le cortex visuel. La découverte de ces unités cérébrales spécialisées a motivé les chercheurs en vision cognitive à étudier comment la locomotion des animaux (évitement des obstacles, planification des chemins, localisation automatique) et d'autres tâches de niveau supérieur sont directement influencées par les perceptions liées aux mouvements. Fait intéressant, les réponses perceptuelles qui se déroulent dans le cortex visuel sont activées non seulement par le mouvement lui-même, mais par des occlusions, des désocclusions, une composition des mouvements et des contours mobiles. En outre, la vision cognitive a relié la capacité du cerveau à appréhender la nature compositionnelle du mouvement dans l'information visuelle à une compréhension de la scène de haut niveau, comme la segmentation et la reconnaissance d'objets
The manuscript that is presented here contains all the findings and conclusions of the carried research in dynamic visual scene analysis. To be precise, we consider the ubiquitous monocular camera computer vision set-up, and the natural unconstrained videos that can be produced by it. In particular, we focus on important problems that are of general interest for the computer vision literature, and of special interest for the film industry, in the context of the video post-production pipeline. The tackled problems can be grouped in two main categories, according to the whether they are driven user interaction or not : user-assisted video processing tools and unsupervised tools for video analysis. This division is rather synthetic but it is in fact related to the ways the proposed methods are used inside the video post-production pipeline. These groups correspond to the main parts that form this manuscript, which are subsequently formed by chapters that explain our proposed methods. However, a single thread ties together all of our findings. This is, a hierarchical analysis of motion composition in dynamic scenes. We explain our exact contributions, together with our main motivations, and results in the following sections. We depart from a hypothesis that links the ability to consider a hierarchical structure of scene motion, with a deeper level of dynamic scene understanding. This hypothesis is inspired by plethora of scientific research in biological and psychological vision. More specifically, we refer to the biological vision research that established the presence of motion-related sensory units in the visual cortex. The discovery of these specialized brain units motivated psychological vision researchers to investigate how animal locomotion (obstacle avoidance, path planning, self-localization) and other higher-level tasks are directly influenced by motion-related percepts. Interestingly, the perceptual responses that take place in the visual cortex are activated not only by motion itself, but by occlusions, dis-occlusions, motion composition, and moving edges. Furthermore, psychological vision have linked the brain's ability to understand motion composition from visual information to high level scene understanding like object segmentation and recognition
4

Brulin, Mathieu. "Analyse sémantique d'un trafic routier dans un contexte de vidéo-surveillance." Thesis, Bordeaux 1, 2012. http://www.theses.fr/2012BOR14589/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Les problématiques de sécurité, ainsi que le coût de moins en moins élevé des caméras numériques, amènent aujourd'hui à un développement rapide des systèmes de vidéosurveillance. Devant le nombre croissant de caméras et l'impossibilité de placer un opérateur humain devant chacune d'elles, il est nécessaire de mettre en oeuvre des outils d'analyse capables d'identifier des évènements spécifiques. Le travail présenté dans cette thèse s'inscrit dans le cadre d'une collaboration entre le Laboratoire Bordelais de Recherche en Informatique (LaBRI) et la société Adacis. L'objectif consiste à concevoir un système complet de vidéo-surveillance destiné à l'analyse automatique de scènes autoroutières et la détection d'incidents. Le système doit être autonome, le moins supervisé possible et doit fournir une détection en temps réel d'un évènement.Pour parvenir à cet objectif, l'approche utilisée se décompose en plusieurs étapes. Une étape d'analyse de bas-niveau, telle que l'estimation et la détection des régions en mouvement, une identification des caractéristiques d'un niveau sémantique plus élevé, telles que l'extraction des objets et la trajectoire des objets, et l'identification d'évènements ou de comportements particuliers, tel que le non respect des règles de sécurité. Les techniques employées s'appuient sur des modèles statistiques permettant de prendre en compte les incertitudes sur les mesures et observations (bruits d'acquisition, données manquantes, ...).Ainsi, la détection des régions en mouvement s'effectue au travers la modélisation de la couleur de l'arrière-plan. Le modèle statistique utilisé est un modèle de mélange de lois, permettant de caractériser la multi-modalité des valeurs prises par les pixels. L'estimation du flot optique, de la différence de gradient et la détection d'ombres et de reflets sont employées pour confirmer ou infirmer le résultat de la segmentation.L'étape de suivi repose sur un filtrage prédictif basé sur un modèle de mouvement à vitesse constante. Le cas particulier du filtrage de Kalman (filtrage tout gaussien) est employé, permettant de fournir une estimation a priori de la position des objets en se basant sur le modèle de mouvement prédéfini.L'étape d'analyse de comportement est constituée de deux approches : la première consiste à exploiter les informations obtenues dans les étapes précédentes de l'analyse. Autrement dit, il s'agit d'extraire et d'analyser chaque objet afin d'en étudier son comportement. La seconde étape consiste à détecter les évènements à travers une coupe du volume 2d+t de la vidéo. Les cartes spatio-temporelles obtenues sont utilisées pour estimer les statistiques du trafic, ainsi que pour détecter des évènements telles que l'arrêt des véhicules.Pour aider à la segmentation et au suivi des objets, un modèle de la structure de la scène et de ses caractéristiques est proposé. Ce modèle est construit à l'aide d'une étape d'apprentissage durant laquelle aucune intervention de l'utilisateur n'est requise. La construction du modèle s'effectue à travers l'analyse d'une séquence d'entraînement durant laquelle les contours de l'arrière-plan et les trajectoires typiques des véhicules sont estimés. Ces informations sont ensuite combinées pour fournit une estimation du point de fuite, les délimitations des voies de circulation et une approximation des lignes de profondeur dans l'image. En parallèle, un modèle statistique du sens de direction du trafic est proposé. La modélisation de données orientées nécessite l'utilisation de lois de distributions particulières, due à la nature périodique de la donnée. Un mélange de lois de type von-Mises est utilisée pour caractériser le sens de direction du trafic
Automatic traffic monitoring plays an important role in traffic surveillance. Video cameras are relatively inexpensive surveillance tools, but necessitate robust, efficient and automated video analysis algorithms. The loss of information caused by the formation of images under perspective projection made the automatic task of detection and tracking vehicles a very challenging problem, but essential to extract a semantic interpretation of vehicles behaviors. The work proposed in this thesis comes from a collaboration between the LaBRI (Laboratoire Bordelais de Recherche en Informatique) and the company Adacis. The aim is to elaborate a complete video-surveillance system designed for automatic incident detection.To reach this objective, traffic scene analysis proceeds from low-level processing to high-level descriptions of the traffic, which can be in a wide variety of type: vehicles entering or exiting the scene, vehicles collisions, vehicles' speed that are too fast or too low, stopped vehicles or objects obstructing part of the road... A large number of road traffic monitoring systems are based on background subtraction techniques to segment the regions of interest of the image. Resulted regions are then tracked and trajectories are used to extract a semantic interpretation of the vehicles behaviors.The motion detection is based on a statistical model of background color. The model used is a mixture model of probabilistic laws, which allows to characterize multimodal distributions for each pixel. Estimation of optical flow, a gradient difference estimation and shadow and highlight detection are used to confirm or invalidate the segmentation results.The tracking process is based on a predictive filter using a motion model with constant velocity. A simple Kalman filter is employed, which allow to predict state of objets based on a \textit{a priori} information from the motion model.The behavior analysis step contains two approaches : the first one consists in exploiting information from low-level and mid-level analysis. Objects and their trajectories are analysed and used to extract abnormal behavior. The second approach consists in analysing a spatio-temporal slice in the 3D video volume. The extracted maps are used to estimate statistics about traffic and are used to detect abnormal behavior such as stopped vehicules or wrong way drivers.In order to help the segmentaion and the tracking processes, a structure model of the scene is proposed. This model is constructed using an unsupervised learning step. During this learning step, gradient information from the background image and typical trajectories of vehicles are estimated. The results are combined to estimate the vanishing point of the scene, the lanes boundaries and a rough depth estimation is performed. In parallel, a statistical model of the trafic flow direction is proposed. To deal with periodic data, a von-Mises mixture model is used to characterize the traffic flow direction
5

Toumoulin, Christine. "Extraction de formes, Suivi d'objets déformables et Reconstruction en Imagerie Médicale : Application à l'Angiographie R-X et au scanner X multibarette." Habilitation à diriger des recherches, Université Rennes 1, 2009. http://tel.archives-ouvertes.fr/tel-00966605.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Les travaux décrits présentent mes activités de recherches sur la période 1990-2009. Ils couvrent la plupart des thématiques d'une chaine image (segmentation, recalage, suivi de mouvement, reconstruction, etc.) et ils procèdent en grande partie de méthodes génériques (mise en correspondance par chaines de caractères, navigation 3D basée sur des moments géométriques et reconstruction par compensation de mouvement).
6

Giraldo, Zuluaga Jhony Heriberto. "Graph-based Algorithms in Computer Vision, Machine Learning, and Signal Processing." Electronic Thesis or Diss., La Rochelle, 2022. http://www.theses.fr/2022LAROS037.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
L'apprentissage de la représentation graphique et ses applications ont suscité une attention considérable ces dernières années. En particulier, les Réseaux Neuronaux Graphiques (RNG) et le Traitement du Signal Graphique (TSG) ont été largement étudiés. Les RNGs étendent les concepts des réseaux neuronaux convolutionnels aux données non euclidiennes modélisées sous forme de graphes. De même, le TSG étend les concepts du traitement classique des signaux numériques aux signaux supportés par des graphes. Les RNGs et TSG ont de nombreuses applications telles que l'apprentissage semi-supervisé, la segmentation sémantique de nuages de points, la prédiction de relations individuelles dans les réseaux sociaux, la modélisation de protéines pour la découverte de médicaments, le traitement d'images et de vidéos. Dans cette thèse, nous proposons de nouvelles approches pour le traitement des images et des vidéos, les RNGs, et la récupération des signaux de graphes variant dans le temps. Notre principale motivation est d'utiliser l'information géométrique que nous pouvons capturer à partir des données pour éviter les méthodes avides de données, c'est-à-dire l'apprentissage avec une supervision minimale. Toutes nos contributions s'appuient fortement sur les développements de la TSG et de la théorie spectrale des graphes. En particulier, la théorie de l'échantillonnage et de la reconstruction des signaux de graphes joue un rôle central dans cette thèse. Les principales contributions de cette thèse sont résumées comme suit : 1) nous proposons de nouveaux algorithmes pour la segmentation d'objets en mouvement en utilisant les concepts de la TSG et des RNGs, 2) nous proposons un nouvel algorithme pour la segmentation sémantique faiblement supervisée en utilisant des réseaux de neurones hypergraphiques, 3) nous proposons et analysons les RNGs en utilisant les concepts de la TSG et de la théorie des graphes spectraux, et 4) nous introduisons un nouvel algorithme basé sur l'extension d'une fonction de lissage de Sobolev pour la reconstruction de signaux graphiques variant dans le temps à partir d'échantillons discrets
Graph representation learning and its applications have gained significant attention in recent years. Notably, Graph Neural Networks (GNNs) and Graph Signal Processing (GSP) have been extensively studied. GNNs extend the concepts of convolutional neural networks to non-Euclidean data modeled as graphs. Similarly, GSP extends the concepts of classical digital signal processing to signals supported on graphs. GNNs and GSP have numerous applications such as semi-supervised learning, point cloud semantic segmentation, prediction of individual relations in social networks, modeling proteins for drug discovery, image, and video processing. In this thesis, we propose novel approaches in video and image processing, GNNs, and recovery of time-varying graph signals. Our main motivation is to use the geometrical information that we can capture from the data to avoid data hungry methods, i.e., learning with minimal supervision. All our contributions rely heavily on the developments of GSP and spectral graph theory. In particular, the sampling and reconstruction theory of graph signals play a central role in this thesis. The main contributions of this thesis are summarized as follows: 1) we propose new algorithms for moving object segmentation using concepts of GSP and GNNs, 2) we propose a new algorithm for weakly-supervised semantic segmentation using hypergraph neural networks, 3) we propose and analyze GNNs using concepts from GSP and spectral graph theory, and 4) we introduce a novel algorithm based on the extension of a Sobolev smoothness function for the reconstruction of time-varying graph signals from discrete samples
7

Legrand, Capucine. "Exploitation conjointe de l'information spatiale et temporelle d'une séquence stéréoscopique d'images synchronisées : application à la détection d'obstacles dans une scène routière." Compiègne, 2009. http://www.theses.fr/2009COMP1794.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Les laboratoires de recherche et l'industrie automobile s'intéressent à l'utilisation de caméras pour des fonctions d'aide à la conduite ou des fonctions de sécurité en raison de la polyvalence qu'ils induisent, et de leur rentabilité économique. Plus précisément, PSA Peugeot Citroën s'intéresse à la richesse des informations issues conjointement de la stéréovision du mouvement qui en font une approche à fort potentiel dans le contexte automobile des fonctions d'aide à ta conduite et de sécurité : il est en effet essentiel de pouvoir localiser, identifier et caractériser avec efficacité des objets tels que véhicules, piétons, éléments de l'infrastructure. La thèse est orientée vers la recherche d'une méthode stéréocinétique générique, applicable à l'analyse de scènes routières intérieures et extérieures. Vers l'intérieur de l'habitacle, on cherchera à détecter les occupants, à localiser leur tête et à déterminer leur mouvement. Vers L'extérieur du véhicule, on cherchera à estimer le temps nous séparant de la collision avec les différents obstacles localisés. Une approche générique utilisant conjointement l'information spatiale et temporelle est proposée pour localiser les objets et estimer leur position et leur mouvement. La segmentation d'objets dans des vidéos stéréoscopiques diverses telles que l'intérieur ou l'extérieur d'un véhicule est ainsi réalisée
My research focuses on trajectory planning and control of autonomous vehicles. This work is a part of an extremely ambitions project launched by the Heudiasyc laboratory about autonomous driving at high speed (longitudinal speed greater to 5m/s : 18km/h). With regard to the control of autonomous vehicles at high speed, a lateral controller using higher-order sliding mode control is proposed. Given the implicit similarity between the sliding mode and the principle of immersion and invariance, two controllers using the principle of immersion and invariance have been subsequently proposed in order to improve the performance with respect to the sliding mode. The development of these new controllers shows very strong robust stability which leads us to study the intrinsic properties of the system. A study of the passivity properties of the system is also carried out, showing some interesting characteristics of the system. Hence, a robust Passivity-based controller has been developed. Regarding the navigation, we have developed two navigation algorithms based on the tentacles method. Subsequently, a feasibility study of trajectory generation strategies for high speed driving is conducted. The outcorne of the simulation proved that the algorithms gave out good results with respect to the expected objectives of obstacle avoidance and global reference path following. Control and motion planning algorithms developed were validated offline by simulation with real data. They have been also tested on a realistic simulator
8

Kumar, Ratnesh. "Segmentation vidéo et suivi d'objets multiples." Thesis, Nice, 2014. http://www.theses.fr/2014NICE4135/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Dans cette thèse nous proposons de nouveaux algorithmes d'analyse vidéo. La première contribution de cette thèse concerne le domaine de la segmentation de vidéos avec pour objectif d'obtenir une segmentation dense et spatio-temporellement cohérente. Nous proposons de combiner les aspects spatiaux et temporels d'une vidéo en une seule notion, celle de Fibre. Une fibre est un ensemble de trajectoires qui sont spatialement connectées par un maillage. Les fibres sont construites en évaluant simultanément les aspects spatiaux et temporels. Par rapport a l’état de l'art une segmentation de vidéo a base de fibres présente comme avantages d’accéder naturellement au voisinage grâce au maillage et aux correspondances temporelles pour la plupart des pixels de la vidéo. De plus, cette segmentation à base de fibres a une complexité quasi linéaire par rapport au nombre de pixels. La deuxième contribution de cette thèse concerne le suivi d'objets multiples. Nous proposons une approche de suivi qui utilise des caractéristiques des points suivis, la cinématique des objets suivis et l'apparence globale des détections. L'unification de toutes ces caractéristiques est effectuée avec un champ conditionnel aléatoire. Ensuite ce modèle est optimisé en combinant les techniques de passage de message et une variante de processus ICM (Iterated Conditional Modes) pour inférer les trajectoires d'objet. Une troisième contribution mineure consiste dans le développement d'un descripteur pour la mise en correspondance d'apparences de personne. Toutes les approches proposées obtiennent des résultats compétitifs ou meilleurs (qualitativement et quantitativement) que l’état de l'art sur des base de données
In this thesis we propose novel algorithms for video analysis. The first contribution of this thesis is in the domain of video segmentation wherein the objective is to obtain a dense and coherent spatio-temporal segmentation. We propose joining both spatial and temporal aspects of a video into a single notion Fiber. A fiber is a set of trajectories which are spatially connected by a mesh. Fibers are built by jointly assessing spatial and temporal aspects of the video. Compared to the state-of-the-art, a fiber based video segmentation presents advantages such as a natural spatio-temporal neighborhood accessor by a mesh, and temporal correspondences for most pixels in the video. Furthermore, this fiber-based segmentation is of quasi-linear complexity w.r.t. the number of pixels. The second contribution is in the realm of multiple object tracking. We proposed a tracking approach which utilizes cues from point tracks, kinematics of moving objects and global appearance of detections. Unification of all these cues is performed on a Conditional Random Field. Subsequently this model is optimized by a combination of message passing and an Iterated Conditional Modes (ICM) variant to infer object-trajectories. A third, minor, contribution relates to the development of suitable feature descriptor for appearance matching of persons. All of our proposed approaches achieve competitive and better results (both qualitatively and quantitatively) than state-of-the-art on open source datasets
9

Massich, Joan. "Segmentation d'objets déformables en imagerie ultrasonore." Thesis, Dijon, 2013. http://www.theses.fr/2013DIJOS090/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Le cancer du sein est le type de cancer le plus répandu, il est la cause principale de mortalité chez les femmes aussi bien dans les pays occidentaux que dans les pays en voie de développement. L'imagerie médicale joue un rôle clef dans la réduction de la mortalité du cancer du sein, en facilitant sa première détection par le dépistage, le diagnostic et la biopsie guidée. Bien que la Mammographie Numérique (DM) reste la référence pour les méthodes d'examen existantes, les échographies ont prouvé leur place en tant que modalité complémentaire. Les images de cette dernière fournissent des informations permettant de différencier le caratère bénin ou malin des lésions solides, ce qui ne peut être détecté par DM. Malgré leur utilité clinique, les images échographiques sont bruitées, ce qui compromet les diagnostiques des radiologues à partir de celles ci. C'est pourquoi un des objectifs premiers des chercheurs en imagerie médicale est d'améliorer la qualité des images et des méthodologies afin de simplifier et de systématiser la lecture et l'interprétation de ces images.La méthode proposée considère le processus de segmentation comme la minimisation d'une structure probabilistique multi-label utilisant un algorithme de minimisation du Max-Flow/Min-Cut pour associer le label adéquat parmi un ensemble de labels figurant des types de tissus, et ce, pour tout les pixels de l'image.Cette dernière est divisée en régions adjacentes afin que tous les pixels d'une même régions soient labelisés de la même manière en fin du processus. Des modèles stochastiques pour la labellisation sont crées à partir d'une base d'apprentissage de données
Breast cancer is the second most common type of cancer being the leading cause of cancer death among females both in western and in economically developing countries. Medical imaging is key for early detection, diagnosis and treatment follow-up. Despite Digital Mammography (DM) remains the reference imaging modality, Ultra-Sound (US) imaging has proven to be a successful adjunct image modality for breast cancer screening, specially as a consequence of the discriminative capabilities that US offers for differentiating between solid lesions that are benign or malignant. Despite US usability,US suffers inconveniences due to its natural noise that compromises the diagnosis capabilities of radiologists. Therefore the research interest in providing radiologists with Computer Aided Diagnosis (CAD) tools to assist the doctors during decision taking. This thesis analyzes the current strategies to segment breast lesions in US data in order to infer meaningful information to be feet to CAD, and proposes a fully automatic methodology for generating accurate segmentations of breast lesions in US data with low false positive rates
10

Habibi, Arash. "Visualisation d'objets très déformables : relations mouvement-forme-image." Grenoble INPG, 1997. http://www.theses.fr/1997INPG0008.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Ce travail se situe dans le domaine de la synthèse d’images par ordinateur et de l’animation par modèles physiques. La modélisation et la visualisation d’un objet physique suppose un travail sur la forme, le mouvement et l’image. Plus cet objet de référence est déformable et plus la relation entre ces trois entités est complexe. Dans ce travail, nous étudions cette relation et nous déterminons dans quelles conditions le comportement (forme, mouvement, image) des objets peut être représenté par des modèles autonomes (modélisation multi-échelles) et découplés (habillage). En particulier, nous étudions le cas des objets très déformables. Un générateur de formes pour objets très déformables doit vérifier un certain nombre de propriétés. Nous présentons un modèle de forme en mouvement vérifiant ces propriétés. Nous en étudions le comportement dynamique et nous présentons les images obtenues
This work falls within the field of image synthesis and computer animation by physical modelling. The modelling and visualization of physical objets consists in a work on shape, motion and image. The more a given reference object is deformable and the more the relation between these three phenomena may grow complex. We study this relation and determine in which conditions the behaviour (shape, motion and image) of an object may be represented by several models which are autonomous (multi-scale modelling) and discoupled (clothing « habillage »). In particular, we study highly deformable objects. A shape modeler for this type of object must verify a certain number of properties. We present a shape model verifying these conditions. We study its dynamic behaviour and present the resulting images
11

Saut, Jean-Philippe. "Planification de Mouvement Pour la Manipulation Dextre d'Objets Rigides." Phd thesis, Université Pierre et Marie Curie - Paris VI, 2007. http://tel.archives-ouvertes.fr/tel-00715477.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette thèse concerne la planification des tâches de manipulation effectuées par une main robotisée. Il s'agit de mettre au point un système de calcul automatique des trajectoires que doivent suivre les doigts et l'objet manipulé, pour passer d'une configuration initiale à une configuration finale données. La méthode proposée dans cette thèse s'appuie sur une formulation originale du problème de planification, basée sur l'étude de la connexité des espaces des configurations de prise. Ces espaces sont explorés par l'intermédiaire de graphes probabilistes. En particulier, un graphe est construit pour explorer GSn, l'espace des configurations de prise à n doigts, n étant le nombre de doigts de la main. Les arêtes de ce graphe sont des chemins linéaires dans GSn. Utiliser de tels chemins permet d'éviter le calcul des mouvements de reconfiguration de prise et donc de réduire les temps de calcul et l'espace mémoire requis par la construction du graphe. Ces chemins ne sont pas cinématiquement réalisables puisque la pose de l'objet et la position des contacts ne peuvent changer indépendamment mais leur utilisation est rendue possible par la généralisation de la propriété de réduction introduite par Alami et al. Les mouvements de changement de prise qui requièrent d'être explicitement calculés au cours de la construction du graphe, sont pris en compte lors d'une étape de fusion des composantes connexes du graphe. Ces fusions sont réalisées à l'aide de chemins élémentaires respectant la cinématique de la manipulation coordonnée. Ces chemins sont appelés "chemins de ressaisie" et "chemins de transfert". Une fois que les configurations initiale et finale appartiennent à une même composante connexe du graphe, les chemins dans GSn sont décomposés en une suite de mouvements de déplacement de l'objet et de reconfiguration de la prise (chemins de transfert et de ressaisie), cinématiquement réalisables. Pour assurer la stabilité des chemins construits, un critère de stabilité de la prise (fermeture de force) est vérifié le long des chemins, lors de leur construction. Pour valider cette approche, une plate-forme de simulation a été développée et a permis de planifier différentes tâches de manipulation dextre avec une main à quatre doigts. Le planificateur offre des performances très intéressantes en terme de temps de calcul et a permis de résoudre des problèmes complexes tels qu'aucun résultat pour des problèmes de difficulté équivalente n'avait jamais été présenté jusqu'à présent. La méthode proposée s'applique à n'importe quel type de main, quel que soit son nombre de doigts mais, comme elle explore uniquement GSn et GS{n-1}, elle peut manquer des solutions si la main robotisée et le modèle des contacts doigt-objet permet la prise avec un nombre différent de doigts. Pour remédier à cela, nous avons proposé une méthode légèrement différente qui s'applique à une main à cinq doigts et consiste à construire un graphe pour explorer chacune des cinq composantes connexes de GS4 à l'aide de chemins linéaires dans cet espace et à tenter de fusionner les différents graphes à l'aide de chemins linéaires dans GS5 ou de chemins de transfert-ressaisie (dans GS3). Enfin, une variante de la méthode proposée a été développée pour prendre en compte le roulement relatif des surfaces de contact au cours de la manipulation de l'objet. Les différentes modifications nécessaires, concernant la représentation des prises et le calcul de chemins de transfert, sont présentées en détail.
12

LACASSAGNE, LIONEL. "Detection de mouvement et suivi d'objets en temps reel." Paris 6, 2000. http://www.theses.fr/2000PA066252.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette these presente une implementation temps reel d'une chaine algorithmique de detection de mouvement et de suivi d'objets. La detection de mouvement est realisee par une difference d'images qui est relaxee par un processus markovien afin d'obtenir une detection robuste. Deux modeles markoviens sont presentes : l'un monoresolution, l'autre multiresolution. Les pixels detectes en mouvement sont regroupes en region grace a un nouvel algorithme d'etiquetage en composantes connexes. Cet algorithme base sur un codage rlc a la propriete d'etre optimum vis-a-vis du nombre d'etiquettes creees. Il est de plus tres rapide et sa complexite est quasi independante des donnees. Deux techniques de suivi sont developpees. La premiere implemente un parcours d'arbre minimisant la distance entre les bords des regions, pour mettre en correspondance ces regions. Cette technique est simple et tres rapide. La seconde est basee sur une approche cinematique et utilise des filtres predictifs pour les associations. Une procedure d'estimation - verification des choix permet de rendre ces choix tres robustes. Pour respecter la cadence video, il est necessaire d'optimiser l'execution des differents algorithmes. Nous presentons des techniques logicielles issues du calcul scientifique pour accelerer leur vitesse d'execution sur les processeurs risc et les dsp vliw. Le deroulage de boucle et le pipeline logiciel optimisent les nids de boucles et le blocage de cache, la localite des donnees. Ces techniques sont presentees a travers l'exemple des filtres recursifs de detection de contours qui permettent d'evaluer les performances, aussi bien des architectures que des techniques d'optimisations. Ces techniques d'optimisation sont ensuite appliquees a la relaxation markovienne et a l'etiquetage. Le facteur d'acceleration ainsi obtenu est superieur a 2. De plus nous estimons que la relaxation et l'etiquetage se parallelisent facilement et efficacement.
13

Brault, Patrice. "Estimation de mouvement et segmentation d'image." Paris 11, 2005. https://tel.archives-ouvertes.fr/tel-00011310.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
La première partie de ce mémoire présente une nouvelle vision de l'estimation de mouvement (EM) dans les séquences vidéo. Nous abordons l'EM à partir de familles d'ondelettes redondantes peu connues et adaptées à différentes transformations, dont, plus particulièrement, la vitesse. Les standards de compression actuels prennent en compte une compression objet mais ne calculent toujours que de simples vecteurs de mouvements de ``blocs''. Nous avons mis en œuvre ces familles d'ondelettes car 1) elles sont construites pour le calcul de paramètres sur plusieurs types de mouvement (rotation, vitesse, accélération). 2) à partir des paramètres de mouvement, nous proposons une approche de l'EM basée sur l'identification des trajectoires des objets. L'approche s'apparente alors à une compression contextuelle, fondée sur une compréhension de la scène. La seconde partie présente deux développements concernant la segmentation non-supervisée dans une approche bayésienne. 1) nous réduisons le temps de segmentation d'une séquence par une mise en oeuvre itérative de la segmentation. Nous montrons l'application à l'EM d'une région segmentée. 2) nous réduisons le temps de segmentation en effectuant la projection de l'image dans le domaine des ondelettes. Ces deux développements sont fondés sur une modélisation de Potts-Markov (PMRF) pour les étiquettes des pixels ou des coefficients d'ondelettes. Ils utilisent un algorithme itératif de type Markov Chain Monte Carlo avec échantillonneur de Gibbs. Enfin, dans l'approche par ondelettes, nous avons développé le modèle de Potts-Markov pour l'adapter aux orientations privilégiées des sous-bandes d'ondelettes
The first part of this thesis presents a new vision of the motion estimation (ME) in video sequences. We investigate motion estimation with redundant wavelet families tuned to different kind of transformations and, in particular, to speed. Today video compression standards are supposed to realize the compression in an object-based approach, but still compute raw motion vectors on “blocks”. We thus implemented these wavelet families because 1) they are built to perform motion parameter quantization on several kinds of motions (rotation, speed, acceleration) and 2) based on the motion parameters, we can propose an approach of the ME through the identification of the objects trajectories. The global approach is then closer to a contextual compression, based on the understanding of the scene. The second part introduces two new developments on unsupervised segmentation in a Bayesian approach. 1) we reduce the computation time of a sequence through an iterative implementation of the segmentation. We show an application with the ME of a segmented region. 2) We reduce the segmentation time by making the projection of the image in the wavelet domain. These two developments are based on a Potts-Markov modelling (PMRF) for the labels of the pixels and of the wavelet coefficients. They use a Markov Chain Monte Carlo iterative algorithm with a Gibbs sampler. We also develop a Potts model in the wavelet domain to tune it to the specific orientations of the wavelet subbands
14

Murgia, Julian. "Segmentation d'objets mobiles par fusion RGB-D et invariance colorimétrique." Thesis, Belfort-Montbéliard, 2016. http://www.theses.fr/2016BELF0289/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette thèse s'inscrit dans un cadre de vidéo-surveillance, et s'intéresse plus précisément à la détection robustesd'objets mobiles dans une séquence d'images. Une bonne détection d'objets mobiles est un prérequis indispensableà tout traitement appliqué à ces objets dans de nombreuses applications telles que le suivi de voitures ou depersonnes, le comptage des passagers de transports en commun, la détection de situations dangereuses dans desenvironnements spécifiques (passages à niveau, passages piéton, carrefours, etc.), ou encore le contrôle devéhicules autonomes. Un très grand nombre de ces applications utilise un système de vision par ordinateur. Lafiabilité de ces systèmes demande une robustesse importante face à des conditions parfois difficiles souventcausées par les conditions d'illumination (jour/nuit, ombres portées), les conditions météorologiques (pluie, vent,neige) ainsi que la topologie même de la scène observée (occultations). Les travaux présentés dans cette thèsevisent à améliorer la qualité de détection d'objets mobiles en milieu intérieur ou extérieur, et à tout moment de lajournée.Pour ce faire, nous avons proposé trois stratégies combinables :i) l'utilisation d'invariants colorimétriques et/ou d'espaces de représentation couleur présentant des propriétésinvariantes ;ii) l'utilisation d'une caméra stéréoscopique et d'une caméra active Microsoft Kinect en plus de la caméra couleurafin de reconstruire l'environnement 3D partiel de la scène, et de fournir une dimension supplémentaire, à savoirune information de profondeur, à l'algorithme de détection d'objets mobiles pour la caractérisation des pixels ;iii) la proposition d'un nouvel algorithme de fusion basé sur la logique floue permettant de combiner les informationsde couleur et de profondeur tout en accordant une certaine marge d'incertitude quant à l'appartenance du pixel aufond ou à un objet mobile
This PhD thesis falls within the scope of video-surveillance, and more precisely focuses on the detection of movingobjects in image sequences. In many applications, good detection of moving objects is an indispensable prerequisiteto any treatment applied to these objects such as people or cars tracking, passengers counting, detection ofdangerous situations in specific environments (level crossings, pedestrian crossings, intersections, etc.), or controlof autonomous vehicles. The reliability of computer vision based systems require robustness against difficultconditions often caused by lighting conditions (day/night, shadows), weather conditions (rain, wind, snow...) and thetopology of the observed scene (occultation...).Works detailed in this PhD thesis aim at reducing the impact of illumination conditions by improving the quality of thedetection of mobile objects in indoor or outdoor environments and at any time of the day. Thus, we propose threestrategies working as a combination to improve the detection of moving objects:i) using colorimetric invariants and/or color spaces that provide invariant properties ;ii) using passive stereoscopic camera (in outdoor environments) and Microsoft Kinect active camera (in outdoorenvironments) in order to partially reconstruct the 3D environment, providing an additional dimension (a depthinformation) to the background/foreground subtraction algorithm ;iii) a new fusion algorithm based on fuzzy logic in order to combine color and depth information with a certain level ofuncertainty for the pixels classification
15

Delamarre, Quentin. "Suivi du mouvement d'objets articulés dans des séquences d'images vidéo." Nice, 2003. http://www.theses.fr/2003NICE4067.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Nous proposons une méthode pour faire "comprendre" automatiquement à un ordinateur les mouvements d'un être humain filmé par des caméras vidéo, sachant qu'aucun marqueur n'a été placé sur celui-ci. Pour cela, nous avons choisi de nous intéresser à une première étape: l'estimation des variations des paramètres du mouvement d'une personne dans le temps. Nous abordons aussi la deuxième étape qui consiste à interpréter ces variations pour leur donner un sens. Des informations sont extraites des images vidéo et sont comparées à un modèle géométrique de l'objet suivi. Ces informations sont soit une segmentation de la silhouette de l'objet dans le cas où les caméras sont éloignées les unes des autres, soit une reconstruction tridimensionnelle de cet objet dans le cas où les caméras sont rapprochées. Nous expliquons pourquoi cette distinction est faite. Dans chacun des cas nous supposons connue la géométrie de l'objet en construisant un modèle 3D constitué de parties rigides simples articulées entre elles. La minimisation de l'erreur d'estimation des paramètres de position est effectuée en créant des forces et en résolvant les équations de la dynamique pour le modèle 3D articulé. Ces forces sont créées à partir des informations trouvées dans les images. Les différentes étapes de l'algorithme sont abordées: la calibration des caméras, la structure du modèle 3D, l'extraction d'informations des images, l'application de forces au modèle 3D, la dynamique de ce modèle et l'estimation et la prédiction de son mouvement dans la scène grâce à un filtre de Kalman. Enfin nous montrons des résultats encourageants et proposons des idées pour généraliser l'algorithme
We introduce you to a method designed to provide the computer, the ability to automatically understand the motions of a markerless filmed human in a multi-cameras environment. In a first step, we decide to estimate the time extended motions variations. Secondly, these variations are interpreted in order to give them significance. After being retrieved from the video pictures, information are compared to a tracked object geometric model. These information could be a segmentation of the object silhouette in case of far distant cameras from each other, or a three-dimensional reconstruction in case of near distant cameras from each other. We ll explain why this distinction is made. In each case, we assume that the object geometry is known thanks to the build of a 3D model made of simple articulated rigid parts. The position parameters error correction is done by creating forces and by resolving the equations of the 3D articulated model dynamic. Information found in the pictures allow us to create such forces. Different steps of the algorithm are introduced: how to calibrate the cameras, the 3D model structure, the information retrieve process, how to apply forces to the model, its dynamic, the estimation and anticipation of the motion in the scene thanks to a Kalman filter. Finally, we expose encouraging results and try to give ideas in order to generalize the algorithm
16

Silbermann, Martine. "Reconnaissance de schémas manuscrits : contribution à l'étude d'objets en mouvement." Grenoble INPG, 1986. http://www.theses.fr/1986INPG0134.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Après squelettisation, l'image du schéma est soumise à la phase de reconnaissance. Une première méthode de type structurelle est proposée et appliquée aux grafcet. Une seconde méthode, mise en œuvre sur les symboles électroniques, s'articule autour des notions d'invariants topologiques et de descripteurs de fourier. Dans un but de généralisation de cette dernière notion, nous avons été amenés à définir une transformée étroitement liée aux transformées de fourier standards, et dont la principale propriété est de traiter identiquement tous les déplacements
17

Silbermann, Martine. "Reconnaissance de schémas manuscrits contribution à l'étude d'objets en mouvement /." Grenoble 2 : ANRT, 1986. http://catalogue.bnf.fr/ark:/12148/cb37601154t.

Full text
APA, Harvard, Vancouver, ISO, and other styles
18

Foret, Guillaume. "Segmentation spatio-temporelle d'objets vidéo en vue de leur caractérisation." Grenoble INPG, 2003. http://www.theses.fr/2003INPG0082.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
La finalité de nos travaux fut d'étendre les applications de la pyramide irrégulière à la détection et au suivi temporel d'objets vidéo dans des séquences naturelles. Nous décrivons, dans un premier temps, des méthodes de segmentation spatiale afin de situer la technique de la pyramide irrégulière. Nous détaillons alors le fonctionnement de cette dernière, avant de proposer une utilisation originale de la pyramide, qui limite la segmentation à un ensemble de pixels de l'image (segmentation locale). L'intérêt de cette segmentation locale par pyramide irrégulière est mis en évidence dans le cadre de la détection semi-automatique d'objets vidéo et de leur suivi. Un état de l'art sur les techniques de segmentation spatio-temporelle, nous permet d'introduire notre propre méthode de suivi temporel d'objets. Elle est constituée de trois phases distinctes : une prédiction d'étiquette par block-matching, une segmentation locale par pyramide irrégulière, et une classification par projection en arrière. Des résultats expérimentaux sont fournis tout au long du document. Nous nous attardons sur des résultats de segmentation de séquences test MPEG. Plusieurs exemples d'application en aval sont alors proposés.
19

Chebaro, Bilal. "Etude du mouvement 3D d'objets par l'analyse d'une séquence stéréoscopique d'images." Toulouse 3, 1993. http://www.theses.fr/1993TOU30195.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Nous decrivons dans cette these un systeme analysant et gerant une sequence stereoscopique d'images. Le but d'un tel systeme est la localisation et la caracterisation des objets mobiles dans une scene avant de proceder dans un deuxieme temps a l'estimation de leurs parametres de mouvement 3d. Notre strategie peut se resumer de la maniere suivante: chaque sequence (droite et gauche) est analysee d'une facon independante, un ensemble d'operateurs permet de detecter et de caracteriser les regions mobiles dans une image. L'ensemble des descriptions des regions mobiles dans une image constitue la base des faits des regions mobiles de cette image. Ces bases de faits sont ensuite utilisees dans un deuxieme temps pour etablir la phase de l'appariement qui met en jeu a chaque pas de traitement quatre images relatives a deux couples stereoscopiques successifs. Lors de cette phase toutes les mises en correspondance temporelles et stereoscopiques sont realisees d'une facon independante. La fusion est assuree quant a elle, par un algorithme original de verification des coherences et de gestion des conflits. Ce dernier traitement est effectue selon une strategie privilegiant les associations temporelles. Lors du calcul de mouvement, les regions mobiles ne sont pas considerees individuellement, mais au contraire, elles sont regroupees entre elles en classes selon un critere garantissant l'identite du mouvement entre les elements d'une meme classe. A ce sujet, nous avons pu en effet demontrer que la conservation au cours de leur mouvement d'un nombre fini de distances entre des points appartenant a deux regions solides garantit l'identite de mouvement entre ces deux regions. Ce critere est exploite pour definir un algorithme de regroupement des regions. Enfin le calcul de mouvement est effectue sur chacune des classes issues de la phase de regroupement
20

Demirdjian, David. "Le mouvement projectif : théorie et applications pour l'autocalibrage et la segmentation du mouvement." Phd thesis, Grenoble INPG, 2000. http://tel.archives-ouvertes.fr/tel-00590318.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
La vision stéréoscopique apparaît dans de nombreuses applications comme le moyen le plus évident pour obtenir des informations tridimensionnelles à partir d'images. Les approches employées reposent généralement sur des modèles euclidiens et nécessitent un étalonnage fort des systèmes stéréoscopiques utilisés, ce qui implique que les paramètres internes des caméras ainsi que la position relative entre les caméras doivent être connues. Or un étalonnage fort et précis nécessite généralement une intervention humaine. Cependant une aide extérieure n'est pas toujours possible et l'utilisation de systèmes faiblement étalonnés (systèmes dont seule la géométrie épipolaire est connue) apparaît alors comme une alternative. Un étalonnage faible est très facile à obtenir mais la difficulté est qu'alors les informations tridimensionnelles obtenues sont projectives et non plus euclidiennes. Ce document s'inscrit dans une approche basée sur un étalonnage faible et s'intéresse à l'étude d'un système stéréoscopique faiblement étalonné évoluant dans un environnement a priori inconnu. Il montre comment, en pratique, on peut tirer partie du mouvement d'un système stéréoscopique pour remonter à la structure métrique de la scène (par auto-étalonnage) et détecter des objets en mouvement. L'espace projectif est utilisé ici pour représenter l'information visuelle issue du système. En particulier, on étudie les transformations projectives 3D -appelées également homographies 3D- qui relient les reconstructions projectives d'une scène rigide. On s'intéresse au problème d'estimation de ces homographies 3D et on montre comment celles-ci entrent en jeu dans des applications telles que l'auto-étalonnage ou la segmentation du mouvement
21

Zinbi, Youssef. "Détection et catégorisation d'objets dans une vidéo." Caen, 2009. http://www.theses.fr/2009CAEN2002.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Dans le contexte de l’analyse vidéo, il est important d’avoir des méthodes de segmentation intelligentes et rapides pour fournir un aperçu rapide du contenu des séquences vidéo. Dans le cadre de cette thèse, nous nous intéressons particulièrement à des problèmes d’extraction et de catégorisation des objets vidéos. Pour l’extraction, nous proposons d'utiliser l'approche par contours actifs globaux basés régions qui permet de localiser rapidement les objets d'intérêt. Pour cela, nous avons utilisé des critères de segmentation qui prennent en compte l’homogénéité et les attributs perceptuels pour définir une compétition entre la région d'intérêt et le fond. Pour améliorer la méthode de détection et de suivi de données vidéo, nous avons étendu la formulation énergétique de notre modèle des contours actifs globaux en incluant une force supplémentaire issue du calcul du flot optique. Dans une seconde partie, nous abordons le problème de l’interprétation du comportement humain (mouvement et gestuelles) dans les séquences vidéo. Les buts poursuivis sont multiples. D’un côté, nous procédons à une analyse du mouvement humain. Le terme “analyse” concerne ici l’extraction d’informations bas-niveau, tels que la silhouette de la personne, la localisation de son visage, l’extraction et classification de son expression faciale. D’un autre côté, on propose une méthode de catégorisation qui faciliterait la réduction de données et de dimensionnalité des données, ainsi que l’interprétation du comportement humain. Il s’agit de la reconnaissance de démarches (marche, course etc. ), de postures (debout, accroupi, etc. ), ou entre des personnes (gestes, attitudes etc. )
Video content analysis is essential for efficient and intelligent utilization of vast multimedia databases. In video sequences, object-based extraction techniques are important for content-based video processing in many applications. In this context, it is important to have methods and algorithms which can execute very fast in order to provide a fast outline of the video content. In this thesis, we are interested particularly to problem of objects extraction and categorization from video sequences. We first propose to use a global active contours approach to extract some Regions of Interest (ROIs). To improve the accuracy of the extracted moving objects in video sequences, we have proposed to incorporate optical flow information into the active contour function. The second part of this thesis address the problem of object categorization in a video sequences, specially for human actions, using spectral clustering. We proposed an approach of posture estimation and we described a methodology to automatically recognize the human activities embedded in practical applications. We proposed to analyse the human behaviour. It refers to the extraction of low-level information, such as his silhouette, the location of the face and the classification of his facial expression. On the other hand, we proposed an new approach of categorization based on spectral analysis that facilitate the reduction of the dimensionality and allows the interpretation of the postures and behavior of persons : walking, running etc. )
22

Bilodeau, Guillaume-Alexandre. "Segmentation en parties d'objets 3D provenant d'images 2D réelles et complexes." Thesis, National Library of Canada = Bibliothèque nationale du Canada, 1999. http://www.collectionscanada.ca/obj/s4/f2/dsk1/tape8/PQDD_0011/MQ41855.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
23

Baurès, Robin. "Influence de la gravité sur la perception et l'interrception d'objets en mouvement." Phd thesis, Université Paris Sud - Paris XI, 2008. http://tel.archives-ouvertes.fr/tel-00265175.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Pour expliquer le succès des individus dans des tâches d'interception d'objets accélérés par la gravité malgré sa faible détection par le système visuel, plusieurs études ont récemment suggéré que la gravité soit internalisée dans un modèle interne de la gravité permettant l'accès au temps de contact (TTC) exact lors de l'interception d'objets en chute libre. Cependant, on peut se demander si certains problèmes méthodologiques et théoriques ne peuvent pas remettre en cause la démonstration de l'existence et l'utilisation effective d'un tel modèle. Le but de ce travail doctoral a été de déterminer de quelle manière notre connaissance de la gravité influence notre perception et nos actions. Pour cela, nous avons conduit six expérimentations issues de trois paradigmes différents, celui des jugements perceptifs, des actions d'interception indirectes et des actions d'interception directes. Les résultats obtenus infirment l'utilisation d'un modèle interne quantitatif de la gravité, et au contraire suggèrent l'utilisation de la gravité comme une connaissance implicite qualitative de la physique, qui aurait pour conséquence de modifier nos jugements perceptifs et nos mouvements d'interception sans permettre de calculer quantitativement les effets de la gravité.
24

Mainprice, Jim. "Planification de mouvement pour la manipulation d'objets sous contraintes d'interaction homme-robot." Phd thesis, INSA de Toulouse, 2012. http://tel.archives-ouvertes.fr/tel-00782708.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Un robot agit sur son environnement par le mouvement, sa capacité à planifier ses mouvements est donc une composante essentielle de son autonomie. La planification de mouvement est un domaine de recherche qui a largement été étudié durant ces dernières décennies. L'objectif de cette thèse est de concevoir des méthodes algorithmiques performantes permettant le calcul automatique de trajectoires pour des systèmes robotiques complexes dans le cadre de la robotique d'assistance. Ce champ applicatif émergeant de la robotique autonome apporte de nouvelles contraintes et de nouveaux défis. Les systèmes considérés qui ont pour vocation de servir l'homme et de l'accompagner dans des tâches du quotidien doivent tenir compte de la sécurité et du bien-être de l'homme. Pour cela, les mouvements du robot doivent être générés en considérant explicitement le partenaire humain raisonant sur un modèle du comportement social de l'homme, de ses capacités et de ses limites afin de produire un comportement synergique optimal. Dans cette thèse nous étendons les travaux pionniers menés au LAAS dans ce domaine afin de produire des mouvements considérant l'homme de manière explicite dans des environnements encombrés. Des algorithmes d'exploration de l'espace des configurations par échantillonnage aléatoire sont combinés à des algorithmes d'optimisation de trajectoire afin de produire des mouvements sûrs et agréables. Nous proposons dans un deuxième temps un planificateur de tâche d'échange d'objet prenant en compte la mobilité du receveur humain permettant ainsi de partager l'effort lors du transfert. La pertinence de cette approche a été étudiée dans une étude utilisateur. Finalement, nous présentons une architecture logicielle qui permet de prendre en compte l'homme de manière dynamique lors de la réalisation de tâches de manipulation interactive. Cette architecture, développée en collaboration avec un partenaire du projet européen Dexmart a également été évaluée dans une étude utilisateur.
25

Baurès, Robin. "Influence de la gravité sur la perception et l'interception d'objets en mouvement." Paris 11, 2007. http://www.theses.fr/2007PA113004.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Pour expliquer le succès des individus dans des tâches d'interception d’objets accélérés par la gravité malgré sa faible détection par le système visuel, plusieurs études ont récemment suggéré que la gravité soit internalisée dans un modèle interne de la gravité permettant l'accès au temps de contact (TTC) exact lors de l’interception d 'objets en chute libre. Cependant, on peut se demander si certains problèmes méthodologiques et théoriques ne peuvent pas remettre en cause 1a démonstration de l’existence et l'utilisation effective d’un tel modèle. Le but de ce travail doctoral a été de déterminer de quelle manière notre connaissance de la gravité influence notre perception et nos actions. Pour cela, nous avons conduit six expérimentations issues de trois paradigmes différents, celui des jugements perceptifs, des actions d’interception indirectes et des actions d’interception directes. Les résultats obtenus infirment l'utilisation d’un modèle interne quantitatif de la gravité, et au contraire suggèrent l’utilisation de la gravité comme une connaissance implicite qualitative de la physique, qui aurait pour conséquence de modifier nos jugements perceptifs et nos mouvements d’interception sans permettre de calculer quantitativement les effets de la gravité
In order to explain Humans' success in interceptive actions of gravitationally accelerated objects, despites the low capacity of the visual system to detect it, several studies have recently suggested that gravity has been embodied in a quantitative internal model of gravity thereby permitting access to exact time-to-contact (TTC) when intercepting a free falling object. However, we may wonder if theoretical and methodological concerns in these experiments can not call into question the effective demonstration of the existence and use of such a model. The goa l of this doctoral work was to determine how our knowledge of gravity influences our perception and actions. We conducted six ex perimentations issued from three different paradigms, perceptive judgment, indirect interception and direct interception. Our results refute the use of a quantitative internal model of gravity, and plead in favour of the use of our knowledge of gravity as a qualitative implicit physics knowledge, which would modulate our perceptive judgements a nd interceptive movements but without giving access to the quantitative effects of gravity
26

Gomila, Cristina. "Mise en correspondance de partitions en vue du suivi d'objets." Phd thesis, École Nationale Supérieure des Mines de Paris, 2001. http://pastel.archives-ouvertes.fr/pastel-00003272.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Dans le domaine des applications multimédia, les futurs standards vont permettre de créer de nouvelles voies de communication, d'accès et de manipulation de l'information audiovisuelle qui vont bien au-delà de la simple compression à laquelle se limitaient les standards de codage précédents. Parmi les nouvelles fonctionnalités, il est espéré que l'utilisateur pourra avoir accès au contenu des images par édition et manipulation des objets présents. Néanmoins, la standardisation ne couvre que la représentation et le codage de ces objets, en laissant ouvert un large champ de développement pour ce qui concerne la probl ématique liée à leur extraction et à leur suivi lorsqu'ils évoluent au long d'une séquence vidéo. C'est précisément sur ce point que porte cette thèse. Dans un premier temps, nous avons procédé à l' étude et à la mise au point d'algorithmes de filtrage et de segmentation à caractère générique, car ces outils sont à la base de tout système d'analyse du contenu d'une image ou d'une séquence. Plus concr ètement, nous avons étudié en détail une nouvelle classe de filtres morphologiques connus sous le nom de nivellements ainsi qu'une variation des algorithmes de segmentation basée sur l'inondation contrainte d'une image gradient. Les techniques de segmentation ont pour but de produire une partition de l'image aussi proche que possible de celle faite par l' oeil humain, en vue de la reconnaissance postérieure des objets. Néanmoins, dans la plupart des cas, cette dernière tâche ne peut être faite que par interaction humaine et, pourtant, lorsqu'on veut retrouver un objet dans une large collection d'images, ou suivre son évolution au long d'une s équence, la surveillance de chacune des partitions devient impossible. S'impose alors le développement d'algorithmes de mise en correspondance capables de propager l'information dans une série d'images, en limitant l'interaction humaine à une seule étape d'initialisation. En faisant le passage des images fixes aux séquences, la partie centrale de cette thèse est consacrée à l' étude du problème de la mise en correspondance de partitions. La méthode que nous avons développée, nommée technique de Segmentation et Appariement Conjoint (SAC), peut être définie comme étant de nature hybride. Elle combine des algorithmes classiques de mise en correspondance de graphes avec de nouvelles techniques d' édition, basées sur les hiérarchies de partitions fournies par la segmentation morphologique. Cette combinaison a donné lieu à un algorithme très robuste, malgré l'instabilité typiquement associée aux processus de segmentation. La segmentation de deux images peut différer fortement si on la considère du seul point de vue d'une partition unique ; néanmoins nous avons montré qu'elle est beaucoup plus stable si on considère des hiérarchies de partitions emboîtées, dans lesquelles tous les contours présents apparaissent, chacun avec une valuation indiquant sa force. Les résultats obtenus par la technique SAC ont fait d'elle une approche très prometteuse. Souple et puissante, elle est capable de reconnaître un objet lorsqu'il réapparaît après occultation grâce à la gestion d'un graphe de mémoire. Bien que nous nous soyons int éressés tout particulièrement à la problématique du suivi, les algorithmes mis au point ont un champ d'application beaucoup plus vaste dans le domaine de l'indexation, en particulier pour la recherche d'objets dans une base de données d'images ou de séquences. Finalement, dans le cadre du projet européen M4M (MPEG f(o)ur mobiles) nous avons abordé la mise en oeuvre d'un démonstrateur de segmentation en temps réel capable de détecter, segmenter et suivre un personnage dans des séquences de vidéophonie. Dans le cadre de cette application, la contrainte du temps réel est devenue le grand d éfi à surmonter, en nous obligeant a simplifier et à optimiser nos algorithmes. L'int erêt principal en termes des nouveaux services est double : d'un côté le détourage automatique du locuteur permettrait d'adapter le codage à l'objet, économisant du débit sans perte de qualité sur les régions d'int erêt ; d'un autre côté il permettrait de faire l' édition personnalisée des séquences en changeant la composition de la scène, par exemple en introduisant un nouveau fond, ou en disposant plusieurs locuteurs dans une salle de conférence virtuelle.
27

Liang, Liang. "Contribution à la segmentation chromatique des images : application à l'identification d'objets colorés." Toulouse, INPT, 1987. http://www.theses.fr/1987INPT049H.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Présentation d'une méthode de segmentation chromatique d'image basée sur l'analyse d'histogrammes locaux et l'implantation dans le module de vision de certaines transformations colorimétriques en temps réel. Une application potentielle des techniques développées à l'identification d'objets colorés est proposée.
28

Liang, Liang. "Contribution à la segmentation chromatique des images application à l'identification d'objets colorés /." Grenoble 2 : ANRT, 1987. http://catalogue.bnf.fr/ark:/12148/cb37607444s.

Full text
APA, Harvard, Vancouver, ISO, and other styles
29

CHERIE, NABIL. "Utilisation des techniques de l'intelligence artificielle pour la modelisation du mouvement d'objets animes." Paris 11, 1991. http://www.theses.fr/1991PA112075.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette these presente les differentes approches de l'animation par ordinateur ainsi que les principaux systemes existants. Elle propose ensuite le systeme gemsa, simulateur de comportements du squelette humain dans un environnement representant un appartement. Un modele mathematique de la marche humaine a ete developpe. Pour generer une variete de marches ainsi que des exagerations, nous avons impose a ce modele la parametrisation comme contrainte forte. L'utilisateur de gemsa exprime son scenario avec une formulation orientee-but. La specification des details de l'animation est alors prise en charge par le systeme. L'utilisateur peut, par exemple, demander au systeme de deplacer le squelette d'une piece a une autre ou de le faire asseoir sur une chaise donnee. La planification de chemins dans l'appartement ainsi que la detection et l'evitement d'obstacles sont traites dans cette these
30

Tawbeh, Khalil. "Etudes d'objets convexes en tomographie discrète et applications." Chambéry, 2009. http://www.theses.fr/2009CHAMS031.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Le but de cette thèse est de comprendre la structure d'objets convexes dans le plan discret. En effet, plusieurs notions de convexités existent comme les HV- convexe, q-convexe et L-convexe et chacune conduit à une étude intéressante. Une notion naturelle de convexités dans le plan discret est la classe des polyominoes HV -convexes avec des cellules consécutives en lignes et colonnes. En utilisant la tomographie discrète et les travaux de Del lungo, Nivat, Barcucci et Pinzani [3, 4] ainsi que ceux de Chrobak et Dürr [17], on est capable de reconstruire des polyominoes qui sont HV -convexes à partir de leurs vecteurs de projections horizontaux et verticaux. En plus de cela, pour un polyomino P, HV -convexe, chaque paire de cellules de P peut être atteinte en utilisant un chemin inclus dans P, avec seulement deux types de pas (un tel chemin est appelé monotone). Un polyomino est dit kL-convexe si pour chaque deux cellules, on peut trouver un chemin monotone avec au plus k changements de direction. Ainsi l'ensemble des kL-convexes forme une hiérarchie des polyominoes HV -convexes selon le nombre de changement de direction des chemins monotones. La notion des polyominoes L-convexes, c'est a dire quand k = 1, a été introduite par Castiglione et Restivo [13] et leurs structures géométriques et tomographiques sont bien connues [10, 11, 12, 14]. Nous proposons d'étudier la classe des polyominoes 2L-convexes qui ont une structure géométrique et tomographique beaucoup plus compliqués que celles des L-convexes. Nous étudions tout d'abord les propriétés et les aspects géométriques de plusieurs sous-classes des 2L-convexes en fonction des chemins monotones, puis nous nous servons de cette étude pour trouver des algorithmes de reconstruction directe pour ces sous-classes. Une deuxième phase de cette thèse est réservée pour la partie appliquée où nous collaborons avec le Professeur François Cotton pour segmenter et reconstruire en 3D la tumeur cérébrale sur des données réelles provenant de l'imagerie médicale. Nous travaillons sur des images par IRM de l'hôpital sud de Lyon afin de calculer et de montrer la stabilité des géométriques pour donner aux médecins des outils sur l'évolution des tumeurs en fonction de temps
The aim of this thesis is to understand the structure of convex objects in the discrete plane. Indeed, several notions of discrete convexity exist such as HV- convex, q-convex and L-convex and each one leads to interesting studies. One natural notion of convexity on the discrete plane is the class of HV -convex polyominoes that is polyominoes with consecutive cells in rows and columns. Following the works of Del lungo, Nivat, Barcucci and Pinzani [3, 4] and also those of Chrobak and Dürr [17], we are able to reconstruct HV -convex polyominoes from their horizontal and vertical projections. In addition to that, for an HV -convex polyomino P every pair of its cells can be reached using a path included in P with only two kinds of unit steps, such a path is called a monotone path. A polyomino is called kL-convex if for every two cells we find a monotone path with at most k changes of direction. Obviously a kL-convex polyomino is an HV -convex polyomino. Thus, the set of kL-convex polyominoes for k Є N forms a hierarchy on HV -convex polyominoes according to the number of changes of direction of monotone paths. For k = 1, the notion of L-convex polyominoes has been introduced by Castiglione and Restivo [13] and their geometrical and tomographical characterizations are well known [10, 11, 12, 14]. In fact, 2L-convex polyominoes is the second level of the hierarchy on HV -convex polyominoes and they are more geometrically complex than those of L-convex polyominoes, more- over there is no result for their direct reconstruction. For that we study first the geometrical aspects of all sub-classes of 2L-convex polyominoes in terms of monotone paths, then we use these properties to give the tomographical aspects of these subclasses. The second phase of this thesis is reserved for the practical part where we work with Professor François Cotton on the segmentation and the 3D reconstruction of brain tumors. Several MRI for real patients are analyzed and geometric invariants are calculated, especially the volume in order to give doctors valid estimations for a better diagnosis
31

Odobez, Jean-Marc. "Estimation, detection et segmentation du mouvement : une approche robuste et markovienne." Rennes 1, 1994. http://www.theses.fr/1994REN10207.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette these traite de la detection et de la localisation d'objets en mouvement dans une sequence d'images acquises par une camera mobile. Nous motivons tout d'abord l'interet du probleme et rappelons diverses methodes existantes proposees pour le resoudre. L'approche que nous avons retenue pour la detection consiste a reconstruire dans un premier temps une sequence d'images, dans laquelle le deplacement apparent dans l'image induit par le mouvement de la camera a ete compense. Pour cela, nous supposons que ce deplacement peut etre decrit par un modele parametrique 2d. Le troisieme chapitre de ce memoire presente la methode robuste et multiresolution que nous avons developpee, qui permet d'estimer ce modele de mouvement parametre (dominant) dans l'image sans etre affecte par la presence d'autres mouvements (ceux des objets mobiles notamment). Le probleme pose se ramene alors a la detection des zones mal compensees dans la sequence ainsi reconstruite. Dans le chapitre quatre, nous definissons des mesures de compensation du mouvement adaptees a ce probleme. Ces mesures et leur fiabilite, calculees a differents instants, ainsi que la carte de detection a l'instant precedent, sont prises en compte au sein d'une regularisation statistique basee sur des modeles de markov multiechelles. L'algorithme que nous avons defini est relativement rapide et permet d'obtenir d'excellents resultats dans des situations complexes. Dans le chapitre cinq, l'algorithme de detection (binaire) precedent est etendu a la segmentation (gestion de n etiquettes) du mouvement dans une sequence d'images. Le schema complet que nous avons defini permet notamment de s'adapter au contenu dynamique de la scene, en creant de nouvelles regions lors de l'apparition de nouveaux objets dans la scene ou lorsque le mouvement d'une region donnee devient plus complexe
32

Ait, Fares Wassima. "Détection et suivi d'objets par vision fondés sur segmentation par contour actif basé région." Phd thesis, Université Paul Sabatier - Toulouse III, 2013. http://tel.archives-ouvertes.fr/tel-00932263.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
La segmentation et le suivi d'objets sont des domaines de recherche compétitif dans la vision par ordinateur. Une de leurs applications importantes réside dans la robotique où la capacité à segmenter un objet d'intérêt du fond de l'image, d'une manière précise, est cruciale particulièrement dans des images acquises à bord durant le mouvement du robot. Segmenter un objet dans une image est une opération qui consiste à distinguer la région objet du celle du fond suivant un critère défini. Suivre un objet dans une séquence d'images est une opération qui consiste à localiser la région objet au fil du temps dans une vidéo. Plusieurs techniques peuvent être utilisées afin d'assurer ces opérations. Dans cette thèse, nous nous sommes intéressés à segmenter et suivre des objets en utilisant la méthode du contour actif en raison de sa robustesse et son efficacité à pouvoir segmenter et suivre des objets non rigides. Cette méthode consiste à faire évoluer une courbe à partir d'une position initiale, entourant l'objet à détecter, vers la position de convergence qui correspond aux bords de cet objet d'intérêt. Nous proposons d'abord un critère global qui dépend des régions de l'image ce qui peut imposer certaines contraintes sur les caractéristiques de ces régions comme une hypothèse d'homogénéité. Cette hypothèse ne peut pas être toujours vérifiée du fait de l'hétérogénéité souvent présente dans les images. Dans le but de prendre en compte l'hétérogénéité qui peut apparaître soit sur l'objet d'intérêt soit sur le fond dans des images bruitées et avec une initialisation inadéquate du contour actif, nous proposons une technique qui combine des statistiques locales et globales pour définir le critère de segmentation. En utilisant un rayon de taille fixe, un demi-­‐disque est superposé sur chaque point du contour actif afin de définir les régions d'extraction locale. Lorsque l'hétérogénéité se présente à la fois sur l'objet d'intérêt et sur le fond de l'image, nous développons une technique basée sur un rayon flexible déterminant deux demi-­‐disques avec deux rayons de valeurs différentes pour extraire l'information locale. Le choix de la valeur des deux rayons est déterminé en prenant en considération la taille de l'objet à segmenter ainsi que de la distance séparant l'objet d'intérêt de ses voisins. Enfin, pour suivre un objet mobile dans une séquence vidéo en utilisant la méthode des contours actifs, nous développons une approche hybride du suivi d'objet basée sur les caractéristiques de la région et sur le vecteur mouvement des points d'intérêt extraits dans la région objet. En utilisant notre approche, le contour actif initial à chaque image sera ajusté suffisamment d'une façon à ce qu'il soit le plus proche possible au bord réel de l'objet d'intérêt, ainsi l'évolution du contour actif basée sur les caractéristiques de la région ne sera pas piégée par de faux contours. Des résultats de simulations sur des images synthétiques et réelles valident l'efficacité des approches proposées.
33

Tremblay, Maxime. "Vision numérique avec peu d'étiquettes : segmentation d'objets et analyse de l'impact de la pluie." Doctoral thesis, Université Laval, 2021. http://hdl.handle.net/20.500.11794/69039.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Un besoin ayant toujours existé dans le domaine de la vision numérique est celui d'avoir accès à des ensembles d'images annotées. Les avancements scientifiques et technologiques ont exacerbé les besoins en données étiquetées; un modèle d'apprentissage profond peut nécessiter des milliers, voire des centaines de milliers (dépendamment de la complexité du problème), d'images étiquetées. Cela peut causer un problème puisque générer de grands ensembles de données étiquetées est une tâche longue et ardue. Est-il possible de travailler en vision numérique sans avoir à collecter et étiqueter des ensembles de données de plus en plus grands ? Dans le cadre de cette thèse, nous tentons de répondre à cette question sur deux fronts différents. Premièrement, nous avons développé une approche de détection et segmentation d'objets nécessitant peu de données d'entraînement. Cette approche, inspirée des modèles par les bag-of-words, modélise l'apparence et la forme des objets de façon éparse; la modélisation de la forme se fait par l'entremise d'un nouveau descripteur de forme. Deuxièmement, nous nous sommes penchés sur le fait que certains ensembles de données sont difficilement capturables et étiquetables. Nous nous sommes concentrés sur un exemple particulier, c'est-à-dire générer un ensemble d'images de scènes extérieures avec de la pluie dont les annotations consistent au taux de précipitation (mm/h). Notre solution consiste à augmenter des images réelles avec de la pluie synthétique. Si ces images augmentées sont suffisamment réalistes, il est possible d'expérimenter sur celles-ci comme si elles étaient des images de pluie réelle. Dans nos expérimentations, nous avons évalué l'effet de la pluie sur différents algorithmes de vision numérique et nous avons augmenté la robustesse de ceux-ci sur des images contenant de la vraie pluie.
34

Ait, Fares Wassima. "Détection et suivi d'objets par vision fondés sur segmentation par contour actif base région." Toulouse 3, 2013. http://thesesups.ups-tlse.fr/2143/.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
La segmentation et le suivi d'objets sont des domaines de recherche compétitifs dans la vision par ordinateur. Une de leurs applications importantes réside dans la robotique où la capacité à segmenter un objet d'intérêt du fond de l'image, d'une manière précise, est cruciale particulièrement dans des images acquises à bord durant le mouvement du robot. Segmenter un objet dans une image est une opération qui consiste à distinguer la région objet de celle du fond suivant un critère défini. Suivre un objet dans une séquence d'images est une opération qui consiste à localiser la région objet au fil du temps dans une vidéo. Plusieurs techniques peuvent être utilisées afin d'assurer ces opérations. Dans cette thèse, nous nous sommes intéressés à segmenter et suivre des objets en utilisant la méthode du contour actif en raison de sa robustesse et son efficacité à pouvoir segmenter et suivre des objets non rigides. Cette méthode consiste à faire évoluer une courbe à partir d'une position initiale, entourant l'objet à détecter, vers la position de convergence qui correspond aux bords de cet objet d'intérêt. Nous utilisons des critères qui dépendent des régions de l'image ce qui peut imposer certaines contraintes sur les caractéristiques de ces régions comme une hypothèse d'homogénéité. Cette hypothèse ne peut pas être toujours vérifiée du fait de l'hétérogénéité souvent présente dans les images. Dans le but de prendre en compte l'hétérogénéité qui peut apparaître soit sur l'objet d'intérêt soit sur le fond dans des images bruitées et avec une initialisation inadéquate du contour actif, nous proposons une technique qui combine des statistiques locales et globales pour définir le critère de segmentation. En utilisant un rayon de taille fixe, un demi-disque est superposé sur chaque point du contour actif afin de définir les régions d'extraction locale. Lorsque l'hétérogénéité se présente à la fois sur l'objet d'intérêt et sur le fond de l'image, nous développons une technique basée sur un rayon flexible déterminant deux demi-disques avec deux rayons de valeurs différentes pour extraire l'information locale. Le choix de la valeur des deux rayons est déterminé en prenant en considération la taille de l'objet à segmenter ainsi que de la distance séparant l'objet d'intérêt de ses voisins. Enfin, pour suivre un objet mobile dans une séquence vidéo en utilisant la méthode du contour actif, nous développons une approche hybride du suivi d'objet basée sur les caractéristiques de la région et sur le vecteur mouvement des points d'intérêt extraits dans la région objet. En utilisant notre approche, le contour actif initial à chaque image sera ajusté suffisamment d'une façon à ce qu'il soit le plus proche possible au bord réel de l'objet d'intérêt, ainsi l'évolution du contour actif basée sur les caractéristiques de la région ne sera pas piégée par de faux contours. Des résultats de simulations sur des images synthétiques et réelles valident l'efficacité des approches proposées
Object segmentation and tracking is a challenging area of ongoing research in computer vision. One important application lies in robotics where the ability to accurately segment an object of interest from its background is crucial and particularly on images acquired onboard during robot motion. Object segmentation technique consists in separating the object region from the image background according to a pre-defined criterion. Object tracking is a process of determining the positions of moving objects in image sequences. Several techniques can be applied to ensure these operations. In this thesis, we are interested to segment and track objects in video sequences using active contour method due to its robustness and efficiency to segment and track non-rigid objects. Active contour method consists in making a curve converge from an initial position around the object to be detected towards this object boundary according to a pre-defined criterion. We employ criteria which depend on the image regions what may impose certain constraints on the characteristics of these regions as a homogeneity assumption. This assumption may not always be verified due to the heterogeneity often present in images. In order to cope with the heterogeneity that may appear either in the object of interest or in the image background in noisy images using an inadequate active contour initialization, we propose a technique that combines local and global statistics in order to compute the segmentation criterion. By using a radius with a fixed size, a half-disk is superposed on each point of the active contour to define the local extraction regions. However, when the heterogeneity appears on both the object of interest and the image background, we develop a new technique based on a flexible radius that defines two half-disks with two different radius values to extract the local information. The choice of the value of these two radii is determined by taking into consideration the object size as well as the distance separating the object of interest from its neighbors. Finally, to track a mobile object within a video sequence using the active contour method, we develop a hybrid object tracking approach based on region characteristics and on motion vector of interest points extracted on the object region. Using our approach, the initial active contour for each image will be adequately adjusted in a way that it will be as close as possible to the actual boundary of the object of interest so that the evolution of active contour based on characteristics of the region will not be trapped by false contours. Simulation results on synthetic and real images validate the effectiveness of the proposed approaches
35

Haddadi, Souad. "Réseaux de neurones, textures et modèles markoviens pour la détection et l'identification d'objets en mouvement." Compiègne, 1997. http://www.theses.fr/1997COMP1081.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette thèse, propose le développement d'une méthode d'analyse de séquence d'images pour l'interprétation de scènes dynamiques où évoluent des objets quelconques ou des êtres humains, sur fond non uniforme et sous éclairage peu contrôlé. Deux axes de recherche ont été abordés : l'analyse de mouvement (détection des objets en mouvement) et la reconnaissance des formes (identification des objets). L'approche de détection proposée s'appuie sur une procédure de segmentation statistique fondée sur le principe markovien et sur l'analyse de la texture. En considérant un opérateur fondé sur les différences entre trois images successives prises deux à deux, on met en évidence les objets mobiles ainsi que les régions du fond découvertes ou recouvertes par ces objets pendant leur mouvement. Une segmentation grossière est ensuite appliquée afin de ne traiter que les zones retenues de l'image. On enchaîne par une segmentation plus fine fondée sur le principe markovien et textural en rapprochant ce problème à celui d'une classification de l'image en pixel fixe et pixel mobile. L'approche d'identification de ces objets utilise un modèle statistique par les réseaux de neurones artificiels. Ils permettent ainsi l'apprentissage numérique par l'exemple. Des modèles d'architectures de réseaux de neurones ont été développés et appliqués à l'identification des êtres humains. Les performances de ces réseaux ont été calculées à l'aide de deux bases de données construites à cette occasion. Nous avons montré que l'on pouvait obtenir de bonnes performances à l'aide de réseaux du type MLP pour notre application. Toutefois, les études menées au cours de cette thèse soulèvent un certain nombre de problèmes théoriques difficiles, ainsi par exemple, à plusieurs reprises, nous nous sommes trouvés confrontés aux problèmes de la sélection d'un ensemble d'apprentissage pertinent
In this PhD thesis, we present a method of analysis for image sequences. The method aims at dynamic scene interpretation where arbitrary objects evolve (in particular, human beings) and the scenes present non-uniform backgrounds and non-controlled illumination. Two processing approaches have been aborded : movement analysis (moving object detection) and pattern recognition (object identification). The proposed detection approach relies on a statistical segmentation procedure, which is based on the markovian principle and the analysis of texture. Considering an operator based on the differences between three successive images, taken two at a time, moving objects are detected, as well as the background regions which are discovered or occluded by these objects during their displacement. A coarse segmentation of this image operator is then applied to process the relevant zones of the image. This operation is then linked to a finer segmentation based on the markovian and textural principle. This problem was approached to a classification of the image operator into fixed and moving pixels. The identification approach of these objects uses another type of statistical model : the artificial neural networks, which allow computer training, after examples. Thus, models of neural network architectures were developed and applied to human being identification. The performances of these networks were calculated using two databases built for this project. We have demonstrated that high performances could be attained using MLP-type networks for our application. However, the studies accomplished during this thesis reveal a certain number of difficult problems. For example, in several cases we confronted the problem of selecting a pertinent training set
36

Pibre, Lionel. "Localisation d'objets urbains à partir de sources multiples dont des images aériennes." Thesis, Montpellier, 2018. http://www.theses.fr/2018MONTS107/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette thèse aborde des problèmes liés à la localisation et la reconnaissance d’objets urbains dans des images multi-sources (optique, infrarouge, Modèle Numérique de Surface) de très haute précision acquises par voie aérienne.Les objets urbains (lampadaires, poteaux, voitures, arbres…) présentent des dimensions, des formes, des textures et des couleurs très variables. Ils peuvent être collés les uns les autres et sont de petite taille par rapport à la dimension d’une image. Ils sont présents en grand nombre mais peuvent être partiellement occultés. Tout ceci rend les objets urbains difficilement identifiables par les techniques actuelles de traitement d’images.Dans un premier temps, nous avons comparé les approches d’apprentissage classiques, composées de deux étapes - extraction de caractéristiques par le biais d’un descripteur prédéfini et utilisation d’un classifieur - aux approches d’apprentissage profond (Deep Learning), et plus précisément aux réseaux de neurones convolutionnels (CNN). Les CNN donnent de meilleurs résultats mais leurs performances ne sont pas suffisantes pour une utilisation industrielle. Nous avons donc proposé deux améliorations.Notre première contribution consiste à combiner de manière efficace les données provenant de sources différentes. Nous avons comparé une approche naïve qui consiste à considérer toutes les sources comme des composantes d’une image multidimensionnelle à une approche qui réalise la fusion des informations au sein même du CNN. Pour cela, nous avons traité les différentes informations dans des branches séparées du CNN. Nous avons ainsi montré que lorsque la base d’apprentissage contient peu de données, combiner intelligemment les sources dans une phase de pré-traitement (nous combinons l'optique et l'infrarouge pour créer une image NDVI) avant de les donner au CNN améliore les performances.Pour notre seconde contribution, nous nous sommes concentrés sur le problème des données incomplètes. Jusque-là, nous considérions que nous avions accès à toutes les sources pour chaque image mais nous pouvons aussi nous placer dans le cas où une source n’est pas disponible ou utilisable pour une image. Nous avons proposé une architecture permettant de prendre en compte toutes les données, même lorsqu’il manque une source sur une ou plusieurs images. Nous avons évalué notre architecture et montré que sur un scénario d’enrichissement, cette architecture permet d'obtenir un gain de plus de 2% sur la F-mesure.Les méthodes proposées ont été testées sur une base de données publique. Elles ont pour objectif d’être intégrées dans un logiciel de la société Berger-Levrault afin d’enrichir les bases de données géographiques et ainsi faciliter la gestion du territoire par les collectivités locales
This thesis addresses problems related to the location and recognition of urban objects in multi-source images (optical, infrared, terrain model) of very high precision acquired by air.Urban objects (lamp posts, poles, car, tree...) have dimensions, shapes, textures and very variable colors. They can be glued to each other and are small with respect to the size of an image. They are present in large numbers but can be partially hidden. All this makes urban objects difficult to identify with current image processing techniques.First, we compared traditional learning approaches, consisting of two stages - extracting features through a predefined descriptor and using a classifier - to deep learning approaches and more precisely Convolutional Neural Networks (CNN). CNNs give better results but their performances are not sufficient for industrial use. We therefore proposed two contributions to increase performance.The first is to efficiently combine data from different sources. We compared a naive approach that considers all sources as components of a multidimensional image to an approach that merges information within CNN itself. For this, we have processed the different information in separate branches of the CNN.For our second contribution, we focused on the problem of incomplete data. Until then, we considered that we had access to all the sources for each image but we can also place ourselves in the case where a source is not available or usable. We have proposed an architecture to take into account all the data, even when a source is missing in one or more images. We evaluated our architecture and showed that on an enrichment scenario, it allows to have a gain of more than 2% on the F-measure.The proposed methods were tested on a public database. They aim to be integrated into a Berger-Levrault company software in order to enrich geographic databases and thus facilitate the management of the territory by local authorities
37

COULIBALY, ISMAILA. "Segmentation du mouvement issue de donnees multisensorielles a partir de sequences d'images." Clermont-Ferrand 2, 1995. http://www.theses.fr/1995CLF21701.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Ce memoire traite le probleme important de la segmentation du mouvement a partir de sequences d'images mixtes: images de luminance et donnees de profondeur de la scene observee. D'abord, une etude bibliographique generale sur l'analyse du mouvement a partir de sequences images denote l'importance que revet ce champ d'investigation. Ensuite, le cadre de ce travail est specifie. Il s'agit de la presentation des sequences d'images mixtes, et des approches retenues pour la segmentation du mouvement. Deux approches d'analyse du mouvement a partir de sequences d'images mixtes ont ete developpees. La premiere approche se rapporte a la mesure du mouvement apparent, tandis que la seconde est relative a la reconstruction du mouvement 3d. La mesure du mouvement apparent est faite au niveau des contours detectes dans les images de luminance. Elle est basee sur la minimisation d'une fonctionnelle globale issue de deux contraintes. La contrainte dite d'observation permet de minimiser l'ecart entre la vitesse apparente a estimer et la vitesse apparente initiale fournie par les donnees 3d. L'initialisation de la vitesse est faite par application de la transformee de hough. La seconde, appelee contrainte de controle, consiste a lisser le champ des vitesses apparentes pour tout contour considere dans l'image. La mise en uvre pratique de cette approche est faite par la relaxation iterative de jacobi. La reconstruction du mouvement 3d est une segmentation en regions coherentes au sens du mouvement 3d. Le schema de segmentation utilise est base sur la modelisation markovienne, et les parametres de mouvement 3d sont estimes par la methode des moindres carres. L'usage des champs de markov permet la prise en compte du modele classique parametre de mouvement 3d compose de la rotation et de la translation dans la scene reelle. Ce type de modelisation permet, en outre, d'exprimer les proprietes d'homogeneite sur la partition finale a obtenir. En definitif, l'utilisation du formalisme bayesien ramene le probleme de la segmentation a un probleme de minimisation d'une fonction d'energie. Celle-ci comporte deux termes. Le premier terme est la fonction d'energie a priori, elle est modelisee par une exponentielle decroissante. Le second est relatif a l'energie d'interaction entre les observations et les etiquettes, cette energie est modelisee par la distance du khi-deux. La mise en uvre finale de la segmentation est realisee par un algorithme de relaxation deterministe de type icm. Une experimentation complete sur des sequences d'images issues de donnees de simulation a permis de valider les approches developpees
38

MOSTAFAVI, GORJI SEYED MOHAMMAD MEHDI. "Une methode de segmentation spatio-temporelle operant par analyse globale du mouvement." Rennes, INSA, 1999. http://www.theses.fr/1999ISAR2210.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Ce memoire presente une methode de segmentation spatio-temporelle de sequences d'images, basee sur une analyse robuste du mouvement. La methode peut s'employer dans un contexte de codage a bas debit ou pour l'obtention d'une description du contenu des sequences d'images. La segmentation de chaque image conduit a deux types de regions : les regions avec antecedent dans l'image precedente et les autres regions (sans antecedent). La segmentation s'opere en deux etapes : une etape d'initialisation puis une etape de suivi temporel. L'etape d'initialisation se fait a partir de deux images non segmentees. Une image courante se voit segmentee a partir d'une image anterieure. L'etape de suivi temporel s'appuie toujours sur deux images : une courante et une anterieure mais en supplement elle necessite de disposer de la segmentation de l'image anterieure. La partie la plus importante de notre travail a porte sur la phase d'initialisation. Le suivi temporel se fonde principalement sur les procedures definies et utilisees dans la phase d'initialisation. Dans cette phase de suivi, l'utilisation de la segmentation de l'image anterieure garantit une meilleure coherence entre les segmentations spatio-temporelles des images successives. La phase d'initialisation opere par une recherche sequentielle des regions avec antecedent appelees egalement regions homogenes au sens du mouvement. La recherche d'une region homogene au sens du mouvement consiste en des iterations successives de deux procedures principales jusqu'a convergence. La premiere procedure recherche une region correspondant a un jeu de parametres de mouvement. La seconde recherche un jeu de parametres de mouvement pour une region donnee. Bien evidemment, la cooperation de ces deux procedures fournit en definitive une region et le jeu de parametres de mouvement associe. La methode developpee est illustree par application sur differentes sequences. Parmi les points forts de notre approche, soulignons la possibilite d'apprehender de grands mouvements et la possibilite de traitement de sequences sous-echantillonnees temporellement.
39

Dufour, Alexandre. "Segmentation, suivi et visualisation d'objets biologiques en microscopie 3D par fluorescence : Approches par modèles déformables." Phd thesis, Université René Descartes - Paris V, 2007. http://tel.archives-ouvertes.fr/tel-00271191.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Nous nous intéressons à la détection et au suivi d'objets biologiques divers (cellules, noyaux, etc.) dans des images et séquences tri-dimensionnelles acquises en microscopie par fluorescence. L'observation de phénomènes biologiques in situ étant de plus en plus cruciale pour les experts, il est nécessaire, en plus de l'analyse quantitative, d'effectuer un rendu volumique 3D de la scène et des objets qui y évoluent. De plus, l'automatisation des techniques d'acquisition d'images requiert un haut niveau de reproductibilité des algorithmes et induit souvent des contraintes de temps de calcul que nous nous efforçons de prendre en compte.

Les modèles déformables, également connus sous le nom de contours actifs, font actuellement partie des méthodes de pointe en analyse d'images pour la segmentation et le suivi d'objets grâce à leur robustesse, leur flexibilité et leur représentation à haut niveau sémantique des entités recherchées. Afin de les adapter à notre problématique, nous devons faire face à diverses difficultés. Tout d'abord, les méthodes existantes se réfèrent souvent aux variations locales d'intensité (ou gradients) de l'image pour détecter le contour des objets recherchés. Cette approche est inefficace en microscopie tridimensionnelle par fluorescence, où les gradients sont très peu prononcés selon l'axe de profondeur de l'image. Ensuite, nous devons gérer le suivi d'objets multiples susceptibles d'entrer en contact en évitant leur confusion. Enfin, nous devons mettre en place un système permettant de visualiser efficacement les contours durant leur déformation sans altérer les temps de calcul.

Dans la première partie de ce travail, nous pallions à ces problèmes en proposant un modèle de segmentation et de suivi multi-objets basé sur le formalisme des lignes de niveaux (ou level sets) et exploitant la fonctionnelle de Mumford et Shah. La méthode obtenue donne des résultats quantitatifs satisfaisants, mais ne se prête pas efficacement au rendu 3D de la scène, pour lequel nous sommes tributaires d'algorithmes dédiés à la reconstruction 3D (e.g. la méthode des "Marching Cubes"), souvent coûteux en mémoire et en temps de calcul. De plus, ces algorithmes peuvent induire des erreurs d'approximation et ainsi entraîner une mauvaise interprétation des résultats.

Dans la seconde partie, nous proposons une variation de la méthode précédente en remplaçant le formalisme des lignes de niveaux par celui des maillages triangulaires, très populaire dans le domaine de la conception assistée par ordinateur (CAO) pour leur rendu 3D rapide et précis. Cette nouvelle approche produit des résultats quantitatifs équivalents, en revanche le formalisme des maillages permet d'une part de réduire considérablement la complexité du problème et autorise d'autre part à effectuer un rendu 3D précis de la scène parallèlement au processus de segmentation, réduisant d'autant plus les temps de calculs.

Les performances des deux méthodes proposées sont d'abord évaluées puis comparées sur un jeu de données simulées reproduisant le mieux possible les caractéristiques des images réelles. Ensuite, nous nous intéressons plus particulièrement à l'évaluation de la méthode par maillages sur des données réelles, en évaluant la robustesse et la stabilité de quelques descripteurs de forme simples sur des expériences d'imagerie haut-débit. Enfin, nous présentons des applications concrètes de la méthode à des problématiques biologiques réelles, réalisées en collaboration avec d'autres équipes de l'Institut Pasteur de Corée.
40

Bugeau, Aurélie. "Détection et suivi d'objets en mouvement dans des scenes complexes, application a la surveillance des conducteurs." Phd thesis, Université Rennes 1, 2007. http://tel.archives-ouvertes.fr/tel-00551601.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
De nombreuses applications en vision par ordinateur nécessitent la détection et le suivi des objets en mouvement dans une séquence d'images. La plupart des méthodes existantes ne donnent de bons résultats que pour des séquences avec des fonds peu changeants, ou si le fond et les objets sont rigides. Le but de cette thèse est de détecter et suivre les objets mobiles dans des séquences (telles que des séquences de conducteurs) ayant un fond dynamique, avec de forts changements d'illumination, de faibles contrastes et éventuellement acquises par une caméra mobile. Cette thèse est décomposée en deux parties. Dans la première, une méthode de détection est proposée. Elle repose sur la définition d'une grille de points décrits par leur mouvement et leur photométrie. Ces points sont ensuite regroupés en "clusters en mouvement" avec un algorithme mean shift à noyau variable et une méthode de sélection automatique de la taille des noyaux. La deuxième partie propose une méthode de suivi combinant des distributions de couleur et de mouvement, la prédiction de l'objet et des observations extérieures (pouvant être les clusters en mouvement) dans une fonction d'énergie minimisée par coupe minimale/flot maximal dans un graphe. Les algorithmes de détection et de suivi sont validés sur différentes séquences aux contenus dynamiques complexes.
41

Selsis, Muriel. "Application des modèles de contours actifs au suivi et à la localisation 3D d'objets en mouvement." Lille 1, 1996. http://www.theses.fr/1996LIL10021.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Ce travail concerne l'adaptation des modèles de contours actifs au suivi et à la localisation 3d d'objets en mouvement dans des séquences d'images stéréoscopiques. Les contours actifs ont été introduits récemment en traitement d'images pour la segmentation d'images statiques. Ce sont des courbes dont l'évolution est régie par la minimisation de l'énergie qui leur est associée. Cette énergie doit être définie en fonction du problème à traiter. La contribution principale de ce travail est la définition d'une énergie permettant le suivi d'objets en mouvement, ainsi que l'introduction d'une procédure d'initialisation rendant ce suivi automatique. Une méthodologie du choix des différents paramètres régissant l'évolution des contours actifs est également proposée. D'autre part, les contours actifs constituent un modelé pertinent des objets caractérisant bien leur forme et leur surface. En les utilisant comme primitives pour l'appariement stéréoscopique, la complexité algorithmique de ce type de procédure est grandement diminuée, de même que le temps de calcul. Les modèles de contours actifs permettent donc de simplifier considérablement les procédures d'appariement, aussi bien temporelles que spatiales. Nous montrons les résultats obtenus sur des séquences stéréoscopiques d'images de synthèse et d'images réelles de trafic urbain.
42

Larvor, Yannick. "Notions de méréogéométrie : description qualitative de propriétés géométriques du mouvement et de la forme d'objets tridimensionnels." Toulouse 3, 2004. http://www.theses.fr/2004TOU30131.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Dans le cadre du raisonnement spatial qualitatif, nous utilisons des formalismes axiomatiques définissant des relations méréotopologiques ayant comme primitive spatiale la région étendue plutôt que le point de la géométrie euclidienne. En ajoutant une primitive morphologique, la sphère, et la géométrie des corps de Tarski, nous exprimons des notions d'angle, d'orientation et de distance qualitative, définissant ainsi une méréogéométrie. Dans ce cadre, nous abordons le problème de la formalisation du mouvement ainsi que celui de la forme d'un objet tridimensionnel. Puis nous utilisons la transformée d'axe médian pour construire un graphe de structure de la forme basé sur des sphères caractéristiques que l'on peut aussi définir grâce à la méréogéométrie. Enfin, des outils de théorie des graphes, calcul du groupe d'automorphisme et test d'isomorphisme permettent d'analyser les graphes de structure, tester la similarité de formes ou archiver ces formes dans une base de données.
43

Bugeau, Aurélie. "Détection et suivi d'objets en mouvement dans des scènes complexes : application à la surveillance des conducteurs." Rennes 1, 2007. ftp://ftp.irisa.fr/techreports/theses/2007/bugeau.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
De nombreuses applications en vision par ordinateur nécessitent la détection et le suivi d'objets en mouvement dans une séquence d'images. Le but de cette thèse est de détecter et suivre les objets mobiles dans des séquences ayant un fond dynamique, avec de forts changements d'illumination, de faibles contrastes et éventuellement acquises par une caméra mobile. Cette thèse est décomposée en deux parties. Dans la première, une méthode de détection est proposée. Elle repose sur la définition d'une grille de points décrits par leur mouvement et leur photométrie. Ces points sont ensuite regroupés en "clusters en mouvement" avec un algorithme mean shift à noyau variable et une méthode de sélection automatique de la taille des noyaux. La deuxième partie propose une méthode de suivi combinant des distributions de couleur et de mouvement, la prédiction de l'objet et des observations extérieures (pouvant être les clusters en mouvement) dans une fonction d'énergie minimisée par coupe minimale/flot maximal dans un graphe
Detecting and tracking moving objects in dynamic scenes is a hard but essential task in a large number of computer vision applications such as surveillance. This thesis aims at detecting, segmenting and tracking foreground moving objects in sequences (such as driver sequences) having highly dynamic backgrounds, illumination changes and low contrasts, and possibly shot by a moving camera. Two main steps compose the thesis. First, moving points, described by their motion and color, are selected within a sub-grid of image pixels. Clusters of points are then formed using a variable bandwidth mean shift with automatic bandwidth selection. In a second part, a tracking method is proposed. It combines color and motion distributions, the prediction of the tracked object and some external observations (which can be the clusters from the detector) into an energy function minimized with Graph Cuts
44

Bugeau, Aurélie Pérez Patrick. "Détection et suivi d'objets en mouvement dans des scènes complexes application à la surveillance des conducteurs /." [S.l.] : [s.n.], 2007. ftp://ftp.irisa.fr/techreports/theses/2007/bugeau.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
45

Fayolle, Jacques. "Etude d'algorithmes de traitement d'images pour l'étude du mouvement d'objets déformables, application à la mesure de vitesses d'écoulements." Phd thesis, Université Jean Monnet - Saint-Etienne, 1996. http://tel.archives-ouvertes.fr/tel-00381025.

Full text
APA, Harvard, Vancouver, ISO, and other styles
46

Sekkal, Rafiq. "Techniques visuelles pour la détection et le suivi d'objets 2D." Phd thesis, INSA de Rennes, 2014. http://tel.archives-ouvertes.fr/tel-00981107.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
De nos jours, le traitement et l'analyse d'images trouvent leur application dans de nombreux domaines. Dans le cas de la navigation d'un robot mobile (fauteuil roulant) en milieu intérieur, l'extraction de repères visuels et leur suivi constituent une étape importante pour la réalisation de tâches robotiques (localisation, planification, etc.). En particulier, afin de réaliser une tâche de franchissement de portes, il est indispensable de détecter et suivre automatiquement toutes les portes qui existent dans l'environnement. La détection des portes n'est pas une tâche facile : la variation de l'état des portes (ouvertes ou fermées), leur apparence (de même couleur ou de couleur différentes des murs) et leur position par rapport à la caméra influe sur la robustesse du système. D'autre part, des tâches comme la détection des zones navigables ou l'évitement d'obstacles peuvent faire appel à des représentations enrichies par une sémantique adaptée afin d'interpréter le contenu de la scène. Pour cela, les techniques de segmentation permettent d'extraire des régions pseudo-sémantiques de l'image en fonction de plusieurs critères (couleur, gradient, texture...). En ajoutant la dimension temporelle, les régions sont alors suivies à travers des algorithmes de segmentation spatio-temporelle. Dans cette thèse, des contributions répondant aux besoins cités sont présentées. Tout d'abord, une technique de détection et de suivi de portes dans un environnement de type couloir est proposée : basée sur des descripteurs géométriques dédiés, la solution offre de bons résultats. Ensuite, une technique originale de segmentation multirésolution et hiérarchique permet d'extraire une représentation en régions pseudo-sémantique. Enfin, cette technique est étendue pour les séquences vidéo afin de permettre le suivi des régions à travers le suivi de leurs contours. La qualité des résultats est démontrée et s'applique notamment au cas de vidéos de couloir.
47

Redon, Stéphane. "Algorithmes de simulation dynamique interactive d'objets rigides." Phd thesis, Université d'Evry-Val d'Essonne, 2002. http://tel.archives-ouvertes.fr/tel-00003580.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Les deux principaux problèmes à résoudre pour concevoir un simulateur dynamique interactif sont la détection de collisions entre les objets virtuels, et le calcul de leur mouvement contraint. La plupart des méthodes de détection de collisions sont discrètes : elles détectent seulement des interpénétrations entre les objets virtuels à des instants discrets successifs. Afin de détecter efficacement des collisions entre objets polyédriques rigides en continu, c'est-à-dire de calculer l'instant de premier contact entre eux et éviter les problèmes inhérents aux méthodes discrètes, nous proposons d'utiliser un mouvement intermédiaire arbitraire pour remplacer le mouvement réel de l'objet et obtenir des équations de détection de collisions faciles à résoudre. Nous présentons deux approches, fondées sur l'exploitation de mouvements intermédiaires arbitraires, qui permettent de détecter des collisions en continu entre objets polyédriques complexes en temps réel. Nous proposons ensuite d'ajouter des informations géométriques aux volumes englobants afin d'exploiter le mouvement de recul relatif des objets et accélérer significativement la détection de collisions lorsque les objets sont proches les uns des autres. La plupart des méthodes classiques de calcul de mouvement contraint sont formulées dans l'espace des contacts. Grâce au principe des moindres contraintes de Gauss, il est possible d'obtenir une formulation équivalente des problèmes dynamiques sans friction dans l'espace des mouvements. Nous montrons que cette formulation est plus avantageuse sur le plan algorithmique. Ceci nous incite à proposer un modèle de friction dans l'espace des mouvements. Les algorithmes proposés ont été implantés et rassemblés dans une librairie C++, CONTACT Toolkit. Nous présentons plusieurs applications de cette librairie, notamment à des cas industriels fournis par Renault et Airbus-EADS, ainsi que son utilisation dans la simulation avec retour d'efforts.
48

Restrepo, Specht Juan Andrés. "Modelisation d'objets 3D par construction incrémentale d'un maillage triangulaire, dans un contexte robotique." Toulouse 3, 2005. http://www.theses.fr/2005TOU30015.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Pour modéliser un objet 3D, plusieurs images doivent être acquises depuis différents points de vue. Les problèmes sont: recalage les vues. Fusion dans une seule représentation. Optimisation par un choix des points de vue. Les images 3D sont recalées par un algorithme appelé “ICP”. Afin de réduire le temps de calcul et améliorer la précision, des variantes de la méthode sont évaluées: points de contrôle, recalage des images ou entre image et modèle courant. Les vues recalées sont fusionnées dans une représentation de maillage triangulaire, qui est construit par une version adaptée de l'algorithme “BPA”, qui peut traiter un nuage de points 3D de distribution non uniformes. Notre méthode peut effectuer la segmentation simultanée du maillage en surfaces planes, de façon globale ou incrémentale. Dans un contexte robotique, on étudie la planification des positions du capteur pour l'acquisition des données ou le but est la minimisation du nombre de vues, tout en favorisant la convergence du recalage
This work treats the modeling of 3D objects and environments from sensor data given by laser or stereo. The modeling process has several parts that have been studied. The acquired views of the object taken from different points are registered using the known “ICP” method, which has been adapted to specific needs and can use extracted information of the image like edge, surface or subsamples in order to reduce calculation time, in incremental or paired manner. The following step is the data fusion of the resulting registered images executed incrementally or at the end of the registration process. Our method was based on ``ball pivoting algorithm'', that has the features to mesh irregular points, to extract planes simultaneously and to recycle existing mesh structures. We have studied also the problem of the sensor position for the view acquisition, better known as ``next-best-view''. Finally we arrive to a set of tools to create a geometric model from an acquired object of the real world
49

Larlus, Diane. "Création et utilisation de vocabulaires visuels pour la catégorisation d'images et la segmentation de classes d'objets." Phd thesis, Grenoble INPG, 2008. http://tel.archives-ouvertes.fr/tel-00343665.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette thèse s'intéresse à l'interprétation d'images fixes et en particulier à la reconnaissance de classes d'objets. Les différentes approches considérées sont toutes des variations du modèle par sac-de-mots, utilisant des représentations locales, quantifiées à l'aide d'un vocabulaire visuel.
Nous nous intéresserons tout d'abord à l'étude de différentes méthodes de création du vocabulaire visuel et à l'évaluation de ces vocabulaires dans le contexte de la catégorisation d'images.
Dans un deuxième temps, nous étudierons la segmentation de classes d'objets et verrons en particulier comment combiner les propriétés de régularisation très locales permises par un champ de Markov avec un modèle d'apparence basé sur des régions qui représentent chacune un objet et qui sont considérées comme des collections de mots visuels.
50

Allili, Mohand Saïd. "Segmentation d'images et suivi d'objets en vidéos approches par estimation, sélection de caractéristiques et contours actifs." Thèse, Université de Sherbrooke, 2008. http://savoirs.usherbrooke.ca/handle/11143/5118.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette thèse aborde deux problèmes parmi les plus importants et les plus complexes dans la vision artificielle, qui sont la segmentation d'images et le suivi d'objets dans les vidéos. Nous proposons plusieurs approches, traitant de ces deux problèmes, qui sont basées sur la modélisation variationnelle (contours actifs) et statistique. Ces approches ont pour but de surmonter différentes limites théoriques et pratiques (algorithmiques) de ces deux problèmes. En premier lieu, nous abordons le problème d'automatisation de la segmentation par contours actifs"ensembles de niveaux", et sa généralisation pour le cas de plusieurs régions. Pour cela, un modèle permettant d'estimer l'information de régions de manière automatique, et adaptative au contenu de l'image, est proposé. Ce modèle n'utilise aucune information a priori sur les régions, et traite également les images de couleur et de texture, avec un nombre arbitraire de régions. Nous introduisons ensuite une approche statistique pour estimer et intégrer la pertinence des caractéristiques et la sémantique dans la segmentation d'objets d'intérêt. En deuxième lieu, nous abordons le problème du suivi d'objets dans les vidéos en utilisant les contours actifs. Nous proposons pour cela deux modèles différents. Le premier suppose que les propriétés photométriques des objets suivis sont invariantes dans le temps, mais le modèle est capable de suivre des objets en présence de bruit, et au milieu de fonds de vidéos non-statiques et encombrés. Ceci est réalisé grâce à l'intégration de l'information de régions, de frontières et de formes des objets suivis. Le deuxième modèle permet de prendre en charge les variations photométriques des objets suivis, en utilisant un modèle statistique adaptatif à l'apparence de ces derniers. Finalement, nous proposons un nouveau modèle statistique, basé sur la Gaussienne généralisée, pour une représentation efficace de données bruitées et de grandes dimensions en segmentation. Ce modèle est utilisé pour assurer la robustesse de la segmentation des images de couleur contenant du bruit, ainsi que des objets en mouvement dans les vidéos (acquises par des caméras statiques) contenant de l'ombrage et/ou des changements soudains d'illumination.

To the bibliography