To see the other types of publications on this topic, follow the link: Apprentissage continu en ligne.

Dissertations / Theses on the topic 'Apprentissage continu en ligne'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Apprentissage continu en ligne.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Wagner, Baptiste. "Apprentissage continu en ligne pour la classification d'images et la détection d'objets." Electronic Thesis or Diss., Université Grenoble Alpes, 2024. http://www.theses.fr/2024GRALT111.

Full text
Abstract:
Dans cette thèse, nous nous intéressons au problème de l'apprentissage continu en ligne des réseaux de neurones artificiels, qui consiste à apprendre en permanence sur un flux de données. La difficulté majeure réside dans le fait qu'intégrer les nouvelles informations présentes dans le flux tend à effacer les connaissances précédemment acquises, un phénomène appelé oubli catastrophique.Dans ce domaine de l'apprentissage continu en ligne, notre recherche porte sur deux applications importantes en vision par ordinateur : la classification d'images et la détection d'objets. Le flux de données est alors constitué d'une suite d'images.En classification d'images le réseau de neurones doit apprendre progressivement à classifier les images des nouvelles classes sans oublier les anciennes. La méthode la plus répandue pour résoudre ce problème est le rejeu de données, qui consiste à ré-entraîner le modèle avec des images d'anciennes classes stockées dans une mémoire externe. Cependant, cette méthode est peu adaptée lorsque la capacité de stockage et la capacité de calcul pour l'entraînement du modèle sont limitées. Nous proposons une nouvelle méthode qui repose sur un schéma d'entraînement basé sur un classificateur un-contre-tous pour répondre à cette limitation. Notre méthode appelée ILOVA (Incremental Learning of One-Vs-All classifiers) offre un meilleur compromis entre précision, oubli, temps de calcul et empreinte mémoire, que les méthodes de l'état de l'art et se montre particulièrement efficace avec des mémoires très réduites, jusqu'à une seule image par classe.En détection d'objets, de nombreux scénarios de test sont construits à partir de séquences vidéo réelles dans lesquelles des objets peuvent réapparaître à plusieurs reprises à différents moments dans le flux de données. Cependant, ce phénomène de revisite que nous appelons rejeu naturel, est peu documenté et son impact sur les performances et l'oubli reste mal compris. Nous proposons alors une métrique, appelée NRS (Natural Replay Score), permettant de quantifier le degré de rejeu naturel d'un scénario, et montrons qu'il est impossible d'évaluer correctement l'oubli d'un modèle en sa présence. La suite de notre étude porte sur l'analyse de l'oubli dans l'architecture Faster R-CNN lorsqu'elle est utilisée en détection d'objets en ligne. D'une part, nos résultats montrent que des rappels réguliers réduisent l'oubli. D'autre part, nous proposons un nouveau protocole, appelé Module Probing, qui permet de mesurer localement l'oubli dans l'architecture. Nous montrons que l’oubli est concentré dans la couche de classification du Faster R-CNN. Enfin, ces analyses nous mènent à proposer la méthode Configurable Recall, basée sur le rejeu de données. Notre méthode permet d'optimiser la fréquence et la durée des rappels et utilise une fonction de perte modifiée qui limite l'oubli dans la couche de classification. En combinant ces deux éléments, nous parvenons à réduire significativement l'oubli pour l’architecture Faster R-CNN
In this thesis, we focus on the problem of online continual learning in artificial neural networks, which involves learning continuously from a data stream. The main challenge is that integrating new information from the stream tends to overwrite previously acquired knowledge, a phenomenon known as catastrophic forgetting.In the field of online continual learning, our research focus on two important applications in computer vision: image classification and object detection. In these cases, the data stream consists of a sequence of images.In image classification, the neural network must progressively learn to classify images from new classes without forgetting the previous ones. The most common method to address this problem is experience replay, which involves retraining the model with images from previously seen classes stored in external memory. However, this method is less suitable when both storage capacity and computational resources are limited. We propose a new method based on a one-vs-all classifier training scheme to overcome this limitation. Our method, called ILOVA (Incremental Learning of One-Vs-All classifiers), offers a better trade-off between accuracy, forgetting, computational time, and memory footprint compared to state-of-the-art methods and proves particularly effective with very limited memory, down to a single image per class.In object detection, many test scenarios are constructed from real video sequences in which objects can reappear multiple times at different moments in the data stream. However, this phenomenon of reappearance, which we call natural replay, is poorly documented, and its impact on performance and forgetting remains poorly understood. We propose a new metric, called NRS (Natural Replay Score), which quantifies the degree of natural replay in a scenario, and show that it is impossible to properly evaluate model forgetting in its presence. The next part of our study focuses on analyzing forgetting in the Faster R-CNN architecture when used for online object detection. On the one hand, our results show that periodic recalls reduce forgetting. On the other hand, we propose a new protocol, called Module Probing, which allows us to measure forgetting locally within the architecture. We show that forgetting is concentrated in the classification layer of Faster R-CNN. Finally, these analyses lead us to propose a method called Configurable Recall, based on experience replay. Our method optimizes the frequency and duration of the recalls and uses a modified loss function to limit forgetting in the classification layer. By combining these two elements, we significantly reduce forgetting in the Faster R-CNN architecture
APA, Harvard, Vancouver, ISO, and other styles
2

Oulhadj, Hamouche. "Des primitives aux lettres : une méthode structurelle de reconnaissance en ligne de mots d'écriture cursive manuscrite avec un apprentissage continu." Paris 12, 1990. http://www.theses.fr/1990PA120045.

Full text
Abstract:
Depuis des années, la communication homme-machine par l'intermédiaire de l'écriture naturelle se heurte, sans succès, au problème complexe de la diversité des formes a identifier. Pour appréhender un tel problème, une nouvelle méthode de reconnaissance structurelle et analytique est proposée. L'approche développée est fondée sur des primitives topologiques insensibles a certaines variations de traces (changement de position et d'échelle, inclinaisons des lettres). Elle assume l'hypothèse d'existence d'un modèle collectif d'écriture que chacun reproduit avec une déformation propre. Ce modèle générique permet de considérer que tout mot écrit par un scripteur donne peut être assimilé a une séquence de lettres prototypes plus ou moins dégénérées. Ainsi, l'information nécessaire à la description d'une lettre repose non seulement sur les primitives représentant cette lettre mais aussi sur l'évaluation du taux de dégénérescence susceptible d'affecter cette lettre en cours de trace. Dans l'approche développée, le problème très délicat de la segmentation du mot est également soulevé. Pour effectuer une segmentation qui correspond exactement aux lettres à reconnaître, une méthode de segmentation intelligente, basée sur une stratégie de prédiction-vérification est proposée. Cette méthode permet de combiner la segmentation du mot et la reconnaissance des lettres dans une opération unique, évitant la segmentation a priori qui est source d'erreurs potentielles. Ces différentes propriétés, renforcées par divers types de connaissances relatives au langage écrit, sont a l'origine des bonnes performances du système étudié
APA, Harvard, Vancouver, ISO, and other styles
3

Yang, Rui. "Online continual learning for 3D detection of road participants in autonomous driving." Electronic Thesis or Diss., Bourgogne Franche-Comté, 2023. http://www.theses.fr/2023UBFCA021.

Full text
Abstract:
La conduite autonome a connu des progrès remarquables au cours des dernières décennies, et la perception machine se présente comme un enjeu fondamental crucial, englobant la détection et le suivi des participants à la circulation tels que les véhicules, les piétons et les cyclistes. Bien que la détection d'objets basée sur la vision ait réalisé des progrès significatifs grâce aux techniques d'apprentissage profond, des défis subsistent dans la détection en 3D.Tout d'abord, les capteurs non visuels, tels que le LiDAR 3D, démontrent des avantages inégalés en matière de détection précise et d'adaptabilité aux conditions d'éclairage variables. Cependant, la complexité liée à la manipulation des données de nuages de points, qui peuvent être difficiles à interpréter, associée au coût élevé de l'annotation manuelle, posent des défis majeurs dans l'utilisation du LiDAR 3D.Deuxièmement, des préoccupations découlent du manque d'interprétabilité des modèles d'apprentissage profond, associée à leur forte dépendance à des données d'entraînement étendues, ce qui nécessite souvent une rétroaction coûteuse pour obtenir une performance acceptable lors de l'adaptation à de nouveaux environnements.Cette thèse aborde ces défis selon trois principaux axes : Génération d'échantillons, Préservation des connaissances et Évitement de l'oubli catastrophique. Nous introduisons le concept d'Apprentissage Continu en Ligne et proposons un cadre général. Ce cadre permet aux modèles de se mettre à jour en temps réel, préservant les connaissances plutôt que les données brutes, et atténuant efficacement la dégradation des performances causée par l'oubli.Les principaux travaux de cette thèse comprennent les trois contributions suivance : 1) Génération d'échantillons : Pour résoudre le problème des nuages de points clairsemés générés par un LiDAR 3D et de l'annotation manuelle laborieuse, nous tirons parti des avantages des données multi-capteurs et utilisons un cadre efficace d'apprentissage en ligne par transfert. Ce cadre transfère efficacement les capacités matures de détection basée sur des images aux détecteurs basés sur le LiDAR 3D. Un aspect innovant est le processus d'apprentissage par utilisation, réalisé grâce à la détection en boucle fermée. Une nouvelle stratégie de fusion d'informations est proposée pour combiner les corrélations spatio-temporelles, améliorant l'efficacité du transfert de connaissances. 2) Préservation des connaissances : L'Apprentissage en Ligne est introduit pour assurer la préservation des connaissances sans conserver les données d'entraînement. Un modèle amélioré de Forêt Aléatoire (Random Forest) en Ligne est intégré, permettant un entrainement rapide du modèle avec des ressources informatiques limitées et un déploiement immédiat. Les paramètres du modèle Forêt Aléatoire en Ligne sont partagés dynamiquement tout au long du processus d’entrainement pour répondre à la distribution inconnue des données. L'exploration des structures d'arbres Forêt Aléatoire en Ligne garantit l'indépendance du processus d’entrainement, renforçant la capacité du modèle à capturer des schémas et des variations complexes. 3) Évitement de l'oubli catastrophique : Pour faire face au problème inévitable de l'oubli dans le cadre d'apprentissage en ligne lors d'un déploiement à long terme, nous proposons le cadre de l'Apprentissage en Ligne à Long-court Terme (ALLCT). L'ALLCT combine de multiples apprenants à court terme basés sur l'apprentissage en ensemble avec un contrôleur à long terme doté d'un mécanisme de décision probabiliste. Ce cadre assure une maintenance efficace des connaissances et s'adapte aux changements lors d'un déploiement à long terme, sans faire d'hypothèses sur les types de modèles et la continuité des données. Les évaluations croisées de jeux de données sur des tâches telles que la détection 3D de participants à la circulation routière démontrent l'efficacité de l'ALLCT dans l'évitement de l'oubli
Autonomous driving has witnessed remarkable progress over the past decades, and machine perception stands as a critical foundational issue, encompassing the detection and tracking of road participants such as vehicles, pedestrians, and cyclists. While vision-based object detection has achieved significant progress thanks to deep learning techniques, challenges still exist in 3D detection.Firstly, non-visual sensors, such as 3D LiDAR, demonstrate unparalleled advantages in achieving precise detection and adaptability to varying lighting conditions. However, the complexity of handling points cloud data, which can be challenging to interpret, coupled with the high cost of manual annotation, pose primary challenges in the use of 3D LiDAR.Secondly, concerns arise from the lack of interpretability in deep learning models, coupled with their heavy reliance on extensive training data, which often necessitates costly retraining for acceptable generalization performance when adapting to new scenes or environments.This dissertation addresses these challenges from three main perspectives: Generation of Samples, Preservation of Knowledge, and Avoidance of Catastrophic Forgetting. We introduce the concept of Online Continual Learning (OCL) and propose a general framework that encompasses detection, tracking, learning, and control. This framework enables models to update in real-time, preserving knowledge rather than raw data, and effectively mitigating the performance degradation caused by catastrophic forgetting.The main work of this dissertation includes: 1) Generation of Samples: To address sparse point clouds generated by 3D LiDAR and the labor-intensive manual annotation, we leverage the advantages of multi-sensor data and employ an efficient online transfer learning framework. This framework effectively transfers mature image-based detection capabilities to 3D LiDAR-based detectors. An innovative aspect is the "learn-by-use" process, achieved through closed-loop detection, facilitating continuous self-supervised learning. A novel information fusion strategy is proposed to combine spatio-temporal correlations, enhancing the effectiveness of knowledge transfer. 2) Preservation of Knowledge: Online Learning (OL) is introduced to address knowledge preservation without retaining training data. An improved Online Random Forest (ORF) model is incorporated, enabling rapid model training with limited computational resources and immediate deployment. The ORF model's parameters are dynamically shared throughout the training process to address the unknown data distribution. The exploration of ORF tree structures ensures independence in training processes, enhancing the model's ability to capture complex patterns and variations. Implementing octrees improves storage efficiency and model access. 3) Avoidance of Catastrophic Forgetting: To tackle the inevitable forgetting problem in online learning frameworks during long-term deployment, we propose the Long Short-Term Online Learning (LSTOL) framework. LSTOL combines multiple short-term learners based on ensemble learning with a long-term controller featuring a probabilistic decision mechanism. This framework ensures effective knowledge maintenance and adapts to changes during long-term deployment, without making assumptions about model types and data continuity. Cross-dataset evaluations on tasks such as 3D detection of road participants demonstrate the effectiveness of LSTOL in avoiding forgetting
APA, Harvard, Vancouver, ISO, and other styles
4

Hocquet, Guillaume. "Class Incremental Continual Learning in Deep Neural Networks." Thesis, université Paris-Saclay, 2021. http://www.theses.fr/2021UPAST070.

Full text
Abstract:
Nous nous intéressons au problème de l'apprentissage continu de réseaux de neurones artificiels dans le cas où les données ne sont accessibles que pour une seule catégorie à la fois. Pour remédier au problème de l'oubli catastrophique qui limite les performances d'apprentissage dans ces conditions, nous proposons une approche basée sur la représentation des données d'une catégorie par une loi normale. Les transformations associées à ces représentations sont effectuées à l'aide de réseaux inversibles, qui peuvent alors être entraînés avec les données d'une seule catégorie. Chaque catégorie se voit attribuer un réseau pour représenter ses caractéristiques. Prédire la catégorie revient alors à identifier le réseau le plus représentatif. L'avantage d'une telle approche est qu'une fois qu'un réseau est entraîné, il n'est plus nécessaire de le mettre à jour par la suite, chaque réseau étant indépendant des autres. C'est cette propriété particulièrement avantageuse qui démarque notre méthode des précédents travaux dans ce domaine. Nous appuyons notre démonstration sur des expériences réalisées sur divers jeux de données et montrons que notre approche fonctionne favorablement comparé à l'état de l'art. Dans un second temps, nous proposons d'optimiser notre approche en réduisant son impact en mémoire en factorisant les paramètres des réseaux. Il est alors possible de réduire significativement le coût de stockage de ces réseaux avec une perte de performances limitée. Enfin, nous étudions également des stratégies pour produire des réseaux capables d'être réutilisés sur le long terme et nous montrons leur pertinence par rapport aux réseaux traditionnellement utilisés pour l'apprentissage continu
We are interested in the problem of continual learning of artificial neural networks in the case where the data are available for only one class at a time. To address the problem of catastrophic forgetting that restrain the learning performances in these conditions, we propose an approach based on the representation of the data of a class by a normal distribution. The transformations associated with these representations are performed using invertible neural networks, which can be trained with the data of a single class. Each class is assigned a network that will model its features. In this setting, predicting the class of a sample corresponds to identifying the network that best fit the sample. The advantage of such an approach is that once a network is trained, it is no longer necessary to update it later, as each network is independent of the others. It is this particularly advantageous property that sets our method apart from previous work in this area. We support our demonstration with experiments performed on various datasets and show that our approach performs favorably compared to the state of the art. Subsequently, we propose to optimize our approach by reducing its impact on memory by factoring the network parameters. It is then possible to significantly reduce the storage cost of these networks with a limited performance loss. Finally, we also study strategies to produce efficient feature extractor models for continual learning and we show their relevance compared to the networks traditionally used for continual learning
APA, Harvard, Vancouver, ISO, and other styles
5

Désoyer, Adèle. "Appariement de contenus textuels dans le domaine de la presse en ligne : développement et adaptation d'un système de recherche d'information." Thesis, Paris 10, 2017. http://www.theses.fr/2017PA100119/document.

Full text
Abstract:
L'objectif de cette thèse, menée dans un cadre industriel, est d'apparier des contenus textuels médiatiques. Plus précisément, il s'agit d'apparier à des articles de presse en ligne des vidéos pertinentes, pour lesquelles nous disposons d'une description textuelle. Notre problématique relève donc exclusivement de l'analyse de matériaux textuels, et ne fait intervenir aucune analyse d'image ni de langue orale. Surviennent alors des questions relatives à la façon de comparer des objets textuels, ainsi qu'aux critères mobilisés pour estimer leur degré de similarité. L'un de ces éléments est selon nous la similarité thématique de leurs contenus, autrement dit le fait que deux documents doivent relater le même sujet pour former une paire pertinente. Ces problématiques relèvent du domaine de la recherche d'information (ri), dans lequel nous nous ancrons principalement. Par ailleurs, lorsque l'on traite des contenus d'actualité, la dimension temporelle est aussi primordiale et les problématiques qui l'entourent relèvent de travaux ayant trait au domaine du topic detection and tracking (tdt) dans lequel nous nous inscrivons également.Le système d'appariement développé dans cette thèse distingue donc différentes étapes qui se complètent. Dans un premier temps, l'indexation des contenus fait appel à des méthodes de traitement automatique des langues (tal) pour dépasser la représentation classique des textes en sac de mots. Ensuite, deux scores sont calculés pour rendre compte du degré de similarité entre deux contenus : l'un relatif à leur similarité thématique, basé sur un modèle vectoriel de ri; l'autre à leur proximité temporelle, basé sur une fonction empirique. Finalement, un modèle de classification appris à partir de paires de documents, décrites par ces deux scores et annotées manuellement, permet d'ordonnancer les résultats.L'évaluation des performances du système a elle aussi fait l'objet de questionnements dans ces travaux de thèse. Les contraintes imposées par les données traitées et le besoin particulier de l'entreprise partenaire nous ont en effet contraints à adopter une alternative au protocole classique d'évaluation en ri, le paradigme de Cranfield
The goal of this thesis, conducted within an industrial framework, is to pair textual media content. Specifically, the aim is to pair on-line news articles to relevant videos for which we have a textual description. The main issue is then a matter of textual analysis, no image or spoken language analysis was undertaken in the present study. The question that arises is how to compare these particular objects, the texts, and also what criteria to use in order to estimate their degree of similarity. We consider that one of these criteria is the topic similarity of their content, in other words, the fact that two documents have to deal with the same topic to form a relevant pair. This problem fall within the field of information retrieval (ir) which is the main strategy called upon in this research. Furthermore, when dealing with news content, the time dimension is of prime importance. To address this aspect, the field of topic detection and tracking (tdt) will also be explored.The pairing system developed in this thesis distinguishes different steps which complement one another. In the first step, the system uses natural language processing (nlp) methods to index both articles and videos, in order to overcome the traditionnal bag-of-words representation of texts. In the second step, two scores are calculated for an article-video pair: the first one reflects their topical similarity and is based on a vector space model; the second one expresses their proximity in time, based on an empirical function. At the end of the algorithm, a classification model learned from manually annotated document pairs is used to rank the results.Evaluation of the system's performances raised some further questions in this doctoral research. The constraints imposed both by the data and the specific need of the partner company led us to adapt the evaluation protocol traditionnal used in ir, namely the cranfield paradigm. We therefore propose an alternative solution for evaluating the system that takes all our constraints into account
APA, Harvard, Vancouver, ISO, and other styles
6

Boudjema, Cédric. "La fonction éducative des musées dans la société numérique : analyse comparative de l'offre pédagogique en ligne de huit musées nationaux dans quatre pays (France, Angleterre, Australie, Etats-Unis)." Thesis, Lille 3, 2016. http://www.theses.fr/2016LIL30013/document.

Full text
Abstract:
Cette thèse porte sur les sites internet des musées et plus particulièrement les sections pédagogiques de huit institutions nationales de quatre pays différents et s’attache à montrer que les musées sont, en ligne, des acteurs de contenus pédagogiques. L’enjeu est d’étudier les sections pédagogiques de ces sites en privilégiant une analyse de contenu et en mettant en œuvre une démarche comparative entre les quatre pays et les types de sites internet afin de saisir les pratiques - et notamment ce que Jean Davallon a appelé « l’anticipation par le destinateur » de ce que fera le visiteur (le destinateur visant par exemple à retenir l’intention de ce dernier ou à le guider dans le contenu), la typologie des contenus, les stratégies pédagogiques mises en œuvre par les institutions muséales en ligne. L’offre pédagogique en ligne est ici définie comme une activité permanente à distance de critiques, de construction de savoirs, de consultation et de divertissement, à propos des ressources muséales. Cette offre se construit également selon des règles cohérentes de design Web. Nous avons choisi d’étudier la pédagogie en ligne autrement selon une démarche constructiviste qui nous conduit à privilégier certains concepts clés : parcours d’apprentissage individualisés, processus d’apprentissage, stratégies cognitives, stratégies métacognitives, « learning styles », taxonomie. D’un point de vue méthodologique, cette thèse s’appuie sur une démarche qualitative et privilégie l’analyse de contenu à partir d’une grille d’analyse comportant 11 catégories : le corpus se compose de huit sites internet et de deux types de musées nationaux : les musées d’art et les musées de sciences avec une section pédagogique. La thèse se compose en deux tomes. Le tome 2 contient l’analyse complète des sites et le tome 1 comporte trois parties. Dans une première partie, la thèse se concentre sur la vocation éducative des musées en prenant en compte ses spécificités et ses complexités. Cette partie précise le contexte historique de la fonction éducative des musées qui ont très tôt développé une stratégie pédagogique en direction du public. Elle s’attache aussi à montrer la spécificité du musée dans l’éducation informelle en le situant en tant que lieu d’apprentissage de concepts et de développement qui développe deux types de médiation. Le musée favorise la formulation de questions, il oriente la réflexion et suscite des interrogations. Elle montre ensuite le musée en tant que partenaire important et complémentaire de l’école. Enfin, cette partie précise le contexte historique des musées en ligne dans les quatre pays de notre analyse et le développement progressif des politiques culturelles d'aujourd’hui et les actions progressives mises en opération par les musées. Dans un second temps, la thèse porte sur l’analyse thématique des sites internet et de leurs sections pédagogiques et s’attache à montrer les étapes successives de l'analyse de contenu via la grille d’analyse conçue pour cette recherche. Dans un premier, temps, il s’agit donc de présenter l’ergonomie générale des sites pour progressivement arriver au traitement général des sections pédagogiques des sites c’est à dire d’identifier les mécanismes sous jacents des sites internet et de leurs sections pédagogiques et dans un second temps d’identifier les différences entre les types de musées et les pays. Enfin, la troisième partie de la thèse attache de l’importance à la typologie des contenus pédagogiques en ligne et se focalise sur les stratégies mises en œuvre sur les sites ainsi que sur la pédagogie déployée. Les sites internet sont ainsi vus comme des éléments interconnectés, destinés à un public cible et renforçant le rôle social du musée. Les publics scolaires et les enseignants sont publics privilégiées, une place prépondérante à ces publics est soulignée
This research studies museum internet sites and in particular the pedagogy of eight national institutions in four different countries and suggests that online museums are educational content players.The interest is to investigate the educational content of the internet sites using a content analysis and implementing a comparison between the four countries and the types of internet sites to be able to understand the practices – and especially what Jean Davallon calls « the anticipation by the “sender” » that the visitor will engage in (the sender aiming for example to keep the attention of the latter or to provide guidance in the contents), the typology of content and the teaching strategies put in place by the online museum institutions. The online educational offer is defined here as a permanent activity as a source of building knowledge, consultation, criticism, and entertainment, from the museum resources. This offer is also constructed according to the consistent rules of Web design.We have chosen to study the online pedagogy according to a constructivist approach that drives us to privilege certain key concepts : individual learning ways, learning processes, cognitive strategies, meta-cognitive strategies, {learning styles}, taxonomy. From a methodological point of view, this thesis relies on a qualitative approach and privileges a content analysis from an analysis grid with eleven categories : the corpus is composed of eight internet sites and of two types of national museums : the art museums and the science museums with an educational section. The thesis is composed of two tomes. The tome 2 contains the complete analysis of the sites and the tome 1 includes three parts. In the first part, the research discusses the educational role of museums with its specificities and complexities. This part defines the historical context of the educational function of museums that very early on developed an educational strategy for the public. It also shows the specificity of museums in informal education as a place of learning concepts and development that develop two types of mediation. The museum favours the formulation of questions; it orientates reflexion and raises questions. It then shows the museum as an important partner and complementary to school. Finally, this part precises the historical context of online museums of the four countries from our analysis and the progressive development of the cultural policies of the present and the progressive actions put into place by the museums.Secondly, the research focuses on the thematic analysis of the internet sites and on their educational sections and attempts to show the successive steps of the content analysis via the analysis grid constructed for this research. Firstly, it is about showing the ergonomics of the sites to progressively arrive upon the general treatment of the educational sections of the sites, that is to say to identify the mechanisms of underlying internet sites and of their educational sections and secondly to identify the differences between the types of museums and their countries. Finally, the third part of the research attaches importance to the typology of the online educational content and focuses on the strategies put into place in the sites as well as the pedagogy deployed. The internet sites are thus viewed as interconnected elements, intended for a target audience and reinforcing the social role of the museum. The schools and the teaching body are a privileged population; a prominent place for them is underlined
APA, Harvard, Vancouver, ISO, and other styles
7

Munos, Rémi. "Apprentissage par renforcement, étude du cas continu." Paris, EHESS, 1997. http://www.theses.fr/1997EHESA021.

Full text
Abstract:
Le probleme aborde est comment concevoir des methodes permettant a des systemes artificiels d' << apprendre par l'experience >>, c'est a dire de resoudre une tache sans etre explicitement programme pour cela, mais seulement a partir du schema d'apprentissage : essais -> erreur ou succes ii s'agit de definir des methodes, sous forme d'algorithmes, permettant la modification des parametres internes du systeme afin de definir des prises de decisions pertinentes. L'approche developpee est celle de << l'apprentissage par renforcement >> qui se definit naturellement sous la forme d'un probleme de controle optimal pour lequel les donnees de la dynamique d'etat sont a priori (au moins partiellement) inconnues du systeme. Cette these est une etude formelle du cas ou l'espace des etats possibles ainsi que le temps auquel les decisions sont prises sont des variable continues ; la preoccupation majeure de ce travail etant l'etude de la convergences des methodes employees. Nous decrivons le formalisme du controle optimal et presentons la methode de la programmation dynamique : definition de la fonction valeur et enonce l'equation de hamiltonjacobi-bellman associee. Nous introduisons les notions desolutions de viscosite et decrivons des methodes d'approximation numeriques a partir de schemas convergents. Puis nous donnons un theoreme de convergence d'algorithmes bases sur les schemas precedents -ce qui represente la contribution majeure de ce travail. Ce theoreme fournit une methode tres generale pour concevoir des algorithmes d'apprentissage par renforcement convergents. Enfin nous illustrons la methode avec divers exemples d'algorithmes varies portant sur des dynamiques d'etat deterministes ou stochastiques, selon des methodes dites directes ou indirectes et a partir de schemas bases sur des methodes aux differences finies ou aux elements finis.
APA, Harvard, Vancouver, ISO, and other styles
8

Sors, Arnaud. "Apprentissage profond pour l'analyse de l'EEG continu." Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAS006/document.

Full text
Abstract:
Ces travaux de recherche visent à développer des méthodes d’apprentissage automatique pour l’analyse de l’électroencéphalogramme (EEG) continu. L’EEG continu est une modalité avantageuse pour l’évaluation fonctionnelle des états cérébraux en réanimation ou pour d’autres applications. Cependant son utilisation aujourd’hui demeure plus restreinte qu’elle ne pourrait l’être, car dans la plupart des cas l’interprétation est effectuée visuellement par des spécialistes.Les sous-parties de ce travail s’articulent autour de l’évaluation pronostique du coma post-anoxique, choisie comme application pilote. Un petit nombre d’enregistrement longue durée a été réalisé, et des enregistrements existants ont été récupérés au CHU Grenoble.Nous commençons par valider l’efficacité des réseaux de neurones profonds pour l’analyse EEG d’échantillons bruts. Nous choisissons à cet effet de travailler sur la classification de stades de sommeil. Nous utilisons un réseau de neurones convolutionnel adapté pour l’EEG que nous entrainons et évaluons sur le jeu de données SHHS (Sleep Heart Health Study). Cela constitue le premier system neuronal à cette échelle (5000 patients) pour l’analyse du sommeil. Les performances de classification atteignent ou dépassent l’état de l’art.En utilisation réelle, pour la plupart des applications cliniques le défi principal est le manque d’annotations adéquates sur les patterns EEG ou sur de court segments de données (et la difficulté d’en établir). Les annotations disponibles sont généralement haut niveau (par exemple, le devenir clinique) est sont donc peu nombreuses. Nous recherchons comment apprendre des représentations compactes de séquences EEG de façon non-supervisée/semi-supervisée. Le domaine de l’apprentissage non supervisé est encore jeune. Pour se comparer aux travaux existants nous commençons avec des données de type image, et investiguons l’utilisation de réseaux adversaires génératifs (GANs) pour l’apprentissage adversaire non-supervisé de représentations. La qualité et la stabilité de différentes variantes sont évaluées. Nous appliquons ensuite un GAN de Wasserstein avec pénalité sur les gradients à la génération de séquences EEG. Le système, entrainé sur des séquences mono-piste de patients en coma post anoxique, est capable de générer des séquences réalistes. Nous développons et discutons aussi des idées originales pour l’apprentissage de représentations en alignant des distributions dans l’espace de sortie du réseau représentatif.Pour finir, les signaux EEG multipistes ont des spécificités qu’il est souhaitable de prendre en compte dans les architectures de caractérisation. Chaque échantillon d’EEG est un mélange instantané des activités d’un certain nombre de sources. Partant de ce constat nous proposons un système d’analyse composé d’un sous-système d’analyse spatiale suivi d’un sous-système d’analyse temporelle. Le sous-système d’analyse spatiale est une extension de méthodes de séparation de sources construite à l’aide de couches neuronales avec des poids adaptatifs pour la recombinaison des pistes, c’est à dire que ces poids ne sont pas appris mais dépendent de caractéristiques du signal d’entrée. Nous montrons que cette architecture peut apprendre à réaliser une analyse en composantes indépendantes, si elle est entrainée sur une mesure de non-gaussianité. Pour l’analyse temporelle, des réseaux convolutionnels classiques utilisés séparément sur les pistes recombinées peuvent être utilisés
The objective of this research is to explore and develop machine learning methods for the analysis of continuous electroencephalogram (EEG). Continuous EEG is an interesting modality for functional evaluation of cerebral state in the intensive care unit and beyond. Today its clinical use remains more limited that it could be because interpretation is still mostly performed visually by trained experts. In this work we develop automated analysis tools based on deep neural models.The subparts of this work hinge around post-anoxic coma prognostication, chosen as pilot application. A small number of long-duration records were performed and available existing data was gathered from CHU Grenoble. Different components of a semi-supervised architecture that addresses the application are imagined, developed, and validated on surrogate tasks.First, we validate the effectiveness of deep neural networks for EEG analysis from raw samples. For this we choose the supervised task of sleep stage classification from single-channel EEG. We use a convolutional neural network adapted for EEG and we train and evaluate the system on the SHHS (Sleep Heart Health Study) dataset. This constitutes the first neural sleep scoring system at this scale (5000 patients). Classification performance reaches or surpasses the state of the art.In real use for most clinical applications, the main challenge is the lack of (and difficulty of establishing) suitable annotations on patterns or short EEG segments. Available annotations are high-level (for example, clinical outcome) and therefore they are few. We search how to learn compact EEG representations in an unsupervised/semi-supervised manner. The field of unsupervised learning using deep neural networks is still young. To compare to existing work we start with image data and investigate the use of generative adversarial networks (GANs) for unsupervised adversarial representation learning. The quality and stability of different variants are evaluated. We then apply Gradient-penalized Wasserstein GANs on EEG sequences generation. The system is trained on single channel sequences from post-anoxic coma patients and is able to generate realistic synthetic sequences. We also explore and discuss original ideas for learning representations through matching distributions in the output space of representative networks.Finally, multichannel EEG signals have specificities that should be accounted for in characterization architectures. Each EEG sample is an instantaneous mixture of the activities of a number of sources. Based on this statement we propose an analysis system made of a spatial analysis subsystem followed by a temporal analysis subsystem. The spatial analysis subsystem is an extension of source separation methods built with a neural architecture with adaptive recombination weights, i.e. weights that are not learned but depend on features of the input. We show that this architecture learns to perform Independent Component Analysis if it is trained on a measure of non-gaussianity. For temporal analysis, standard (shared) convolutional neural networks applied on separate recomposed channels can be used
APA, Harvard, Vancouver, ISO, and other styles
9

Salperwyck, Christophe. "Apprentissage incrémental en ligne sur flux de données." Phd thesis, Université Charles de Gaulle - Lille III, 2012. http://tel.archives-ouvertes.fr/tel-00845655.

Full text
Abstract:
L'apprentissage statistique propose un vaste ensemble de techniques capables de construire des modèles prédictifs à partir d'observations passées. Ces techniques ont montré leurs capacités à traiter des volumétries importantes de données sur des problèmes réels. Cependant, de nouvelles applications génèrent de plus en plus de données qui sont seulement visibles sous la forme d'un flux et doivent être traitées séquentiellement. Parmi ces applications on citera : la gestion de réseaux de télécommunications, la modélisation des utilisateurs au sein d'un réseau social, le web mining. L'un des défis techniques est de concevoir des algorithmes permettant l'apprentissage avec les nouvelles contraintes imposées par les flux de données. Nous proposons d'abord ce problème en proposant de nouvelles techniques de résumé de flux de données dans le cadre de l'apprentissage supervisé. Notre méthode est constituée de deux niveaux. Le premier niveau utilise des techniques incrémentales de résumé en-ligne pour les flux qui prennent en compte les ressources mémoire et processeur et possèdent des garanties en termes d'erreur. Le second niveau utilise les résumés de faible taille, issus du premier niveau, pour construire le résumé final à l'aide d'une méthode supervisée performante hors-ligne. Ces résumés constituent un prétraitement qui nous permet de proposer de nouvelles versions du classifieur bayésien naïf et des arbres de décision fonctionnant en-ligne sur flux de données. Les flux de données peuvent ne pas être stationnaires mais comporter des changements de concept. Nous proposons aussi une nouvelle technique pour détecter ces changements et mettre à jour nos classifieurs.
APA, Harvard, Vancouver, ISO, and other styles
10

Orseau, Laurent. "Imitation algorithmique : Apprentissage Incrémental En-ligne de Séquences." Rennes, INSA, 2007. http://www.theses.fr/2007ISAR0014.

Full text
Abstract:
En apprentissage continuel, un agent apprenant est en continuelle interaction avec son environnement. À chaque instant, il reçoit des entrées, doit effectuer un calcul et un apprentissage court (en-ligne), puis renvoie des sorties. Il n'y a pas de but particulier, l'agent doit simplement apprendre au fur et à mesure, incrémentalement, sans notion de "problème" a priori, en réutilisant la connaissance acquise précédemment pour apprendre des problèmes de plus en plus complexes. Nous nous intéressons dans ce cadre à l'apprentissage de séquences complexes. Mais l'agent ne peut pas se permettre d'effectuer un grand nombre d'essais et d'erreurs. Comment dans ce cas apprendre rapidement à partir d'un nombre réduit d'exemples ?Les méthodes existantes pour résoudre de tels problèmes ne sont pas adaptées à l'apprentissage continuel, car il augmente grandement les difficultés. Pour simplifier la tâche, nous adoptons alors un protocole d'imitation, qui permet à l'agent d'apprendre en observant un professeur, tout en lui laissant une grande autonomie et en étant en accord avec l'apprentissage continuel. L'imitation étant habituellement utilisée dans un cadre robotique, nous l'étendons pour pouvoir apprendre des séquences plus complexes : c'est l'Imitation Algorithmique. Un système d'apprentissage adapté, CSAAL, est ensuite proposé et les expérimentations montrent qu'il est effectivement capable d'apprendre des séquences complexes en très peu d'exemples. Une extension du système précédent, H-CSAAL, permet alors de réutiliser hiérarchiquement des fonctions récurrentes, augmentant ainsi à la fois l'autonomie de l'agent et ses capacités de généralisation
In continual learning, an agent is continually interacting with its environment. At each time step, it receives inputs, uses a small amount of computations (online) and gives outputs. There is no real definition of a goal to learn, the agent must acquire more and more knowledge, incrementally, and re-use it in more complex tasks. In this framework, we are interested in learning complex sequences, involving recurrence, variables and conditions. But the agent cannot use a large number of trials and error, because of its interaction with the environment. How then can learning be possible from a small number of examples?Traditional methods that are able to solve such complex tasks do not fit in the continual learning framework, because difficulties become harder. To simplify the task, an imitation protocol is used, allowing the agent to learn by seeing a teacher doing, but this respects the continual learning constraints and keeps a high autonomy. Imitation is usually used in a robotic framework, so we extend it to learn more complex sequences~: this is Algorithmic Imitation. A learning system, CSAAL, is then developed and tested on experiments showing that it is indeed able to learn complex sequences within few examples. An extension of this system, H-CSAAL, allows to re-use hierarchically recurrent functions, increasing both the autonomy of the agent and its generalization capacities
APA, Harvard, Vancouver, ISO, and other styles
11

Ammarcha, Chawki. "Mélange des poudres en continu : modèles dynamiques et caractérisation des mélanges en ligne." Thesis, Toulouse, INPT, 2010. http://www.theses.fr/2010INPT0138/document.

Full text
Abstract:
La généralisation des mélangeurs continu dans l'industrie est freinée par le manque de connaissance générale sur ces procédés et en particulier d'une stratégie de contrôle commande de ce procédé. Se plaçant dans cette perspective, ce travail se penche, tant du point du vue expérimental et modélisation, sur la dynamique du procédé de mélange en continu, en particulier durant les phases transitoires que sont le démarrage, la vidange ou le changement de consigne. On étudie l'effet des variables opératoires, vitesse d'agitation et débit, sur la répartition massique et les débits internes des particules dans le mélangeur, ainsi que sur les variations d'homogénéité du mélange en sortie. A ce titre, un protocole expérimental spécifique basé sur l'analyse d'images est développé pour mesurer en ligne la qualité du mélange à une échelle d'observation que l'on peut ajuster. Un cadre de modélisation Markovienne est proposé pour décrire les phénomènes observés aux échelles macro et méso. Le modèle permet de décrire la composition du mélange dans les différentes zones du mélangeur ainsi qu'en sortie de l'appareil, quel que soit le régime envisagé, notamment lors de fortes perturbations de vitesse de rotation, dont l'intérêt est discuté
The implementation of a continuous mixer in the industry requires detailed studies for a better understanding of this process, with essential aim the development of a control process strategy. The present work reports experimental and modelling results concerning the dynamics of a continuous powder mixer in steady and unsteady states. In particular, we will focus on the transitory phases that are likely to occur : starting, emptying, feeder's feeding, accidental perturbation, etc. We investigate the effect of operating variables, as rotational speed of the stirrer and the inflow rate, on the distribution of particles mass in the mixer and the intermediates flow rates, as well as that of the homogeneity of binary mixtures at the outlet of continuous mixer. A specific experimental protocol, based on image analysis, has been developed for determining mixture quality. The scale of scrutiny can be adjusted and mixture homogeneity can be calculated for this scale in real time. AMarkov chain model is proposed to describe the phenomena observed at both macro-and meso-scales. The model allows to describe the composition of the mixture in different zones of the mixer as well as in the outlet of the vessel, during steady and unsteady regimes and especially at high speed perturbations, whose interest is discussed
APA, Harvard, Vancouver, ISO, and other styles
12

Ferreira, Emmanuel. "Apprentissage automatique en ligne pour un dialogue homme-machine situé." Thesis, Avignon, 2015. http://www.theses.fr/2015AVIG0206/document.

Full text
Abstract:
Un système de dialogue permet de doter la Machine de la capacité d'interagir de façon naturelle et efficace avec l'Homme. Dans cette thèse nous nous intéressons au développement d'un système de dialogue reposant sur des approches statistiques, et en particulier du cadre formel des Processus Décisionnel de Markov Partiellement Observable, en anglais Partially Observable Markov Decision Process (POMDP), qui à ce jour fait office de référence dans la littérature en ce qui concerne la gestion statistique du dialogue. Ce modèle permet à la fois une prise en compte améliorée de l'incertitude inhérente au traitement des données en provenance de l'utilisateur (notamment la parole) et aussi l'optimisation automatique de la politique d'interaction à partir de données grâce à l'apprentissage par renforcement, en anglais Reinforcement Learning (RL). Cependant, une des problématiques liées aux approches statistiques est qu'elles nécessitent le recours à une grande quantité de données d'apprentissage pour atteindre des niveaux de performances acceptables. Or, la collecte de telles données est un processus long et coûteux qui nécessite généralement, pour le cas du dialogue, la réalisation de prototypes fonctionnels avec l'intervention d'experts et/ou le développement de solution alternative comme le recours à la simulation d'utilisateurs. En effet, très peu de travaux considèrent à ce jour la possibilité d'un apprentissage de la stratégie de la Machine de part sa mise en situation de zéro (sans apprentissage préalable) face à de vrais utilisateurs. Pourtant cette solution présente un grand intérêt, elle permet par exemple d'inscrire le processus d'apprentissage comme une partie intégrante du cycle de vie d'un système lui offrant la capacité de s'adapter à de nouvelles conditions de façon dynamique et continue. Dans cette thèse, nous nous attacherons donc à apporter des solutions visant à rendre possible ce démarrage à froid du système mais aussi, à améliorer sa capacité à s'adapter à de nouvelles conditions (extension de domaine, changement d'utilisateur,...). Pour ce faire, nous envisagerons dans un premier temps l'utilisation de l'expertise du domaine (règles expertes) pour guider l'apprentissage initial de la politique d'interaction du système. De même, nous étudierons l'impact de la prise en compte de jugements subjectifs émis par l'utilisateur au fil de l'interaction dans l'apprentissage, notamment dans un contexte de changement de profil d'utilisateur où la politique préalablement apprise doit alors pouvoir s'adapter à de nouvelles conditions. Les résultats obtenus sur une tâche de référence montrent la possibilité d'apprendre une politique (quasi-)optimale en quelques centaines d'interactions, mais aussi que les informations supplémentaires considérées dans nos propositions sont à même d'accélérer significativement l'apprentissage et d'améliorer la tolérance aux bruits dans la chaîne de traitement. Dans un second temps nous nous intéresserons à réduire les coûts de développement d'un module de compréhension de la parole utilisé dans l'étiquetage sémantique d'un tour de dialogue. Pour cela, nous exploiterons les récentes avancées dans les techniques de projection des mots dans des espaces vectoriels continus conservant les propriétés syntactiques et sémantiques, pour généraliser à partir des connaissances initiales limitées de la tâche pour comprendre l'utilisateur. Nous nous attacherons aussi à proposer des solutions afin d'enrichir dynamiquement cette connaissance et étudier le rapport de cette technique avec les méthodes statistiques état de l'art. Là encore nos résultats expérimentaux montrent qu'il est possible d'atteindre des performances état de l'art avec très peu de données et de raffiner ces modèles ensuite avec des retours utilisateurs dont le coût peut lui-même être optimisé
A dialogue system should give the machine the ability to interactnaturally and efficiently with humans. In this thesis, we focus on theissue of the development of stochastic dialogue systems. Thus, we especiallyconsider the Partially Observable Markov Decision Process (POMDP)framework which yields state-of-the-art performance on goal-oriented dialoguemanagement tasks. This model enables the system to cope with thecommunication ambiguities due to noisy channel and also to optimize itsdialogue management strategy directly from data with Reinforcement Learning (RL)methods.Considering statistical approaches often requires the availability of alarge amount of training data to reach good performance. However, corpora of interest are seldom readily available and collectingsuch data is both time consuming and expensive. For instance, it mayrequire a working prototype to initiate preliminary experiments with thesupport of expert users or to consider other alternatives such as usersimulation techniques.Very few studies to date have considered learning a dialogue strategyfrom scratch by interacting with real users, yet this solution is ofgreat interest. Indeed, considering the learning process as part of thelife cycle of a system offers a principle framework to dynamically adaptthe system to new conditions in an online and seamless fashion.In this thesis, we endeavour to provide solutions to make possible thisdialogue system cold start (nearly from scratch) but also to improve its ability to adapt to new conditions in operation (domain extension, new user profile, etc.).First, we investigate the conditions under which initial expertknowledge (such as expert rules) can be used to accelerate the policyoptimization of a learning agent. Similarly, we study how polarized userappraisals gathered throughout the course of the interaction can beintegrated into a reinforcement learning-based dialogue manager. Morespecifically, we discuss how this information can be cast intosocially-inspired rewards to speed up the policy optimisation for bothefficient task completion and user adaptation in an online learning setting.The results obtained on a reference task demonstrate that a(quasi-)optimal policy can be learnt in just a few hundred dialogues,but also that the considered additional information is able tosignificantly accelerate the learning as well as improving the noise tolerance.Second, we focus on reducing the development cost of the spoken language understanding module. For this, we exploit recent word embedding models(projection of words in a continuous vector space representing syntacticand semantic properties) to generalize from a limited initial knowledgeabout the dialogue task to enable the machine to instantly understandthe user utterances. We also propose to dynamically enrich thisknowledge with both active learning techniques and state-of-the-artstatistical methods. Our experimental results show that state-of-the-artperformance can be obtained with a very limited amount of in-domain andin-context data. We also show that we are able to refine the proposedmodel by exploiting user returns about the system outputs as well as tooptimize our adaptive learning with an adversarial bandit algorithm tosuccessfully balance the trade-off between user effort and moduleperformance.Finally, we study how the physical embodiment of a dialogue system in a humanoid robot can help the interaction in a dedicated Human-Robotapplication where dialogue system learning and testing are carried outwith real users. Indeed, in this thesis we propose an extension of thepreviously considered decision-making techniques to be able to take intoaccount the robot's awareness of the users' belief (perspective taking)in a RL-based situated dialogue management optimisation procedure
APA, Harvard, Vancouver, ISO, and other styles
13

Sidana, Sumit. "Systèmes de recommandation pour la publicité en ligne." Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAM061/document.

Full text
Abstract:
Cette thèse est consacrée à l’étude des systèmes de recommandation basés sur des réseaux de neurones artificiels appris pour faire de l'ordonnancement de produits avec des retours implicites (sous forme de clics). Dans ce sens, nous proposons un nouveau modèle neuronal qui apprend conjointement la représentation des utilisateurs et des produits dans un espace latent, ainsi que la relation de préférence des utilisateurs sur les produits. Nous montrons que le modèle proposé est apprenable au sens du principe de la minimisation du risque empirique et performant par rapport aux autres modèles de l'état de l'art sur plusieurs collections. En outre, nous contribuons à la création de deux nouvelles collections, produites grâce aux enregistrements des comportements de clients de Kelkoo (https://www.kelkoo.com/); le leader européen de la publicité programmatique et de Purch (http://www.purch.com/). Les deux jeux de données recueillent des retours implicites des utilisateurs sur des produits, ainsi qu’un grand nombre d'informations contextuelles concernant à la fois les clients et les produits. La collections de données de Purch contient en plus une information sur la popularité des produits ainsi que des commentaires textuelles associés. Nous proposons, une stratégie simple et efficace sur la manière de prendre en compte le biais de la popularité ainsi qu'un modèle probabiliste latent temporel pour extraire automatiquement les thèmes des textes des commentaires.Mots clés. Systèmes de recommandation, apprentissage d'ordonnancement, réseaux de neurones, recommandations avec des retours implicites, Modèles probabilistes latents temporels
This thesis is dedicated to the study of Recommendation Systems for implicit feedback (clicks) mostly using Learning-to-rank and neural network based approaches. In this line, we derive a novel Neural-Network model that jointly learns a new representation of users and items in an embedded space as well as the preference relation of users over the pairs of items and give theoretical analysis. In addition we contribute to the creation of two novel, publicly available, collections for recommendations that record the behavior of customers of European Leaders in eCommerce advertising, Kelkoofootnote{url{https://www.kelkoo.com/}} and Purchfootnote{label{purch}url{http://www.purch.com/}}. Both datasets gather implicit feedback, in form of clicks, of users, along with a rich set of contextual features regarding both customers and offers. Purch's dataset, is affected by popularity bias. Therefore, we propose a simple yet effective strategy on how to overcome the popularity bias introduced while designing an efficient and scalable recommendation algorithm by introducing diversity based on an appropriate representation of items. Further, this collection contains contextual information about offers in form of text. We make use of this textual information in novel time-aware topic models and show the use of topics as contextual information in Factorization Machines that improves performance. In this vein and in conjunction with a detailed description of the datasets, we show the performance of six state-of-the-art recommender models.Keywords. Recommendation Systems, Data Sets, Learning-to-Rank, Neural Network, Popularity Bias, Diverse Recommendations, Contextual information, Topic Model
APA, Harvard, Vancouver, ISO, and other styles
14

BOUDOKHANE, CHEDLY. "Automatisation d'une colonne de rectification en continu analyse en ligne par chromatographie en phase gazeuse." Paris 6, 1990. http://www.theses.fr/1990PA066421.

Full text
Abstract:
Dans les systemes continus et en chimie fine, un interet marque se manifeste pour l'automatisation. La microinformatique a apporte dans ce domaine des possibilites nouvelles tres precieuses que nous avons mises a profit pour automatiser une colonne pilote de rectification en continu. Ce travail est divise en trois parties. La premiere partie traite des rappels theoriques sur la rectification et decrit le materiel choisi et monte pour automatiser les differentes operations de cette colonne tels que l'asservissement de la puissance de chauffage, le choix du taux de reflux, le controle continu de la qualite des produits distilles, etc. . . La deuxieme partie concerne la mise au point d'un systeme d'analyse en ligne par chromatographie en phase gazeuse en vue de controler en continu les divers courants de cette colonne au moyen d'un analyseur automatique et d'un calculateur integrateur. La troisieme partie decrit la mise au point des procedures developpees pour l'acquisition des donnees et la gestion de commande des differents elements de la colonne. Ceci a permis de centraliser toutes les operations du procede sur le compatible ibm pc. Cette troisieme partie presente egalement la validation de cette automatisation et la verification de l'efficacite de la colonne grace a l'etude experimentale du melange binaire cyclohexane-toluene. Le dispositif realise est donc un outil bien adapte aux problemes poses par l'operation unitaire de distillation. Sa transposition a l'echelle industrielle peut etre envisagee
APA, Harvard, Vancouver, ISO, and other styles
15

Bassagou, Dikagma. "EXOLINE : Dispositif instrumenté pour analyser les interactions en apprentissage collaboratif en ligne." Thesis, Lille 1, 2019. http://www.theses.fr/2019LIL1I074.

Full text
Abstract:
Cette étude porte sur un dispositif qui pourrait permettre d’analyser la motivation et l’autonomie des étudiants en l’absence de régulation humaine dans un enseignement à distance. En effet dans la littérature, la motivation et l’autonomie ont une implication dans l’abandon des apprenants en situation d’apprentissage en ligne. Pour analyser ces facteurs, certains chercheurs utilisent de manière ponctuelle des questionnaires et d’autres utilisent des traces numériques produites par des EIAH (Environnements informatiques pour l'apprentissage humain). Dans la plupart de ces études l’intervention d’un tuteur pour réguler l’activité d’apprentissage est importante. L’objectif de cette recherche est d’arriver à identifier des étudiants pouvant suivre un enseignant à distance avec les meilleures chances de réussite. Pour ce faire, nous avons conçu un dispositif combinant l’exploitation de questionnaires et de traces numériques d’apprentissage. Ce dispositif contient une plateforme dénommée « Exoline » qui soutient un scénario pédagogique alternant le travail individuel et les activités collaboratives en sept étapes. Les activités collaboratives sont régulées par un système de vote (j’aime/je n’aime pas) de la plateforme et le travail individuel correspond à des phases de contribution éditoriale par chaque apprenant membre d’un groupe. Pour collecter les données relatives à la dynamique de collaboration et d’apprentissage, nous avons organisé une expérimentation avec 794 étudiants de l’Université de Kara avec un taux de participation de 40,55 %. Nous avons ensuite appliqué différentes méthodes statistiques aux données (questionnaires et traces) issues de l’expérimentation afin d’identifier et étudier les relations existantes entre l’apprentissage, la motivation et l’autonomie. Notre étude a mis en évidence, au-delà de la motivation initiale, le rôle de la dynamique de maintien de la motivation tout au long du processus d’apprentissage. Le niveau de progression (nombre d’étapes réalisées) par l’apprenant dans notre dispositif Exoline s’est révélé être un indicateur intéressant de la performance d’apprentissage. En d’autres termes, l’étude montre que la plupart des étudiants qui abandonnent le font plutôt en début de parcours. Sur un plan plus contextuel, notre étude montre aussi comment l’environnement socio-économique influence le parcours pédagogique des étudiants en particulier au Togo
This study concerns a mechanism that could make it possible to analyse students' motivation and autonomy in the absence of human regulation in distance education. Indeed, in the literature, motivation and autonomy have an implication in the drop-out of learners in e-learning situations. To analyze these factors, some researchers use questionnaires on an ad hoc basis and others use digital traces produced by TEL (Technology Enhanced Learning). In most of these studies, the intervention of a tutor to regulate learning activity is important. The objective of this research is to identify students who can follow a teacher from a distance with the best chances of success. To do this, we have designed a system that combines the use of questionnaires and digital learning traces. This system contains a platform called "Exoline" that supports a pedagogical scenario that alternates individual work and collaborative activities in seven steps. Collaborative activities are regulated by a voting system (I like/dislike) of the platform and individual work corresponds to phases of editorial contribution by each learner member of a group. To collect data on collaboration and learning dynamics, we conducted an experiment with 794 students from Kara University with a participation rate of 40.55%. We then applied different statistical methods to the data (questionnaires and traces) from the experiment to identify and study the relationships between learning, motivation and autonomy. Our study highlighted, beyond the initial motivation, the role of the dynamics of maintaining motivation throughout the learning process. The level of progression (number of steps performed) by the learner in our Exoline device has proven to be an interesting indicator of learning performance. In other words, the study shows that most students who drop out do so at the beginning of the course. On a more contextual level, our study also shows how the socioeconomic environment influences the educational path of students, particularly in Togo
APA, Harvard, Vancouver, ISO, and other styles
16

Bovo, Angela. "Apprentissage automatique pour l'assistance au suivi d'étudiants en ligne : approches classique et bio-inspirée." Thesis, Toulouse 1, 2014. http://www.theses.fr/2014TOU10035/document.

Full text
Abstract:
Cette thèse a pris la forme d’un partenariat entre l’équipe VORTEX du laboratoire de recherche en informatique IRIT et l’entreprise Andil, spécialisée dans l'informatique pour l'e-learning. Ce partenariat est conclu autour d’une thèse CIFRE, dispositif soutenu par l’État via l’ANRT. La doctorante, Angela Bovo, a travaillé au sein de l'Université Toulouse 1 Capitole. Un partenariat a également été noué avec l'institut de formation Juriscampus, qui nous a fourni des données issues de formations réelles pour nos expérimentations. Notre objectif principal avec ce projet était d'améliorer les possibilités de suivi des étudiants en cours de formation en ligne pour éviter leur décrochage ou leur échec. Nous avons proposé des possibilités de suivi par apprentissage automatique classique en utilisant comme données les traces d'activité des élèves. Nous avons également proposé, à partir de nos données, des indicateurs de comportement des apprenants. Avec Andil, nous avons conçu et réalisé une application web du nom de GIGA, déjà commercialisée et appréciée par les responsables de formation, qui implémente ces propositions et qui a servi de base à de premières expériences de partitionnement de données qui semblent permettre d'identifier les étudiants en difficulté ou en voie d'abandon. Ce projet a également été lancé avec l'objectif d'étudier les possibilités de l'algorithme d'apprentissage automatique inspiré du cerveau humain Hierarchical Temporal Memory (HTM), dans sa version Cortical Learning Algorithm (CLA), dont les hypothèses fondatrices sont bien adaptées à notre problème. Nous avons proposé des façons d'adapter HTM-CLA à des fonctionnalités d'apprentissage automatique classique (partitionnement, classification, régression, prédiction), afin de comparer ses résultats à ceux fournis par les autres algorithmes plus classiques ; mais aussi de l'utiliser comme base d'un moteur de génération de comportement, qui pourrait être utilisé pour créer un tuteur virtuel intelligent chargé de conseiller les apprenants en temps réel. Les implémentations ne sont toutefois pas encore parvenues à produire des résultats probants
This Ph.D. took the shape of a partnership between the VORTEX team in the computer science research laboratory IRIT and the company Andil, which specializes in software for e-learning. This partnership was concluded around a CIFRE Ph.D. This plan is subsidized by the French state through the ANRT. The Ph.D. student, Angela Bovo, worked in Université Toulouse 1 Capitole. Another partnership was built with the training institute Juriscampus, which gave us access to data from real trainings for our experiments. Our main goal for this project was to improve the possibilities for monitoring students in an e-learning training to keep them from falling behind or giving up. We proposed ways to do such monitoring with classical machine learning methods, with the logs from students' activity as data. We also proposed, using the same data, indicators of students' behaviour. With Andil, we designed and produced a web application called GIGA, already marketed and sold, and well appreciated by training managers, which implements our proposals and served as a basis for first clustering experiments which seem to identify well students who are failing or about to give up. Another goal of this project was to study the capacities of the human brain inspired machine learning algorithm Hierarchical Temporal Memory (HTM), in its Cortical Learning Algorithm (CLA) version, because its base hypotheses are well adapted to our problem. We proposed ways to adapt HTM-CLA to classical machine learning functionalities (clustering, classification, regression, prediction), in order to compare its results to those of more classical algorithms; but also to use it as a basis for a behaviour generation engine, which could be used to create an intelligent tutoring system tasked with advising students in real time. However, our implementations did not get to the point of conclusive results
APA, Harvard, Vancouver, ISO, and other styles
17

Bouillon, Manuel. "Apprentissage actif en-ligne d'un classifieur évolutif, application à la reconnaissance de commandes gestuelles." Thesis, Rennes, INSA, 2016. http://www.theses.fr/2016ISAR0019/document.

Full text
Abstract:
L'utilisation de commandes gestuelles est une nouvelle méthode d'interaction sur interface tactile. Une bonne méthode pour faciliter la mémorisation de ces commandes gestuelles est de laisser l'utilisateur les personnaliser. Ce contexte applicatif induit une situation d'apprentissage croisé, où l'utilisateur doit mémoriser le jeu de symboles elle système doit apprendre à reconnaître les différents symboles. Cela implique un certain nombre de contraintes, à la fois sur le système de reconnaissance de symboles ct sur le système de supervision de son apprentissage. Il faut par exemple que le classifieur puisse apprendre à partir de peu de données, continuer à apprendre pendant son utilisation et suivre toute évolution des données indéfiniment. Le superviseur doit quant à lui optimiser la coopération entre l'utilisateur et le système de reconnaissance pour minimiser les interactions tout en maximisant l'apprentissage. Cette thèse présente d'une part, le système d'apprentissage évolutif Evolve oo, capable d'apprendre rapidement il partir de peu de données et de suivre les changements de concepts. D'autre part, elle introduit le superviseur actif en-ligne lntuiSup qui permet d'optimiser la coopération entre le système et l'utilisateur, lors de l'utilisation de commandes gestuelles personnalisées notamment Evolve oo est un système d'inférence floue, capable d'apprendre rapidement grâce aux capacités génératrices des prémisses des règles, tout en permettant d'obtenir une précision élevée grâce aux capacités discriminantes des conclusions d'ordre un. L'intégration d'oubli dans le processus d'apprentissage permet de maintenir le gain de l'apprentissage indéfiniment, permettant ainsi l'ajout de classes à n'importe quel moment de l'utilisation du système ct garantissant son évolutivité « à vie». Le superviseur actif en-ligne lntuiSup permet d'optimiser les interactions avec l'utilisateur pour entraîner un système d'apprentissage lorsque l'utilisateur est dans la boucle. Il permet de faire évoluer la proportion de données que l'utilisateur doit étiqueter en fonction de la difficulté du problème et de l'évolution de l'environnement (changements de concepts). L'utilisation d'une méthode de« dopage» de l'apprentissage permet d'optimiser la répartition de ces interactions avec l'utilisateur pour maximiser leur impact sur l'apprentissage
Using gesture commands is a new way of interacting with touch sensitive interfaces. In order to facilitate user memorization of several commands, it is essential to let the user customize the gestures. This applicative context gives rise to a crosslearning situation, where the user has to memorize the set of commands and the system has to learn and recognize the different gestures. This situation implies several requirements, from the recognizer and from the system that supervizes its learning process. For instance, the recognizer has to be able to learn from few data samples, to keep learning during its use and to follow indefinitely any change of the data now. The supervisor has to optimize the cooperation between the recognizer and the system to minimize user interactions while maximizing recognizer learning. This thesis presents on the one hand the evolving recognition system Evolve oo, that is capable of fast teaming from few data samples, and that follows concept drifts. On the other hand, this thesis also presents the on line active supervisor lntuiSup, that optimizes user-system cooperation when the user is in the training loop, as during customized gesture command use for instance. The evolving classifier Evolve oo is a fuzzy inference system that is fast learning thanks to the generative capacity of rule premises, and at the same time giving high precision thanks to the discriminative capacity of first order rule conclusion. The use of forgetting in the learning process allows to maintain the learning gain indefinitely, enabling class adding at any stage of system learning, and guaranteeing lifelong evolving capacity. The on line active supervisor IntuiSup optimizes user interactions to train a classifier when the user is in the training loop. The proportion of data that is labeled by the user evolves to adapt to problem difficulty and to follow environment evolution (concept drift s). The use of a boosting method optimizes the timing of user interactions to maximize their impact on classifier learning process
APA, Harvard, Vancouver, ISO, and other styles
18

Portet, François. "Pilotages d'algorithmes pour la reconnaissance en ligne d'arythmies cardiaques." Rennes 1, 2005. https://tel.archives-ouvertes.fr/tel-00011942v2.

Full text
Abstract:
L'objectif de cette thèse est la réalisation du système de monitoring cardiaque intelligent IP-Calicot, capable grâce à un module de pilotage d'algorithmes de modifier dynamiquement sa chaîne de traitement afin d'obtenir un diagnostic médical fiable même en milieu bruité. Le système extrait d'un électrocardiogramme (ECG) les informations servant à diagnostiquer une arythmie cardiaque. Le contexte courant, constitué du bruit de ligne et du diagnostic médical, permet un pilotage à trois niveaux par sélection des algorithmes de traitement du signal, des éléments à extraire de l'ECG, le décrivant ainsi dans un langage plus ou moins précis, et sélection du langage de description à utiliser pour établir le diagnostic. Le pilote agit sur la chaîne de traitement grâce à des règles de pilotage acquises par expertises et déduites d'études statistiques. Les tests effectués sur des ECG pathologiques bruités typiques de situations cliniques montrent l'intérêt et la faisabilité de cette approche.
APA, Harvard, Vancouver, ISO, and other styles
19

Portet, François Cordier Marie-Odile Carrault Guy. "Pilotages d'algorithmes pour la reconnaissance en ligne d'arythmies cardiaques." [S.l.] : [s.n.], 2005. ftp://ftp.irisa.fr/techreports/theses/2005/portet.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
20

Jeunesse, Christophe. "Collaboration et interculturalité dans la formation en ligne. Contribution à l'écologie de l'apprenance." Thesis, Paris 10, 2009. http://www.theses.fr/2009PA100161/document.

Full text
Abstract:
Cette recherche porte sur l’étude des spécificités liées à l’apprentissage collaboratif en ligne et en contexte multiculturel. Elle se situe à l’intersection des réflexions menées sur les champs conceptuels traitant de la motivation, de la culture, du genre, et de la formation à distance médiatisée par les technologies éducatives. Le contexte de cette étude réside en une formation universitaire en ligne rassemblant 249 étudiants européens et africains, tous francophones, en formation continue et travaillant au sein d’un dispositif d’apprentissage collaboratif à distance. Ma réflexion a été guidée par le questionnement à propos de la manière dont les étudiants vivaient la collaboration en ligne en contexte multiculturel, et notamment sur les difficultés manifestées par les Africains alors même qu’ils semblaient présenter une attitude plus positive que leurs pairs occidentaux vis-à-vis de cette modalité d’apprentissage. Plusieurs enquêtes successives : préliminaires, quantitative et qualitative auprès d’échantillons représentatifs des étudiants permettent d’apporter un certain nombre de réponses à la question de recherche ainsi que des informations complémentaires. La culture, et notamment l’environnement sociotechnique des apprenants, constitue bien une variable supplémentaire à prendre en compte par rapport au genre pour décoder les attitudes et les comportements d’apprenants impliqués dans une formation collaborative en ligne. Une réflexion autour des dimensions de l’apprenance et de la distance transactionnelle permet également de mieux comprendre les relations entre les acteurs de la formation et les adaptations nécessaires du dispositif de formation dans un tel contexte
The research concerns the study of specificities connected to the online collaborative learning in a multicultural context. It is situated at the intersection of the reflections carried out on the conceptual fields dealing with the motivation, with the culture, with the gender and with the distance training mediatized by the educational technologies. The context of this study lies in and online university training gathering 249 European and African students, all French-speaking people, in an adult continuing training and working within remote collaborative learning plan. My reflection was driven by the questioning about the way the students lived the online collaboration in multicultural context, in particular on the difficulties shown by the Africans while at the same time they seemed to present a more positive attitude than their western peers towards this method of training. Several successive investigations (preliminary, quantitative and qualitative among representative samples of the students) make it possible to bring a certain number of answers to the question of research as well as additional details. The culture, in particular the sociotechnical environment of the learners, provides an additional variable well to be taken into account with regard to the gender necessary to decode attitudes and behavior of learners who are involved in a online collaborative training. A reflection around the dimensions of the “learnance” (learning readiness) and the transactional distance also allows to understand better the relations between the actors of the training and the necessary adaptations of the training design in such a context
APA, Harvard, Vancouver, ISO, and other styles
21

Yibokou, Kossi Seto. "Apprentissage informel de l'anglais en ligne : quelles conséquences sur la prononciation des étudiants français ?" Thesis, Strasbourg, 2019. https://publication-theses.unistra.fr/restreint/theses_doctorat/2019/Yibokou_Kossi_Seto_2019_ED520.pdf.

Full text
Abstract:
Ce travail s’inscrit dans le cadre de l’apprentissage informel de l’anglais en ligne et explore les pratiques liées aux diverses sources d’exposition d’un échantillon d’étudiants de l’Université de Strasbourg. Les données collectées à partir d’un test de prononciation, d’un test de perception et d’un sondage, montrent une variabilité inter et intra-individuelle inhérente à la complexité du système dans lequel évoluent les participants. Eu regard aux accents Received Pronunciation et General American, les analyses acoustiques d’éléments de prononciation mettent en évidence des productions orales constituées de mélanges de spécificités des deux accents et celles de la langue française. La perturbation de la production de la parole, mise en oeuvre au travers de la variation de la vitesse d’élocution, indique une résistivité du système pour certains sons/séquences de sons. Les résultats montrent également que les séries télévisées constituent les activités les plus influentes parmi celles qui favorisent l’imitation vocale et permettent une appropriation phonético-phonologique
This work is part of the online informal learning of English and explores practices related to various sources of exposure of a sample of students from the University of Strasbourg. The data collected, based on a pronunciation test, a perception test and a survey, show inter- and intra-individual variability inherent to the complexity of the system in which participants evolve. With regards to Received Pronunciation and General American accents, acoustic analyses of pronunciation elements highlight oral productions composed of mixtures of characteristics of the two accents and those of the French language. The perturbation of speech production, implemented through fast speech variation, indicates a resistivity of the system for certain sounds/sequences of sounds. Results also show that television series are the most influential activities among those that promote vocal imitation and allow phonetic-phonological appropriation
APA, Harvard, Vancouver, ISO, and other styles
22

Rivera-Santos, Miguel. "Les déterminants de l'apprentissage entre partenaires dans les alliances : Elaboration d'un modèle théorique et étude empirique sur le secteur du commerce en ligne." Jouy-en Josas, HEC, 2003. http://www.theses.fr/2003EHEC0003.

Full text
Abstract:
Pour expliquer l'apprentissage dans les alliances, la recherche s'est concentrée sur l'analyse de facteurs variés, tels que la capacité d'absorption de l'entreprise, son expérience des alliances, ou la taciteté de la ressource acquise. Une analyse de ces facteurs permet de mettre en évidence que, d'une part, ils se chevauchent conceptuellement, et que, d'autre part, tous contiennent deux aspects distincts, un aspect d'apprentissage et un aspect de protection. Ceci nous mène à poser la question de recherche suivante : Quels facteurs déterminent le transfert de ressources dans les alliances ? Suivant une approche par les ressources, nous proposons que placer l'analyse au niveau du transfert de ressources permet de découvrir l'existence de deux capacités fondamentales de l'entreprise, qui déterminent le transfert de ressources dans les alliances, qu'il s'agisse de transferts de l'alliance vers l'entreprise focale ou de l'alliance vers son partenaire. Nous les appelons " capacité de coordination " et " capacité de protection " de l'entreprise dans l'alliance. Nous proposons qu'elles se fondent sur une série de micro-composantes, qui peuvent être spécifiques à l'entreprise (caractéristiques de l'interface, expérience des alliances, et volonté d'apprendre et de protéger) ou spécifiques à l'alliance (caractéristiques du partenaire, caractéristiques des collaborateurs, et caractéristiques de l'alliance). Nous testons notre modèle sur un échantillon de 124 alliances e-commerce. Nous trouvons une validation empirique de l'existence des capacités de coordination et de protection, ainsi que de leurs relations avec leurs micro-composantes sous-jacentes, et nous trouvons une troisième capacité distincte des deux premières, la capacité de coordination et de protection simultanées. Nous trouvons également que ces capacités permettent d'expliquer le transfert de ressources dans les alliances. Ceci nous suggère le fondement d'une nouvelle théorie de l'apprentissage dans les alliances.
APA, Harvard, Vancouver, ISO, and other styles
23

Rochd, El Mehdi. "Modèles probabilistes de consommateurs en ligne : personnalisation et recommandation." Thesis, Aix-Marseille, 2015. http://www.theses.fr/2015AIXM4086.

Full text
Abstract:
Les systèmes de recherche ont facilité l’accès à l’information disponible sur le web à l’aide de mécanismes de collecte, d’indexation et de stockage de contenus hétérogènes.Ils génèrent des traces résultant de l’activité des internautes. Il s’agit ensuite d’analyser ces données à l’aide d’outils de data mining afin d’améliorer la qualité de réponse de ces systèmes ou de la personnaliser en fonction des profils des utilisateurs. Certains acteurs, comme la société Marketshot, se positionnent comme intermédiaires entre les consommateurs et les professionnels. Ils mettent en relation les acheteurs potentiels avec les grandes marques et leurs réseaux de distribution à travers leurs sites Internet d’aide à l’achat. Pour cela, ces intermédiaires ont développé des portails efficaces et stockent de gros volumes de données liées à l’activité des internautes sur leurs sites. Ces gisements de données sont exploités pour répondre favorablement aux besoins des internautes, ainsi qu’à ceux des professionnels qui cherchent à comprendre le comportement de leurs clients et anticiper leurs actes d’achats. C’est dans ce contexte, où on cherche à fouiller les données collectées du web, que se placent mes travaux de recherche. L’idée est de construire des modèles qui permettent d’expliciter une corrélation entre les activités des internautes sur les sites d’aide à l’achat et les tendances de ventes de produits dans la « vraie vie ». En effet, ma thèse se place dans le cadre de l’apprentissage probabiliste et plus particulièrement des modèles graphiques « Topic Models ». Elle consiste à modéliser les comportements des internautes à partir des données d’usages de sites web
Research systems have facilitated access to information available on the web using mechanisms for collecting, indexing and storage of heterogeneous content. They generate data resulting from the activity of users on Internet (queries, logfile). The next step is to analyze the data using data mining tools in order to improve the response’s quality of these systems, or to customize the response based on users’ profiles. Some actors, such as the company Marketshot, are positioned as intermediaries between consumers and professionals. Indeed, they link potential buyers with the leading brands and distribution networks through their websites. For such purposes, these intermediaries have developed effective portals, and have stored large volumes of data related to the activity of users on their websites. These data repositories are exploited to respond positively to the needs of users as well as those of professionals who seek to understand the behavior of their customers and anticipate their purchasing actions. My thesis comes within the framework of searching through the data collected from the web. The idea is to build models that explain the correlation between the activities of users on websites of aid for the purchase, and sales trends of products in « real life ». In fact, my research concerns probabilistic learning, in particular Topic Models. It involves modeling the users’ behavior from uses of trader websites
APA, Harvard, Vancouver, ISO, and other styles
24

Nissen, Elke. "Apprendre une langue en ligne dans une perspective actionnelle : effets de l'interaction sociale." Phd thesis, Université Louis Pasteur - Strasbourg I, 2003. http://tel.archives-ouvertes.fr/edutice-00001449.

Full text
Abstract:
La pratique de l'évaluation universitaire est aujourd'hui majoritairement individuelle, y compris dans les formations à distance (FAD) basées sur l'apprentissage en groupe restreint tutoré. C'est un type d'évaluation proposé également dans un dispositif de FAD en langues, Babbelnet, qui s'inscrit dans la perspective actionnelle en émergence actuellement dans la didactique des langues en Europe. L'hypothèse de recherche est triple. Elle consiste à dire que 1) ce dispositif est adéquat pour apprendre à réaliser une tâche universitaire en langue étrangère ; 2) grâce à l'interaction entre les étudiants, l'apprentissage en groupe restreint tutoré est supérieur à l'apprentissage individuel tutoré pour améliorer les compétences individuelles en lien avec ce type de tâche ; 3) le progrès effectué par les membres d'un groupe dépend cependant de la qualité de l'interaction dans le groupe.
Nous menons deux observations contrôlées des personnes se formant par ce dispositif – soit en groupe tutoré, soit en individuel tutoré. L'analyse porte sur un pré- et un post-test, des tâches réalisées durant la phase d'apprentissage, des formulaires auto-administrés et une étude de l'interaction. Les observations ne confirment que partiellement les hypothèses : pendant la phase d'apprentissage, les groupes restreints évoluent différemment, et ce probablement en raison des phénomènes de leadership qui s'y développent. Les apprenants affichent de meilleures performances durant la phase d'apprentissage que lors des tests, mais leurs résultats entre le pré- et le post-test ne s'améliorent pas sensiblement. Une supériorité d'un apprentissage en groupe tutoré par rapport à un apprentissage individuel tutoré ne peut pas être démontrée, du moins pour la tâche et les contextes observés. Plus que la modalité d'apprentissage (en groupe vs. en individuel), le facteur déterminant pour l'apprentissage semble être la présence d'un tuteur.
APA, Harvard, Vancouver, ISO, and other styles
25

Yao, Ziwen. "Régulateur adaptatif robuste pour les liaisons de transport a courant continu en haute tension." Vandoeuvre-les-Nancy, INPL, 1993. http://www.theses.fr/1993INPL051N.

Full text
Abstract:
Cette thèse présente un ensemble de méthodes de synthèse du contrôle commande adaptatif robuste dans le domaine fréquentiel pour les liaisons de transport à courant continu en haute tension destine à améliorer la stabilité en basse fréquence du réseau. Cet ensemble de méthodes consiste en une méthode de modélisation des réseaux d'interconnexion, une méthode d'analyse de stabilité pour les réseaux d'interconnexion, une approche d'identification des réseaux électriques et une approche de synthèse du régulateur adaptatif-robuste. La méthode de simplification de modélisation des réseaux d'interconnexion est fondée sur des propriétés algébriques: l'y-symétrie et la possibilité de découplage de la matrice de caractéristiques de fréquence des réseaux. Basé sur ces propriétés et sur le critère de stabilité de Nyquist généralisé, un critère de stabilité est proposé pour les réseaux d'interconnexion. L'approche d'identification des réseaux électriques est fondée sur ces propriétés algébriques et est réalisée à l'aide de la transformation de Fourier. Afin de montrer les avantages ainsi que les inconvénients des méthodes proposées cette thèse est illustrée par différents résultats de simulation numérique. Dans ces simulations numériques sont étudiés les phénomènes d'interaction torsionnelle entre la liaison TCCHT IFA 2000 et les turboalternateurs voisins
APA, Harvard, Vancouver, ISO, and other styles
26

Gomont, Jacques. "Mise au point d'un procédé de filtration/expression continu applicable à la déshydratation en ligne de suspensions solide-liquide concentrées." Compiègne, 1986. http://www.theses.fr/1986COMPI251.

Full text
APA, Harvard, Vancouver, ISO, and other styles
27

Caillault, Emilie. "Architecture et Apprentissage d'un Système Hybride Neuro-Markovien pour la Reconnaissance de l'Écriture Manuscrite En-Ligne." Phd thesis, Université de Nantes, 2005. http://tel.archives-ouvertes.fr/tel-00084061.

Full text
Abstract:
Les travaux présentés dans le cadre de cette thèse portent sur l'étude, la conception, le développement et le test d'un système de reconnaissance de mots manuscrits non contraints en-ligne pour une application omni-scripteurs. Le système proposé repose sur une architecture hybride neuro-markovienne comportant d'une part, un réseau de neurones à convolution (TDNN et/ou SDNN), et d'autre part des modèles de Markov à états cachés (MMC). Le réseau de neurones a une vision globale et travaille au niveau caractère, tandis que le MMC s'appuie sur une description plus locale et permet le passage du caractère au niveau mot. Nous avons d'abord étudié le système de reconnaissance au niveau caractère isolé (digits, majuscules, minuscules) et optimisé les architectures des réseaux en termes de performances et de taille. La seconde partie du travail a porté sur le passage au niveau mot. Ici, l'effort a consisté avant tout à la définition d'un schéma d'apprentissage global au niveau mot qui permet d'assurer la convergence globale du système, en définissant une fonction d'objectif qui mixe des critères basés modèle générateur (typiquement par maximum de vraisemblance) et des critères discriminants (de type maximum d'information mutuelle). Les différentes résultats présentés (sur les bases MNIST, IRONOFF, UNIPEN) montrent l'influence des principaux paramètres du système, soit en termes de topologie, de sources d'information, de modèles d'apprentissage (nombre d'états, pondération des critères, durée).
APA, Harvard, Vancouver, ISO, and other styles
28

Poisson, Émilie. "Architecture et apprentissage d'un système hybride neuro-markovien pour la reconnaissance de l'écriture manuscrite en-ligne." Nantes, 2005. http://www.theses.fr/2005NANT2082.

Full text
Abstract:
Les travaux présentés dans le cadre de cette thèse portent sur l'étude, la conception, le développement et le test d'un système de reconnaissance de mots manuscrits non contraints en-ligne pour une application omni-scripteurs. Le système proposé repose sur une architecture hybride neuro-markovienne comportant d'une part, un réseau de neurones à convolution (TDNN et/ou SDNN), et d'autre part des modèles de Markov à états cachés (MMC). Le réseau de neurones a une vision globale et travaille au niveau caractère, tandis que le MMC s'appuie sur une description plus locale et permet le passage du caractère au niveau mot. Nous avons d'abord étudié le système de reconnaissance au niveau caractère isolé (digits, majuscules, minuscules) et optimisé les architectures des réseaux en termes de performances et de taille. La seconde partie du travail a porté sur le passage au niveau mot. Ici, l'effort a consisté avant tout à la définition d'un schéma d'apprentissage global au niveau mot qui permet d'assurer la convergence globale du système, en définissant une fonction d'objectif qui mixe des critères basés modèle générateur (typiquement par maximum de vraisemblance) et des critères discriminants (de type maximum d'information mutuelle). Les différentes résultats présentés (sur les bases MNIST, IRONOFF, UNIPEN) montrent l'influence des principaux paramètres du système, soit en termes de topologie, de sources d'information, de modèles d'apprentissage (nombre d'états, pondération des critères, durée)
This thesis deals with the study, the conception, the development and the test of an online unconstrained handwriting word recognition system for an omni-writer application. The proposed system is based on a hybrid architecture including on the one hand, a neural convolutional network (TDNN and/or SDNN), and on the other hand Hidden Markov Models (HMM). The neural network has a global vision and works at the character level, while the HMM works on a more local description and allows the extension from the character level to the word level. The system was first dedicated for processing isolated characters (digits, lowercase letters, uppercase letters). This architecture has been optimized in terms of performances and size. The second part of this work concerns the extension to the word level. In this case, we have defined a global training scheme directly at the word level. It allows to insure the global convergence of the system. It relies on an objective function that combines two main criteria: one based on generative models (typically by maximum likelihood estimation) and the second one based on discriminant criteria (maximum mutual information). Several results are presented on MNIST, IRONOFF and UNIPEN databases. They show the influence of the main parameters of the system, either in terms of topologies, information sources, and training models (number of states, criteria weighting, duration)
APA, Harvard, Vancouver, ISO, and other styles
29

Garcin, Claudine. "Pratiques participatives, apprentissage et développement professionnel sur Internet : Le cas de la communauté en ligne "Moodle"." Thesis, Aix-Marseille, 2014. http://www.theses.fr/2014AIXM3007/document.

Full text
Abstract:
Ce travail de recherche se situe dans le cadre de la théorie de l'activité et dans celui de l'apprentissage social. Il porte sur les pratiques des internautes qui investissent du temps et du travail dans la mise en oeuvre et l'amélioration de la plate-forme d'enseignement en ligne « Moodle ». Même si leur objectif principal n'est pas l'apprentissage en tant que tel, leur activité nécessite de créer, de diffuser et d'acquérir certains types de savoirs et ainsi de se développer professionnellement. Alors que des informations circulent au sein des communautés virtuelles sur Internet, l'enquête ethnographique proposée considère l'activité « Moodle » comme une activité sociale située génératrice d'apprentissages. Elle repose d'une part sur un questionnaire sur les pratiques des intéressés (les Moodleurs) et d'autre part, s'appuie sur l'analyse des traces écrites qu'ils produisent sur le Web social. Les résultats permettent de mieux cerner qui sont ces « Moodleurs » et quelles sont leurs activités. Ils montrent aussi que si des apprentissages sont en jeu, ils concernent avant tout des savoir-faire. Il apparaît également qu'un développement professionnel est repérable dans cette dynamique collective interactionnelle qui ne s'effectue pas dans un cadre institutionnel classique
The research is based on the framework of Activity Theory and the Social Learning Theory. This thesis addresses the practices of the Internet users who invest work and time in the improvement and the design of "Moodle", the platform for online education.Even if their main objective is not developing their knowledge, their activity requires creating, diffusing and acquiring certain types of knowledge and consequently developing their professional skills. Since information circulates within the virtual communities on the Internet, the selected ethnographic method considers "Moodle" activity as a situated and social activity generating learning process. It is based on both a questionnaire on the practices of the involved people (the Moodlers) and an analysis of the written traces that they produce on the social Web. The outcomes, on the one hand, show how the "Moodlers" manage their activities to learn mainly in a know-how perspective. On the other hand, it appears that the professional development depends on a collective and an interactional dynamics which is not determined by the institutional framework
APA, Harvard, Vancouver, ISO, and other styles
30

Moulet, Lucie. "Modélisation de l'apprenant avec une approche par compétences dans le cadre d'environnement d'apprentissage en ligne." Paris 6, 2011. http://www.theses.fr/2011PA066636.

Full text
APA, Harvard, Vancouver, ISO, and other styles
31

Mainsant, Marion. "Apprentissage continu sous divers scénarios d'arrivée de données : vers des applications robustes et éthiques de l'apprentissage profond." Electronic Thesis or Diss., Université Grenoble Alpes, 2023. http://www.theses.fr/2023GRALS045.

Full text
Abstract:
Le cerveau humain reçoit en continu des informations en provenance de stimuli externes. Il a alors la capacité de s’adapter à de nouvelles connaissances tout en conservant une mémoire précise de la connaissance apprise par le passé. De plus en plus d’algorithmes d’intelligence artificielle visent à apprendre des connaissances à la manière d’un être humain. Ils doivent alors être mis à jour sur des données variées arrivant séquentiellement et disponibles sur un temps limité. Cependant, un des verrous majeurs de l’apprentissage profond réside dans le fait que lors de l’apprentissage de nouvelles connaissances, les anciennes sont quant-à-elles perdues définitivement, c’est ce que l’on appelle « l’oubli catastrophique ». De nombreuses méthodes ont été proposées pour répondre à cette problématique, mais celles-ci ne sont pas toujours applicables à une mise en situation réelle car elles sont construites pour obtenir les meilleures performances possibles sur un seul scénario d’arrivée de données à la fois. Par ailleurs, les meilleures méthodes existant dans l’état de l’art sont la plupart du temps ce que l’on appelle des méthodes à « rejeu de données » qui vont donc conserver une petite mémoire du passé, posant ainsi un problème dans la gestion de la confidentialité des données ainsi que dans la gestion de la taille mémoire disponible.Dans cette thèse, nous proposons d’explorer divers scénarios d’arrivée de données existants dans la littérature avec, pour objectif final, l’application à la reconnaissance faciale d’émotion qui est essentielle pour les interactions humain-machine. Pour cela nous présenterons l’algorithme Dream Net – Data-Free qui est capable de s’adapter à un vaste nombre de scenarii d’arrivée des données sans stocker aucune donnée passée. Cela lui permet donc de préserver la confidentialité des données apprises. Après avoir montré la robustesse de cet algorithme comparé aux méthodes existantes de l’état de l’art sur des bases de données classiques de la vision par ordinateur (Mnist, Cifar-10, Cifar-100 et Imagenet-100), nous verrons qu’il fonctionne également sur des bases de données de reconnaissance faciale d’émotions. En s’appuyant sur ces résultats, nous proposons alors un démonstrateur embarquant l’algorithme sur une carte Nvidia Jetson nano. Enfin nous discuterons la pertinence de notre approche pour la réduction des biais en intelligence artificielle ouvrant ainsi des perspectives vers une IA plus robuste et éthique
The human brain continuously receives information from external stimuli. It then has the ability to adapt to new knowledge while retaining past events. Nowadays, more and more artificial intelligence algorithms aim to learn knowledge in the same way as a human being. They therefore have to be able to adapt to a large variety of data arriving sequentially and available over a limited period of time. However, when a deep learning algorithm learns new data, the knowledge contained in the neural network overlaps old one and the majority of the past information is lost, a phenomenon referred in the literature as catastrophic forgetting. Numerous methods have been proposed to overcome this issue, but as they were focused on providing the best performance, studies have moved away from real-life applications where algorithms need to adapt to changing environments and perform, no matter the type of data arrival. In addition, most of the best state of the art methods are replay methods which retain a small memory of the past and consequently do not preserve data privacy.In this thesis, we propose to explore data arrival scenarios existing in the literature, with the aim of applying them to facial emotion recognition, which is essential for human-robot interactions. To this end, we present Dream Net - Data-Free, a privacy preserving algorithm, able to adapt to a large number of data arrival scenarios without storing any past samples. After demonstrating the robustness of this algorithm compared to existing state-of-the-art methods on standard computer vision databases (Mnist, Cifar-10, Cifar-100 and Imagenet-100), we show that it can also adapt to more complex facial emotion recognition databases. We then propose to embed the algorithm on a Nvidia Jetson nano card creating a demonstrator able to learn and predict emotions in real-time. Finally, we discuss the relevance of our approach for bias mitigation in artificial intelligence, opening up perspectives towards a more ethical AI
APA, Harvard, Vancouver, ISO, and other styles
32

Zimmer, Matthieu. "Apprentissage par renforcement développemental." Thesis, Université de Lorraine, 2018. http://www.theses.fr/2018LORR0008/document.

Full text
Abstract:
L'apprentissage par renforcement permet à un agent d'apprendre un comportement qui n'a jamais été préalablement défini par l'homme. L'agent découvre l'environnement et les différentes conséquences de ses actions à travers des interactions avec celui-ci : il apprend de sa propre expérience, sans avoir de connaissances préétablies des buts ni des effets de ses actions. Cette thèse s'intéresse à la façon dont l'apprentissage profond peut aider l'apprentissage par renforcement à gérer des espaces continus et des environnements ayant de nombreux degrés de liberté dans l'optique de résoudre des problèmes plus proches de la réalité. En effet, les réseaux de neurones ont une bonne capacité de mise à l'échelle et un large pouvoir de représentation. Ils rendent possible l'approximation de fonctions sur un espace continu et permettent de s'inscrire dans une approche développementale nécessitant peu de connaissances a priori sur le domaine. Nous cherchons comment réduire l'expérience nécessaire à l'agent pour atteindre un comportement acceptable. Pour ce faire, nous avons proposé le cadre Neural Fitted Actor-Critic qui définit plusieurs algorithmes acteur-critique efficaces en données. Nous examinons par quels moyens l'agent peut exploiter pleinement les transitions générées par des comportements précédents en intégrant des données off-policy dans le cadre proposé. Finalement, nous étudions de quelle manière l'agent peut apprendre plus rapidement en tirant parti du développement de son corps, en particulier, en procédant par une augmentation progressive de la dimensionnalité de son espace sensorimoteur
Reinforcement learning allows an agent to learn a behavior that has never been previously defined by humans. The agent discovers the environment and the different consequences of its actions through its interaction: it learns from its own experience, without having pre-established knowledge of the goals or effects of its actions. This thesis tackles how deep learning can help reinforcement learning to handle continuous spaces and environments with many degrees of freedom in order to solve problems closer to reality. Indeed, neural networks have a good scalability and representativeness. They make possible to approximate functions on continuous spaces and allow a developmental approach, because they require little a priori knowledge on the domain. We seek to reduce the amount of necessary interaction of the agent to achieve acceptable behavior. To do so, we proposed the Neural Fitted Actor-Critic framework that defines several data efficient actor-critic algorithms. We examine how the agent can fully exploit the transitions generated by previous behaviors by integrating off-policy data into the proposed framework. Finally, we study how the agent can learn faster by taking advantage of the development of his body, in particular, by proceeding with a gradual increase in the dimensionality of its sensorimotor space
APA, Harvard, Vancouver, ISO, and other styles
33

Lefort, Mathieu. "Apprentissage spatial de corrélations multimodales par des mécanismes d'inspiration corticale." Phd thesis, Université Nancy II, 2012. http://tel.archives-ouvertes.fr/tel-00756687.

Full text
Abstract:
Cette thèse traite de la problématique de l'unification de différents flux d'informations modales qui peuvent provenir des senseurs d'un agent. Cette unification, inspirée des expériences psychologiques comme l'effet ventriloque, s'appuie sur la détection de corrélations, définies comme des motifs spatiaux qui apparaissent régulièrement dans les flux d'entrée. L'apprentissage de l'espace des corrélations du flux d'entrée échantillonne cet espace et généralise les échantillons appris. Cette thèse propose des principes fonctionnels pour le traitement multimodal de l'information qui ont aboutit à l'architecture connexionniste, générique, modulaire et cortico-inspirée SOMMA (Self-Organizing Maps for Multimodal Association). Dans ce modèle, le traitement de chaque modalité s'effectue au sein d'une carte corticale. L'unification multimodale de l'information est obtenue par la mise en relation réciproque de ces cartes. L'échantillonnage et la généralisation des corrélations reposent sur une auto-organisation contrainte des cartes. Ce modèle est caractérisé par un apprentissage progressif de ces propriétés fonctionnelles: les propriétés monomodales amorcent l'émergence des propriétés multimodales et, dans le même temps, l'apprentissage de certaines corrélations par chaque carte est un préalable à l'auto-organisation de ces cartes. Par ailleurs, l'utilisation d'une architecture connexionniste et d'un apprentissage continu et non supervisé fournit au modèle des propriétés de robustesse et d'adaptabilité qui sont généralement absentes des approches informatiques classiques.
APA, Harvard, Vancouver, ISO, and other styles
34

Bouker, Mohamed Ali. "Les communautés d'apprentissage professionnelles en ligne : un moyen de développement professionnel d'acteurs en éducation." Doctoral thesis, Université Laval, 2017. http://hdl.handle.net/20.500.11794/27437.

Full text
Abstract:
Ce travail porte sur les limites et les besoins en formation dans les communautés d’apprentissage professionnelles (CAPs) en ligne. Dans le cadre de ce travail, les thèmes suivants sont abordés : le fonctionnement et le développement des CAPs ; les besoins en formation dans des CAPs ; le rôle des technologies de l’information et de la communication (TIC) dans ces communautés ; les moyens technologiques utilisés dans les CAPs ; et l’impact de l’intégration de la technologie dans les CAPs. De façon spécifique, cette étude a pour but d’identifier les aspects suivants des CAPs en ligne : des acteurs qui ont procédé à l’intégration et à la promotion de ces communautés ; les besoins en formation éprouvés au sein de ces communautés ; les moyens qui assurent leur bon fonctionnement et les obstacles qui l’entravent. Notre recherche est menée par entrevues semi-structurées auprès de participants (enseignants, directions d’école, conseillers pédagogiques, formateurs) à des CAPs en ligne (N=10) et à des CAPs en face à face (N=39), et ce, dans deux provinces canadiennes : le Québec et le Nouveau-Brunswick. Dans le cadre de cette recherche, nous posons un certain nombre de questions relativement au fonctionnement de ces communautés. Qui a été à l’origine de l’implantation des TIC dans les CAPs ? Quels sont les impacts de l’utilisation des TIC dans les CAPs ? Par quels moyens les TIC sont-elles utilisées ? Comment se vit la collaboration au sein d’une CAP en ligne entre la direction, les conseillers pédagogiques, les enseignants et les formateurs ? Quels sont les rôles joués par ces acteurs en éducation et comment ces CAPs en ligne contribuent-elles à leur développement professionnel ? Quels sont les besoins en formations des participants dans ces CAPs en ligne ? Et, finalement, quelles sont les limites avec lesquelles doivent composer les membres de ces communautés qui sont susceptibles d’entraver leur bon fonctionnement et d’empêcher de combler ces besoins ? Notre cadre conceptuel est construit à partir de quatre modèles théoriques connus : le modèle de la théorie de l’apprentissage de Wenger (2005), le cycle de développement professionnel des enseignants en réseaux de Huberman (1995), le modèle d’activité humaine d'Engeström (1994) et le modèle du développement professionnel des enseignants dans une communauté virtuelle de Daele (2004). Les résultats montrent que ce sont les enseignants et les directeurs qui sont les principaux acteurs à l’origine de l’implantation des TIC dans les CAPs. Le développement des compétences en TIC facilite la collaboration entre les membres de la CAP. Ces derniers manifestent à la fois leur intérêt et leurs besoins en formation en TIC pour assurer l’amélioration de la collaboration et de la communication dans leur CAP. Ils soutiennent l’idée que l’intégration des technologies représente un avantage pour améliorer le fonctionnement des CAPs. Bien que les participants montrent que le développement des compétences en TIC joue un rôle de facilitateur dans leur travail en CAPs, ils soulignent également leurs besoins pour la formation dans ce domaine afin d’améliorer leur développement professionnel. Nos résultats montrent que le temps et l’adaptation aux nouvelles TIC représentent des obstacles majeurs au bon déroulement de la vie dans les CAPs en ligne. Dans le cadre de leur travail au sein des CAPs, nos participants font état de différents besoins. D’une part, des besoins relatifs à leur contexte professionnel : éducationnels, pédagogiques et didactiques. D’autre part, des besoins spécifiques à leur participation aux travaux au sein de la CAP : être avertis sur certains sujets, être accompagnés et avoir une formation continue tout au long de leur participation dans la CAP. Enfin, nos résultats montrent que deux obstacles importants empêchent le bon fonctionnement de ces CAPs : des problèmes financiers et le manque de disponibilité des technologies dans certains milieux.
In this study, we examined the online professional learning community (PLC) approach used to support the professional development of education stakeholders. Specifically, we sought to identify the instigators and promoters of these online PLCs, the needs expressed regarding training, the means deployed for effective outcomes, and the issues interfering with professional growth within the PLC. We conducted semi-structured interviews with teachers, principals, education consultants, and facilitators who were members of online PLCs (N = 10) and onsite PLCs (N = 39) in two Canadian provinces, namely Québec and New Brunswick. Several questions were asked during the course of this research: Who is responsible for integrating information and communication technologies (ICTs) in the PLCs? What impact do ICTs have in the PLCs and how are they deployed? How is the collaborative process experienced between principals, education consultants, teachers and training instructors in an online PLC? What are the roles of these education stakeholders and how do online PLCs contribute to their professional development? What type of training do online PLC members need? And finally, which challenges and issues experienced by PLC members interfere with proper functioning and performance? Our conceptual framework was inspired by elements from four recognized theoretical models: Wenger’s social learning theory (2005), Huberman’s professional life cycle model for networking teachers (1995), Engeström’s human activity theory (1994), and Daele’s teacher professional development model in online communities (2004). Our results show that teachers and principals were most likely to instigate ICT implementation in PLCs. The development of ICT skills facilitated collaboration between the PLC members. Indeed, the latter expressed both their interest and need for ICT training to continue improving collaboration and communication within their community, and they concurred that integrating technologies would be beneficial to the PLC’s structure and performance. In addition to agreeing that developing computer skills would help their work as a PLC, our study’s respondents also emphasized a need for this training to further their professional development. Our results show that in online PLCs. time factors and having to adapt to new ICTs represented major issues hampering the advancement of these communities. Regarding their work within the PLC, our respondents stated various needs. On one hand were the professional aspects, namely, educational, pedagogical, and didactic needs, and on the other hand were needs relative to their participation in tasks within the PLC, such as keeping informed on certain subjects, being supervised, and benefiting from continuing education throughout their time in the PLC. Finally, our results reveal two significant issues hindering performance outcomes in these PLCs: financial concerns and the lack of available technologies in certain remote area schools.
APA, Harvard, Vancouver, ISO, and other styles
35

Chollet, Antoine. "Apprentissage et mobilisation de compétences managériales des joueurs de jeux de rôle en ligne massivement multijoueurs (MMORPG)." Thesis, Montpellier, 2015. http://www.theses.fr/2015MONTD049/document.

Full text
Abstract:
Les média relatent des cas de joueurs de MMORPG recrutés sur des postes à responsabilités au regard de leurs compétences managériales acquises en jouant. Les joueurs de MMORPG développent-ils réellement des compétences managériales en jouant, et si oui, dans quelles conditions ? Pour explorer ces questions de recherche, nous fondons nos travaux sur la Théorie de l'Apprentissage Social ainsi que sur la Théorie Sociale Cognitive, toutes deux issues des recherches d'Albert Bandura. La revue de la littérature ainsi qu'une étude qualitative exploratoire (13 joueurs et anciens joueurs de MMORPG) nous amènent à proposer un modèle structurel de l'apprentissage des compétences managériales des joueurs de MMORPG. Ce modèle est testé grâce à une étude quantitative menée auprès de 4.397 individus. Deux analyses ont été réalisées. Pour la première, à visée exploratoire, permettant d'épurer les instruments de mesure, 414 questionnaires ont été validés (sur 707 reçus). Pour la seconde, à visée confirmatoire, permettant de vérifier les hypothèses, 2.628 questionnaires ont été validés (sur 3.690 reçus). Après avoir dessiné le profil des joueurs de MMORPG, nous montrons qu'il existe des phénomènes d'apprentissage de compétences managériales perçues par les joueurs, développées puis mobilisées dans les MMORPG, selon certaines conditions liées à l'environnement du jeu ainsi qu'à l'état intérieur du joueur. Le modèle proposé est ainsi validé. Les conclusions de cette recherche offrent des perspectives pour les joueurs ainsi que les organisations dans divers domaines, tels que le recrutement ou la formation, en tirant profit du potentiel des MMORPG. Des études longitudinales mériteraient d'être menées pour explorer l'évolution de l'apprentissage des joueurs de MMORPG et confirmer nos résultats
Media relate instances where MMORPG players are being recruited to responsibility positions, thanks to their managerial skills, acquired through playing. Do MMORPG players really develop such skills though playing, and if so, under what conditions? To explore these research questions, we're basing our works on the Social Learning Theory as well as the Social Cognitive Theory, both resulting from of Albert Bandura's researches. Literature reviewing as well as an exploratory qualitative study (13 players and older MMORPG players) led us to propose a managerial skill learning structural model of the MMORPG player. Two analyses were realized.The first one, in an exploratory aim, allowing to refine measuring tools, saw 414 questionnaires being validated (on 707 collected). The second one, with a confirmatory aim, allowing to verify hypothesis, saw 2 628 questionnaires being validated (on 3 690 collected). Once we've drawn the MMORPG player's profile, we're showing that there are managerial skill learning phenomena perceived by the players that are developed then mastered in MMORPG, under specific conditions linked to the game's environment, as well as the internal state of the player. The proposed model is thus validated.Conclusions of this research offer possibilities for players as well as organizations in various domains, such as recruitment or training, by benefiting MMORPG's potential. Longitudinal studies would deserve to be done in order to explore the MMORPG's player learning evolution, and confirm our results
APA, Harvard, Vancouver, ISO, and other styles
36

Caraguel, Valérie. "Appropriation des technologies et apprentissage dans un environnement en e-learning : le rôle du tutorat en ligne." Thesis, Aix-Marseille, 2013. http://www.theses.fr/2013AIXM1106/document.

Full text
Abstract:
Le projet de la recherche est de participer à l’intelligibilité des dispositifs d’interactions tuteur-apprenant afin de soutenir les processus d’appropriation de la technologie et d’apprentissage dans un contexte d’e-learning. Outre l’e-learning, l’analyse de la littérature se focalise donc sur trois champs théoriques : l’apprentissage, l’appropriation et le tutorat en ligne. Ceci nous amène à nous interroger sur les modalités d’interventions tutorales et leurs évolutions ainsi que sur la médiatisation du tuteur dans l’apprentissage des apprenants. Une étude de cas, réalisée dans une formation d’Aix-Marseille Université, nous permet d’identifier les éléments de réponses aux questionnements précédents. Les résultats montrent que le tuteur est principalement perçu dans un rôle d’accompagnement, et qu’il constitue le lien social entre le dispositif technologique et les apprenants. Au-delà de ces activités, nous avons relevé que le tuteur peut aussi occuper deux autres fonctions tutorales : celle de knowledge manager et celle de facilitateur de tutorat entre pairs. Nous suggérons ainsi qu’un objectif des dispositifs d’e-learning est de mettre en place un système tutoral laissant émerger et favorisant un certain degré d’auto-organisation entre apprenants. Notre recherche montre également que l’objectif de « rendre la technologie transparente » est atteint lorsque l’appropriation des technologies par les apprenants est favorisée dès la phase amont du processus d’enseignement. Pour conclure, alors qu’on craignait que l’e-learning ne se substitue aux enseignants, nous relevons que le rôle de ces derniers apparaît en évolution, laissant émerger celui du tuteur !
The purpose of this research is to contribute to a deeper understanding of tutor-learner interactions within the framework of a supportive process of appropriation of technology and learning in the context of e-learning. In addition to e-learning, the literature review focuses on three theoretical fields: learning, appropriation, and e-tutoring. This leads us to question the modes of e-tutoring and their evolution; and the media coverage of the tutor in the learners’ process of learning. A case study, performed at Aix Marseille University, enables us to identify elements of responses to previous questions. The results show that the tutor is seen primarily in a supporting role, and that he may be the social link between the platform and the learners. Beyond these activities, we found that the e-tutors may also have two other e-tutoring functions: knowledge manager and facilitator of peer-tutoring. This allows us ultimately to suggest that a goal of e-learning systems is to set up an e-tutoring system, while leaving the emergence and fostering of self-organization to the learners themselves. Our research also shows that the goal of "making technology transparent" is reached when the acquisition of technology by students is initiated and promoted from the upstream phases of the teaching process. Finally, while there was a concern that e-learning replaces the need for teachers, we found that the role of the latter is reinforced, although still evolving: in other words, the role of the teacher changes; the e-tutor emerges! They become the critical link between electronics and learning, between " e " and " learning "!
APA, Harvard, Vancouver, ISO, and other styles
37

Caraguel, Valérie. "Appropriation des technologies et apprentissage dans un environnement en e-learning : le rôle du tutorat en ligne." Electronic Thesis or Diss., Aix-Marseille, 2013. http://www.theses.fr/2013AIXM1106.

Full text
Abstract:
Le projet de la recherche est de participer à l’intelligibilité des dispositifs d’interactions tuteur-apprenant afin de soutenir les processus d’appropriation de la technologie et d’apprentissage dans un contexte d’e-learning. Outre l’e-learning, l’analyse de la littérature se focalise donc sur trois champs théoriques : l’apprentissage, l’appropriation et le tutorat en ligne. Ceci nous amène à nous interroger sur les modalités d’interventions tutorales et leurs évolutions ainsi que sur la médiatisation du tuteur dans l’apprentissage des apprenants. Une étude de cas, réalisée dans une formation d’Aix-Marseille Université, nous permet d’identifier les éléments de réponses aux questionnements précédents. Les résultats montrent que le tuteur est principalement perçu dans un rôle d’accompagnement, et qu’il constitue le lien social entre le dispositif technologique et les apprenants. Au-delà de ces activités, nous avons relevé que le tuteur peut aussi occuper deux autres fonctions tutorales : celle de knowledge manager et celle de facilitateur de tutorat entre pairs. Nous suggérons ainsi qu’un objectif des dispositifs d’e-learning est de mettre en place un système tutoral laissant émerger et favorisant un certain degré d’auto-organisation entre apprenants. Notre recherche montre également que l’objectif de « rendre la technologie transparente » est atteint lorsque l’appropriation des technologies par les apprenants est favorisée dès la phase amont du processus d’enseignement. Pour conclure, alors qu’on craignait que l’e-learning ne se substitue aux enseignants, nous relevons que le rôle de ces derniers apparaît en évolution, laissant émerger celui du tuteur !
The purpose of this research is to contribute to a deeper understanding of tutor-learner interactions within the framework of a supportive process of appropriation of technology and learning in the context of e-learning. In addition to e-learning, the literature review focuses on three theoretical fields: learning, appropriation, and e-tutoring. This leads us to question the modes of e-tutoring and their evolution; and the media coverage of the tutor in the learners’ process of learning. A case study, performed at Aix Marseille University, enables us to identify elements of responses to previous questions. The results show that the tutor is seen primarily in a supporting role, and that he may be the social link between the platform and the learners. Beyond these activities, we found that the e-tutors may also have two other e-tutoring functions: knowledge manager and facilitator of peer-tutoring. This allows us ultimately to suggest that a goal of e-learning systems is to set up an e-tutoring system, while leaving the emergence and fostering of self-organization to the learners themselves. Our research also shows that the goal of "making technology transparent" is reached when the acquisition of technology by students is initiated and promoted from the upstream phases of the teaching process. Finally, while there was a concern that e-learning replaces the need for teachers, we found that the role of the latter is reinforced, although still evolving: in other words, the role of the teacher changes; the e-tutor emerges! They become the critical link between electronics and learning, between " e " and " learning "!
APA, Harvard, Vancouver, ISO, and other styles
38

Belley, Sophie. "Conception de systèmes d'analyse et de contrôle en ligne pour une unité de production de solution d'enrobage en continu pour comprimés pharmaceutiques." Mémoire, Université de Sherbrooke, 2014. http://hdl.handle.net/11143/5941.

Full text
Abstract:
Depuis que la FDA a publié, en 2004, l’initiative visant à promouvoir le développement et l’implantation de technologies d’analyses de procédé (PATs), de nombreux groupes de recherche ont prouvé qu’un suivi et un contrôle adéquat des procédés rendait possible la relâche des produits en temps réel, ouvrant ainsi la voie à la production en mode continu. Dans ce contexte, cette étude présente la conception de systèmes d’analyse et de contrôle en ligne visant à assurer, en temps réel, la qualité d’un produit pharmaceutique intermédiaire fabriqué en mode continu. Le produit visé est une solution d’enrobage pour comprimés pharmaceutiques, utilisée à des fins esthétiques et afin de protéger le comprimé de l’environnement, laquelle est préparée par mélange d’eau et de divers composants disponibles commercialement sous forme d’un pré-mélange de poudre. Les attributs critiques de qualités (CQAs) de la solution ont d’abord été identifiés grâce aux connaissances du produit et du procédé. Par la suite, un certain nombre d’outils d’analyse de procédé ont été évalués pour leur capacité à analyser et à suivre ces attributs en ligne. Les outils sélectionnés ont ensuite été intégrés à l’unité pilote de préparation de solution d’enrobage en continue (UPSEC), laquelle a été étudiée afin de déterminer les paramètres critiques du procédé (CPPs). Des relations mathématiques établies entre les CQAs et les CPPs sont au coeur du système de contrôle en ligne qui sera implanté sur l’unité pilote. Au final, cette étude devrait fournir une preuve de concept, pour l’industrie pharmaceutique, d’un système d’analyse et de contrôle en ligne de la qualité pour un produit ayant été préparé en mode continu.
APA, Harvard, Vancouver, ISO, and other styles
39

Duneau, Laurent. "Etude et réalisation d'un système adaptatif pour la reconnaissance en ligne de mots manuscrits." Compiègne, 1994. http://www.theses.fr/1994COMP7665.

Full text
Abstract:
L'utilisation du stylo comme interface homme-machine nécessite la mise au point de systèmes de reconnaissance performants. De plus, pour améliorer le confort de l'utilisateur, et donc, sa productivité, il est très souhaitable de pouvoir identifier des mots manuscrits cursifs, dans lesquels les lettres ne sont pas obligatoirement séparées les unes des autres. Nous proposons ici un système qui effectue simultanément reconnaissance et segmentation en lettres, pour un vocabulaire prédéfini de plusieurs dizaines de milliers de mots. La solution envisagée repose sur un ensemble de prototypes de lettres, ainsi que sur une recherche heuristique, dirigée par le lexique. La principale originalité de ce système est sa grande capacité d'apprentissage. Celui-ci peut en effet apprendre automatiquement l'écriture d'un utilisateur donné, directement à partir d'un échantillon de quelques dizaines à quelques centaines de mots manuscrits. Cette opération est fondée sur un module qui permet de segmenter en lettres un ensemble de mots étiquettés, sans intervention humaine. En suivant le même principe, notre système est également capable de s'adapter à une nouvelle écriture au cours de son utilisation. Cette adaptation continue permet d'obtenir des taux de reconnaissance supérieurs à 95%, pour un vocabulaire de près de 25000 mots.
APA, Harvard, Vancouver, ISO, and other styles
40

Zimmer, Matthieu. "Apprentissage par renforcement développemental." Electronic Thesis or Diss., Université de Lorraine, 2018. http://www.theses.fr/2018LORR0008.

Full text
Abstract:
L'apprentissage par renforcement permet à un agent d'apprendre un comportement qui n'a jamais été préalablement défini par l'homme. L'agent découvre l'environnement et les différentes conséquences de ses actions à travers des interactions avec celui-ci : il apprend de sa propre expérience, sans avoir de connaissances préétablies des buts ni des effets de ses actions. Cette thèse s'intéresse à la façon dont l'apprentissage profond peut aider l'apprentissage par renforcement à gérer des espaces continus et des environnements ayant de nombreux degrés de liberté dans l'optique de résoudre des problèmes plus proches de la réalité. En effet, les réseaux de neurones ont une bonne capacité de mise à l'échelle et un large pouvoir de représentation. Ils rendent possible l'approximation de fonctions sur un espace continu et permettent de s'inscrire dans une approche développementale nécessitant peu de connaissances a priori sur le domaine. Nous cherchons comment réduire l'expérience nécessaire à l'agent pour atteindre un comportement acceptable. Pour ce faire, nous avons proposé le cadre Neural Fitted Actor-Critic qui définit plusieurs algorithmes acteur-critique efficaces en données. Nous examinons par quels moyens l'agent peut exploiter pleinement les transitions générées par des comportements précédents en intégrant des données off-policy dans le cadre proposé. Finalement, nous étudions de quelle manière l'agent peut apprendre plus rapidement en tirant parti du développement de son corps, en particulier, en procédant par une augmentation progressive de la dimensionnalité de son espace sensorimoteur
Reinforcement learning allows an agent to learn a behavior that has never been previously defined by humans. The agent discovers the environment and the different consequences of its actions through its interaction: it learns from its own experience, without having pre-established knowledge of the goals or effects of its actions. This thesis tackles how deep learning can help reinforcement learning to handle continuous spaces and environments with many degrees of freedom in order to solve problems closer to reality. Indeed, neural networks have a good scalability and representativeness. They make possible to approximate functions on continuous spaces and allow a developmental approach, because they require little a priori knowledge on the domain. We seek to reduce the amount of necessary interaction of the agent to achieve acceptable behavior. To do so, we proposed the Neural Fitted Actor-Critic framework that defines several data efficient actor-critic algorithms. We examine how the agent can fully exploit the transitions generated by previous behaviors by integrating off-policy data into the proposed framework. Finally, we study how the agent can learn faster by taking advantage of the development of his body, in particular, by proceeding with a gradual increase in the dimensionality of its sensorimotor space
APA, Harvard, Vancouver, ISO, and other styles
41

Portet, François. "Pilotage d'algorithmes pour la reconnaissance en ligne d'arythmies cardiaques." Phd thesis, Université Rennes 1, 2005. http://tel.archives-ouvertes.fr/tel-00011942.

Full text
Abstract:
L'objectif de cette thèse est la réalisation du système de monitorage cardiaque intelligent IP-Calicot capable, grâce à un module de pilotage d'algorithmes, d'utiliser les informations du contexte courant pour modifier sa chaîne de traitements afin d'obtenir un diagnostic médical fiable même en milieu bruité. À partir d'un électrocardiogramme (ECG), le système extrait en ligne, par traitement du signal, les informations qui vont permettre d'établir un diagnostic d'arythmie cardiaque modélisé par un réseau temporel (chronique). En utilisant le contexte courant, constitué du bruit de ligne et du diagnostic médical, le module de pilotage agit dynamiquement à trois niveaux~: il sélectionne et paramètre les algorithmes de traitement du signal, il choisit les éléments à extraire du signal, décrivant ainsi l'ECG dans un langage plus ou moins précis, et sélectionne le langage de description à utiliser pour établir le diagnostic en ligne. Le pilote est représenté par un système expert qui agit sur la chaîne de traitements grâce à des règles de pilotage acquises par expertises et déduites d'études statistiques. Le système a été validé sur des ECG bruités typiques de situations cliniques. Les résultats démontrent l'intérêt et la faisabilité du pilotage proposé.
APA, Harvard, Vancouver, ISO, and other styles
42

Marcastel, Alexandre. "Allocation de puissance en ligne dans un réseau IoT dynamique et non-prédictible." Thesis, Cergy-Pontoise, 2019. http://www.theses.fr/2019CERG0995/document.

Full text
Abstract:
L’Internet des Objets (IoT) est envisagé pour interconnecter des objets communicants et autonomes au sein du même réseau, qui peut être le réseau Internet ou un réseau de communication sans fil. Les objets autonomes qui composent les réseaux IoT possèdent des caractéristiques très différentes, que ce soit en terme d’application, de connectivité, de puissance de calcul, de mobilité ou encore de consommation de puissance. Le fait que tant d’objets hétérogènes partagent un même réseau soulève de nombreux défis tels que : l’identification des objets, l’efficacité énergétique, le contrôle des interférences du réseau, la latence ou encore la fiabilité des communications. La densification du réseau couplée à la limitation des ressources spectrales (partagées entre les objets) et à l’efficacité énergétique obligent les objets à optimiser l’utilisation des ressources fréquentielles et de puissance de transmission. De plus, la mobilité des objets au sein du réseau ainsi que la grande variabilité de leur comportement changent la dynamique du réseau qui devient imprévisible. Dans ce contexte, il devient difficile pour les objets d’utiliser des algorithmes d’allocation de ressources classiques, qui se basent sur une connaissance parfaite ou statistique du réseau. Afin de transmettre de manière efficace, il est impératif de développer de nouveaux algorithmes d’allocation de ressources qui sont en mesure de s’adapter aux évolutions du réseau. Pour cela, nous allons utiliser des outils d’optimisation en ligne et des techniques d’apprentissage. Dans ce cadre nous allons exploiter la notion du regret qui permet de comparer l’efficacité d’une allocation de puissance dynamique à la meilleure allocation de puissance fixe calculée à posteriori. Nous allons aussi utiliser la notion de non-regret qui garantit que l’allocation de puissance dynamique donne des résultats asymptotiquement optimaux . Dans cette thèse, nous nous sommes concentrés sur le problème de minimisation de puissance sous contrainte de débit. Ce type de problème permet de garantir une certaine efficacité énergétique tout en assurant une qualité de service minimale des communications. De plus, nous considérons des réseaux de type IoT et ne faisons donc aucune hypothèse quant aux évolutions du réseau. Un des objectifs majeurs de cette thèse est la réduction de la quantité d’information nécessaire à la détermination de l’allocation de puissance dynamique. Pour résoudre ce problème, nous avons proposé des algorithmes inspirés du problème du bandit manchot, problème classique de l’apprentissage statistique. Nous avons montré que ces algorithmes sont efficaces en terme du regret lorsque l’objet a accès à un vecteur, le gradient ou l’estimateur non-biaisé du gradient, comme feedback d’information. Afin de réduire d’avantage la quantité d’information reçue par l’objet, nous avons proposé une méthode de construction d’un estimateur du gradient basé uniquement sur une information scalaire. En utilisant cet estimateur nous avons présenté un algorithme efficace d’allocation de puissance
One of the key challenges in Internet of Things (IoT) networks is to connect numerous, heterogeneous andautonomous devices. These devices have different types of characteristics in terms of: application, computational power, connectivity, mobility or power consumption. These characteristics give rise to challenges concerning resource allocation such as: a) these devices operate in a highly dynamic and unpredictable environments; b) the lack of sufficient information at the device end; c) the interference control due to the large number of devices in the network. The fact that the network is highly dynamic and unpredictable implies that existing solutions for resource allocation are no longer relevant because classical solutions require a perfect or statistical knowledge of the network. To address these issues, we use tools from online optimization and machine learning. In the online optimization framework, the device only needs to have strictly causal information to define its online policy. In order to evaluate the performance of a given online policy, the most commonly used notion is that of the regret, which compares its performance in terms of loss with a benchmark policy, i.e., the best fixed strategy computed in hindsight. Otherwise stated, the regret measures the performance gap between an online policy and the best mean optimal solution over a fixed horizon. In this thesis, we focus on an online power minimization problem under rate constraints in a dynamic IoT network. To address this issue, we propose a regret-based formulation that accounts for arbitrary network dynamics, using techniques used to solve the multi-armed bandit problem. This allows us to derive an online power allocation policy which is provably capable of adapting to such changes, while relying solely on strictly causal feedback. In so doing, we identify an important tradeoff between the amount of feedback available at the transmitter side and the resulting system performance. We first study the case in which the device has access to a vector, either the gradient or an unbiased estimated of the gradient, as information feedback. To limit the feedback exchange in the network our goal is to reduce it as mush as possible. Therefore, we study the case in which the device has access to only a loss-based information (scalar feedback). In this case, we propose a second online algorithm to determine an efficient and adaptative power allocation policy
APA, Harvard, Vancouver, ISO, and other styles
43

Kers, Hagberg Anna. "À la recherche des facteurs de réussite au lycée : Apprentissage de langues en ligne au lycée - une étude." Thesis, Högskolan Dalarna, Franska, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:du-13851.

Full text
Abstract:
The aim of this academic essay is to research into Distance teaching in language education at a comprehensive upper high school in a region in Sweden. Qualitative and quantitative studies are combined by using evaluation and interview methods with students who have completed their studies and with those who have decided to terminate them 2012/2013. The goals are to identify success factors and elements in devising and compiling on-line language courses thus eliminating failure by students unable / choosing not to complete courses. Present Distance teaching is mostly applicable for the already motivated students and research shows that measures can be taken to increase the percentage of successful and satisfied students.
APA, Harvard, Vancouver, ISO, and other styles
44

Baudoin, Emmanuel. "Facteurs de suivi et apprentissages individuels des salariés dans des parcours e-learning : quatre études de cas chez un constructeur automobile." Paris 9, 2010. https://portail.bu.dauphine.fr/fileviewer/index.php?doc=2010PA090057.

Full text
APA, Harvard, Vancouver, ISO, and other styles
45

Darwiche, Domingues Omar. "Exploration en apprentissage par renforcement : au-delà des espaces d'états finis." Thesis, Université de Lille (2022-....), 2022. http://www.theses.fr/2022ULILB002.

Full text
Abstract:
L'apprentissage par renforcement (reinforcement learning, RL) est un paradigme de l'apprentissage automatique qui nous permet de concevoir des algorithmes qui apprennent à prendre des décisions et à interagir avec le monde. Les algorithmes de RL peuvent être classés comme hors ligne ou en ligne. Dans le cas hors ligne, l'algorithme dispose d'un ensemble de données fixe, avec lequel il doit calculer une bonne stratégie de prise de décision. Dans le cas en ligne, l'agent doit collecter efficacement des données par lui-même, en interagissant avec l'environnement : c'est le problème que l'on appelle exploration en apprentissage par renforcement. Cette thèse présente des contributions théoriques et pratiques sur le RL en ligne. Nous étudions la performance dans le pire des cas des algorithmes de RL dans des environnements finis, c'est-à-dire, ceux qui peuvent être modélisés avec un nombre fini d'états, et où l'ensemble des actions qui peuvent être prises par un agent est aussi fini. Cette performance se dégrade à mesure que le nombre d'états augmente, alors qu'en pratique, l'espace d'états peut être arbitrairement grand ou continu. Pour résoudre ce problème, nous proposons des algorithmes à noyaux qui peuvent être implémentés pour des espaces d'états généraux, et pour lesquels nous proposons des résultats théoriques sous des hypothèses faibles sur l'environnement. Ces algorithmes reposent sur une fonction noyau qui mesure la similarité entre différents états, qui peut être définie sur des espaces d'état arbitraires, y compris des ensembles discrets et des espaces euclidiens, par exemple. De plus, nous montrons que nos algorithmes à noyaux sont capables d'apprendre dans des environnements non stationnaires en utilisant des fonctions noyau dépendantes du temps, et nous proposons et analysons des versions approximatives de nos méthodes pour réduire leur complexité de calcul. Finalement, nous introduisons une autre approximation de nos méthodes à noyaux, qui peut être implémentée avec des algorithmes d'apprentissage par renforcement profond et intégrer de différentes méthodes d'apprentissage de représentation pour définir un noyau
Reinforcement learning (RL) is a powerful machine learning framework to design algorithms that learn to make decisions and to interact with the world. Algorithms for RL can be classified as offline or online. In the offline case, the algorithm is given a fixed dataset, based on which it needs to compute a good decision-making strategy. In the online case, an agent needs to efficiently collect data by itself, by interacting with the environment: that is the problem of exploration in reinforcement learning. This thesis presents theoretical and practical contributions to online RL. We investigate the worst-case performance of online RL algorithms in finite environments, that is, those that can be modeled with a finite amount of states, and where the set of actions that can be taken by an agent is also finite. Such performance degrades as the number of states increases, whereas in real-world applications the state set can be arbitrarily large or continuous. To tackle this issue, we propose kernel-based algorithms for exploration that can be implemented for general state spaces, and for which we provide theoretical results under weak assumptions on the environment. Those algorithms rely on a kernel function that measures the similarity between different states, which can be defined on arbitrary state-spaces, including discrete sets and Euclidean spaces, for instance. Additionally, we show that our kernel-based algorithms are able to handle non-stationary environments by using time-dependent kernel functions, and we propose and analyze approximate versions of our methods to reduce their computational complexity. Finally, we introduce a scalable approximation of our kernel-based methods, that can be implemented with deep reinforcement learning and integrate different representation learning methods to define a kernel function
APA, Harvard, Vancouver, ISO, and other styles
46

Zaninotti, Marion. "Planification en ligne de la stratégie de navigation pour un drone autonome en environnement urbain." Electronic Thesis or Diss., Toulouse, ISAE, 2024. http://www.theses.fr/2024ESAE0063.

Full text
Abstract:
Les drones peuvent aujourd'hui être utilisés pour diverses applications, notamment la robotique de service, l'exploration et la surveillance d'environnements, l'agriculture de précision, ainsi que les missions de recherche et sauvetage. Le besoin de navigation autonome pour les drones devient donc de plus en plus important.Un grand nombre de drones utilisent le GPS (Global Positioning System) pour se localiser.Cependant, en environnement urbain, la position mesurée peut être imprécise, voire indisponible, ce qui peut compromettre la sécurité d'une mission.Dans ce contexte, le problème de navigation efficace et sûre pour un drone autonome, sous une disponibilité du GNSS incertaine, a été modélisé comme un POMDP (Partially Observable Markov Decision Process).Toutefois, la planification dans un modèle aussi complexe souffre d'un coût de calcul élevé et atteint des résultats insuffisants sous des contraintes de temps-réel.Récemment, des recherches se sont concentrées sur l'intégration d'un apprentissage hors ligne afin de guider la planification en ligne.Inspirés par la modélisation de l'état de l'art CAMP (Context-specific Abstract Markov decision Process), nous proposons une méthode consistant à apprendre une contrainte à imposer lors de la planification en ligne de ce problème. Imposer cette contrainte permet de réaliser une abstraction de l'espace d'état, en limitant la navigation du drone à l'intérieur d'un couloir de l'environnement.Nous généralisons ensuite cette méthode à l'ensemble des problèmes de navigation SSP (Stochastic Shortest Path) avec dead ends. Le poids attribué à la sécurité par rapport à l'efficacité du chemin est appris, puis un chemin global est planifié en fonction de ce poids, et la contrainte est déduite de ce chemin global. La résolution repose alors sur une hybridation entre la planification de chemin global et la planification de chemin en ligne.Puis, nous appliquons cette méthode généralisée au problème FrozenLake, dans lequel un agent cherche un chemin à travers un lac gelé menant à un but tout en évitant les trous, et au problème initial de navigation de drone.Les conclusions de l'ensemble des expérimentations démontrent que l'utilisation d'une telle méthode peut améliorer la qualité des solutions obtenues par une planification en ligne, en particulier pour des environnements et missions de navigation complexes
UAVs can now be used for various applications, including service robotics, exploration and monitoring of environments, precision agriculture, as well as search and rescue missions. The need for autonomous navigation for UAVs is therefore becoming increasingly important. Many UAVs use GPS (Global Positioning System) for localization. However, in urban environments, the measured position can be inaccurate or even unavailable, which can compromise mission safety.In this context, the problem of efficient and safe navigation for an autonomous UAV, under uncertain GNSS availability, has been modeled as a POMDP (Partially Observable Markov Decision Process). Nevertheless, planning in such a complex model suffers from high computational cost and yields insufficient results under real-time constraints.Recently, research has focused on integrating offline learning to guide online planning. Inspired by the state-of-the-art CAMP (Context-specific Abstract Markov Decision Process) modeling, we propose a method that involves learning a constraint to be imposed during online planning for this problem. Imposing this constraint allows for an abstraction of the state space by restricting the UAV's navigation to a corridor within the environment.We then generalize this method to all SSP (Stochastic Shortest Path) problems with dead ends. The weight assigned to safety versus path efficiency is learned, a global path is planned based on this weight, and the constraint is derived from this global path. The resolution thus relies on a hybrid approach combining global path planning and online path planning.Afterward, we apply this generalized method to the FrozenLake problem, where an agent seeks a path across a frozen lake to reach a goal while avoiding holes, and to the initial UAV navigation problem. The results of all the experiments demonstrate that using such a method can improve the quality of solutions obtained through online planning, particularly for complex navigation environments and missions
APA, Harvard, Vancouver, ISO, and other styles
47

Mckim, Kerrie. "Sites Internet : approches par les tâches et apprentissage du lexique en langue étrangère." Grenoble, 2010. http://www.theses.fr/2010GRENL001.

Full text
Abstract:
Cette thèse s'inscrit dans les domaines des Recherches en Acquisition des Langues et de l'Apprentissage des Langues Assisté par Ordinateur. Elle s'intéresse en particulier à l'intégration des sites Internet en cours de langue seconde ou étrangère. La problématique part du constat que les cours de langue utilisent les sites Internet sans avoir étudié l'impact de ceux-ci sur l'acquisition. Le terrain d'étude pour cette recherche est un cours universitaire (aux Etats-Unis) de pratique de la langue, avec les apprenants en français langue étrangère de niveaux faux—débutant /intermédiaire. Le dispositif en place pour ce cours est composé d'une part de la consultation de sites Internet hors cours et d'autre part de la réalisation de tâches communicatives en présentiel. Cette analyse a pour but d'étudier le lexique repris depuis les sites Internet et utilisé par les apprenants Elle présente en premier lieu les tâches communicatives effectuées par les apprenants ainsi que les sites Internet utilisés pour la réalisation des tâches. En deuxième lieu, lors des chapitres d’analyse, le lexique utilisé par les apprenants est étudié et comparé avec le lexique présenté sur les sites
This dissertation lies within the fields of Second Language Acquisition and Computer-Assisted Language Learning integrating a task-based learning approach while focusing on lexical acquisition. This study was developed following the observation that websites are frequently used in the foreign language class yet little research has been done to examine the impact that the use of l websites has on the students’ acquisition of the language. The purpose of this research is to examine the impact of the websites on lexical learning in the foreign language classroom. The participants in this study are university students enrolled in a conversational language class, Their language level range from advanced beginners to advanced intermediate learners. Websites are integrated into the course curriculum through the use of Blackboard (a course management system) and studied outside of class to prepare for in class communicative tasks. The study presents a description of the communicative tasks carried out by the students as well as the Internet websites used in the execution of the communicative tasks. Comparisons are then made between the language produced by the learners during the tasks and the lexical items present on the websites
APA, Harvard, Vancouver, ISO, and other styles
48

Al, Hajj Mohamad Rami. "Reconnaissance hors ligne de mots manuscrits cursifs par l'utilisation de systèmes hybrides et de techniques d'apprentissage automatique." Paris, ENST, 2007. http://www.theses.fr/2007ENST0020.

Full text
Abstract:
La reconnaissance automatique hors ligne des mots écrits permet d'améliorer l'interaction entre l'homme et la machine dans beaucoup d'applications notamment la bureautique et les tâches de traitement automatique de documents telles que le tri automatique du courrier, l'enregistrement et la vérification des chèques bancaires. La reconnaissance hors ligne des mots manuscrits cursifs, tels que ceux écrits en arabe, reste toujours un problème ouvert. Les difficultés inhérentes à la reconnaissance sont la normalisation de l'écriture, la segmentation des mots en éléments de base ainsi que la modélisation de ces éléments. Concevoir un système pour la reconnaissance automatique hors ligne des mots manuscrits est l'objectif des travaux de recherche de cette thèse. L'approche proposée est de type analytique, sans segmentation explicite des mots en ses caractères constituants, et est basée sur une modélisation stochastique de type MMC (Modèles de Markov Cachés). La méthode adoptée est à deux étapes : une étape de reconnaissance dans laquelle différents types de caractéristiques sont examinés, et une étape pour la combinaison des classifieurs en post-traitement dans laquelle différentes stratégies de combinaison sont appliquées. Les classifieurs combinés en post-traitement prennent en considération les inclinaisons, les positions erronées des marques diacritiques et les chevauchements pouvant exister dans l'écriture manuscrite. Le système de référence basé sur la méthode proposée a montré de trés bonnes performances à la compétition organisée à ICDAR 05, où des systèmes à l'état de l'art ont été comparés et examinés sur la base de référence IFN/ENIT
The automatic offline recognition of handwritten words improves human-machine interaction. It is already used in many business office applications dealing with the automatic processing of documents such as automatic post sorting, and the verification and recognition of bank check amounts. The off line recognition of cursive handwritten words remains an open problem due to difficulties such as :handwriting normalization, word segmentation into compound components and the modeling of these components. The main objective of this thesis, is to propose, design, and implement a system for the automatic offline recognition of Arabic handwritten words. The proposed approach is analytical without explicit segmentation of words into compound characters, and it is based on the stochastic HMM approach (Hidden Markov models). The method is composed of two stages : a recognition stage based on different features, and a combination stage of three HMM-based classifiers. Each individual HMM classifier uses a sliding window with a specific inclination. Different combining strategies are tested, among them the Sum rule, the Majority Vote rule and the Borda Count rule. The best combination strategy consists of using a neural network-based combining classifier. The combination of these classifiers can better cope with the writing inclination, the erroneous positions of diacritical marks and points, and the overlapping of consecutive characters in handwritten words. The reference system based on the proposed method has shown best performance at the competition organized at ICDAR 2005, where a set of state-of art systems were compared and tested on the IFN/ENIT benchmark database
APA, Harvard, Vancouver, ISO, and other styles
49

Péret, Laurent. "Recherche en ligne pour les Processus Décisionnels de Markov : application à la maintenance d'une constellation de satellites." Phd thesis, Toulouse, INPT, 2004. https://hal.science/tel-04603802.

Full text
Abstract:
La résolution de Processus de Markov de grande dimension est habituellement basée sur le calcul hors ligne d'une approximation de la fonction de valeur optimale et sur son exploitation en ligne pour définir une politique a priori. Toutefois, quand l'espace d'états est très vaste et qu'aucune représentation structurée efficace n'est reconnue, le calcul d'une bonne approximation de la fonction de valeur optimale s'avère souvent être une tâche difficile. Nous proposons ici une approche alternative reposant sur la simulation stochastique du processus décisionnel depuis chaque état courant sur un certain horizon de raisonnement. Cette approche conduit à la définition en ligne d'une politique stochastique en remplacement de la politique a prioi traditionnelle. Nous proposons en particulier deux algorithmes pour contrôler l'allocation en ligne des simulations. Notre démarche a été validée sur une application proposée par le Centre National d'Etudes Spatiales concernant la maintenance d'une constellation de 32 satellites en orbite basse. Les actions à entreprendre définissent la préparation au sol de nouveaux satellites puis leur injection en orbite. L'objectif est de pallier efficacement les pannes affectant les satellites, qui, en raison de l'hostilité du milieu spatial, sont relativement fréquentes. Ce problème nous a conduit à mettre en oeuvre diverses techniques à base de simulations pour optimiser les politiques de maintenance. Les plus performantes de ces méthodes, combinant optimisation hors ligne et recherche en ligne, ont permis de diminuer les coûts simulés de maintenance de 26%.
APA, Harvard, Vancouver, ISO, and other styles
50

Cruz, José Marcio Martins da. "Contribution au classement statistique mutualisé de messages électroniques (spam)." Paris, ENMP, 2011. https://pastel.archives-ouvertes.fr/pastel-00637173.

Full text
Abstract:
Depuis la fin des années 90, les différentes méthodes issues de l'apprentissage artificiel ont été étudiées et appliquées au problème de classement de messages électroniques (filtrage de spam), avec des résultats très bons, mais pas parfaits. Il a toujours été considéré que ces méthodes étaient adaptées aux solutions de filtrage orientées vers un seul destinataire et non pas au classement des messages d'une communauté entière. Dans cette thèse notre démarche a été, d'abord, de chercher à mieux comprendre les caractéristiques des données manipulées, à l'aide de corpus réels de messages, avant de proposer des nouveaux algorithmes. Puis, nous avons utilisé un classificateur à régression logistique avec de l'apprentissage actif en ligne - pour démontrer empiriquement qu'avec un algorithme simple et une configuration d'apprentissage mieux adaptée au contexte réel de classement, on peut obtenir des résultats aussi bons que ceux que l'on obtient avec des algorithmes plus complexes. Nous avons aussi démontré, avec des ensembles de messages d'un petit groupe d'utilisateurs, que la perte d'efficacité peut ne pas être significative dans un contexte de classement mutualisé
Since the 90's, different machine learning methods were investigated and applied to the email classification problem (spam filtering), with very good but not perfect results. It was always considered that these methods are well adapted to filter messages to a single user and not filter to messages of a large set of users, like a community. Our approach was, at first, look for a better understanding of handled data, with the help of a corpus of real messages, before studying new algorithms. With the help of a logistic regression classifier with online active learning, we could show, empirically, that with a simple classification algorithm coupled with a learning strategy well adapted to the real context it's possible to get results which are as good as those we can get with more complex algorithms. We also show, empirically, with the help of messages from a small group of users, that the efficiency loss is not very high when the classifier is shared by a group of users
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography