Rozprawy doktorskie na temat „Apprentissage à partir de peu d'exemples”

Kliknij ten link, aby zobaczyć inne rodzaje publikacji na ten temat: Apprentissage à partir de peu d'exemples.

Utwórz poprawne odniesienie w stylach APA, MLA, Chicago, Harvard i wielu innych

Wybierz rodzaj źródła:

Sprawdź 17 najlepszych rozpraw doktorskich naukowych na temat „Apprentissage à partir de peu d'exemples”.

Przycisk „Dodaj do bibliografii” jest dostępny obok każdej pracy w bibliografii. Użyj go – a my automatycznie utworzymy odniesienie bibliograficzne do wybranej pracy w stylu cytowania, którego potrzebujesz: APA, MLA, Harvard, Chicago, Vancouver itp.

Możesz również pobrać pełny tekst publikacji naukowej w formacie „.pdf” i przeczytać adnotację do pracy online, jeśli odpowiednie parametry są dostępne w metadanych.

Przeglądaj rozprawy doktorskie z różnych dziedzin i twórz odpowiednie bibliografie.

1

Bollinger, Toni. "Généralisation en apprentissage à partir d'exemples". Paris 11, 1986. http://www.theses.fr/1986PA112064.

Pełny tekst źródła
Streszczenie:
Cette thèse traite essentiellement du problème de la généralisation, en tant l'accent sur deux de ces aspects. Dans la première partie nous précisons ce que nous entendons par un exemple accepté par une description, ce qui nous conduit à donner une définition formelle de "plus général". Nous présentons aussi une méthode destinée à déterminer si une description est plus générale qu'une autre. La deuxième partie est consacrée à la présentation d'un algorithme de généralisation fondé sur l'appariement structurel. Nous décrivons d'abord la méthode de l'appariement structurel qui sert à transformer les descriptions des exemples jusqu'à ce qu'elles se ressemblent le plus possible. Cette opération a pour but de préserver un maximum d'information pendant la généralisation. Ensuite, nous présentons AGAPE, un algorithme de généralisation à partir d'exemples, ainsi que son implémentation. La tâche principale de cet algorithme est de mettre les exemples en appariement structurel ce qui rend triviale l'opération de la généralisation elle-même. A la fin de cette thèse, nous propo sons quelques extensions de cet algorithme. Surtout afin qu'il puisse également traiter des contre-exemples
This thesis treats two aspects of the problem of generalization in machine learning. First, we give a formal definition of the relation "more general" which we deduce from our notion of an example that is accepted by a description. We present also a methodology for determining if one description is more general than another. In the second part, we describe the generalization algorithm AGAPE based on structural matching. This algorithm tries to preserve a maximum of information common to the examples by transforming the descriptions of the examples until they match structurally, i. E. Until the descriptions are almost identical. At the end of this thesis, we present some extensions of this algorithm especially designed for enabling the treatement of counter-examples
Style APA, Harvard, Vancouver, ISO itp.
2

Bollinger, Toni. "Généralisation en apprentissage a partir d'exemples". Grenoble 2 : ANRT, 1986. http://catalogue.bnf.fr/ark:/12148/cb37596263z.

Pełny tekst źródła
Style APA, Harvard, Vancouver, ISO itp.
3

HANSER, THIERRY. "Apprentissage automatique de methodes de synthese a partir d'exemples". Université Louis Pasteur (Strasbourg) (1971-2008), 1993. http://www.theses.fr/1993STR13106.

Pełny tekst źródła
Streszczenie:
La construction manuelle de bases de connaissance en synthese assistee par ordinateur (sao) est une tache longue et fastidieuse. Cette these decrit une methode qui permet d'automatiser ce travail. Le projet grams (generation de reseaux pour l'apprentissage de methodes de synthese) represente une nouvelle approche dans la maniere d'acquerir, de representer et d'exploiter la connaissance en synthese assistee par ordinateur. Le but du projet est d'etablir une connaissance generale sur des classes de reactions organiques a partir d'exemples extraits de banques de donnees. La methode proposee repose sur des techniques d'apprentissage automatique par induction
Style APA, Harvard, Vancouver, ISO itp.
4

Gautheron, Léo. "Construction de Représentation de Données Adaptées dans le Cadre de Peu d'Exemples Étiquetés". Thesis, Lyon, 2020. http://www.theses.fr/2020LYSES044.

Pełny tekst źródła
Streszczenie:
L'apprentissage automatique consiste en l'étude et la conception d'algorithmes qui construisent des modèles capables de traiter des tâches non triviales aussi bien ou mieux que les humains et, si possible, à un moindre coût.Ces modèles sont généralement entraînés à partir d'un ensemble de données où chaque exemple décrit une instance de la même tâche et est représenté par un ensemble de caractéristiques et un résultat ou étiquette que nous voulons généralement prédire.Un élément nécessaire au succès de tout algorithme d'apprentissage automatique est lié à la qualité de l'ensemble de caractéristiques décrivant les données, également appelé représentation des données.Dans l'apprentissage supervisé, plus les caractéristiques décrivant les exemples sont corrélées avec l'étiquette, plus le modèle sera efficace.Il existe trois grandes familles de caractéristiques : les caractéristiques ``observables'', les caractéristiques ``fabriquées à la main'' et les caractéristiques ``latentes'' qui sont généralement apprises automatiquement à partir des données d'entraînement.Les contributions de cette thèse s'inscrivent dans le cadre de cette dernière catégorie. Plus précisément, nous nous intéressons au cadre spécifique de l'apprentissage d'une représentation discriminatoire lorsque le nombre de données d'intérêt est limité.Un manque de données d'intérêt peut être constaté dans différents scénarios.Tout d'abord, nous abordons le problème de l'apprentissage déséquilibré avec une classe d'intérêt composée de peu d'exemples en apprenant une métrique qui induit un nouvel espace de représentation où les modèles appris ne favorisent pas les exemples majoritaires.Deuxièmement, nous proposons de traiter un scénario avec peu d'exemples disponibles en apprenant en même temps une représentation de données pertinente et un modèle qui généralise bien en boostant des modèles basés sur des noyaux et des caractéristiques de Fourier aléatoires.Enfin, pour traiter le scénario d'adaptation de domaine où l'ensemble cible ne contient pas d'étiquette alors que les exemples sources sont acquis dans des conditions différentes, nous proposons de réduire l'écart entre les deux domaines en ne conservant que les caractéristiques les plus similaires qui optimisent la solution d'un problème de transport optimal entre les deux domaines
Machine learning consists in the study and design of algorithms that build models able to handle non trivial tasks as well as or better than humans and hopefully at a lesser cost.These models are typically trained from a dataset where each example describes an instance of the same task and is represented by a set of characteristics and an expected outcome or label which we usually want to predict.An element required for the success of any machine learning algorithm is related to the quality of the set of characteristics describing the data, also referred as data representation or features.In supervised learning, the more the features describing the examples are correlated with the label, the more effective the model will be.There exist three main families of features: the ``observable'', the ``handcrafted'' and the ``latent'' features that are usually automatically learned from the training data.The contributions of this thesis fall into the scope of this last category. More precisely, we are interested in the specific setting of learning a discriminative representation when the number of data of interest is limited.A lack of data of interest can be found in different scenarios.First, we tackle the problem of imbalanced learning with a class of interest composed of a few examples by learning a metric that induces a new representation space where the learned models do not favor the majority examples.Second, we propose to handle a scenario with few available examples by learning at the same time a relevant data representation and a model that generalizes well through boosting models using kernels as base learners approximated by random Fourier features.Finally, to address the domain adaptation scenario where the target set contains no label while the source examples are acquired in different conditions, we propose to reduce the discrepancy between the two domains by keeping only the most similar features optimizing the solution of an optimal transport problem between the two domains
Style APA, Harvard, Vancouver, ISO itp.
5

Henniche, M'hammed. "Apprentissage incrémental à partir d'exemples dans un espace de recherche réduit". Paris 13, 1998. http://www.theses.fr/1998PA13A001.

Pełny tekst źródła
Style APA, Harvard, Vancouver, ISO itp.
6

Truong, Nguyen Tuong Vinh. "Apprentissage de fonctions d'ordonnancement avec peu d'exemples étiquetés : une application au routage d'information, au résumé de textes et au filtrage collaboratif". Paris 6, 2009. http://www.theses.fr/2009PA066568.

Pełny tekst źródła
Streszczenie:
Dans ce mémoire, nous nous sommes intéressés à l’apprentissage de fonctions d’ordonnancement avec peu d’exemples étiquetés. Nous avons abordé cette problématique sous deux angles différents. D’une part, nous avons cherché à améliorer les performances en apprentissage supervisé en exploitant l’information contenue dans un grand nombre de données non-étiquetées. Ce cadre est connu sous le nom d’apprentissage semi-supervisé. D’autre part, nous avons considéré l’apprentissage actif, dont le but est d’inclure itérativement les exemples les plus informatifs dans la base d’apprentissage. Dans une première partie de ce mémoire, nous présentons nos modèles développés en apprentissage semi-supervisé et actif pour l’ordonnancement biparti. Nous nous sommes intéressés à des modèles de faible complexité. Dans une deuxième partie, nous validons nos modèles sur les tâches de routage d’information, de résumé automatique de textes et de filtrage collaboratif qui rentrent dans le cadre de notre étude.
Style APA, Harvard, Vancouver, ISO itp.
7

Barnachon, Mathieu. "Reconnaissance d'actions en temps réel à partir d'exemples". Phd thesis, Université Claude Bernard - Lyon I, 2013. http://tel.archives-ouvertes.fr/tel-00820113.

Pełny tekst źródła
Streszczenie:
Le développement de l'image numérique et des outils associés ces dernières années a entraîné une évolution dans les attentes des utilisateurs et des changements dans leurs habitudes de travail. Cette évolution apporte de nouvelles possibilités d'utilisation ouvrant l'usage à un public très large, allant des interactions gestuelles aux jeux vidéo, en passant par le suivi d'activités à domicile, la surveillance, ... Pour qu'elles puissent être performantes et attractives, ces nouvelles technologies nécessitent la mise en œuvre d'outils de reconnaissance et d'interprétation des gestes humains, par des méthodes efficaces, rapides et ouvertes. Actuellement, les méthodes proposées en reconnaissance d'actions peuvent être regroupées en trois catégories principales : les approches de type apprentissage automatique (Machine Learning), les modélisations stochastique ou encore les méthodes utilisant le paradigme des examplars. Les travaux développés dans cette thèse se rattachent à cette dernière catégorie : " méthodes à base d'exemples " (examplar-based) où l'apprentissage peut être fait à partir de quelques instances représentatives. Nous avons fait le choix d'une démarche qui limite le recours à des grandes bases de données, et qui permet la reconnaissance d'action de façon anticipée, c'est-à-dire avant que cette dernière ne soit finie. Pour ce faire, nos travaux ont été menés selon deux visions complémentaires, avec le soucis constant d'aboutir à des traitements qui soient temps réel, précis et ouverts à la reconnaissance de nouvelles actions
Style APA, Harvard, Vancouver, ISO itp.
8

Lu, Cheng-Ren. "Apprentissage incrémental par analogie : le système OGUST⁺". Paris 11, 1989. http://www.theses.fr/1989PA112393.

Pełny tekst źródła
Streszczenie:
Nous présentons dans cette thèse le système d'apprentissage OGUST+, une extension du système OGUST. OGUST+, comme son prédécesseur, est un système de généralisation à partir d'exemples. Il cherche une des généralisations les plus spécifiques. L'amélioration d'OGUST+, par rapport à OGUST, consiste en sa capacité de faire de l'apprentissage incrémental, dans la mesure où il peut accepter une série d'exemples les uns après les autres, sans recommencer le processus d'apprentissage avec pour entrée tous les exemples. L'analogie est la méthode de base pour faire de l'apprentissage incrémental. Etant donné un nouvel exemple, on cherche d'abord parmi les exemples déjà traités, un exemple Ei très "similaire" au nouvel exemple, on consulte ensuite les explications qu'OGUST fournit pour savoir comment cet ancien exemple a été généralisé, et puis on généralise le nouvel exemple tout en simulant le processus de la généralisation de l'ancien exemple choisi. L'analogie permet de tenir compte des similarités entre les exemples et de trouver de bons appariements entre les objets dans la généralisation et les objets dans les exemples. Elle nous offre de meilleures garanties pour obtenir une bonne généralisation. Une stratégie de retour en arrière est conçue dans cette thèse pour traiter une éventuelle sur-généralisation des exemples. Puisque la stratégie de recherche de généralisations adaptée dans le système est la stratégie en profondeur d'abord, nous sommes obligés de retourner en arrière, si une sur-généralisation se produit. Nous avons défini des conditions de retour arrière qui, une fois satisfaites, déclenchent le processus de retour arrière pour retrouver une des généralisations les plus spécifiques. Le système préserve son incrémentalité, lors de retour arrière, en ne considérant qu'un sous ensemble d'exemples présentés.
Style APA, Harvard, Vancouver, ISO itp.
9

Mordelet, Fantine. "Méthodes d'apprentissage statistique à partir d'exemples positifs et indéterminés en biologie". Phd thesis, École Nationale Supérieure des Mines de Paris, 2010. http://pastel.archives-ouvertes.fr/pastel-00566401.

Pełny tekst źródła
Streszczenie:
La biologie est un domaine scientifique qui reste encore très incomplet au sens où la somme de connaissances qu'il nous reste à découvrir est non négligeable. Il est fréquent que les techniques de laboratoire traditionnelles soient inadaptées à la complexité du problème traité. Une raison possible à cela est que leur mise en œuvre requiert souvent beaucoup de temps et/ou de moyens financiers. Par ailleurs, certaines d'entre elles produisent des résultats peu fiables ou à trop faible débit. C'est pourquoi ces techniques peinent parfois à apporter des réponses aux nombreuses questions biologiques non résolues. En parallèle, l'évolution des biotechnologies a permis de produire massivement des données biologiques. Les expériences biologiques à haut débit permettent à présent de caractériser des cellules à l'échelle du génome et sont porteuses d'espoir pour la compréhension de phénomènes biologiques complexes. Ces deux faits combinés ont induit un besoin croissant de mathématiciens et de statisticiens en biologie. La tâche des bioinformaticiens est non seulement d'analyzer efficacement les masses de données produites par les expériences à haut débit et d'en extraire une information fiable mais aussi d'élaborer des modèles de systèmes biologiques menant à des prédictions utiles. L'inférence de réseaux de régulation et la recherche de gènes de maladie sont deux exemples parmi d'autres, de problèmes où une expertise bioinformatique peut s'avérer nécessaire. L'inférence de réseaux de régulation consiste à identifier les relations de régulation transcriptionnelle entre des gènes régulateurs appelés facteurs de transcription et des gènes cibles. Par ailleurs, la recherche de gènes de maladie consiste à déterminer les gènes dont les mutations mènent au développement d'une maladie génétiquement transmise. Dans les deux cas, les biologistes sont confrontés à des listes de milliers de gènes à tester. Le défi du bioinformaticien est donc de produire une liste de priorité où les interactions ou gènes candidats sont rangés par ordre de pertinence au problème traité, en vue d'une validation expérimentale. Les deux problèmes mentionnés plus haut partagent une caractéristique commune : ce sont tous les deux des problèmes de priorisation pour lesquels un petit nombre d'exemples positifs est disponible (des interactions connues ou gènes de maladie déjà identifiés) mais pour lesquels on ne dispose pas de données négatives. En effet, les bases de données biologiques ne reportent que rarement les paires de gènes non interactives. De même, il est difficile voire impossible de déterminer à coup sûr qu'un gène n'est pas impliqué dans le développement d'une maladie. Par ailleurs, des nombreux exemples indéterminés existent qui sont par exemple des gènes dont on ne sait pas si ils interagissent avec un facteur de transcription ou encore des gènes dont on ne sait pas s'ils sont causaux pour une maladie. Le problème de l'apprentissage à partir d'exemples positifs et indéterminés (PU learning en anglais) a été étudié en soi dans le domaine de l'apprentissage automatique (machine learning). L'objet de cette thèse est l'étude de méthodes de PU learning et leur application à des problèmes biologiques. Le premier chapitre présente le bagging SVM, un nouvel algorithme de PU learning et évalue ses performances et propriétés sur un jeu de données standard. L'idée principale de cet algorithme est d'exploiter au moyen d'une procédure voisine du bagging, une caractéristique intrinsèque d'un problème de PU learning qui est que l'ensemble des exemples indéterminés contient des positifs cachés. Le bagging SVM atteint des performances comparables à l'état de l'art tout en faisant preuve de bonnes propriétés en termes de rapidité et d'échelle par rapport au nombre d'exemples. Le deuxième chapitre est consacré à SIRENE, une nouvelle méthode supervisée pour l'inférence de réseaux de régulation. SIRENE est un algorithme conceptuellement simple qui donne de bons résultats en comparaison à des méthodes existantes pour l'inférence de réseaux. Enfin, le troisième chapitre décrit ProDiGe, un algorithme pour la priorisation de gènes de maladie à partir d'exemples positifs et indéterminés. Cet algorithme, issu du bagging SVM, peut gérer la recherche de gènes de maladies à l'échelle du génome et permet d'intégrer plusieurs sources de données. Sa capacité à retrouver correctement des gènes de maladie a été démontrée sur un jeu de données réel.
Style APA, Harvard, Vancouver, ISO itp.
10

Nogry, Sandra Mille Alain. "Faciliter l'apprentissage à partir d'exemples en situation de résolution de problèmes Application au projet AMBRE /". Lyon : Université Lumière Lyon 2, 2005. http://theses.univ-lyon2.fr/sdx/theses/lyon2/2005/nogry_s.

Pełny tekst źródła
Style APA, Harvard, Vancouver, ISO itp.
11

Blin, Laurent. "Apprentissage de structures d'arbres à partir d'exemples ; application à la prosodie pour la synthèse de la parole". Rennes 1, 2002. http://www.theses.fr/2002REN10117.

Pełny tekst źródła
Streszczenie:
Cette thèse présente une approche de génération de la prosodie pour la synthèse de la parole, via la définition de représentations arborescentes des énoncés et l'utilisation de mesures de similarité entre ces structures. La prosodie d'un nouvel énoncé est générée par un apprentissage par plus proche voisin. Ces travaux se sont intéressés à la prédiction d'étiquettes ToBI sur des énoncés en anglais américain. Cette these a étudié plusieurs configurations expérimentales. Deux types de structures arborescentes ont été utilisées : une représentation syntaxique classique et une représentation par structure de performance,divisant un énoncé en groupes accentuels et intonatifs. L'influence d'une construction automatique de ces structures a en outre été testée. Deux algorithmes de calcul de distance entre arbres ont également été employés, fondés sur des opérateurs d'édition entre noeuds. Les bases d'une génération de la prosodie par analogie ont également été posées.
Style APA, Harvard, Vancouver, ISO itp.
12

Aguirre, Cervantes José Luis. "Construction automatique de taxonomies à partir d'exemples dans un modèle de connaissances par objets". Grenoble INPG, 1989. http://www.theses.fr/1989INPG0067.

Pełny tekst źródła
Style APA, Harvard, Vancouver, ISO itp.
13

Bouthinon, Dominique. "Apprentissage à partir d'exemples ambigus : étude théorique et application à la découverte de structures communes à un ensemble de séquences d'ARN". Paris 13, 1996. http://www.theses.fr/1996PA132033.

Pełny tekst źródła
Streszczenie:
Nous étudions une classe de problèmes d'apprentissage caractérisée par l'absence de contre-exemples, chaque exemple du concept cible étant représenté de manière ambigüe par plusieurs descriptions dont une seule, à priori inconnue, est réelle. Le problème pose est double puisqu'il s'agit d'apprendre les caractéristiques les plus spécifiques communes aux exemples, ce qui revient implicitement à identifier ces derniers. Le principe de résolution est fondé sur la recherche de similarités répétées dont la distribution émerge des ressemblances aléatoires. Nous montrons que cette classe de problèmes nécessite une nouvelle définition de la complétude et de la consistance, et qu'en fixant certaines limites à l'utilisation de la négation il est possible de construire une méthode de résolution générale. Le problème de la prédiction de la structure secondaire commune à un groupe de séquences d'ARN relevant de cette classe, nous proposons de le résoudre avec la méthode précitée. En l'occurrence nous construisons, pour chaque séquence, les plus grandes structures valides optimisant un critère d'énergie directement corrélé à la plausibilité d'une structure, critère que l'on ne peut exploiter pour déterminer directement la structure secondaire. Une représentation originale permet de coder ces structures, ainsi que leurs sous-structures, sous la forme d'un dictionnaire, dont les plus longs préfixes qui satisfont un taux minimal de répétition désignent les structures secondaires candidates que nous identifions au moyen d'un algorithme de complexité linéaire. Une mesure permet de classer les structures candidates en établissant la plausibilité de chacune d'elles en fonction de son taux de répétition effectif dans les séquences, comparativement à son taux à priori, calculé sur des séquences aléatoires. Les premiers résultats sur plusieurs groupes de séquences sont encourageants puisque la structure secondaire a été découverte sans aucune information préalable.
Style APA, Harvard, Vancouver, ISO itp.
14

VOGEL, HUGUES. "Apprentissage automatique de connaissances reactionnelles : acquisition d'exemples de reactions a partir de bases de donnees et prise en compte des conditions reactionnelles". Université Louis Pasteur (Strasbourg) (1971-2008), 2000. http://www.theses.fr/2000STR13062.

Pełny tekst źródła
Streszczenie:
Le systeme grams (generation de reseaux pour l'apprentissage de methodes de synthese) apporte une solution innovante et efficace aux problemes poses par l'informatisation de l'apprentissage par decouverte dans le domaine de la synthese organique. Son objectif est de construire automatiquement, a partir d'exemples extraits de bases de donnees reactionnelles, une description concise des differents facteurs, aussi bien structuraux que conditionnels, influencant le rendement des reactions et de stocker cette information dans des bases de connaissances exploitables par des systemes informatiques d'aide a la synthese. Cette these presente les developpements que nous avons apportes en ce qui concerne l'automatisation de l'acquisition des exemples de reactions et la prise en compte, dans le processus d'apprentissage de grams, d'un ensemble d'attributs numeriques caracterisant les conditions reactionnelles.
Style APA, Harvard, Vancouver, ISO itp.
15

Vrain, Christel. "Un outil pour la généralisation utilisant systématiquement les théorèmes : le système OGUST". Paris 11, 1987. http://www.theses.fr/1987PA112302.

Pełny tekst źródła
Streszczenie:
La plupart des systèmes d'Apprentissage actuels n'utilisent qu'incomplètement les connaissances sur le domaine dans lequel se fait l'Apprentissage et se limitent très souvent à des propriétés exprimées sous forme de taxonomies. Nous proposons dans cette thèse un système d'apprentissage dans un domaine à théorie forte, où les propriétés sont exprimées sous forme de théorèmes universels ou de taxonomies. Notre système utilise une notion nouvelle appelée Mise en Correspondance Structurelle. Nous résolvons ainsi un problème classique en Démonstration Automatique: celui des boucles de raisonnement. Une des particularités de ce système par rapport aux autres systèmes d'apprentissage à partir d'exemples est sa capacité à fournir des explications. Ces explications pourront s'avérer utiles pour traiter les contre-exemples ou pour faire de l'apprentissage incrémental.
Style APA, Harvard, Vancouver, ISO itp.
16

Guiroy, Simon. "Towards Understanding Generalization in Gradient-Based Meta-Learning". Thèse, 2019. http://hdl.handle.net/1866/23783.

Pełny tekst źródła
Streszczenie:
Dans ce mémoire, nous étudions la généralisation des réseaux de neurones dans le contexte du méta-apprentissage, en analysant divers propriétés des surface leurs fonctions objectifs. La recherche en apprentissage automatique portant sur les surfaces de fonctions objectifs des réseaux de neurones ayant aidé à comprendre leur généralisation en apprentissage supervisé standard, nous proposons l'étude de telles surfaces dans le but d'approfondir nos connaissances sur la généralisation en méta-apprentissage. Nous introduisons d'abord la littérature sur les fonctions objectifs des réseaux de neurones à la Section \ref{sec:intro:objective_landscapes}, puis celle portant sur le méta-apprentissage à la Section \ref{sec:intro:meta-learning}, pour enfin terminer notre introduction avec le méta-apprentissage par descente de gradient, très similaire à l'entraînement des réseaux de neurones par descente de gradient stochastique et pour une tâche unique. Nous présentons par la suite notre travail sur les fonctions objectifs en méta-apprentissage au Chapitre \ref{chap:prof_forcing}, lequel nous avons soumis à la conférence NeurIPS 2019 en tant qu'article scientifique. Au moment d'écrire ce mémoire, et au meilleur de notre connaissance, ce travail est le premier à étudier empiriquement les surfaces des fonctions objectifs en méta-apprentissage, particulièrement dans le contexte de l'apprentissage profond, et nous mettons notamment en lumière certaines propriétés de ces surfaces qui apparaissent liées à la généralisation des réseaux de neurones à de nouvelles tâches. Nous démontrons empiriquement qu'alors que progresse la phase de méta-entraînement, pour les solutions aux nouvelles tâches obtenues via quelques itérations de descente de gradient, la courbure de la fonction objective décroit monotoniquement, la valeur de la fonction objective diminue, tandis que la distance euclidienne avec la solution ``méta-entraînement" augmente. Cependant, nous observons que la courbure des minima continue de décroître même lorsque le sur-apprentissage devient apparent et que la généralisation commence à se dégrader, indiquant que la courbure des minima semble peu corrélée à la généralisation en méta-apprentissage par descente de gradient. De plus, nous montrons empiriquement que la généralisation aux nouvelles tâches semble plutôt liée à la cohérence de leurs trajectoires d'adaptation dans l'espace des paramètres, mesurée par la similarité cosinus moyenne entre les trajectoires. Nous montrons également que la cohérence des gradients ''meta-test", mesurée par le produit scalaire moyen entre les vecteurs de gradients spécifiques aux nouvelles tâches, évalué à solution meta-entraînement, est également corrélée à la généralisation. Nous basant sur ces observations, nous proposons un nouveau terme de régularisation pour l'algorithme de méta-apprentissage Model Agnostic Meta-Learning (MAML).
In this master's thesis, we study the generalization of neural networks in gradient-based meta-learning by analyzing various properties of the objective landscapes. Meta-learning, a challenging paradigm where models not only have to learn a task but beyond that, are trained for ``learning to learn" as they must adapt to new tasks and environments with very limited data about them. With research on the objective landscapes of neural networks in classical supervised having provided some answers regarding their ability to generalize for new data points, we propose similar analyses aimed at understanding generalization in meta-learning. We first introduce the literature on objective landscapes of neural networks in Section \ref{sec:intro:objective_landscapes}. We then introduce the literature of meta-learning in Section \ref{chap:prof_forcing}, concluding our introduction with the approach of gradient-based meta-learning, a meta-learning setup that bears strong similarities to the traditional supervised learning setup through stochastic gradient-based optimization. At the time of writing of this thesis, and to the best of our knowledge, this is the first work to empirically study the objective landscapes in gradient-based meta-learning, especially in the context of deep learning. We notably provide some insights on some properties of those landscapes that appear correlated to the generalization to new tasks. We experimentally demonstrate that as meta-training progresses, the meta-test solutions, obtained after adapting the meta-train solution of the model, to new tasks via few steps of gradient-based fine-tuning, become flatter, lower in loss, and further away from the meta-train solution. We also show that those meta-test solutions become flatter even as generalization starts to degrade, thus providing experimental evidence against the correlation between generalization and flat minima in the paradigm of gradient-based meta-leaning. Furthermore, we provide empirical evidence that generalization to new tasks is correlated with the coherence between their adaptation trajectories in parameter space, measured by the average cosine similarity between task-specific trajectory directions, starting from a same meta-train solution. We also show that coherence of meta-test gradients, measured by the average inner product between the task-specific gradient vectors evaluated at meta-train solution, is also correlated with generalization. Based on these observations, we propose a novel regularizer for the Model Agnostic Meta-Learning (MAML) algorithm and provide experimental evidence for its effectiveness.
Style APA, Harvard, Vancouver, ISO itp.
17

Batot, Edouard. "From examples to knowledge in model-driven engineering : a holistic and pragmatic approach". Thèse, 2018. http://hdl.handle.net/1866/21737.

Pełny tekst źródła
Style APA, Harvard, Vancouver, ISO itp.
Oferujemy zniżki na wszystkie plany premium dla autorów, których prace zostały uwzględnione w tematycznych zestawieniach literatury. Skontaktuj się z nami, aby uzyskać unikalny kod promocyjny!

Do bibliografii