Dissertations / Theses: 'Apprentissage continu en ligne'

1

Wagner, Baptiste. "Apprentissage continu en ligne pour la classification d'images et la détection d'objets." Electronic Thesis or Diss., Université Grenoble Alpes, 2024. http://www.theses.fr/2024GRALT111.

Full text

Abstract:

Dans cette thèse, nous nous intéressons au problème de l'apprentissage continu en ligne des réseaux de neurones artificiels, qui consiste à apprendre en permanence sur un flux de données. La difficulté majeure réside dans le fait qu'intégrer les nouvelles informations présentes dans le flux tend à effacer les connaissances précédemment acquises, un phénomène appelé oubli catastrophique.Dans ce domaine de l'apprentissage continu en ligne, notre recherche porte sur deux applications importantes en vision par ordinateur : la classification d'images et la détection d'objets. Le flux de données est alors constitué d'une suite d'images.En classification d'images le réseau de neurones doit apprendre progressivement à classifier les images des nouvelles classes sans oublier les anciennes. La méthode la plus répandue pour résoudre ce problème est le rejeu de données, qui consiste à ré-entraîner le modèle avec des images d'anciennes classes stockées dans une mémoire externe. Cependant, cette méthode est peu adaptée lorsque la capacité de stockage et la capacité de calcul pour l'entraînement du modèle sont limitées. Nous proposons une nouvelle méthode qui repose sur un schéma d'entraînement basé sur un classificateur un-contre-tous pour répondre à cette limitation. Notre méthode appelée ILOVA (Incremental Learning of One-Vs-All classifiers) offre un meilleur compromis entre précision, oubli, temps de calcul et empreinte mémoire, que les méthodes de l'état de l'art et se montre particulièrement efficace avec des mémoires très réduites, jusqu'à une seule image par classe.En détection d'objets, de nombreux scénarios de test sont construits à partir de séquences vidéo réelles dans lesquelles des objets peuvent réapparaître à plusieurs reprises à différents moments dans le flux de données. Cependant, ce phénomène de revisite que nous appelons rejeu naturel, est peu documenté et son impact sur les performances et l'oubli reste mal compris. Nous proposons alors une métrique, appelée NRS (Natural Replay Score), permettant de quantifier le degré de rejeu naturel d'un scénario, et montrons qu'il est impossible d'évaluer correctement l'oubli d'un modèle en sa présence. La suite de notre étude porte sur l'analyse de l'oubli dans l'architecture Faster R-CNN lorsqu'elle est utilisée en détection d'objets en ligne. D'une part, nos résultats montrent que des rappels réguliers réduisent l'oubli. D'autre part, nous proposons un nouveau protocole, appelé Module Probing, qui permet de mesurer localement l'oubli dans l'architecture. Nous montrons que l’oubli est concentré dans la couche de classification du Faster R-CNN. Enfin, ces analyses nous mènent à proposer la méthode Configurable Recall, basée sur le rejeu de données. Notre méthode permet d'optimiser la fréquence et la durée des rappels et utilise une fonction de perte modifiée qui limite l'oubli dans la couche de classification. En combinant ces deux éléments, nous parvenons à réduire significativement l'oubli pour l’architecture Faster R-CNN
In this thesis, we focus on the problem of online continual learning in artificial neural networks, which involves learning continuously from a data stream. The main challenge is that integrating new information from the stream tends to overwrite previously acquired knowledge, a phenomenon known as catastrophic forgetting.In the field of online continual learning, our research focus on two important applications in computer vision: image classification and object detection. In these cases, the data stream consists of a sequence of images.In image classification, the neural network must progressively learn to classify images from new classes without forgetting the previous ones. The most common method to address this problem is experience replay, which involves retraining the model with images from previously seen classes stored in external memory. However, this method is less suitable when both storage capacity and computational resources are limited. We propose a new method based on a one-vs-all classifier training scheme to overcome this limitation. Our method, called ILOVA (Incremental Learning of One-Vs-All classifiers), offers a better trade-off between accuracy, forgetting, computational time, and memory footprint compared to state-of-the-art methods and proves particularly effective with very limited memory, down to a single image per class.In object detection, many test scenarios are constructed from real video sequences in which objects can reappear multiple times at different moments in the data stream. However, this phenomenon of reappearance, which we call natural replay, is poorly documented, and its impact on performance and forgetting remains poorly understood. We propose a new metric, called NRS (Natural Replay Score), which quantifies the degree of natural replay in a scenario, and show that it is impossible to properly evaluate model forgetting in its presence. The next part of our study focuses on analyzing forgetting in the Faster R-CNN architecture when used for online object detection. On the one hand, our results show that periodic recalls reduce forgetting. On the other hand, we propose a new protocol, called Module Probing, which allows us to measure forgetting locally within the architecture. We show that forgetting is concentrated in the classification layer of Faster R-CNN. Finally, these analyses lead us to propose a method called Configurable Recall, based on experience replay. Our method optimizes the frequency and duration of the recalls and uses a modified loss function to limit forgetting in the classification layer. By combining these two elements, we significantly reduce forgetting in the Faster R-CNN architecture