Tesi: "Prediction de séries temporelle"

1

Hmamouche, Youssef. "Prédiction des séries temporelles larges". Thesis, Aix-Marseille, 2018. http://www.theses.fr/2018AIXM0480.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

De nos jours, les systèmes modernes sont censés stocker et traiter des séries temporelles massives. Comme le nombre de variables observées augmente très rapidement, leur prédiction devient de plus en plus compliquée, et l’utilisation de toutes les variables pose des problèmes pour les modèles classiques.Les modèles de prédiction sans facteurs externes sont parmi les premiers modèles de prédiction. En vue d’améliorer la précision des prédictions, l’utilisation de multiples variables est devenue commune. Ainsi, les modèles qui tiennent en compte des facteurs externes, ou bien les modèles multivariés, apparaissent, et deviennent de plus en plus utilisés car ils prennent en compte plus d’informations.Avec l’augmentation des données liées entre eux, l’application des modèles multivariés devient aussi discutable. Le challenge dans cette situation est de trouver les facteurs les plus pertinents parmi l’ensemble des données disponibles par rapport à une variable cible.Dans cette thèse, nous étudions ce problème en présentant une analyse détaillée des approches proposées dans la littérature. Nous abordons le problème de réduction et de prédiction des données massives. Nous discutons également ces approches dans le contexte du Big Data.Ensuite, nous présentons une méthodologie complète pour la prédiction des séries temporelles larges. Nous étendons également cette méthodologie aux données très larges via le calcul distribué et le parallélisme avec une implémentation du processus de prédiction proposé dans l’environnement Hadoop/Spark
Nowadays, storage and data processing systems are supposed to store and process large time series. As the number of variables observed increases very rapidly, their prediction becomes more and more complicated, and the use of all the variables poses problems for classical prediction models.Univariate prediction models are among the first models of prediction. To improve these models, the use of multiple variables has become common. Thus, multivariate models and become more and more used because they consider more information.With the increase of data related to each other, the application of multivariate models is also questionable. Because the use of all existing information does not necessarily lead to the best predictions. Therefore, the challenge in this situation is to find the most relevant factors among all available data relative to a target variable.In this thesis, we study this problem by presenting a detailed analysis of the proposed approaches in the literature. We address the problem of prediction and size reduction of massive data. We also discuss these approaches in the context of Big Data.The proposed approaches show promising and very competitive results compared to well-known algorithms, and lead to an improvement in the accuracy of the predictions on the data used.Then, we present our contributions, and propose a complete methodology for the prediction of wide time series. We also extend this methodology to big data via distributed computing and parallelism with an implementation of the prediction process proposed in the Hadoop / Spark environment

2

Hmamouche, Youssef. "Prédiction des séries temporelles larges". Electronic Thesis or Diss., Aix-Marseille, 2018. http://www.theses.fr/2018AIXM0480.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

De nos jours, les systèmes modernes sont censés stocker et traiter des séries temporelles massives. Comme le nombre de variables observées augmente très rapidement, leur prédiction devient de plus en plus compliquée, et l’utilisation de toutes les variables pose des problèmes pour les modèles classiques.Les modèles de prédiction sans facteurs externes sont parmi les premiers modèles de prédiction. En vue d’améliorer la précision des prédictions, l’utilisation de multiples variables est devenue commune. Ainsi, les modèles qui tiennent en compte des facteurs externes, ou bien les modèles multivariés, apparaissent, et deviennent de plus en plus utilisés car ils prennent en compte plus d’informations.Avec l’augmentation des données liées entre eux, l’application des modèles multivariés devient aussi discutable. Le challenge dans cette situation est de trouver les facteurs les plus pertinents parmi l’ensemble des données disponibles par rapport à une variable cible.Dans cette thèse, nous étudions ce problème en présentant une analyse détaillée des approches proposées dans la littérature. Nous abordons le problème de réduction et de prédiction des données massives. Nous discutons également ces approches dans le contexte du Big Data.Ensuite, nous présentons une méthodologie complète pour la prédiction des séries temporelles larges. Nous étendons également cette méthodologie aux données très larges via le calcul distribué et le parallélisme avec une implémentation du processus de prédiction proposé dans l’environnement Hadoop/Spark
Nowadays, storage and data processing systems are supposed to store and process large time series. As the number of variables observed increases very rapidly, their prediction becomes more and more complicated, and the use of all the variables poses problems for classical prediction models.Univariate prediction models are among the first models of prediction. To improve these models, the use of multiple variables has become common. Thus, multivariate models and become more and more used because they consider more information.With the increase of data related to each other, the application of multivariate models is also questionable. Because the use of all existing information does not necessarily lead to the best predictions. Therefore, the challenge in this situation is to find the most relevant factors among all available data relative to a target variable.In this thesis, we study this problem by presenting a detailed analysis of the proposed approaches in the literature. We address the problem of prediction and size reduction of massive data. We also discuss these approaches in the context of Big Data.The proposed approaches show promising and very competitive results compared to well-known algorithms, and lead to an improvement in the accuracy of the predictions on the data used.Then, we present our contributions, and propose a complete methodology for the prediction of wide time series. We also extend this methodology to big data via distributed computing and parallelism with an implementation of the prediction process proposed in the Hadoop / Spark environment

3

Ziat, Ali Yazid. "Apprentissage de représentation pour la prédiction et la classification de séries temporelles". Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066324/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Nous nous intéressons au développement de méthodes qui répondent aux difficultés posées par l’analyse des séries temporelles. Nos contributions se focalisent sur deux tâches : la prédiction de séries temporelles et la classification de séries temporelles. Notre première contribution présente une méthode de prédiction et de complétion de séries temporelles multivariées et relationnelles. Le but est d’être capable de prédire simultanément l’évolution d’un ensemble de séries temporelles reliées entre elles selon un graphe, ainsi que de compléter les valeurs manquantes dans ces séries (pouvant correspondre par exemple à une panne d’un capteur pendant un intervalle de temps donné). On se propose d’utiliser des techniques d’apprentissage de représentation pour prédire l’évolution des séries considérées tout en complétant les valeurs manquantes et prenant en compte les relations qu’il peut exister entre elles. Des extensions de ce modèle sont proposées et décrites : d’abord dans le cadre de la prédiction de séries temporelles hétérogènes puis dans le cas de la prédiction de séries temporelles avec une incertitude exprimée. Un modèle de prédiction de séries spatio-temporelles est ensuiteproposé, avec lequel les relations entre les différentes séries peuvent être exprimées de manière plus générale, et où ces dernières peuvent être apprises.Enfin, nous nous intéressons à la classification de séries temporelles. Un modèle d’apprentissage joint de métrique et de classification de séries est proposé et une comparaison expérimentale est menée
This thesis deals with the development of time series analysis methods. Our contributions focus on two tasks: time series forecasting and classification. Our first contribution presents a method of prediction and completion of multivariate and relational time series. The aim is to be able to simultaneously predict the evolution of a group of time series connected to each other according to a graph, as well as to complete the missing values in these series (which may correspond for example to a failure of a sensor during a given time interval). We propose to use representation learning techniques to forecast the evolution of the series while completing the missing values and taking into account the relationships that may exist between them. Extensions of this model are proposed and described: first in the context of the prediction of heterogeneous time series and then in the case of the prediction of time series with an expressed uncertainty. A prediction model of spatio-temporal series is then proposed, in which the relations between the different series can be expressed more generally, and where these can be learned.Finally, we are interested in the classification of time series. A joint model of metric learning and time-series classification is proposed and an experimental comparison is conducted

4

Ziat, Ali Yazid. "Apprentissage de représentation pour la prédiction et la classification de séries temporelles". Electronic Thesis or Diss., Paris 6, 2017. http://www.theses.fr/2017PA066324.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Nous nous intéressons au développement de méthodes qui répondent aux difficultés posées par l’analyse des séries temporelles. Nos contributions se focalisent sur deux tâches : la prédiction de séries temporelles et la classification de séries temporelles. Notre première contribution présente une méthode de prédiction et de complétion de séries temporelles multivariées et relationnelles. Le but est d’être capable de prédire simultanément l’évolution d’un ensemble de séries temporelles reliées entre elles selon un graphe, ainsi que de compléter les valeurs manquantes dans ces séries (pouvant correspondre par exemple à une panne d’un capteur pendant un intervalle de temps donné). On se propose d’utiliser des techniques d’apprentissage de représentation pour prédire l’évolution des séries considérées tout en complétant les valeurs manquantes et prenant en compte les relations qu’il peut exister entre elles. Des extensions de ce modèle sont proposées et décrites : d’abord dans le cadre de la prédiction de séries temporelles hétérogènes puis dans le cas de la prédiction de séries temporelles avec une incertitude exprimée. Un modèle de prédiction de séries spatio-temporelles est ensuiteproposé, avec lequel les relations entre les différentes séries peuvent être exprimées de manière plus générale, et où ces dernières peuvent être apprises.Enfin, nous nous intéressons à la classification de séries temporelles. Un modèle d’apprentissage joint de métrique et de classification de séries est proposé et une comparaison expérimentale est menée
This thesis deals with the development of time series analysis methods. Our contributions focus on two tasks: time series forecasting and classification. Our first contribution presents a method of prediction and completion of multivariate and relational time series. The aim is to be able to simultaneously predict the evolution of a group of time series connected to each other according to a graph, as well as to complete the missing values in these series (which may correspond for example to a failure of a sensor during a given time interval). We propose to use representation learning techniques to forecast the evolution of the series while completing the missing values and taking into account the relationships that may exist between them. Extensions of this model are proposed and described: first in the context of the prediction of heterogeneous time series and then in the case of the prediction of time series with an expressed uncertainty. A prediction model of spatio-temporal series is then proposed, in which the relations between the different series can be expressed more generally, and where these can be learned.Finally, we are interested in the classification of time series. A joint model of metric learning and time-series classification is proposed and an experimental comparison is conducted

5

Sànchez, Pérez Andrés. "Agrégation de prédicteurs pour des séries temporelles, optimalité dans un contexte localement stationnaire". Thesis, Paris, ENST, 2015. http://www.theses.fr/2015ENST0051/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Cette thèse regroupe nos résultats sur la prédiction de séries temporelles dépendantes. Le document comporte trois chapitres principaux où nous abordons des problèmes différents. Le premier concerne l’agrégation de prédicteurs de décalages de Bernoulli Causales, en adoptant une approche Bayésienne. Le deuxième traite de l’agrégation de prédicteurs de ce que nous définissions comme processus sous-linéaires. Une attention particulaire est portée aux processus autorégressifs localement stationnaires variables dans le temps, nous examinons un schéma de prédiction adaptative pour eux. Dans le dernier chapitre nous étudions le modèle de régression linéaire pour une classe générale de processus localement stationnaires
This thesis regroups our results on dependent time series prediction. The work is divided into three main chapters where we tackle different problems. The first one is the aggregation of predictors of Causal Bernoulli Shifts using a Bayesian approach. The second one is the aggregation of predictors of what we define as sub-linear processes. Locally stationary time varying autoregressive processes receive a particular attention; we investigate an adaptive prediction scheme for them. In the last main chapter we study the linear regression problem for a general class of locally stationary processes

6

Sànchez, Pérez Andrés. "Agrégation de prédicteurs pour des séries temporelles, optimalité dans un contexte localement stationnaire". Electronic Thesis or Diss., Paris, ENST, 2015. http://www.theses.fr/2015ENST0051.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Cette thèse regroupe nos résultats sur la prédiction de séries temporelles dépendantes. Le document comporte trois chapitres principaux où nous abordons des problèmes différents. Le premier concerne l’agrégation de prédicteurs de décalages de Bernoulli Causales, en adoptant une approche Bayésienne. Le deuxième traite de l’agrégation de prédicteurs de ce que nous définissions comme processus sous-linéaires. Une attention particulaire est portée aux processus autorégressifs localement stationnaires variables dans le temps, nous examinons un schéma de prédiction adaptative pour eux. Dans le dernier chapitre nous étudions le modèle de régression linéaire pour une classe générale de processus localement stationnaires
This thesis regroups our results on dependent time series prediction. The work is divided into three main chapters where we tackle different problems. The first one is the aggregation of predictors of Causal Bernoulli Shifts using a Bayesian approach. The second one is the aggregation of predictors of what we define as sub-linear processes. Locally stationary time varying autoregressive processes receive a particular attention; we investigate an adaptive prediction scheme for them. In the last main chapter we study the linear regression problem for a general class of locally stationary processes

7

Arnoux, Thibaud. "Prédiction d'interactions dans les flots de liens. Combiner les caractéristiques structurelles et temporelles". Electronic Thesis or Diss., Sorbonne université, 2018. http://www.theses.fr/2018SORUS229.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Le formalisme des flots de liens représente une approche permettant de conserver la dynamique du système tout en fournissant un cadre d'étude solide pour appréhender le comportement du système. Un flot de liens est une série de triplets (t,u,v) indiquant qu'une interaction a eu lieu entre u et v au temps t. La forte importance de la dynamique du système dans la prédiction dans les flots de liens la place au carrefour de la prédiction de liens dans les graphes et de la prédiction de séries temporelles. Nous allons explorer différentes formalisations du problème de la prédiction dans les flots de liens. Dans la suite nous nous intéresserons à la prédiction de l'activité, c'est-à-dire prédire le nombre d'interactions apparaissant dans le futur pour chaque paire de nœuds durant une certaine période. Nous introduisons le protocole développé, permettant de combiner de manière cohérente les caractéristiques des données afin d'effectuer la prédiction de l'activité. Nous étudions le comportement de notre protocole sur diverses expériences sur quatre jeux de données et évaluons la qualité de chaque prédiction. Nous étudierons comment l'utilisation de classes de nœuds permet de préserver la diversité des types de liens prédits tout en améliorant la prédiction. Notre objectif est de définir un cadre de prédiction général permettant des études approfondies de la relation entre caractéristiques structurelles et temporelles dans les tâches de prédiction
The link stream formalism represent an approach allowing to capture the system dynamic while providing a framework to understand the system's behavior. A link stream is a sequence of triplet (t,u,v) indicating that an interaction occurred between u and v at time t. The importance of the system's dynamic during the prediction places it at the crossroads of link prediction in graphs and time series prediction. We will explore several formalizations of the problem of prediction in link streams. In the following we will study the activity prediction, that is to say predicting the number of interactions occurring in the future between each pair of nodes during a given period. We introduce the protocol, allowing to combine the data characteristics to predict the activity. We study the behavior of our protocol during several experiments on four datasets et evaluate the prediction quality. We will look at how the introduction of pair of nodes classes allows to preserve the link diversity in the prediction while improving the prediction. Our goal is to define a general prediction framework allowing in-depth studies of the relationship between temporal and structural characteristics in prediction tasks

8

Çinar, Yagmur Gizem. "Prédiction de séquences basée sur des réseaux de neurones récurrents dans le contexte des séries temporelles et des sessions de recherche d'information". Thesis, Université Grenoble Alpes (ComUE), 2019. http://www.theses.fr/2019GREAM079.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Cette thèse examine les défis de la prédiction de séquence dans différents scénarios, tels que la prédiction de séquence à l'aide de réseaux de neurones récurrents (RNN) dans le contexte des séries temporelles et des sessions de recherche d'informations (RI). Prédire les valeurs inconnues suivant certaines valeurs précédemment observées est appelée prédiction de séquence. Elle est largement applicable à de nombreux domaines où un comportement séquentiel est observé dans les données. Dans cette étude, nous nous concentrons sur deux tâches de prédiction de séquences: la prévision de séries temporelles et la prédiction de la requête suivante dans une session de recherche d'informations.Les séries temporelles comprennent souvent des pseudo-périodes, c'est-à-dire des intervalles de temps avec une forte corrélation entre les valeurs des séries temporelles. Les changements saisonniers dans les séries temporelles météorologiques ou la consommation d'électricité le jour et la nuit sont quelques exemples de pseudo-périodes. Dans un scénario de prévision, les pseudo-périodes correspondent à la différence entre les positions de la sortie prévue et les entrées spécifiques. Afin de capturer des périodes dans des RNN, une mémoire de la séquence d'entrée est requise. Les RNN séquence à séquence (avec mécanisme d'attention) réutilisent des (représentations des) valeurs d'entrée spécifiques pour prédire les valeurs de sortie. Les RNN séquence à séquence avec un mécanisme d'attention semblent convenir à la capture de périodes. Ainsi, nous explorons d’abord la capacité d’un mécanisme d’attention dans ce contexte. Cependant, selon notre analyse initiale, un mécanisme d’attention standard ne permet pas de capturer les périodes. Par conséquent, nous proposons un modèle RNN d’attention basé sur le contenu et sensible à la période. Ce modèle étend les RNN séquence à séquence de l'état de l'art avec un mécanisme d’attention. Il vise à capturer les périodes dans une série temporelle avec ou sans valeurs manquantes. Nos résultats expérimentaux avec des RNN contenant un mécanisme d'attention basé sur le contenu et sensible à la période montrent une amélioration significative des performances de prévision des séries temporelles univariées et multivariées sur plusieurs ensembles de données disponibles publiquement.La prédiction de la requête suivante est un autre défi de la prédiction de séquence. La prédiction de la requête suivante aide les utilisateurs à désambiguïser leur requête, à explorer différents aspects de leur besoin en information ou à former une requête précise et succincte qui permet d’optimiser les performances de la recherche. Une session de recherche est dynamique et les besoins en informations d'un utilisateur peuvent changer au cours d'une session de recherche à la suite des interactions de recherche. De plus, les interactions d'un utilisateur avec un moteur de recherche influencent les reformulations de requêtes de l'utilisateur. Considérant cette influence sur les formulations de requête, nous analysons d’abord l’origine des mots des requêtes suivantes. En utilisant l’analyse des sources des mots de requête, nous proposons deux approches de prédiction de requête: une vue d'ensemble et une vue de séquence. La vue d'ensemble adapte une approche de sac de mots en utilisant un nouvel ensemble de traits définis en fonction des sources d'analyse des mots des requêtes suivantes. Ici, la prochaine requête est prédite en utilisant un apprentissage de classification. La vue de séquence étend un modèle RNN hiérarchique en prenant en compte les sources des mots des requêtes suivantes dans la prédiction. Les sources des mots des requêtes suivantes sont incorporées à l'aide d'un mécanisme d'attention sur les mots d'interaction. Nous avons observé que l’utilisation de l’approche séquentielle, une formulation naturelle du problème, et l’exploitation de toutes les sources des mots permettent d’améliorer la prédiction des requêtes suivantes
This thesis investigates challenges of sequence prediction in different scenarios such as sequence prediction using recurrent neural networks (RNNs) in the context of time series and information retrieval (IR) search sessions. Predicting the unknown values that follow some previously observed values is basically called sequence prediction.It is widely applicable to many domains where a sequential behavior is observed in the data. In this study, we focus on two different types of sequence prediction tasks: time series forecasting and next query prediction in an information retrieval search session.Time series often display pseudo-periods, i.e. time intervals with strong correlation between values of time series. Seasonal changes in weather time series or electricity usage at day and night time are some examples of pseudo-periods. In a forecasting scenario, pseudo-periods correspond to the difference between the positions of the output being predicted and specific inputs.In order to capture periods in RNNs, one needs a memory of the input sequence. Sequence-to-sequence RNNs (with attention mechanism) reuse specific (representations of) input values to predict output values. Sequence-to-sequence RNNs with an attention mechanism seem to be adequate for capturing periods. In this manner, we first explore the capability of an attention mechanism in that context. However, according to our initial analysis, a standard attention mechanism did not perform well to capture the periods. Therefore, we propose a period-aware content-based attention RNN model. This model is an extension of state-of-the-art sequence-to-sequence RNNs with attention mechanism and it is aimed to capture the periods in time series with or without missing values.Our experimental results with period-aware content-based attention RNNs show significant improvement on univariate and multivariate time series forecasting performance on several publicly available data sets.Another challenge in sequence prediction is the next query prediction. The next query prediction helps users to disambiguate their search query, to explore different aspects of the information they need or to form a precise and succint query that leads to higher retrieval performance. A search session is dynamic, and the information need of a user might change over a search session as a result of the search interactions. Furthermore, interactions of a user with a search engine influence the user's query reformulations. Considering this influence on the query formulations, we first analyze where the next query words come from? Using the analysis of the sources of query words, we propose two next query prediction approaches: a set view and a sequence view.The set view adapts a bag-of-words approach using a novel feature set defined based on the sources of next query words analysis. Here, the next query is predicted using learning to rank. The sequence view extends a hierarchical RNN model by considering the sources of next query words in the prediction. The sources of next query words are incorporated by using an attention mechanism on the interaction words. We have observed using sequence approach, a natural formulation of the problem, and exploiting all sources of evidence lead to better next query prediction

9

David, Etienne. "Time series forecasting models applied on large datasets with inclusion of external signals". Electronic Thesis or Diss., Institut polytechnique de Paris, 2024. http://www.theses.fr/2024IPPAS002.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

La prévision de séries temporelles est un problème mathématique répandu dans de nombreux secteurs, devenant un véritable défi pour les méthodes existantes de la littérature lorsque de grands ensembles de données rassemblant des milliers de séries temporelles et des signaux externes sont considérés. Une illustration concrète de ce problème peut être trouvée dans l'industrie de la mode où ses acteurs tentent d'anticiper l'évolution de milliers de vêtements pour créer leurs collections, analysant les comportements des influenceurs pour proposer la mode de demain.En utilisant cette application comme fil conducteur, nous présentons trois contributions explorant différentes réponses concernant le problème de prévision de séries temporelles où de grands ensembles de données et des signaux externes sont considérés. Une première réponse est proposée avec l'introduction d'un nouveau modèle hybride et la publication d'un large ensemble de données rassemblant 10000 séries temporelles de mode et des signaux externes d'influenceurs. Une seconde approche est ensuite étudiée avec un travail théorique sur les modèles de Markov cachés à signaux externes. Enfin, une dernière réponse est proposée avec l'introduction d'une nouvelle méthode mélangeant le fonctionnement interne des modèles de Markov cachés avec des réseaux de neurones.Les résultats présentés dans ces trois contributions ont mis en évidence plusieurs éléments de réponse. Premièrement, les réseaux de neurones sont décisifs pour traiter de grands ensembles de données et sont particulièrement bien conçus pour exploiter des signaux externes. Deuxièmement, les modèles de Markov cachés avec signaux externes sont également des méthodes efficaces, capables de capturer des dépendances complexes entre des séries temporelles et leurs signaux externes. Cependant, ils ne parviennent pas à gérer de grands ensembles de données car un modèle doit être entraîné pour chaque nouvelle série temporelle. Enfin, inspirés par les résultats frappants des modèles de Markov cachés avec des signaux externes, nous montrons que l'introduction de processus cachés dans des modèles basés sur des réseaux neuronaux peut les aider à explorer plus profondément les grands ensembles de données, à modéliser une plus grande variété de comportements et à exploiter plus finement les signaux externes
Time series forecasting is a widespread mathematical problem in numerous sectors becoming a real challenge for existing methods of the literature where large datasets gathering thousands of time series and external signals are considered. A concrete illustration of this issue can be find in the fashion industry where its actors try to anticipate the evolution of thousands of garments to create their collections, analysing influencers and early adopters behaviours to propose the fashion of tomorrow.Using this application as a common thread, we present three contributions exploring different answers regarding the time series forecasting problem where large datasets and external signals are considered. A first answer is proposed with the introduction of a new hybrid model and the publication of a large dataset gathering 10000 fashion time series and influencers external signals. A second approach is then studied with theoretical work done on hidden Markov models with external signals. Finally, a last answer is proposed with the introduction of a new method mixing the inner workings of hidden Markov model and neural networks.Results presented in this three contribution highlighted several elements of answer. Firstly, neural networks are decisive to deal with large datasets and they are particularly well designed to leverage external signals. Secondly, hidden Markov models with external signals are also strong methods that can capture complex dependencies between time series and their external signals. However, they fail at handling large datasets as a model has to be trained for each new time series. Finally, inspired by the striking results of hidden Markov models with external signals, we reveal that introducing hidden processes in neural-network-based models can help them explore large datasets more deeply, model a richer variety of behaviour and leverage more finely external signals

10

Andreux, Mathieu. "Foveal autoregressive neural time-series modeling". Electronic Thesis or Diss., Paris Sciences et Lettres (ComUE), 2018. http://www.theses.fr/2018PSLEE073.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Cette thèse s'intéresse à la modélisation non-supervisée de séries temporelles univariées. Nous abordons tout d'abord le problème de prédiction linéaire des valeurs futures séries temporelles gaussiennes sous hypothèse de longues dépendances, qui nécessitent de tenir compte d'un large passé. Nous introduisons une famille d'ondelettes fovéales et causales qui projettent les valeurs passées sur un sous-espace adapté au problème, réduisant ainsi la variance des estimateurs associés. Dans un deuxième temps, nous cherchons sous quelles conditions les prédicteurs non-linéaires sont plus performants que les méthodes linéaires. Les séries temporelles admettant une représentation parcimonieuse en temps-fréquence, comme celles issues de l'audio, réunissent ces conditions, et nous proposons un algorithme de prédiction utilisant une telle représentation. Le dernier problème que nous étudions est la synthèse de signaux audios. Nous proposons une nouvelle méthode de génération reposant sur un réseau de neurones convolutionnel profond, avec une architecture encodeur-décodeur, qui permet de synthétiser de nouveaux signaux réalistes. Contrairement à l'état de l'art, nous exploitons explicitement les propriétés temps-fréquence des sons pour définir un encodeur avec la transformée en scattering, tandis que le décodeur est entraîné pour résoudre un problème inverse dans une métrique adaptée
This dissertation studies unsupervised time-series modelling. We first focus on the problem of linearly predicting future values of a time-series under the assumption of long-range dependencies, which requires to take into account a large past. We introduce a family of causal and foveal wavelets which project past values on a subspace which is adapted to the problem, thereby reducing the variance of the associated estimators. We then investigate under which conditions non-linear predictors exhibit better performances than linear ones. Time-series which admit a sparse time-frequency representation, such as audio ones, satisfy those requirements, and we propose a prediction algorithm using such a representation. The last problem we tackle is audio time-series synthesis. We propose a new generation method relying on a deep convolutional neural network, with an encoder-decoder architecture, which allows to synthesize new realistic signals. Contrary to state-of-the-art methods, we explicitly use time-frequency properties of sounds to define an encoder with the scattering transform, while the decoder is trained to solve an inverse problem in an adapted metric

11

Dridi, Aicha. "A novel efficient time series deep learning approach using classification, prediction and reinforcement : energy and telecom use case". Electronic Thesis or Diss., Institut polytechnique de Paris, 2022. http://www.theses.fr/2022IPPAS010.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

La croissance massive des capteurs (température, humidité, accéléromètre, capteur de position) et des appareils mobiles (smartphones, tablettes, smartwatch …) fait que la quantité de données générées augmente de manière explosive. Cette immense quantité de données peut être collectée et gérée. Le travail réalisé durant cette thèse vise à proposer en un premier temps une approche qui traite un type de données spécifique qui sont les séries temporelles. Pour ce faire nous avons utilisé des méthodes de classification basées sur des réseaux de neurones convolutifs ainsi que des multi layer perceptron afin d'extraire les informations pertinentes. Nous avons par la suite eu recours à l'utilisation des réseaux de neurones récurrents pour réaliser les prédictions. Les données utilisées provenaient de plusieurs sources : Données de consommation énergétique, données de production d'énergies renouvelables, données cellulaires, données de trace GPS de taxi. Nous avons également investigué plusieurs autres méthodes telles que la compression sémantique ainsi que le transfer learning. Les deux méthodes décrites précédemment nous permettent pour la première de ne transmettre que les poids des réseaux de neurones ou en cas d'anomalie détectée d'envoyer les données la constituant. Le transfer learning nous permet quant à lui de réaliser de bonnes prédictions même si les données traitées souffrent d'un manque ou d'un bruit. Ces traitements nous ont permis par la suite de mettre en place des mécanismes dynamiques de détection d'anomalie. L'objectif du dernier volet de la thèse est le développement et l'implémentation d'une solution de management des ressources ayant comme entrée le résultat des phases précédentes. Pour mettre en place cette solution de gestion des ressources nous avons utilisé plusieurs approches tel que l'apprentissage par renforcement, la résolution exacte ou encore des réseaux de neurones récurrents. Une première application est la mise en place d'un système de management de l'énergie et la seconde est la gestion du déploiement des drones pour assister les réseaux cellulaires en cas d'anomalies
The massive growth of sensors (temperature, humidity, accelerometer, position sensor) and mobile devices (smartphones, tablets, smartwatches) increases the amount of data generated explosively. This immense amount of data can be collected and managed. The work carried out during this thesis aims first to propose an approach that deals with a specific type of data, which are time series. First, we used classification methods based on convolutional neural networks and multilayer perceptrons to extract the relevant information. We then used recurrent neural networks to make the predictions. We treated several time series data: energy, cellular, and GPS taxi track data. We also investigated several other methods like as semantic compression and transfer learning. The two described methods above allow us for the first to transmit only the weight of the neural networks, or if an anomaly is detected, send the anomalous data. Transfer learning allows us to make good predictions even if the data is missing or noisy. These methods allowed us to set up dynamic anomaly detection mechanisms. The objective of the last part of the thesis is to develop and implement a resource management solution having as input the result of the previous phases. We used several methods to implement this resource management solution, such as reinforcement learning, exact resolution, or recurrent neural networks. The first application is the implementation of an energy management system. The second application is the management of the deployment of drones to assist cellular networks when an anomaly occurs

12

Nguyen, Thi Thu Tam. "Learning techniques for the load forecasting of parcel pick-up points". Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG034.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

La livraison de colis en points relais (PR) ou en consigne automatique est une alternative intéressante à la livraison à domicile, que ce soit pour des achats auprès de commerçants en ligne (B2C) ou sur des plateformes de vente entre particuliers (C2C). Un colis peut être livré en PR à un coût réduit et reste plusieurs jours à disposition du client avant d'être retourné au vendeur. Cependant, lorsque le PR choisi est saturé, le colis peut être refusé par le gestionnaire du PR et livré à un autre PR sur la tournée du transporteur. Ceci engendre une perte de temps pour le client et donc du mécontentement. Afin d'améliorer la satisfaction du client, lors d'un achat de produit il est donc important que le gestionnaire des PR (GPR) ne propose que des PR qui seront susceptibles d'accepter les colis. Cette tâche est complexe à cause des délais de livraison : un colis n'affecte la charge d'un PR qu'un à quelques jours après la commande, selon le transporteur. Cette thèse a pour objectif de prédire l'évolution de la charge d'un PR afin de permettre à un GPR de mieux équilibrer les charges de PR géographiquement proches et de limiter le risque de refus d'un colis. Pour cela, une analyse des historiques de charges de PR est effectuée afin de déterminer les paramètres importants influant sur la charge. Des modèles statistiques et issus de l'intelligence artificielle sont ensuite comparés. Dans une première partie, nous considérons la charge des PR liée aux achats en ligne effectués auprès de sites marchands (B2C). La modélisation de l'évolution de la charge d'un PR tient compte du nombre de colis dans chaque état (prêt à être expédié, en transit, livré au PR). Ensuite, le cycle de vie d'un colis est pris en compte dans le processus de prédiction, via des modèles des flux de commandes, des délais de livraison, et du processus de retrait. L'approche proposée reposant sur un modèle est comparée avec des approches exploitant la série temporelle du nombre de livraisons, de retraits et de la charge en termes de précision de prédiction. Dans un deuxième temps, nous considérons la partie de la charge des PR liée aux colis issus des sites de vente entre particuliers (C2C). Dans cette approche, la probabilité qu'un colis contribue à la charge d'un PR est évaluée en fonction de la connaissance de l'état du colis au moment de la prédiction. Le cycle de vie du colis est modélisé par un processus markovien à sauts. De plus, le nombre de colis déposés à destination d'un PR donné est décrit par un modèle autorégressif à changements markoviens (MSAR) pour prendre en compte de la non-stationarité de l'activité de vente entre particuliers. Les paramètres des modèles sont estimés à partir de données historiques sur les dates de chaque étape: dépôt, collecte, livraison et retrait. Il est ensuite possible de déduire la probabilité de la charge future d'un PR. Cette approche est à nouveau comparée à des techniques exploitant la série temporelle de la charge (modèle de Holt-Winters, SARIMA ou LSTM). Dans les deux cas, l'approche proposée considérant le cycle de vie des colis donne de meilleures performances de prédiction, en particulier pour la prédiction jusqu'à quatre jours à l'avance dans le cas du B2C et jusqu'à six jours à l'avance dans le cas du C2C, en comparaison avec les modèles de type LSTM, Holt-Winters, ou SARIMA. Ces résultats permettent de prédire la charge d'un PR avec une erreur relative de 3 colis à 1 jour, et de 7 colis à 3 jours pour les colis B2C, et de 5 colis à 1 jour et de 8 colis à 7 jours pour les colis C2C. Compte-tenu des délais entre commande et livraison (en général de 1 à 3 jours pour le B2C et de 4-5 jours pour le C2C), ces techniques de prédiction sont utiles pour permettre un équilibrage de la charge de PR voisins. Les travaux futurs seront pour but d’améliorer les approches de prévision et de déterminer une méthode d’équilibrage de charge pour mieux gérer le flux de colis
Pick-Up Points (PUP) represent an alternative delivery option for purchases from online retailers (Business-to-Customer, B2C) or online Customer-to-Customer (C2C) marketplaces. Parcels are delivered at a reduced cost to a PUP and wait until being picked up by customers or returned to the original warehouse if their sojourn time is over. When the chosen PUP is overloaded, the parcel may be refused and delivered to the next available PUP on the carrier tour. PUP load forecasting is an efficient method for the PUP management company (PMC) to better balance the load of each PUP and reduce the number of rerouted parcels. This thesis aims to describe the parcel flows in a PUP and to proposed models used to forecast the evolution of the load. For the PUP load associated with the B2C business, the parcel life-cycle has been taken into account in the forecasting process via models of the flow of parcel orders, the delivery delays, and the pick-up process. Model-driven and data-driven approaches are compared in terms of load-prediction accuracy. For the PUP load associated with the C2C business, the daily number of parcels dropped off with a given PUP as target is described by a Markov-Switching AutoRegressive model to account for the non-stationarity of the second-hand shopping activity. The life-cycle of each parcel is modeled by a Markov jump process. Model parameters are evaluated from previous parcel drop-off, delivery, and pick-up records. The probability mass function of the future load of a PUP is then evaluated using all information available on parcels with this PUP as target. In both cases, the proposed model-driven approaches give, for most of the cases, better forecasting performance, compared with the data-driven models, involving LSTM, Random forest, Holt-Winters, and SARIMA models, up to four days ahead in the B2C case and up to six days ahead in the C2C case. The first approach applied to the B2C parcel load yields an MAE of 3 parcels for the one-day ahead prediction and 8 parcels for the four-day ahead prediction. The second approach applied to the C2C parcel load yields an MAE of 5 parcels for the one-day ahead prediction and 8 parcels for the seven-day ahead prediction. These prediction horizons are consistent with the delivery delay associated with these parcels (1-3 days in the case of a B2C parcel and 4-5 days in the case of a C2C parcel). Future research directions aim at optimizing the prediction accuracy, especially in predicting future orders and studying a load-balancing approach to better share the load between PUPs

13

Barkaoui, Ahmed. "La désagrégation temporelle des séries d'observations économiques". Paris 10, 1995. http://www.theses.fr/1995PA100055.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Cette thèse traite le problème rencontre en modélisation économétrique lorsque les séries d'observations sur certaines variables ne sont disponibles qu'en valeurs agrégées dans le temps. Les solutions pratiques consistent à estimer les valeurs non observées en respectant la comptabilité avec les observations agrégées (procédures de désagrégation temporelle). Cette estimation peut se faire à partir des observations agrèges uniquement ou en utilisant, quand elles sont disponibles, des indicateurs économiques observées dans la bonne temporalité. L'étude des principales procédures utilisées dans les organismes de statistique ou dans les logiciels d'économétrie a permis de proposer -pour un problème donne- un critère de sélection base sur l'information connue a priori sur les séries et sur des tests statistiques. Le problème de la désagrégation temporelle a été étendu au cas d'un vecteur de variables lorsque leur somme est observée en données désagrégées. Deux applications ont été effectuées : l'une sur la construction de séries trimestrielles de la fbcf productif par branche d'activité, et l'autre sur l'estimation du PIB marchand mensuel. Si l'un considère que la série désagrégée peut être générée à partir d'un modèle dynamique quelconque complètement spécifié, de nouvelles procédures permettant de résoudre le problème en utilisant la représentation dans l'espace des états et les techniques du filtre e kalman et du lissage
This thesis treats the problem encountered in econometric modeling when temporal observations on certain variables are available only in a temporally aggregated fora. The practical solution consists of estimating disaggregated series which are consistent with the observed data (temporal disaggregation procedures). This estimation can be done only by aggregated series or by using some related series -if available- observed in the suit time periods. The analysis of the principal procedures used in statistic organisms or in econometric software’s, has allowed to propose -for a given problem- a criterion of selection based on a priori known on time series and on statistical tests. The problem of temporal disaggregation was extended to the case of a vector of variables when the sum of the latters is observed in disaggregated data. Two applications were performed: the first was performed on the construction of the quarterly series of productive investment (fbcf) by activity branch. The second on the estimation of monthly merchant gdp. If we assume that the disaggregated series can be generated by whatever completely specified dynamic model, new methods can resolve the problem using the states space representation and the kalean filter and smoothing technics

14

Agoua, Xwégnon. "Développement de méthodes spatio-temporelles pour la prévision à court terme de la production photovoltaïque". Thesis, Paris Sciences et Lettres (ComUE), 2017. http://www.theses.fr/2017PSLEM066/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

L’évolution du contexte énergétique mondial et la lutte contre le changement climatique ont conduit à l’accroissement des capacités de production d’énergie renouvelable. Les énergies renouvelables sont caractérisées par une forte variabilité due à leur dépendance aux conditions météorologiques. La maîtrise de cette variabilité constitue un enjeu important pour les opérateurs du système électrique, mais aussi pour l’atteinte des objectifs européens de réduction des émissions de gaz à effet de serre, d’amélioration de l’efficacité énergétique et de l’augmentation de la part des énergies renouvelables. Dans le cas du photovoltaïque(PV), la maîtrise de la variabilité de la production passe par la mise en place d’outils qui permettent de prévoir la production future des centrales. Ces prévisions contribuent entre autres à l’augmentation du niveau de pénétration du PV,à l’intégration optimale dans le réseau électrique, à l’amélioration de la gestion des centrales PV et à la participation aux marchés de l’électricité. L’objectif de cette thèse est de contribuer à l’amélioration de la prédictibilité à court-terme (moins de 6 heures) de la production PV. Dans un premier temps, nous analysons la variabilité spatio-temporelle de la production PV et proposons une méthode de réduction de la non-stationnarité des séries de production. Nous proposons ensuite un modèle spatio-temporel de prévision déterministe qui exploite les corrélations spatio-temporelles entre les centrales réparties sur une région. Les centrales sont utilisées comme un réseau de capteurs qui permettent d’anticiper les sources de variabilité. Nous proposons aussi une méthode automatique de sélection des variables qui permet de résoudre les problèmes de dimension et de parcimonie du modèle spatio-temporel. Un modèle spatio-temporel probabiliste a aussi été développé aux fins de produire des prévisions performantes non seulement du niveau moyen de la production future mais de toute sa distribution. Enfin nous proposons, un modèle qui exploite les observations d’images satellites pour améliorer la prévision court-terme de la production et une comparaison de l’apport de différentes sources de données sur les performances de prévision
The evolution of the global energy context and the challenges of climate change have led to anincrease in the production capacity of renewable energy. Renewable energies are characterized byhigh variability due to their dependence on meteorological conditions. Controlling this variabilityis an important challenge for the operators of the electricity systems, but also for achieving the Europeanobjectives of reducing greenhouse gas emissions, improving energy efficiency and increasing the share of renewable energies in EU energy consumption. In the case of photovoltaics (PV), the control of the variability of the production requires to predict with minimum errors the future production of the power stations. These forecasts contribute to increasing the level of PV penetration and optimal integration in the power grid, improving PV plant management and participating in electricity markets. The objective of this thesis is to contribute to the improvement of the short-term predictability (less than 6 hours) of PV production. First, we analyze the spatio-temporal variability of PV production and propose a method to reduce the nonstationarity of the production series. We then propose a deterministic prediction model that exploits the spatio-temporal correlations between the power plants of a spatial grid. The power stationsare used as a network of sensors to anticipate sources of variability. We also propose an automaticmethod for selecting variables to solve the dimensionality and sparsity problems of the space-time model. A probabilistic spatio-temporal model has also been developed to produce efficient forecasts not only of the average level of future production but of its entire distribution. Finally, we propose a model that exploits observations of satellite images to improve short-term forecasting of PV production

15

Vuillemin, Benoit. "Recherche de règles de prédiction dans un contexte d'Intelligence Ambiante". Thesis, Lyon, 2020. http://www.theses.fr/2020LYSE1120.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Cette thèse traite du sujet de l’intelligence ambiante, fusion entre l’intelligence artificielle et l’internet des objets. L’objectif de ce travail est d’extraire des règles de prédiction à partir des données fournies par les objets connectés dans un environnement, afin de proposer aux utilisateurs des automatisations. Notre principale motivation repose sur la confidentialité, les interactions entre utilisateurs et l’explicabilité du fonctionnement du système. Dans ce contexte, plusieurs contributions ont été apportées. La première est une architecture d’intelligence ambiante qui fonctionne localement et traite les données provenant d’un seul environnement connecté. La seconde est un processus de discrétisation sans a priori sur les données d’entrée, permettant de prendre en compte les différentes données provenant de divers objets. La troisième est un nouvel algorithme de recherche de règles sur une série temporelle, qui évite les limitations des algorithmes de l’état de l’art. L’approche a été validée par des tests sur deux bases de données réelles. Enfin, les perspectives de développement du système sont présentées
This thesis deals with the subject of Ambient Intelligence, the fusion between Artificial Intelligence and the Internet of Things. The goal of this work is to extract prediction rules from the data provided by connected objects in an environment, in order to propose automation to users. Our main concern relies on privacy, user interactions, and the explainability of the system’s operation. In this context, several contributions were made. The first is an ambient intelligence architecture that operates locally, and processes data from a single connected environment. The second is a discretization process without a priori on the input data, allowing to take into account different kinds of data from various objects. The third is a new algorithm for searching rules over a time series, which avoids the limitations of stateoftheart algorithms. The approach was validated by tests on two real databases. Finally, prospects for future developments in the system are presented

16

Ben, Hamadou Radhouane. "Contribution à l'analyse spatio-temporelle de séries écologiques marines". Paris 6, 2003. http://www.theses.fr/2003PA066021.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

17

Huard, Malo. "Apprentissage et prévision séquentiels : bornes uniformes pour le regret linéaire et séries temporelles hiérarchiques". Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASM009.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Ce travail présente quelques contributions théoriques et pratiques à la prévision des suites arbitraires. Dans ce domaine, la prévision se déroule séquentiellement en même temps que l'apprentissage. À chaque étape, on ajuste le modèle sur les données passées afin de prévoir la prochaine observation. Le but de ce modèle est de faire les meilleures prévisions possibles, c'est-à-dire celles qui minimisent leurs écarts avec les observations. Les méthodes d'apprentissage séquentielles sont évaluées par leur regret, qui mesure à quelle point une stratégie est proche de la meilleure possible, qui est seulement connue une fois l'ensemble des données disponible. Un des résultats de cette thèse est d'étendre l'ensemble des stratégies auxquels on se compare lorsque l'on fait de la régression linéaire séquentielle. Nous avons adapté un algorithme existant en améliorant ses garanties théoriques pour lui permettre de se comparer à n'importe quelle combinaison linéaire constante sans restriction sur la norme de ses poids de mélange. Un deuxième travail a consisté à étendre les méthodes de prévisions séquentielles lorsque les données à prévoir sont hiérarchiquement organisées. Nous avons testé ces méthodes hiérarchiques sur deux applications pratiques, la prévision de consommation électrique des ménages et la prévision de ventes pour le e-commerce
This work presents some theoretical and practical contributions to the prediction of arbitrary sequences. In this domain, forecasting takes place sequentially at the same time as learning. At each step, the model is fitted on the past data in order to predict the next observation. The goal of this model is to make the best possible predictions, i.e. those that minimize their deviations from the observations, which are made a posteriori. Sequential learning methods are evaluated by their regret, which measures how close strategies are to the best possible, known only after all the data is available. In this thesis, we extend the set of weights vectors a method is compared to when doing sequential linear regression. We have adapted an existing algorithm by improving its theoretical guarantees allowing it to be compared to any constant linear combination without restriction on the norm of its mixing weights. A second work consisted in extending sequential forecasting methods when forcasted data is organized in a hierarchy. We tested these hierarchical methods on two practical applications, household power consumption prediction and demand forecasts in e-commerce

18

Hugueney, Bernard. "Représentations symboliques de longues séries temporelles". Paris 6, 2003. http://www.theses.fr/2003PA066161.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

19

Corbineau, Ana. "Variabilité temporelle des grands poissons pélagiques exploités dans les écosystèmes marins tropicaux". Paris 6, 2009. http://www.theses.fr/2009PA066257.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Le développement de la pêche thonière industrielle dans l’océan mondial depuis le début des années 1950 et le suivi des statistiques de pêche par les différentes commissions thonières régionales nous ont permis de construire des séries temporelles de captures et de taux de captures (CPUE) sur les principales espèces commercialement exploitées. Les océans ont été divisés en grandes provinces biogéographiques définies par Longhurst. Les statistiques spatialisées de pêche ont été agrégées par province biogéographique, par pays pêcheur et par espèce. Les composantes périodiques de chaque série temporelle ont été mises en évidence à partir de la méthode des ondelettes. Pour comparer les spectres d’ondelettes, nous avons appliqué une méthode multivariée basée sur la covariance entre chaque paire de spectres. Chaque spectre est identifié par une modalité de chacun des facteurs (espèce, province, flottille, ou océan). A partir d’une matrice de distances entre toutes les paires de spectres, nous avons classé les séries temporelles et identifié les facteurs les plus influant. Ensuite, nous avons étudié les relations entre les séries de capture et de CPUE et les indices climatiques globaux à partir des analyses d’ondelettes croisées. Les résultats montrent que le facteur « province géographique » structure plus les patterns de variations que les facteurs « espèce » et « océan ». L’impact de la variabilité climatique sur les séries de captures de thons est modulé par la province géographique aussi. Les fluctuations des séries temporelles traduisent donc des interactions complexes entre les processus biologiques, les stratégies de pêche et la variabilité environnementale.

20

Himdi, Khalid El. "Séries chronologiques binaires avec récompenses : Applications à la modélisation en climatologie". Grenoble 1, 1986. http://tel.archives-ouvertes.fr/tel-00320012.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Divers types de séries chronologiques binaires avec récompenses sont étudiés en vue de la modélisation de la succession des valeurs d'une variable climatologique dans une station de mesure pour une période donnée de l'année. Pour différentes hypothèses de dépendance entre les états successifs du processus, nous précisons les caractéristiques essentielles du modèle associé. Des essais de modélisation concernant les séries de précipitations journalières mesurées dans deux stations pluviométriques du réseau français illustrent les possibilités d'utilisation des modèles envisagés

21

Nowakowski, Samuel. "Détection de défauts dans les séries temporelles". Nancy 1, 1989. http://www.theses.fr/1989NAN10074.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Utilisation des calculs de distances pour résoudre des problèmes rencontrés pour les tests de détection de changements tels que le test du rapport de vraisemblance généralisé. Expérimentation de la méthode de la variable instrumentale

22

Parmezan, Antonio Rafael Sabino. "Predição de séries temporais por similaridade". Universidade de São Paulo, 2016. http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21112016-150659/.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Um dos maiores desafios em Mineração de Dados é a integração da informação temporal ao seu processo. Esse fato tem desafiado profissionais de diferentes domínios de aplicação e recebido investimentos consideráveis da comunidade científica e empresarial. No contexto de predição de Séries Temporais, os investimentos se concentram no subsídio de pesquisas destinadas à adaptação dos métodos convencionais de Aprendizado de Máquina para a análise de dados na qual o tempo constitui um fator importante. À vista disso, neste trabalho é proposta uma nova extensão do algoritmo de Aprendizado de Máquina k-Nearest Neighbors (kNN) para predição de Séries Temporais, intitulado de kNN - Time Series Prediction with Invariances (kNN-TSPI ). O algoritmo concebido difere da versão convencional pela incorporação de três técnicas para obtenção de invariância à amplitude e deslocamento, invariância à complexidade e tratamento de casamentos triviais. Como demonstrado ao longo desta dissertação de mestrado, o uso simultâneo dessas técnicas proporciona ao kNN-TSPI uma melhor correspondência entre as subsequências de dados e a consulta de referência. Os resultados de uma das avaliações empíricas mais extensas, imparciais e compreensíveis já conduzidas no tema de predição de Séries Temporais evidenciaram, a partir do confronto de dez métodos de projeção, que o algoritmo kNN-TSPI, além de ser conveniente para a predição automática de dados a curto prazo, é competitivo com os métodos estatísticos estado-da-arte ARIMA e SARIMA. Por mais que o modelo SARIMA tenha atingido uma precisão relativamente superior a do método baseado em similaridade, o kNN-TSPI é consideravelmente mais simples de ajustar. A comparação objetiva e subjetiva entre algoritmos estatísticos e de Aprendizado de Máquina para a projeção de dados temporais vem a suprir uma importante lacuna na literatura, a qual foi identificada por meio de uma revisão sistemática seguida de uma meta-análise das publicações selecionadas. Os 95 conjuntos de dados empregados nos experimentos computacionais juntamente com todas as projeções analisadas em termos de Erro Quadrático Médio, coeficiente U de Theil e taxa de acerto Prediction Of Change In Direction encontram-se disponíveis no portal Web ICMC-USP Time Series Prediction Repository. A presente pesquisa abrange também contribuições e resultados significativos em relação às propriedades inerentes à predição baseada em similaridade, sobretudo do ponto de vista prático. Os protocolos experimentais delineados e as diversas conclusões obtidas poderão ser usados como referência para guiar o processo de escolha de modelos, configuração de parâmetros e aplicação dos algoritmos de Inteligência Artificial para predição de Séries Temporais.
One of the major challenges in Data Mining is integrating temporal information into process. This difficulty has challenged professionals several application fields and has been object of considerable investment from scientific and business communities. In the context of Time Series prediction, these investments consist majority of grants for designed research aimed at adapting conventional Machine Learning methods for data analysis problems in which time is an important factor. We propose a novel modification of the k-Nearest Neighbors (kNN) learning algorithm for Time Series prediction, namely the kNN - Time Series Prediction with Invariances (kNN-TSPI). Our proposal differs from the literature by incorporating techniques for amplitude and offset invariance, complexity invariance, and treatment of trivial matches. These three modifications allow more meaningful matching between the reference queries and Time Series subsequences, as we discuss with more details throughout this masters thesis. We have performed one of the most comprehensible empirical evaluations of Time Series prediction, in which we faced the proposed algorithm with ten methods commonly found in literature. The results show that the kNN-TSPI is appropriate for automated short-term projection and is competitive with the state-of-the-art statistical methods ARIMA and SARIMA. Although in our experiments the SARIMA model has reached a slightly higher precision than the similarity based method, the kNN-TSPI is considerably simpler to adjust. The objective and subjective comparisons of statistical and Machine Learning algorithms for temporal data projection fills a major gap in the literature, which was identified through a systematic review followed by a meta-analysis of selected publications. The 95 data sets used in our computational experiments, as well all the projections with respect to Mean Squared Error, Theils U coefficient and hit rate Prediction Of Change In Direction are available online at the ICMC-USP Time Series Prediction Repository. This work also includes contributions and significant results with respect to the properties inherent to similarity-based prediction, especially from the practical point of view. The outlined experimental protocols and our discussion on the usage of them, can be used as a guideline for models selection, parameters setting, and employment of Artificial Intelligence algorithms for Time Series prediction.

23

Guàrdia, Sebaoun Elie. "Accès personnalisé à l'information : prise en compte de la dynamique utilisateur". Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066519/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

L’enjeu majeur de cette thèse réside dans l’amélioration de l’adéquation entre l’information retournée et les attentes des utilisateurs à l’aide de profils riches et efficaces. Il s’agit donc d’exploiter au maximum les retours utilisateur (qu’ils soient donnés sous la forme de clics, de notes ou encore d’avis écrits) et le contexte. En parallèle la forte croissance des appareils nomades (smartphones, tablettes) et par conséquent de l’informatique ubiquitaire nous oblige à repenser le rôle des systèmes d’accès à l’information. C’est pourquoi nous ne nous sommes pas seulement intéressés à la performance à proprement parler mais aussi à l’accompagnement de l’utilisateur dans son accès à l’information. Durant ces travaux de thèse, nous avons choisi d’exploiter les textes écrit par les utilisateurs pour affiner leurs profils et contextualiser la recommandation. À cette fin, nous avons utilisé les avis postés sur les sites spécialisés (IMDb, RateBeer, BeerAdvocate) et les boutiques en ligne (Amazon) ainsi que les messages postés sur Twitter.Dans un second temps, nous nous sommes intéressés aux problématiques de modélisation de la dynamique des utilisateurs. En plus d’aider à l’amélioration des performances du système, elle permet d’apporter une forme d’explication quant aux items proposés. Ainsi, nous proposons d’accompagner l’utilisateur dans son accès à l’information au lieu de le contraindre à un ensemble d’items que le système juge pertinents
The main goal of this thesis resides in using rich and efficient profiling to improve the adequation between the retrieved information and the user's expectations. We focus on exploiting as much feedback as we can (being clicks, ratings or written reviews) as well as context. In the meantime, the tremendous growth of ubiquitous computing forces us to rethink the role of information access platforms. Therefore, we took interest not solely in performances but also in accompanying users through their access to the information. Through this thesis, we focus on users dynamics modeling. Not only it improves the system performances but it also brings some kind of explicativity to the recommendation. Thus, we propose to accompany the user through his experience accessing information instead of constraining him to a given set of items the systems finds fitting

24

Do, Cao Tri. "Apprentissage de métrique temporelle multi-modale et multi-échelle pour la classification robuste de séries temporelles par plus proches voisins". Thesis, Université Grenoble Alpes (ComUE), 2016. http://www.theses.fr/2016GREAM028/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

La définition d'une métrique entre des séries temporelles est un élément important pour de nombreuses tâches en analyse ou en fouille de données, tel que le clustering, la classification ou la prédiction. Les séries temporelles présentent naturellement différentes caractéristiques, que nous appelons modalités, sur lesquelles elles peuvent être comparées, comme leurs valeurs, leurs formes ou leurs contenus fréquentielles. Ces caractéristiques peuvent être exprimées avec des délais variables et à différentes granularités ou localisations temporelles - exprimées globalement ou localement. Combiner plusieurs modalités à plusieurs échelles pour apprendre une métrique adaptée est un challenge clé pour de nombreuses applications réelles impliquant des données temporelles. Cette thèse propose une approche pour l'Apprentissage d'une Métrique Multi-modal et Multi-scale (M2TML) en vue d'une classification robuste par plus proches voisins. La solution est basée sur la projection des paires de séries temporelles dans un espace de dissimilarités, dans lequel un processus d'optimisation à vaste marge est opéré pour apprendre la métrique. La solution M2TML est proposée à la fois dans le contexte linéaire et non-linéaire, et est étudiée pour différents types de régularisation. Une variante parcimonieuse et interprétable de la solution montre le potentiel de la métrique temporelle apprise à pouvoir localiser finement les modalités discriminantes, ainsi que leurs échelles temporelles en vue de la tâche d'analyse considérée. L'approche est testée sur un vaste nombre de 30 bases de données publiques et challenging, couvrant des images, traces, données ECG, qui sont linéairement ou non-linéairement séparables. Les expériences montrent l'efficacité et le potentiel de la méthode M2TML pour la classification de séries temporelles par plus proches voisins
The definition of a metric between time series is inherent to several data analysis and mining tasks, including clustering, classification or forecasting. Time series data present naturally several characteristics, called modalities, covering their amplitude, behavior or frequential spectrum, that may be expressed with varying delays and at different temporal granularity and localization - exhibited globally or locally. Combining several modalities at multiple temporal scales to learn a holistic metric is a key challenge for many real temporal data applications. This PhD proposes a Multi-modal and Multi-scale Temporal Metric Learning (M2TML) approach for robust time series nearest neighbors classification. The solution is based on the embedding of pairs of time series into a pairwise dissimilarity space, in which a large margin optimization process is performed to learn the metric. The M2TML solution is proposed for both linear and non linear contexts, and is studied for different regularizers. A sparse and interpretable variant of the solution shows the ability of the learned temporal metric to localize accurately discriminative modalities as well as their temporal scales.A wide range of 30 public and challenging datasets, encompassing images, traces and ECG data, that are linearly or non linearly separable, are used to show the efficiency and the potential of M2TML for time series nearest neighbors classification

25

Schopf, Eliseu Celestino. "Método neuro-estatístico para predição de séries temporais ruidosas". reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2007. http://hdl.handle.net/10183/11476.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

O presente trabalho trata da criação de uma nova abordagem para predição de séries temporais ruidosas, com modelo desconhecido e que apresentam grandes não-linearidades. O novo método neuro-estatístico proposto combina uma rede neural de múltiplas camadas com o método estatístico Filtro de Kalman Estendido. A justificativa para a junção dessas abordagens é o fato de possuírem características complementares para o tratamento das peculiaridades das séries descritas. Quanto ao ruído, o FKE consegue minimizar a sua influência, trabalhando com a variância do ruído extraído dos dados reais. Quanto ao modelo gerador da série, as redes neurais aproximam a sua função, aprendendo a partir de amostras dos próprios dados. Grandes não-linearidades também são tratadas pelas RNs. O método neuro-estatístico segue a estrutura do FKE, utilizando a RN como processo preditivo. Com isso, elimina-se a necessidade de conhecimento prévio da função de transição de estados. O poder de tratamento de não-linearidades da RN é mantido, utilizando-se a previsão desta como estimativa de estado e os seus valores internos para cálculo das jacobianas do FKE. As matrizes de covariâncias dos erros de estimativa e dos ruídos são utilizadas para melhora do resultado obtido pela RN. A rede é treinada com um conjunto de dados retirado do histórico da série, de maneira off-line, possibilitando o uso de poderosas estruturas de redes de múltiplas camadas. Os resultados do método neuro-estatístico são comparados com a mesma configuração de RN utilizada em sua composição, sendo ambos aplicados na série caótica de Mackey-Glass e em uma série combinada de senos. Ambas séries possuem grandes não-linearidades e são acrescidas de ruído. O novo método alcança resultados satisfatórios, melhorando o resultado da RN em todos os experimentos. Também são dadas contribuições no ajuste dos parâmetros do FKE, utilizados no novo método. O método híbrido proporciona uma melhora mútua entre a RN e o FKE, explicando os bons resultados obtidos.
This work presents a new forecast method over highly nonlinear noisy time series. The neural statistical method uses a multi-layer perceptron (NN) and the Extended Kalman Filter (EKF). The justification for the combination of these approaches is that they possess complementary characteristics for the treatment of the peculiarities of the series. The EKF minimizes the influence of noise, working with the variance of the noise obtained from the real data. The NN approximates the generating model’s function. High nonlinearities are also treated by the neural network. The neural statistical method follows the structure of the EKF, using the NN as the predictive process. Thus, it isn’t necessary previous knowledge of the state transition function. The power of treatment of nonlinearities of the NN is kept, using forecast of this as estimative of state and its internal values for calculation of the Jacobian matrix of the EKF. The error estimative covariance and the noise covariance matrixes are used to improve the NN outcome. The NN is trained offline by past observations of the series, which enable the use of powerfuls neural networks. The results of the neural statistical method are compared with the same configuration of NN used in its composition, being applied in the chaotic series of Mackey-Glass and an sine mistures series. Both series are noisy and highly nonlinear. The new method obtained satisfactory result, improving the result of the regular NN in all experiments. The method also contributes in the adjustment of the parameters of the EKF. The hybrid method has a mutual improvement between the NN and the EKF, which explains the obtained good results.

26

Guàrdia, Sebaoun Elie. "Accès personnalisé à l'information : prise en compte de la dynamique utilisateur". Electronic Thesis or Diss., Paris 6, 2017. http://www.theses.fr/2017PA066519.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

L’enjeu majeur de cette thèse réside dans l’amélioration de l’adéquation entre l’information retournée et les attentes des utilisateurs à l’aide de profils riches et efficaces. Il s’agit donc d’exploiter au maximum les retours utilisateur (qu’ils soient donnés sous la forme de clics, de notes ou encore d’avis écrits) et le contexte. En parallèle la forte croissance des appareils nomades (smartphones, tablettes) et par conséquent de l’informatique ubiquitaire nous oblige à repenser le rôle des systèmes d’accès à l’information. C’est pourquoi nous ne nous sommes pas seulement intéressés à la performance à proprement parler mais aussi à l’accompagnement de l’utilisateur dans son accès à l’information. Durant ces travaux de thèse, nous avons choisi d’exploiter les textes écrit par les utilisateurs pour affiner leurs profils et contextualiser la recommandation. À cette fin, nous avons utilisé les avis postés sur les sites spécialisés (IMDb, RateBeer, BeerAdvocate) et les boutiques en ligne (Amazon) ainsi que les messages postés sur Twitter.Dans un second temps, nous nous sommes intéressés aux problématiques de modélisation de la dynamique des utilisateurs. En plus d’aider à l’amélioration des performances du système, elle permet d’apporter une forme d’explication quant aux items proposés. Ainsi, nous proposons d’accompagner l’utilisateur dans son accès à l’information au lieu de le contraindre à un ensemble d’items que le système juge pertinents
The main goal of this thesis resides in using rich and efficient profiling to improve the adequation between the retrieved information and the user's expectations. We focus on exploiting as much feedback as we can (being clicks, ratings or written reviews) as well as context. In the meantime, the tremendous growth of ubiquitous computing forces us to rethink the role of information access platforms. Therefore, we took interest not solely in performances but also in accompanying users through their access to the information. Through this thesis, we focus on users dynamics modeling. Not only it improves the system performances but it also brings some kind of explicativity to the recommendation. Thus, we propose to accompany the user through his experience accessing information instead of constraining him to a given set of items the systems finds fitting

27

Clarotto, Lucia. "Spatio-temporal prediction by stochastic partial differential equationsPrédiction spatio-temporelle par équations aux dérivées partielles stochastiques". Electronic Thesis or Diss., Université Paris sciences et lettres, 2023. http://www.theses.fr/2023UPSLM022.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

L'introduction de modèles statistiques inspirés de la physique des phénomènes sous-jacents et numériquement efficaces est d'un intérêt croissant pour la prédiction de processus spatio-temporels en sciences environnementales. Les grands jeux de données spatio-temporelles nécessitent de nouvelles méthodes numériques efficaces. L'approche par Equations aux Dérivées Partielles Stochastiques (EDPS) s'est avérée efficace pour l'estimation et la prédiction dans un contexte spatial. Nous présentons ici une EDPS d'advection-diffusion avec une dérivée de premier ordre en temps qui définit une grande classe de modèles spatio-temporels non séparables. On construit une approximation de la solution de l'EDPS par un champ aléatoire Markovien Gaussien en discrétisant la dérivée temporelle par la méthode des différences finies (Euler implicite) et en résolvant l'EDPS spatiale par la méthode des éléments finis (Galerkin continu) à chaque pas de temps. La technique de stabilisation "Streamline Diffusion" est introduite lorsque le terme d'advection domine la diffusion. Des méthodes de calcul efficaces sont proposées pour estimer les paramètres de l'EDPS et pour prédire le champ spatio-temporel par krigeage, ainsi que pour effectuer des simulations conditionnelles. L'approche est appliquée à des jeux de données de rayonnement solaire et de vitesse du vent. Ses avantages et ses limites sont examinées, et de nouvelles perspectives de travail sont envisagées, notamment afin de proposer une extension dans un cadre non stationnaire. On présente également un travail portant sur la généralisation non séparable de la classe de Gneiting des fonctions de covariance spatio-temporelles multivariées. Le principal potentiel de l'approche est la possibilité d'obtenir des modèles entièrement non séparables dans un cadre multivarié, et les avantages sont illustrés sur un ensemble de données météorologiques trivariées. De plus, on propose une analyse de méthodes d'estimation et de prédiction approximées pour les données spatiales et spatio-temporelles, motivée par l'objectif de parvenir à un compromis entre l'efficacité statistique et la complexité computationnelle. Ces méthodes se sont avérées efficaces pour l'estimation des paramètres et la prédiction dans le contexte de la "Compétition de statistiques spatiales pour les grands jeux de données" organisée par la King Abdullah University of Science and Technology (KAUST) en 2021 et 2022. Enfin, d'autres pistes de recherche sont envisagées et examinées
In the task of predicting spatio-temporal fields in environmental science using statistical methods, introducing statistical models inspired by the physics of the underlying phenomena that are numerically efficient is of growing interest. Large space-time datasets call for new numerical methods to efficiently process them. The Stochastic Partial Differential Equation (SPDE) approach has proven to be effective for the estimation and the prediction in a spatial context. We present here the unsteady advection-diffusion SPDE which defines a large class of nonseparable spatio-temporal models. A Gaussian Markov random field approximation of the solution to the SPDE is built by discretizing the temporal derivative with a finite difference method (implicit Euler) and by solving the spatial SPDE with a finite element method (continuous Galerkin) at each time step. The Streamline Diffusion stabilization technique is introduced when the advection term dominates the diffusion. Computationally efficient methods are proposed to estimate the parameters of the SPDE and to predict the spatio-temporal field by kriging, as well as to perform conditional simulations. The approach is applied to solar radiation and wind speed datasets. Its advantages and limitations are discussed, and new perspectives for future work are envisaged, especially involving a nonstationary extension of the approach. As a further contribution of the PhD, the nonseparable generalization of the Gneiting class of multivariate space-time covariance functions is presented. The main potential of the approach is the possibility to obtain entirely nonseparable models in a multivariate setting, and this advantage is shown on a weather trivariate dataset. Finally, a review of some methods for approximate estimation and prediction for spatial and spatio-temporal data is proposed, motivated by the objective of reaching a trade-off between statistical efficiency and computational complexity. These methods proved to be effective for parameter estimation and prediction in the context of the "Spatial Statistics Competition for Large Datasets" organized by the King Abdullah University of Science and Technology (KAUST) in 2021 and 2022. Lastly, possible further research directions are discussed

28

Guégan, Dominique. "Modèles bilinéaires et polynomiaux de séries chronologiques : étude probabiliste et analyse statistique". Grenoble 1, 1988. http://tel.archives-ouvertes.fr/tel-00330671.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Cette thèse présente l'étude probabiliste et statistique approfondie des modèles bilinéaires à temps discret. On étudie ces modèles à partir de différentes approches (discrète, markovienne). On trouve tout d'abord une présentation globale des modèles non linéaires, la description des outils probabilistes utiles à l'étude des modèles non linéaires, ainsi qu'une présentation des modèles bilinéaires à partir de simulations permettant de mettre en évidence leurs principales caractéristiques trajectorielles. L'approche markovienne s'avère beaucoup plus puissante que l'approche directe. Nous démontrons l'existence d'une représentation markovienne sous la forme d'un modèle polynomial affine en l'état; nous donnons des critères pour la minimalité et l'inversibilité de ces représentations. Sur le plan statistique, nous avons montre la convergence presque sure des estimateurs des moindres carrés. D'autres estimateurs sont aussi envisagés permettant de mettre en place des tests d'adéquation de modèles. Certains travaux de l'auteur (huit articles) ont été publiés et sont regroupés dans l'annexe.

29

Hili, Ouagnina. "Contribution à l'estimation des modèles de séries temporelles non linéaires". Université Louis Pasteur (Strasbourg) (1971-2008), 1995. http://www.theses.fr/1995STR13169.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Le but de la these est d'effectuer l'inference statistique d'une classe generale de modeles de series temporelles non lineaires. Notre contribution consiste d'abord a determiner des conditions assurant l'existence d'une loi stationnaire, l'existence des moments de cette loi stationnaire et la forte melangeance de tels modeles. Nous etablissons ensuite les proprietes asymptotiques de l'estimateur du minimum de distance d'hellinger du parametre d'interet. La robustesse de cet estimateur est egalement envisagee. Nous examinons aussi, via la methode des moindres carres, les proprietes asymptotiques des estimateurs des coefficients des modeles autoregressifs a seuils

30

Al, Saleh Mohammed. "SPADAR : Situation-aware and proactive analytics for dynamic adaptation in real time". Electronic Thesis or Diss., université Paris-Saclay, 2022. http://www.theses.fr/2022UPASG060.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Bien que le niveau de rayonnement soit une préoccupation sérieuse qui nécessite une surveillance continue, de nombreux systèmes existants sont conçus pour effectuer cette tâche. Radiation Early Warning System (REWS) est l'un de ces systèmes qui surveille le niveau de rayonnement gamma dans l'air. Un tel système nécessite une intervention manuelle élevée, dépend totalement de l'analyse d'experts et présente des lacunes qui peuvent parfois être risquées. Dans cette thèse, l'approche RIMI (Refining Incoming Monitored Incidents) sera introduite, qui vise à améliorer ce système pour gagner en autonome tout en laissant la décision finale aux experts. Une nouvelle méthode est présentée qui aidera à changer ce système pour devenir plus intelligent tout en apprenant des incidents passés de chaque système spécifique
Although radiation level is a serious concern that requires continuous monitoring, many existing systems are designed to perform this task. Radiation Early Warning System (REWS) is one of these systems which monitors the gamma radiation level in the air. Such a system requires high manual intervention, depends totally on experts' analysis, and has some shortcomings that can be risky sometimes. In this thesis, the RIMI (Refining Incoming Monitored Incidents) approach will be introduced, which aims to improve this system while becoming more autonomous while keeping the final decision to the experts. A new method is presented which will help in changing this system to become more intelligent while learning from past incidents of each specific system

31

Ladjouze, Salim. "Problèmes d'estimation dans les séries temporelles stationnaires avec données manquantes". Phd thesis, Université Joseph Fourier (Grenoble ; 1971-2015), 1986. http://tel.archives-ouvertes.fr/tel-00319946.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Le problème des données manquantes a été abordé en introduisant les processus modulés en amplitude. Les propriétés de type ergodique (ergodicité au k-ième degré) sont étudiées dans le cadre des processus asymptotiquement stationnaires. Dans le domaine non paramétrique on étudie la consistance de deux estimateurs de la fonction de covariance et la variance asymptotique de l'un deux. On propose ensuite une méthode générale d'estimation de la fonction de densité spectrale du processus étudié. L'estimateur obtenu est étudié du point de vue biais et variance asymptotiques. Des méthodes d'estimation paramétrique, basées sur le périodogramme et du maximum de vraisemblance, sont aussi présentées

32

Plaud, Angéline. "Classification ensembliste des séries temporelles multivariées basée sur les M-histogrammes et une approche multi-vues". Thesis, Université Clermont Auvergne‎ (2017-2020), 2019. http://www.theses.fr/2019CLFAC047.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

La mesure des différents phénomènes terrestres et l’échange d’informations ont permis l’émergence d’un type de données appelé série temporelle. Celle-ci se caractérise par un grand nombre de points la composant et surtout par des interactions entre ces points. En outre, une série temporelle est dite multivariée lorsque plusieurs mesures sont captées à chaque instant de temps. Bien que l’analyse des séries temporelles univariées, une mesure par instant, soit très développée, l’analyse des séries multivariées reste un challenge ouvert. En effet, il n’est pas possible d’appliquer directement les méthodes univariées sur les données multivariées, car il faut tenir compte des interactions entre séries de mesures.De plus, dans le cadre d’applications industrielles, les séries temporelles ne sont pas composées d’un même nombre de mesures, ce qui complique encore leur analyse. Or les méthodes mises à disposition, aujourd’hui, pour la classification supervisée de ces séries, ne permettent pas de répondre de manière satisfaisante à cette problématique en plus d’une gestion rapide et efficace des données. Cette approche emploie donc un nouvel outil, qui n’a jamais été utilisé dans le domaine de la classification de séries temporelles multivariées, qui est le M-histogramme pour répondre à cette question.Un M-histogramme est à la base une méthode de visualisation sur M axes de la fonction de densité sous-jacente à un échantillon de données. Son utilisation ici permet de produire une nouvelle représentation de nos données afin de mettre en évidence les interactions entre dimensions.Cette recherche de liens entre dimensions correspond aussi tout particulièrement à un sous-domaine d’apprentissage, appelé l’apprentissage multi-vues. Où une vue est une extraction de plusieurs dimensions d’un ensemble de données, de même nature ou type. L’objectif est alors d’exploiter le lien entre ces dimensions afin de mieux classifier les dites données, au travers d’un modèle ensembliste permettant d’agréger les prédictions émises à partir de chaque vue. Dans cette thèse, nous proposons donc une méthode multi-vues ensembliste de M-histogrammes afin de classifier les Séries Temporelles Multivariées (STM). Cela signifie que plusieurs M-histogrammes sont créés à partir de plusieurs vues des STM exploitées. Une prédiction est ensuite réalisée grâce à chaque M-histogramme. Enfin ces prédictions sont ensuite agrégées afin de produire une prédiction finale.Il est montré dans la suite que la méthode ainsi créée est capable de répondre au problème général de la classification supervisée de STM et son efficacité est exposée sur un cas applicatif Michelin
Recording measurements about various phenomena and exchanging information about it, participate in the emergence of a type of data called time series. Today humongous quantities of those data are often collected. A time series is characterized by numerous points and interactions can be observed between those points. A time series is multivariate when multiple measures are recorded at each timestamp, meaning a point is, in fact, a vector of values. Even if univariate time series, one value at each timestamp, are well-studied and defined, it’s not the case of multivariate one, for which the analysis is still challenging. Indeed, it is not possible to apply directly techniques of classification developed on univariate data to the case of multivariate one. In fact, for this latter, we have to take into consideration the interactions not only between points but also between dimensions. Moreover, in industrial cases, as in Michelin company, the data are big and also of different length in terms of points size composing the series. And this brings a new complexity to deal with during the analysis. None of the current techniques of classifying multivariate time series satisfies the following criteria, which are a low complexity of computation, dealing with variation in the number of points and good classification results. In our approach, we explored a new tool, which has not been applied before for MTS classification, which is called M-histogram. A M-histogram is a visualization tool using M axis to project the density function underlying the data. We have employed it here to produce a new representation of the data, that allows us to bring out the interactions between dimensions. Searching for links between dimensions correspond particularly to a part of learning techniques called multi-view learning. A view is an extraction of dimensions of a dataset, which are of same nature or type. Then the goal is to display the links between the dimensions inside each view in order to classify all the data, using an ensemble classifier. So we propose a multi-view ensemble model to classify multivariate time series. The model creates multiple M-histograms from differents groups of dimensions. Then each view allows us to get a prediction which we can aggregate to get a final prediction. In this thesis, we show that the proposed model allows a fast classification of multivariate time series of different sizes. In particular, we applied it on aMichelin use case

33

Jorge, Inès. "Machine-learning-based predictive maintenance for lithium-ion batteries in electric vehicles". Electronic Thesis or Diss., Strasbourg, 2023. http://www.theses.fr/2023STRAD056.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

La batterie est un élément central des véhicules électriques, soumis à de nombreux enjeux en termes de performances, sécurité et coût. La durée de vie des batteries en particulier fait l’objet d’une grande attention, car elle doit s’aligner avec la durée de vie d’un véhicule. Dans ce contexte, la maintenance prévisionnelle vise à prédire de manière fiable la durée de vie utile restante (RUL) et l’évolution de l’état de santé (SOH) d'une batterie Lithium-Ion (Li-Ion) en utilisant les données d'utilisation passées et présentes, de manière à anticiper les opérations de maintenance. L’objectif de cette thèse est de tirer profit de l’information contenue dans les séries temporelles de courant, tension et température via des algorithmes d’apprentissage automatique. Plusieurs modèles prédictifs ont étés développés à partir de jeux de données publics, afin de prédire le RUL d’une batterie ou l’évolution de son SOH à plus ou moins long terme
The battery is a central component of electric vehicles, and is subject to numerous challenges in terms of performance, safety and cost. The life of batteries in particular is the subject of a great deal of attention, as it needs to be aligned with the life of a vehicle. In this context, predictive maintenance aims to reliably predict the remaining useful life (RUL) and the evolution of the state of health (SOH) of a Lithium-Ion (Li-Ion) battery using past and present operating data, so as to anticipate maintenance operations. The objective of this thesis is to take advantage of the information contained in the time series of current, voltage and temperature via machine learning algorithms. Several predictive models have been developed from public datasets, in order to predict the RUL of a battery or the evolution of its SOH in the more or less long term

34

Tandeo, Pierre. "MODÉLISATION SPATIO-TEMPORELLE D'UNE VARIABLE QUANTITATIVE À PARTIR DE DONNÉES MULTI-SOURCES APPLICATION À LA TEMPÉRATURE DE SURFACE DES OCÉANS". Phd thesis, Agrocampus - Ecole nationale supérieure d'agronomie de rennes, 2010. http://tel.archives-ouvertes.fr/tel-00582679.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Ce travail de thèse porte sur une variable océanographique importante dans le suivi du climat : la température de surface des océans. Au niveau global, les observations de cette température sont fournies principalement par des radiomètres embarqués sur des satellites. Afin de traiter ce flux important de données, un traitement statistique s'impose dans le but de synthétiser l'information en des cartes globales et quotidiennes de notre variable d'intérêt. Pour ce faire, nous proposons un modèle linéaire de type espace-d'état avec des erreurs Gaussiennes. Nous commençons par présenter ce modèle sur des données issues de séries temporelles ayant un échantillonnage irrégulier. Suit un travail d'inférence avec la mise en place d'un schéma d'estimation des paramètres, basé sur la combinaison d'une méthode des moments et du maximum de vraisemblance au travers de l'algorithme EM et des probabilités de filtrage et lissage de Kalman. Nous appliquons enfin cette méthodologie pour estimer les variances d'erreurs et le paramètre de corrélation temporelle à tout l'océan Atlantique. Nous ajoutons ensuite la composante spatiale et proposons une structure d'ordre deux, séparable, basée sur le produit d'une covariance temporelle et d'une covariance spatiale ani- sotrope. Les paramètres de cette dernière sont estimés sur l'océan Atlantique à partir de techniques géostatistiques usuelles et forment un atlas pertinent pour les océanographes. Fi- nalement, nous montrons que l'apport de l'information spatiale augmente le pouvoir prédictif du modèle.

35

Guerre, Emmanuel. "Méthode non paramétriques d'analyse des séries temporelles multivariées : estimation de mesures de dépendances". Paris 6, 1993. http://www.theses.fr/1993PA066110.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Dans un premier chapitre, on presente differentes hypotheses permettant, si elles sont verifiees, d'obtenir de meilleures vitesses de convergence pour des estimateurs utilisant ces proprietes. Les deux chapitres suivants s'interessent a l'estimation de mesures caracterisant ces hypotheses de dependance: on etudie la convergence presque sure et la loi limite d'estimateurs non parametriques de contrastes de kullback. Le dernier chapitre s'interesse a un probleme different, de choix de modeles. On propose des tests pour determiner si une marche aleatoire est de type geometrique ou arithmetique

36

Santos, Gustavo Adolfo Campos dos. "S-SWAP: scale-space based workload analysis and prediction". reponame:Repositório Institucional da UFC, 2013. http://www.repositorio.ufc.br/handle/riufc/18777.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

SANTOS, Gustavo Adolfo Campos dos. S-SWAP: scale-space based workload analysis and prediction. 2013. 99 f. Dissertação (Mestrado em ciência da computação)- Universidade Federal do Ceará, Fortaleza-CE, 2013.
Submitted by Elineudson Ribeiro (elineudsonr@gmail.com) on 2016-07-28T19:41:50Z No. of bitstreams: 1 2013_dis_gacsantos.pdf: 3910335 bytes, checksum: 15f381ec4c1d77510c3d76424bf764aa (MD5)
Approved for entry into archive by Rocilda Sales (rocilda@ufc.br) on 2016-08-01T15:38:14Z (GMT) No. of bitstreams: 1 2013_dis_gacsantos.pdf: 3910335 bytes, checksum: 15f381ec4c1d77510c3d76424bf764aa (MD5)
Made available in DSpace on 2016-08-01T15:38:14Z (GMT). No. of bitstreams: 1 2013_dis_gacsantos.pdf: 3910335 bytes, checksum: 15f381ec4c1d77510c3d76424bf764aa (MD5) Previous issue date: 2013
This work presents a scale-space based approach to assist dynamic resource provisioning. The application of this theory makes it possible to eliminate the presence of irrelevant information from a signal that can potentially induce wrong or late decision making. Dynamic provisioning involves increasing or decreasing the amount of resources allocated to an application in response to workload changes. While monitoring both resource consumption and application-speci c metrics is fundamental in this process since the latter is of great importance to infer information about the former, dealing with these pieces of information to provision resources in dynamic environments poses a big challenge. The presence of unwanted characteristics, or noise, in a signal that represents the monitored metrics favors misleading interpretations and is known to a ect forecast models. Even though some forecast models are robust to noise, reducing its in uence may decrease training time and increase e ciency. Because a dynamic environment demands decision making and predictions on a quickly changing landscape, approximations are necessary. Thus it is important to realize how approximations give rise to limitations in the forecasting process. On the other hand, being aware of when detail is needed, and when it is not, is crucial to perform e cient dynamic forecastings. In a cloud environment, resource provisioning plays a key role for ensuring that providers adequately accomplish their obligation to customers while maximizing the utilization of the underlying infrastructure. Experiments are shown considering simulation of both reactive and proactive strategies scenarios with a real-world trace that corresponds to access rate. Results show that embodying scale-space theory in the decision making stage of dynamic provisioning strategies is very promising. It both improves workload analysis, making it more meaningful to our purposes, and lead to better predictions.
This work presents a scale-space based approach to assist dynamic resource provisioning. The application of this theory makes it possible to eliminate the presence of irrelevant information from a signal that can potentially induce wrong or late decision making. Dynamic provisioning involves increasing or decreasing the amount of resources allocated to an application in response to workload changes. While monitoring both resource consumption and application-speci c metrics is fundamental in this process since the latter is of great importance to infer information about the former, dealing with these pieces of information to provision resources in dynamic environments poses a big challenge. The presence of unwanted characteristics, or noise, in a signal that represents the monitored metrics favors misleading interpretations and is known to a ect forecast models. Even though some forecast models are robust to noise, reducing its in uence may decrease training time and increase e ciency. Because a dynamic environment demands decision making and predictions on a quickly changing landscape, approximations are necessary. Thus it is important to realize how approximations give rise to limitations in the forecasting process. On the other hand, being aware of when detail is needed, and when it is not, is crucial to perform e cient dynamic forecastings. In a cloud environment, resource provisioning plays a key role for ensuring that providers adequately accomplish their obligation to customers while maximizing the utilization of the underlying infrastructure. Experiments are shown considering simulation of both reactive and proactive strategies scenarios with a real-world trace that corresponds to access rate. Results show that embodying scale-space theory in the decision making stage of dynamic provisioning strategies is very promising. It both improves workload analysis, making it more meaningful to our purposes, and lead to better predictions.

37

Delbart, Célestine. "Variabilité spatio-temporelle du fonctionnement d'un aquifère karstique du Dogger : suivis hydrodynamiques et géochimiques multifréquences ; traitement du signal des réponses physiques et géochimiques". Phd thesis, Université Paris Sud - Paris XI, 2013. http://tel.archives-ouvertes.fr/tel-00939300.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Les aquifères karstiques sont parmi les milieux souterrains les plus difficiles à caractériser. Ils sont connus pour avoir des réponses complexes aux événements pluvieux en raison de l'hétérogénéité de la porosité allant de la porosité matricielle (micro-porosité) à la porosité de conduits (macro-porosité). La porosité de conduits génère des vitesses de transfert élevées au sein de l'aquifère, à l'origine de la vulnérabilité des aquifères karstiques. L'objectif de cette thèse est de définir les modalités du transfert de l'eau et des solutés au sein d'un aquifère karstique du Dogger situé en Bourgogne. Deux approches complémentaires ont été utilisées: (i) l'analyse de chroniques piézométriques et débitmétriques à partir d'outils de traitement du signal et (ii) une caractérisation géochimique et isotopique des eaux souterraines basée sur l'utilisation d'une large palette de traceurs, notamment des traceurs de datation. Ces deux approches ont été appliquées à différentes échelles temporelles: un suivi haute fréquence (jusqu'à 1h) lors de pics de crue pour étudier les transferts rapides et un suivi à long terme (pluri-annuel) pour caractériser les transferts lents et étudier la variabilité saisonnière des modalités d'écoulement. Ce travail a permis de mettre en évidence une très large distribution des temps de résidence de l'eau souterraine, de quelques heures, lors d'événements de crue souligné par des temps de réponse pluie-niveau piézométrique faible (inférieurs à 70 h) à quelques années pour l'écoulement de base mis en évidence par l'utilisation de traceurs de datation (39Kr, CFC-12 et SF6). En réponse aux précipitations, différentes masses d'eau ont pu être décrites: (i) une eau à vitesse d'écoulement lente, qui correspond à l'écoulement de base mis en évidence par l'utilisation des traceurs de datation; (ii) une eau de recharge rapide dont le temps de résidence au sein de l'aquifère varie, selon les porosités empruntées, de quelques heures à quelques jours soulignés grâce au suivi en continu de la conductivité électrique, des éléments majeurs et du tritium; et (iii) des eaux stockées au sein de la zone non saturée, remobilisées lors de pics de crue mises en évidence par la variation des compositions géochimiques en tritium et Ca2+ des eaux souterraines lors de pics de crue. Malgré une forte hétérogénéité des processus d'écoulement, une logique spatiale des écoulements rapides apparaît. Le temps de réponse du niveau piézométrique à un événement pluvieux et le temps de résidence augmentent vers l'aval du dôme hydrogéologique. L'étude temporelle de la réponse impulsionnelle par la méthode du corrélogramme croisé coulissant montre que le temps de réponse varie de façon saisonnière, et est plus court en été. La variation du temps de réponse pour un forage entre été et hiver est significative et peut atteindre une centaine d'heures. Cette variabilité temporelle s'explique en partie par une variabilité de l'intensité des pluies (plus importantes en été) qui induit une variation des mécanismes d'écoulement au sein de l'épikarst. Lors d'événements de pluie intense, la saturation de l'épikarst est plus importante provocant des transferts latéraux en son sein et permettant de transférer les eaux vers les conduits les plus ouverts.

38

Héas, Patrick. "Apprentissage bayésien de structures spatio-temporelles : application à la fouille visuelle de séries temporelles d'images de satellites". Toulouse, ENSAE, 2005. http://www.theses.fr/2005ESAE0004.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Durant les dernières décennies, les satellites n'ont cessé d'acquérir des images de haute résolution de beaucoup de sites d'observation de la Terre. De nouveaux produits sont apparus avec ce processus d'acquisition intensif : les séries temporelles d'images satellites de haute résolution. Elles représentent un important volume de données dont le riche contenu informatif est susceptible d'intéresser un large panel d'applications nouvelles. Cette thèse présente un concept de fouille d'information qui permet l'apprentissage de structures spatio-temporelles contenues dans les séquences d'images, l'objectif étant l'interprétation et la recherche probabiliste de phénomènes dans l'espace et le temps. Les connaissances expertes d'un utilisateur conduisent le processus d'apprentissage, via la communication d'exemples et de contre exemples. Les fondements théoriques de ce concept se situent à l'interface de l'inférence bayésienne et entropique, des modèles stochastiques et de la cognition visuelle. Le concept emploie une modélisation hiérarchique bayésienne du contenu des séquences d'images, qui permet de lier les intérêt des utilisateurs aux différentes structures spatio-temporelles. La hiérarchie comprend deux principales phases d'apprentissage : l'inférence non supervisé d'un graphe de trajectoires de clusters dynamiques et, basé sur ce graphe, l'apprentissage interactif d'étiquettes sémantiques associées aux structures spatio-temporelles contenues dans la scène dynamique. Les algorithmes et méthodes développés sont intégrés dans un système de fouille visuelle d'information. Ce système représente un outil entièrement novateur pour l'exploitation du contenu des séries temporelles d'images satellites de haute résolution. Les expériences effectuées avec une série temporelles d'images SPOT démontrent les capacités du système dans la compréhension de scènes dynamiques.

39

Aikes, Junior Jorge. "Estudo da influência de diversas medidas de similaridade na previsão de séries temporais utilizando o algoritmo KNN-TSP". Universidade Estadual do Oeste do Parana, 2012. http://tede.unioeste.br:8080/tede/handle/tede/1084.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Made available in DSpace on 2017-07-10T17:11:50Z (GMT). No. of bitstreams: 1 JORGE AIKES JUNIOR.PDF: 2050278 bytes, checksum: f5bae18bbcb7465240488c45b2c813e7 (MD5) Previous issue date: 2012-04-11
Time series can be understood as any set of observations which are time ordered. Among the many possible tasks appliable to temporal data, one that has attracted increasing interest, due to its various applications, is the time series forecasting. The k-Nearest Neighbor - Time Series Prediction (kNN-TSP) algorithm is a non-parametric method for forecasting time series. One of its advantages, is its easiness application when compared to parametric methods. Even though its easier to deﬁne kNN-TSP s parameters, some issues remain opened. This research is focused on the study of one of these parameters: the similarity measure. This parameter was empirically evaluated using various similarity measures in a large set of time series, including artiﬁcial series with seasonal and chaotic characteristics, and several real world time series. It was also carried out a case study comparing the predictive accuracy of the kNN-TSP algorithm with the Moving Average (MA), univariate Seasonal Auto-Regressive Integrated Moving Average (SARIMA) and multivariate SARIMA methods in a time series of a Korean s hospital daily patients ﬂow in the Emergency Department. This work also proposes an approach to the development of a hybrid similarity measure which combines characteristics from several measures. The research s result demonstrated that the Lp Norm s measures have an advantage over other measures evaluated, due to its lower computational cost and for providing, in general, greater accuracy in temporal data forecasting using the kNN-TSP algorithm. Although the literature in general adopts the Euclidean similarity measure to calculate de similarity between time series, the Manhattan s distance can be considered an interesting candidate for deﬁning similarity, due to the absence of statistical signiﬁcant difference and to its lower computational cost when compared to the Euclidian measure. The measure proposed in this work does not show signiﬁcant results, but it is promising for further research. Regarding the case study, the kNN-TSP algorithm with only the similarity measure parameter optimized achieves a considerably lower error than the MA s best conﬁguration, and a slightly greater error than the univariate e multivariate SARIMA s optimal settings presenting less than one percent of difference.
Séries temporais podem ser entendidas como qualquer conjunto de observações que se encontram ordenadas no tempo. Dentre as várias tarefas possíveis com dados temporais, uma que tem atraído crescente interesse, devido a suas várias aplicações, é a previsão de séries temporais. O algoritmo k-Nearest Neighbor - Time Series Prediction (kNN-TSP) é um método não-paramétrico de previsão de séries temporais que apresenta como uma de suas vantagens a facilidade de aplicação, quando comparado aos métodos paramétricos. Apesar da maior facilidade na determinação de seus parâmetros, algumas questões relacionadas continuam em aberto. Este trabalho está focado no estudo de um desses parâmetros: a medida de similaridade. Esse parâmetro foi avaliado empiricamente utilizando diversas medidas de similaridade em um grande conjunto de séries temporais que incluem séries artiﬁciais, com características sazonais e caóticas, e várias séries reais. Foi realizado também um estudo de caso comparativo entre a precisão da previsão do algoritmo kNN-TSP e a dos métodos de Médias Móveis (MA), Auto-regressivos de Médias Móveis Integrados Sazonais (SARIMA) univariado e SARIMA multivariado, em uma série de ﬂuxo diário de pacientes na Área de Emergência de um hospital coreano. Neste trabalho é ainda proposta uma abordagem para o desenvolvimento de uma medida de similaridade híbrida, que combine características de várias medidas. Os resultados obtidos neste trabalho demonstram que as medidas da Norma Lp apresentam vantagem sobre as demais medidas avaliadas, devido ao seu menor custo computacional e por apresentar, em geral, maior precisão na previsão de dados temporais utilizando o algoritmo kNN-TSP. Apesar de na literatura, em geral, a medida Euclidiana ser adotada como medida de similaridade, a medida Manhattan pode ser considerada candidata interessante para deﬁnir a similaridade entre séries temporais, devido a não apresentar diferença estatisticamente signiﬁcativa com a medida Euclidiana e possuir menor custo computacional. A medida proposta neste trabalho, não apresenta resultados signiﬁcantes, mas apresenta-se promissora para novas pesquisas. Com relação ao estudo de caso, o algoritmo kNN-TSP, com apenas o parâmetro de medida de similaridade otimizado, alcança um erro consideravelmente inferior a melhor conﬁguração com MA, e pouco maior que as melhores conﬁgurações dos métodos SARIMA univariado e SARIMA multivariado, sendo essa diferença inferior a um por cento.

40

Renard, Xavier. "Time series representation for classification : a motif-based approach". Electronic Thesis or Diss., Paris 6, 2017. http://www.theses.fr/2017PA066593.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Nos travaux décrits dans cette thèse portent sur l’apprentissage d’une représentation pour la classification automatique basée sur la découverte de motifs à partir de séries temporelles. L’information pertinente contenue dans une série temporelle peut être encodée temporellement sous forme de tendances, de formes ou de sous-séquences contenant habituellement des distorsions. Des approches ont été développées pour résoudre ces problèmes souvent au prix d’une importante complexité calculatoire. Parmi ces techniques nous pouvons citer les mesures de distance et les représentations de l’information contenue dans les séries temporelles. Nous nous concentrons sur la représentation de l’information contenue dans les séries temporelles. Nous proposons un cadre (framework) pour générer une nouvelle représentation de séries temporelles basée sur la découverte automatique d’ensembles discriminants de sous-séquences. Cette représentation est adaptée à l’utilisation d’algorithmes de classification classiques basés sur des attributs. Le framework proposé transforme un ensemble de séries temporelles en un espace d’attributs (feature space) à partir de sous-séquences énumérées des séries temporelles, de mesures de distance et de fonctions d’agrégation. Un cas particulier de ce framework est la méthode notoire des « shapelets ». L’inconvénient potentiel d’une telle approache est le nombre très important de sous-séquences à énumérer en ce qu’il induit un très grand feature space, accompagné d’une très grande complexité calculatoire. Nous montrons que la plupart des sous-séquences présentes dans un jeu de données composé de séries temporelles sont redondantes. De ce fait, un sous-échantillonnage aléatoire peut être utilisé pour générer un petit sous-ensemble de sous-séquences parmi l’ensemble exhaustif, en préservant l’information nécessaire pour la classification et tout en produisant un feature space de taille compatible avec l’utilisation d’algorithmes d’apprentissage automatique de l’état de l’art avec des temps de calculs raisonnable. On démontre également que le nombre de sous-séquences à tirer n’est pas lié avec le nombre de séries temporelles présent dans l’ensemble d’apprentissage, ce qui garantit le passage à l’échelle de notre approche. La combinaison de cette découverte dans le contexte de notre framework nous permet de profiter de techniques avancées (telles que des méthodes de sélection d’attributs multivariées) pour découvrir une représentation de séries temporelles plus riche, en prenant par exemple en considération les relations entre sous-séquences. Ces résultats théoriques ont été largement testés expérimentalement sur une centaine de jeux de données classiques de la littérature, composés de séries temporelles univariées et multivariées. De plus, nos recherches s’inscrivant dans le cadre d’une convention de recherche industrielle (CIFRE) avec Arcelormittal, nos travaux ont été appliqués à la détection de produits d’acier défectueux à partir des mesures effectuées par les capteurs sur des lignes de production
Our research described in this thesis is about the learning of a motif-based representation from time series to perform automatic classification. Meaningful information in time series can be encoded across time through trends, shapes or subsequences usually with distortions. Approaches have been developed to overcome these issues often paying the price of high computational complexity. Among these techniques, it is worth pointing out distance measures and time series representations. We focus on the representation of the information contained in the time series. We propose a framework to generate a new time series representation to perform classical feature-based classification based on the discovery of discriminant sets of time series subsequences (motifs). This framework proposes to transform a set of time series into a feature space, using subsequences enumerated from the time series, distance measures and aggregation functions. One particular instance of this framework is the well-known shapelet approach. The potential drawback of such an approach is the large number of subsequences to enumerate, inducing a very large feature space and a very high computational complexity. We show that most subsequences in a time series dataset are redundant. Therefore, a random sampling can be used to generate a very small fraction of the exhaustive set of subsequences, preserving the necessary information for classification and thus generating a much smaller feature space compatible with common machine learning algorithms with tractable computations. We also demonstrate that the number of subsequences to draw is not linked to the number of instances in the training set, which guarantees the scalability of the approach. The combination of the latter in the context of our framework enables us to take advantage of advanced techniques (such as multivariate feature selection techniques) to discover richer motif-based time series representations for classification, for example by taking into account the relationships between the subsequences. These theoretical results have been extensively tested on more than one hundred classical benchmarks of the literature with univariate and multivariate time series. Moreover, since this research has been conducted in the context of an industrial research agreement (CIFRE) with Arcelormittal, our work has been applied to the detection of defective steel products based on production line's sensor measurements

41

Besseau, Romain. "Analyse de cycle de vie de scénarios énergétiques intégrant la contrainte d’adéquation temporelle production-consommation". Thesis, Paris Sciences et Lettres (ComUE), 2019. http://www.theses.fr/2019PSLEM068.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Ces travaux de thèse portent sur l’évaluation des impacts environnementaux de l’énergie. Le modèle énergétique actuel, qui supporte l’ensemble des activités économiques mondiales, cause d’importants impacts environnementaux en contribuant au changement climatique et à l’épuisement de ressources, mais aussi en dégradant la biodiversité et la santé humaine. Les impacts environnementaux de l’énergie sont évalués, non pas en considérant la seule phase de production d’énergie, mais l’intégralité de leur cycle de vie : de l’extraction des matières premières jusqu’à la fin de vie. La production d’énergie renouvelable étant météo-dépendante, des systèmes de stockage d’énergie peuvent devenir nécessaires pour assurer l’adéquation temporelle entre la production et la consommation lorsque les taux de pénétration d’énergies renouvelables deviennent importants. Dans un premier temps, des modèles paramétrés d’inventaires de cycle de vie ont été développés pour chaque filière de production et de stockage d’énergie. Ils permettent de tenir compte de la variabilité technologique, spatiale et temporelle de la performance environnementale de ces systèmes qui peut être importante. Dans un second temps, une approche reposant sur le développement et le couplage de modèles paramétrés de séries temporelles de production et de consommation a été mise au point. Elle permet d’estimer les besoins de stockage induits par la météo-dépendance de la production mais aussi de la consommation. La méthode globale dynamique et paramétrique d’évaluation d’impacts environnementaux par Analyse de Cycle de Vie (ACV) alors développée a été appliquée à des scénarios d’autoconsommation puis au territoire insulaire de La Réunion. Ces travaux démontrent que, même en tenant compte des besoins de stockage induits par la variabilité de la production, les énergies renouvelables présentent, sur leur cycle de vie, une empreinte environnementale qui reste nettement inférieure aux alternatives fossiles qu’elles cherchent à substituer
This research work deals with the environmental impact assessment of energy. The current energy model, which supports the global economy, leads to major environmental impacts by contributing to climate change and resource depletion,and by degrading biodiversity and human health. The environmental impacts of energy systems are assessed, not only considering the energy generation phase, but the whole life-cycle of energy systems : from raw material extraction to end of life. As renewable energies are weather dependent, storage systems may become required to ensure the temporal balance between the production of energy and consumption when renewable energies reach high penetration rates. As a first step, parameterized life-cycle inventory models have been developed for the main energy technologies to produce orstore energy. Those models enable to account for the technological, spatial and temporal variability that can be important. As a second step, an approach based on times-series to model energy production as well as energy consumption has been developed. It allows assessing the energy storage needs induced by the weather dependency of the production and consumption.The global dynamic and parametric method to assess the life cycle environmental impact here developed has been appliedto self-consumption scenarios and then, to the insular territory of La Réunion. Those applications reveal that, even when accounting for the storage need induced by the weather dependency of the production, renewable energies present an environmental footprint significantly lower than the fossil counterparts they aim to substitute

42

Valk, Marcio. "O uso de quase U-estatísticas para séries temporais uni e multivaridas". [s.n.], 2011. http://repositorio.unicamp.br/jspui/handle/REPOSIP/307526.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Orientador: Aluísio de Souza Pinheiro
Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática Estatítica e Computação Científica
Made available in DSpace on 2018-08-17T14:57:09Z (GMT). No. of bitstreams: 1 Valk_Marcio_D.pdf: 2306844 bytes, checksum: 31162915c290291a91806cdc6f69f697 (MD5) Previous issue date: 2011
Resumo: Classificação e agrupamento de séries temporais são problemas bastante explorados na literatura atual. Muitas técnicas são apresentadas para resolver estes problemas. No entanto, as restrições necessárias, em geral, tornam os procedimentos específicos e aplicáveis somente a uma determinada classe de séries temporais. Além disso, muitas dessas abordagens são empíricas. Neste trabalho, propomos métodos para classificação e agrupamento de séries temporais baseados em quase U-estatísticas(Pinheiro et al. (2009) e Pinheiro et al. (2010)). Como núcleos das U-estatísticas são utilizadas métricas baseadas em ferramentas bem conhecidas na literatura de séries temporais, entre as quais o periodograma e a autocorrelação amostral. Três situações principais são consideradas: séries univariadas; séries multivariadas; e séries com valores aberrantes. _E demonstrada a normalidade assintética dos testes propostos para uma ampla classe de métricas e modelos. Os métodos são estudados também por simulação e ilustrados por aplicação em dados reais.
Abstract: Classifcation and clustering of time series are problems widely explored in the current literature. Many techniques are presented to solve these problems. However, the necessary restrictions in general, make the procedures specific and applicable only to a certain class of time series. Moreover, many of these approaches are empirical. We present methods for classi_cation and clustering of time series based on Quasi U-statistics (Pinheiro et al. (2009) and Pinheiro et al. (2010)). As kernel of U-statistics are used metrics based on tools well known in the literature of time series, including the sample autocorrelation and periodogram. Three main situations are considered: univariate time series, multivariate time series, and time series with outliers. It is demonstrated the asymptotic normality of the proposed tests for a wide class of metrics and models. The methods are also studied by simulation and applied in a real data set.
Doutorado
Estatistica
Doutor em Estatística

43

Lê, Thu Trang. "Extraction d'informations de changement à partir des séries temporelles d'images radar à synthèse d'ouverture". Thesis, Université Grenoble Alpes (ComUE), 2015. http://www.theses.fr/2015GREAA020/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

La réussite du lancement d'un grand nombre des satellites Radar à Synthèse d'Ouverture (RSO - SAR) de nouvelle génération a fourni régulièrement des images SAR et SAR polarimétrique (PolSAR) multitemporelles à haute et très haute résolution spatiale sur de larges régions de la surface de la Terre. Le système SAR est approprié pour des tâches de surveillance continue ou il offre l'avantage d'être indépendant de l'éclairement solaire et de la couverture nuageuse. Avec des données multitemporelles, l'information spatiale et temporelle peut être exploitée simultanément pour rendre plus concise, l'extraction d'information à partir des données. La détection de changement de structures spécifiques dans un certain intervalle de temps nécessite un traitement complexe des données SAR et la présence du chatoiement (speckle) qui affecte la rétrodiffusion comme un bruit multiplicatif. Le but de cette thèse est de fournir une méthodologie pour simplifier l'analyse des données multitemporelles SAR. Cette méthodologie doit bénéficier des avantages d'acquisitions SAR répétitives et être capable de traiter différents types de données SAR (images SAR mono-, multi- composantes, etc.) pour diverses applications. Au cours de cette thèse, nous proposons tout d'abord une méthode générale basée sur une matrice d'information spatio-temporelle appelée Matrice de détection de changement (CDM). Cette matrice contient des informations de changements obtenus à partir de tests croisés de similarité sur des voisinages adaptatifs. La méthode proposée est ensuite exploitée pour réaliser trois tâches différentes: 1) la détection de changement multitemporel avec différents types de changements, ce qui permet la combinaison des cartes de changement entre des paires d'images pour améliorer la performance de résultat de détection de changement; 2) l'analyse de la dynamicité de changement de la zone observée, ce qui permet l'étude de l'évolution temporelle des objets d'intérêt; 3) le filtrage nonlocal temporel des séries temporelles d'images SAR/PolSAR, ce qui permet d'éviter le lissage des informations de changement dans des séries pendant le processus de filtrage.Afin d'illustrer la pertinence de la méthode proposée, la partie expérimentale de la thèse est effectuée sur deux sites d'étude: Chamonix Mont-Blanc, France et le volcan Merapi, Indonésie, avec différents types de changements (i.e. évolution saisonnière, glaciers, éruption volcanique, etc.). Les observations de ces sites d'étude sont acquises sur quatre séries temporelles d'images SAR monocomposantes et multicomposantes de moyenne à haute et très haute résolution: des séries temporelles d'images Sentinel-1, ALOS-PALSAR, RADARSAT-2 et TerraSAR-X
A large number of successfully launched and operated Synthetic Aperture Radar (SAR) satellites has regularly provided multitemporal SAR and polarimetric SAR (PolSAR) images with high and very high spatial resolution over immense areas of the Earth surface. SAR system is appropriate for monitoring tasks thanks to the advantage of operating in all-time and all-weather conditions. With multitemporal data, both spatial and temporal information can simultaneously be exploited to improve the results of researche works. Change detection of specific features within a certain time interval has to deal with a complex processing of SAR data and the so-called speckle which affects the backscattered signal as multiplicative noise.The aim of this thesis is to provide a methodology for simplifying the analysis of multitemporal SAR data. Such methodology can benefit from the advantages of repetitive SAR acquisitions and be able to process different kinds of SAR data (i.e. single, multipolarization SAR, etc.) for various applications. In this thesis, we first propose a general framework based on a spatio-temporal information matrix called emph{Change Detection Matrix} (CDM). This matrix contains temporal neighborhoods which are adaptive to changed and unchanged areas thanks to similarity cross tests. Then, the proposed method is used to perform three different tasks:1) multitemporal change detection with different kinds of changes, which allows the combination of multitemporal pair-wise change maps to improve the performance of change detection result;2) analysis of change dynamics in the observed area, which allows the investigation of temporal evolution of objects of interest;3) nonlocal temporal mean filtering of SAR/PolSAR image time series, which allows us to avoid smoothing change information in the time series during the filtering process.In order to illustrate the relevancy of the proposed method, the experimental works of the thesis is performed on four datasets over two test-sites: Chamonix Mont-Blanc, France and Merapi volcano, Indonesia, with different types of changes (i.e., seasonal evolution, glaciers, volcanic eruption, etc.). Observations of these test-sites are performed on four SAR images time series from single polarization to full polarization, from medium to high, very high spatial resolution: Sentinel-1, ALOS-PALSAR, RADARSAT-2 and TerraSAR-X time series

44

Mei, Jiali. "Time series recovery and prediction with regression-enhanced nonnegative matrix factorization applied to electricity consumption". Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLS578/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Nous sommes intéressé par la reconstitution et la prédiction des séries temporelles multivariées à partir des données partiellement observées et/ou agrégées.La motivation du problème vient des applications dans la gestion du réseau électrique.Nous envisageons des outils capables de résoudre le problème d'estimation de plusieurs domaines.Après investiguer le krigeage, qui est une méthode de la litérature de la statistique spatio-temporelle, et une méthode hybride basée sur le clustering des individus, nous proposons un cadre général de reconstitution et de prédiction basé sur la factorisation de matrice nonnégative.Ce cadre prend en compte de manière intrinsèque la corrélation entre les séries temporelles pour réduire drastiquement la dimension de l'espace de paramètres.Une fois que le problématique est formalisé dans ce cadre, nous proposons deux extensions par rapport à l'approche standard.La première extension prend en compte l'autocorrélation temporelle des individus.Cette information supplémentaire permet d'améliorer la précision de la reconstitution.La deuxième extension ajoute une composante de régression dans la factorisation de matrice nonnégative.Celle-ci nous permet d'utiliser dans l'estimation du modèle des variables exogènes liées avec la consommation électrique, ainsi de produire des facteurs plus interprétatbles, et aussi améliorer la reconstitution.De plus, cette méthod nous donne la possibilité d'utiliser la factorisation de matrice nonnégative pour produire des prédictions.Sur le côté théorique, nous nous intéressons à l'identifiabilité du modèle, ainsi qu'à la propriété de la convergence des algorithmes que nous proposons.La performance des méthodes proposées en reconstitution et en prédiction est testé sur plusieurs jeux de données de consommation électrique à niveaux d'agrégation différents
We are interested in the recovery and prediction of multiple time series from partially observed and/or aggregate data.Motivated by applications in electricity network management, we investigate tools from multiple fields that are able to deal with such data issues.After examining kriging from spatio-temporal statistics and a hybrid method based on the clustering of individuals, we propose a general framework based on nonnegative matrix factorization.This frameworks takes advantage of the intrisic correlation between the multivariate time series to greatly reduce the dimension of the parameter space.Once the estimation problem is formalized in the nonnegative matrix factorization framework, two extensions are proposed to improve the standard approach.The first extension takes into account the individual temporal autocorrelation of each of the time series.This increases the precision of the time series recovery.The second extension adds a regression layer into nonnegative matrix factorization.This allows exogenous variables that are known to be linked with electricity consumption to be used in estimation, hence makes the factors obtained by the method to be more interpretable, and also increases the recovery precision.Moreover, this method makes the method applicable to prediction.We produce a theoretical analysis on the framework which concerns the identifiability of the model and the convergence of the algorithms that are proposed.The performance of proposed methods to recover and forecast time series is tested on several multivariate electricity consumption datasets at different aggregation level

45

Deeb, Ahmad. "Intégrateurs temporels basés sur la resommation des séries divergentes : applications en mécanique". Thesis, La Rochelle, 2015. http://www.theses.fr/2015LAROS033/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Les systèmes dynamiques qui évoluent sur un grand intervalle de temps (dynamique moléculaire, prédiction astronomique, turbulence...) occupent une place importante dans le domaine de la science de l'ingénieur. Leur résolution numérique constitue, jusqu'à l'heure actuelle, un défi. En effet, la simulation de la solution nécessite un solveur non seulement rapide mais aussi qui respecte les propriétés physiques du problème, pour garantir la stabilité. Dans cette thèse, on se propose d'étudier, vis-à-vis de cette problématique, un schéma d'intégration temporelle basée sur la décomposition de la solution en série temporelle, suivie de la technique de resommation de Borel des séries divergentes. On analyse alors la rapidité du schéma sur des problèmes modèles. Ensuite, on montre sa capacité à préserver la structure des équations (symplecticité, iso-spectralité, conservation de l'énergie...) à un ordre arbitrairement élevé. Par la suite, on applique le schéma à la résolution d'équations aux dérivées partielles issues de la mécanique, dont les équations de la chaleur, de Burgers et de Navier-Stokes bidimensionnelles. Pour cela, on associe le schéma à une méthode de discrétisation par éléments finis en espace. Enfin, dans le but de rendre l'algorithme plus robuste, on s'intéresse à la représentation de la somme de Borel par une série de factorielle généralisée
Dynamical systems which evolve in a large time interval (molecular dynamic, astronomical prediction, turbulence…) take an important place in engineering science. Their numerical resolution has so far constituted a challenge. Indeed, the simulation of the solution requires a solver which is not only fast but also respects the physical properties of the problem, to ensure the stability. In this thesis, we propose to study, regarding this issue, a time integration scheme based on the decomposition of the solution into time series, followed by Borel's resummation technique of divergent series. We analyse the speed of scheme on model problems. Next, we show its capability to preserve the structure of the equation (symplecticity, iso-spectrality, conservation of energy…) up to an arbitrary high order. Thereafter, we use the scheme to resolve partial differential equations coming from mechanics, including the two-dimensional heat equation, Burger’s equation and the Navier-Stokes equation. To this aim, we choose a finite element method for space discretisation. Finally, and in order to make the algorithm more robust, we are interested in the representation of the Borel sum by a generalized factorials series

46

Lohier, Théophile. "Analyse temporelle de la dynamique de communautés végétales à l'aide de modèles individus-centrés". Thesis, Clermont-Ferrand 2, 2016. http://www.theses.fr/2016CLF22683/document.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Les communautés végétales constituent des systèmes complexes au sein desquels de nombreuses espèces, pouvant présenter une large variété de traits fonctionnels, interagissent entre elles et avec leur environnement. En raison de la quantité et de la diversité de ces interactions les mécanismes qui gouvernent les dynamiques des ces communautés sont encore mal connus. Les approches basées sur la modélisation permettent de relier de manière mécaniste les processus gouvernant les dynamiques des individus ou des populations aux dynamiques des communautés qu'ils forment. L'objectif de cette thèse était de développer de telles approches et de les mettre en oeuvre pour étudier les mécanismes sous-jacents aux dynamiques des communautés. Nous avons ainsi développés deux approches de modélisation. La première s'appuie sur un cadre de modélisation stochastique permettant de relier les dynamiques de populations aux dynamiques des communautés en tenant compte des interactions intra- et interspécifiques et de l'impact des variations environnementale et démographique. Cette approche peut-être aisément appliquée à des systèmes réels et permet de caractériser les populations végétales à l'aide d'un petit nombre de paramètres démographiques. Cependant nos travaux suggèrent qu'il n'existe pas de relation simple entre ces paramètres et les traits fonctionnels des espèces, qui gouvernent pourtant leur réponse aux facteurs externes. La seconde approche a été développée pour dépasser cette limite et s'appuie sur le modèle individu-centré Nemossos qui représente de manière explicite le lien entre le fonctionnement des individus et les dynamiques de la communauté qu'ils forment. Afin d'assurer un grand potentiel d'application à Nemossos, nous avons apportés une grande attention au compromis entre réalisme et coût de paramétrisation. Nemossos a ainsi pu être entièrement paramétré à partir de valeur de traits issues de la littérature , son réalisme a été démontré, et il a été utilisé pour mener des expériences de simulations numériques sur l'importance de la variabilité temporelle des conditions environnementales pour la coexistence d'espèces fonctionnellement différentes. La complémentarité des deux approches nous a permis de proposer des éléments de réponse à divers questions fondamentales de l'écologie des communautés incluant le rôle de la compétition dans les dynamiques des communautés, l'effet du filtrage environnementale sur leur composition fonctionnel ou encore les mécanismes favorisant la coexistence des espèces végétales. Ici ces approches ont été utilisées séparément mais leur couplage peut offrir des perspectives intéressantes telles que l'étude du lien entre le fonctionnement des plantes et les dynamiques des populations. Par ailleurs chacune des approches peut être utilisée dans une grande variété d'expériences de simulation susceptible d'améliorer notre compréhension des mécanismes gouvernant les communautés végétales
Plant communities are complex systems in which multiple species differing by their functional attributes interact with their environment and with each other. Because of the number and the diversity of these interactions the mechanisms that drive the dynamics of theses communities are still poorly understood. Modelling approaches enable to link in a mechanistic fashion the process driving individual plant or population dynamics to the resulting community dynamics. This PhD thesis aims at developing such approaches and to use them to investigate the mechanisms underlying community dynamics. We therefore developed two modelling approaches. The first one is based on a stochastic modelling framework allowing to link the population dynamics to the community dynamics whilst taking account of intra- and interspecific interactions as well as environmental and demographic variations. This approach is easily applicable to real systems and enables to describe the properties of plant population through a small number of demographic parameters. However our work suggests that there is no simple relationship between these parameters and plant functional traits, while they are known to drive their response to extrinsic factors. The second approach has been developed to overcome this limitation and rely on the individual-based model Nemossos that explicitly describes the link between plant functioning and community dynamics. In order to ensure that Nemossos has a large application potential, a strong emphasis has been placed on the tradeoff between realism and parametrization cost. Nemossos has then been successfully parameterized from trait values found in the literature, its realism has been demonstrated and it has been used to investigate the importance of temporal environmental variability for the coexistence of functionally differing species. The complementarity of the two approaches allows us to explore various fundamental questions of community ecology including the impact of competitive interactions on community dynamics, the effect of environmental filtering on their functional composition, or the mechanisms favoring the coexistence of plant species. In this work, the two approaches have been used separately but their coupling might offer interesting perspectives such as the investigation of the relationships between plant functioning and population dynamics. Moreover each of the approaches might be used to run various simulation experiments likely to improve our understanding of mechanisms underlying community dynamics

47

Six, Delphine. "Analyse statistique des distributions spatiales et temporelles des séries de bilans de masse des glaciers alpins et des calottes polaires de l'hémisphère nord". Grenoble 1, 2000. http://www.theses.fr/2000GRE10255.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Les variations du metabolisme des glaciers ou des calottes polaires refletent les fluctuations du climat. A l'echelle de l'annee, ces fluctuations sont traduites par des variations du bilan de masse du glacier. L'inventaire complet des mesures regroupe environ 70 glaciers repartis dans differents massifs de l'hemisphere nord et 60 points de mesure au groenland. Une analyse statistique a ensuite permis de determiner la distribution spatiale et temporelle des series, ainsi que de mieux comprendre la relation glacier-climat aux differentes echelles, depuis celle d'un glacier jusqu'a celle d'un massif. Sur le glacier, l'evolution des bilans peut etre parfois tres differente d'un point a l'autre liee a la sensibilite variable du bilan selon l'altitude. Cette etude met en evidence les disparites liees aux donnees d'accumulation hivernale et les limites d'un modele lineaire de variation pour decrire les bilans sur un glacier. En revanche, la coherence de differents glaciers entre eux peut etre tres forte si l'on passe a l'echelle du massif. C'est le cas dans les alpes et en scandinavie, meme si certaines periodes montrent de tres fortes inhomogeneites de variations, probablement liees au role plus important de l'accumulation hivernale. Cette coherence disparait cependant pour d'autres massifs parfois moins etendus comme les glaciers americains ou la zone d'accumulation du groenland. Pour cette derniere, les analyses montrent qu'il est difficile d'extraire un signal annuel coherent distinct du bruit de mesure. Enfin, l'etude des donnees meteorologiques et de l'oscillation nord atlantique (nao) permet de detailler les reponses des bilans aux sollicitations climatiques sur les dernieres decennies. Il semble que les modifications des

48

Claudino, Joana Filipa Caetano. "Intelligent system for time series pattern identification and prediction". Master's thesis, Instituto Superior de Economia e Gestão, 2020. http://hdl.handle.net/10400.5/21036.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Mestrado em Gestão de Sistemas de Informação
Os crescentes volumes de dados representam uma fonte de informação potencialmente valiosa para as empresas, mas também implicam desafios nunca antes enfrentados. Apesar da sua complexidade intrínseca, as séries temporais são um tipo de dados notavelmente relevantes para o contexto empresarial, especialmente para tarefas preditivas. Os modelos Autorregressivos Integrados de Médias Móveis (ARIMA), têm sido a abordagem mais popular para tais tarefas, porém, não estão preparados para lidar com as cada vez mais comuns séries temporais de maior dimensão ou granularidade. Assim, novas tendências de investigação envolvem a aplicação de modelos orientados a dados, como Redes Neuronais Recorrentes (RNNs), à previsão. Dada a dificuldade da previsão de séries temporais e a necessidade de ferramentas aprimoradas, o objetivo deste projeto foi a implementação dos modelos clássicos ARIMA e as arquiteturas RNN mais proeminentes, de forma automática, e o posterior uso desses modelos como base para o desenvolvimento de um sistema modular capaz de apoiar o utilizador em todo o processo de previsão. Design science research foi a abordagem metodológica adotada para alcançar os objetivos propostos e envolveu, para além da identificação dos objetivos, uma revisão aprofundada da literatura que viria a servir de suporte teórico à etapa seguinte, designadamente a execução do projeto e findou com a avaliação meticulosa do artefacto produzido. No geral todos os objetivos propostos foram alcançados, sendo os principais contributos do projeto o próprio sistema desenvolvido devido à sua utilidade prática e ainda algumas evidências empíricas que apoiam a aplicabilidade das RNNs à previsão de séries temporais.
The current growing volumes of data present a source of potentially valuable information for companies, but they also pose new challenges never faced before. Despite their intrinsic complexity, time series are a notably relevant kind of data in the entrepreneurial context, especially regarding prediction tasks. The Autoregressive Integrated Moving Average (ARIMA) models have been the most popular approach for such tasks, but they do not scale well to bigger and more granular time series which are becoming increasingly common. Hence, newer research trends involve the application of data-driven models, such as Recurrent Neural Networks (RNNs), to forecasting. Therefore, given the difficulty of time series prediction and the need for improved tools, the purpose of this project was to implement the classical ARIMA models and the most prominent RNN architectures in an automated fashion and posteriorly to use such models as foundation for the development of a modular system capable of supporting the common user along the entire forecasting process. Design science research was the adopted methodology to achieve the proposed goals and it comprised the activities of goal definition, followed by a thorough literature review aimed at providing the theoretical background necessary to the subsequent step that involved the actual project execution and, finally, the careful evaluation of the produced artifact. In general, each the established goals were accomplished, and the main contributions of the project were the developed system itself due to its practical usefulness along with some empirical evidence supporting the suitability of RNNs to time series forecasting.
info:eu-repo/semantics/publishedVersion

49

Houfaidi, Souad. "Robustesse et comportement asymptotique d'estimateurs des paramètres d'une série chronologique : (AR(P) et ARMA(P, Q))". Nancy 1, 1986. http://www.theses.fr/1986NAN10065.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

Nous définissons quelques estimateurs des paramètres d'un processus AR(P) (chapitre I), puis d'un processus ARMA(P,Q) (chapitre II). Nous étudions d'une part leurs robustesses et d'autre part leurs comportements asymptotiques (convergence presque sûre et normalité asymptotique). Nous donnons comme application (chapitre III), l'identification d'une série chronologique et recherche du M-estimateur associé

50

Tudesque, Loïc. "Analyse temporelle et spatiale des composantes chimiques, hydromorphologiques et diatomiques en relation avec les changements globaux". Toulouse 3, 2011. http://thesesups.ups-tlse.fr/1474/.

Testo completo

Gli stili APA, Harvard, Vancouver, ISO e altri

Abstract (sommario):

L'objectif de cette thèse était d'évaluer l'effet des changements globaux sur les milieux aquatiques. L'analyse exploratoire des bases de données d'occupation des sols, de physico-chimie, d'hydromorphologie, de diatomées dans les cours d'eau du bassin Adour-Garonne et de diatomées en Guyane a mis en évidence : 1) l'effet du changement global sur la qualité des eaux marquée par la hausse des températures et une atténuation sensible de l'eutrophisation ; 2) l'importance prépondérante des patrons d'occupation des sols à l'échelle du bassin versant ; 3) la persistance des diatomées et le changement des caractéristiques des communautés périphytiques face aux conditions de stress extrême dues à l'orpaillage en Guyane. Ces résultats ont démontré leurs valeurs quant à leurs potentiels de transfert vers les domaines de "la recherche appliquée" en proposant : 1) un référentiel temporel de la qualité chimique des eaux du bassin Adour-Garonne ; 2) l'intégration des patrons de l'occupation des sols à l'échelle du bassin versant dans le développement de nouveaux outils de bio-indication ; 3) la mise au point d'un indice diatomique générique basé sur les capacités motrices des diatomées et destiné au contexte guyanais
This thesis aimed at assessing the effect of global changes on aquatic ecosystems. The exploratory analysis of the land cover patterns, physicochemical, hydromorphological, and diatom databases in the Adour-Garonne basin and the diatom flora of streams in French Guyana highlighted: 1) the effect of the global changes on the water quality characterized by the temperature increase and the significant mitigation of eutrophication ; 2) the strongest influence of the land cover patterns at the catchment scale ; 3) the persistence of the diatom flora and the change of community structures facing extreme stress due to gold mining ; These results testified their importance as for their potential transfers towards the fields of "applied research", particularly proposing: 1) a temporal reference frame of the chemical water quality of the Adour-Garonne basin ; 2) to integrate the land cover patterns extracted at the catchment scale in order to improve or develop new biomonitoring tools ; 3) the development of a new generic diatom index appropriate to the French Guyana context based on the diatom motility abilities

Tesi sul tema "Prediction de séries temporelle"

Cita una fonte nei formati APA, MLA, Chicago, Harvard e in molti altri stili