Thèses : « Données de survies »

1

Ortholand, Juliette. « Joint modelling of events and repeated observations : an application to the progression of Amyotrophic Lateral Sclerosis ». Electronic Thesis or Diss., Sorbonne université, 2024. http://www.theses.fr/2024SORUS227.

Texte intégral

Résumé :

L’hétérogénéité des progressions des maladies chroniques, comme la Sclérose Latérale Amyotrophique (SLA), constitue un obstacle au développement de traitements. L'utilisation croissante de bases de données, couplée à la modélisation de ces maladies, contribue à une meilleure compréhension de ce phénomène. Cependant, les données collectées ne permettent de décrire que des trajectoires partielles qui doivent être réalignées pour reconstruire une progression complète de la maladie. Le modèle spatiotemporel est l’un des modèles développés pour traiter cette question. Son principal intérêt est sa capacité à réaligner les progressions des patients à la fois en terme de chronologie (aspect temporel), grâce à un âge latent, et en terme d’ordre de progression des données longitudinales (aspect spatial). Cependant, ce modèle n’a pas été conçu pour la modélisation d’évènements, cruciaux dans la SLA : survie ou introduction de support de vie, comme la ventilation non invasive (VNI). A l’inverse, les modèles conjoints existants offrent l'avantage de traiter simultanément des données longitudinales et de survie. Cependant, ils ne réalignent pas les trajectoires, ce qui compromet leur résolution temporelle. Cette thèse visait à étendre le modèle spatiotemporel en un modèle spatiotemporel conjoint, permettant l'examen des données longitudinales et de survie dans la SLA. Nous avons d’abord appliqué le modèle spatiotemporel pour étudier l’impact de l'interaction entre le sexe et le site de début (spinal ou bulbaire) sur la progression de la SLA. En utilisant la base de données PRO-ACT, nous avons démontré une influence significative à la fois du sexe et du site de début sur six résultats longitudinaux surveillant le déclin fonctionnel et respiratoire ainsi que l'indice de masse corporelle. Cependant, cette étude n'a pas incorporé d'analyse de survie, malgré son importance dans la SLA, en raison des limitations du modèle. Pour combler cette lacune, nous avons associé au modèle spatiotemporel un modèle de survie qui estime une distribution de Weibull de l’évènement (le décès ici) à partir de l’âge latent, créant ainsi un modèle temporel univarié conjoint. Après validation du modèle, nous l'avons comparé à un modèle conjoint de l’état de l’art sur les données PRO-ACT. Notre modèle a obtenu des performances significativement supérieures en termes de biais absolu et d'AUC moyenne pour les événements censurés à droite. Cela a démontré l'efficacité de notre approche dans le contexte de la SLA. Cependant, la modélisation de plusieurs résultats longitudinaux nécessite une approche multivariée et l'initiation de support de vie, qui peut être censurée par le décès, doit aussi être prise en compte. Nous avons donc étendu le modèle temporel conjoint en un modèle spatiotemporel conjoint avec des risques concurrents pour analyser l'initiation de la VNI. Cela impliquait de coupler le modèle spatiotemporel multivarié avec un modèle de survie pour risques concurrents estimé à partir de l'âge latent. Après validation, nous avons comparé notre modèle à un modèle conjoint de l’état de l’art sur les données PRO-ACT et avons analysé l'interaction entre le sexe et le site de début en complément de la première étude. Le modèle spatiotemporel conjoint a atteint des performances similaires au modèle de l’état de l’art tout en capturant un processus latent partagé, l'âge latent, tandis que le modèles de l’état de l’art examinent l'impact des données longitudinales sur la survie. Pour faciliter la reproductibilité et la réutilisation de ces modèles, ils ont été implémentés dans le logiciel open source Leaspy. Cette thèse introduit le premier modèle permettant de réaligner des trajectoires partielles en combinant la modélisation de données longitudinales et de survie. Nous avons démontré sa pertinence pour comprendre l'occurrence d'événements critiques dans la SLA
Progression heterogeneity in chronic diseases such as Amyotrophic Lateral Sclerosis (ALS) is a significant obstacle to developing effective treatments. Leveraging the growing wealth of large databases through modelling can help better understanding it. However, the data collected only offer access to partial trajectories, that need to be realigned to reconstruct a comprehensive disease progression. To address this challenge, data-driven progression models like the longitudinal Spatiotemporal model were developed. Its main interest is its ability to synchronise patients onto a common disease timeline (temporal aspect) thanks to a latent disease age, while also capturing the remaining variability through parameters that account for outcome ordering (spatial aspect). However, this model was primarily designed for longitudinal data, overlooking crucial outcomes in ALS such as time to death or initiation of life support, like Non-Invasive Ventilation (NIV). Conversely, existing joint models offer the advantage of simultaneously handling longitudinal and survival data. However, they do not realign trajectories, which compromises their temporal resolution. This thesis aimed to expand the Spatiotemporal model into a Joint Spatiotemporal model, enabling, for ALS research, the examination of survival data alongside longitudinal data. First, we applied the Spatiotemporal model to explore how the interaction between sex and onset site (spinal or bulbar) impacts the progression of ALS patients. We selected 1,438 patients from the PRO-ACT database. We demonstrated a significant influence of both sex and onset site on six longitudinal outcomes monitoring the functional and respiratory decline in addition to Body Mass Index. However, this study did not incorporate survival analysis, despite its paramount importance in ALS, due to limitations inherent to the Spatiotemporal model. To address this gap, we associated the Spatiotemporal model with a survival model that estimates a Weibull survival model from its latent disease age, creating a univariate Joint Temporal model. After model validation, we benchmarked our model with a state-of-the-art joint model on PRO-ACT data. Our model exhibited significantly superior performance in terms of absolute bias and mean cumulative AUC for right-censored events. This demonstrated the efficacy of our approach in the context of ALS compared to existing joint models. However, modelling several longitudinal outcomes requires a multivariate approach. Life support initiation that might be censored by death needs to be also considered. We thus extended the Joint Temporal model, into a multivariate Joint Spatiotemporal model with competing risks to analyse NIV initiation. This involved coupling the multivariate Spatiotemporal model with a cause-specific Weibull survival model from the latent disease age. We incorporated spatial parameters with a Cox proportional effect on the hazard. After validation, we benchmarked our model with a state-of-the-art joint model on PRO-ACT data and analysed sex and onset site interaction in complement to the first study. The Joint Spatiotemporal model achieved similar performance to the state-of-the-art model while capturing an underlying shared latent process, the latent disease age, whereas the state-of-the-art models the impact of longitudinal outcomes on survival. To enhance the reproducibility and facilitate the reuse of these models, the proposed models were implemented in the open-source software Leaspy. In conclusion, this thesis introduces the first data-driven progression model combining longitudinal and survival modelling. We demonstrated its relevance to understand the occurrence of critical events in ALS. This work paves the way for further extension to analyse recurrent events, among other potential applications in causal inference