Log in

Relevant bibliographies by topics / Imputation de Valeurs manquantes / Journal articles

Journal articles on the topic 'Imputation de Valeurs manquantes'

To see the other types of publications on this topic, follow the link: Imputation de Valeurs manquantes.

Author: Grafiati

Published: 7 July 2024

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 23 journal articles for your research on the topic 'Imputation de Valeurs manquantes.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse journal articles on a wide variety of disciplines and organise your bibliography correctly.

1

Trempe, Normand, Marie-Claude Boivin, Ernest Lo, and Amadou Diogo Barry. "L’utilisation de la variable sur la langue d’usage à la maison du Registre des décès du Québec." Notes de recherche 43, no. 1 (June 4, 2014): 163–80. http://dx.doi.org/10.7202/1025494ar.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

La mortalité est une des mesures de la santé globale de la population les plus utilisées et on peut y intégrer une composante linguistique et culturelle en utilisant la langue d’usage à la maison qui est inscrite au Registre des décès du Québec. Nous avons exploré les fichiers des décès du Québec de 1990 à 2007 afin de mesurer les proportions d’absence de réponse selon différentes variables comme la région sociosanitaire, l’établissement ou le type de déclarant. Nous concluons à la suite de cette étude exploratoire que l’information est suffisamment exacte pour donner un portrait réaliste de la mortalité par groupes linguistiques. Nous recommandons de faire une imputation pour les valeurs manquantes et nous proposons certaines améliorations à l’enregistrement de la variable linguistique au Registre des décès du Québec.

2

Basham, C. Andrew. "Variations régionales de prévalence de la multimorbidité en Colombie-Britannique (Canada) : analyse transversale des données de l’Enquête sur la santé dans les collectivités canadiennes de 2015-2016." Promotion de la santé et prévention des maladies chroniques au Canada 40, no. 7/8 (July 2020): 251–61. http://dx.doi.org/10.24095/hpcdp.40.7/8.02f.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

Introduction La multimorbidité constitue une préoccupation majeure pour les planificateurs de la santé de la population et de la prestation de services. Il est important de disposer de données sur la prévalence (en chiffres absolus et en proportions) de la multimorbidité au sein des populations régionales bénéficiant des services de santé afin de planifier les soins liés à la multimorbidité. Au Canada, il n’existe pas de publication systématique des estimations de prévalence de la multimorbidité par région sanitaire. L’Enquête sur la santé dans les collectivités canadiennes (ESCC) offre une source de données utile pour effectuer ces estimations. Méthodologie Nous avons utilisé les données du cycle 2015-2016 de l’ESCC portant sur la ColombieBritannique (C.B.) pour estimer et comparer la prévalence de la multimorbidité (trois maladies chroniques ou plus) au moyen d’analyses pondérées. Nous avons calculé les fréquences et les proportions brutes de la multimorbidité en fonction de la zone de prestation de services de santé (ZPSS) de la C.B. Nous avons eu recours à une régression logistique pour estimer les variations de prévalence de la multimorbidité par ZPSS, avec ajustement pour divers facteurs de confusion connus. Nous avons réalisé, en guise d’analyse de sensibilité, une imputation multiple au moyen d’équations en chaîne pour les valeurs des covariables manquantes. Nous avons également modifié la définition de la multimorbidité pour réaliser une analyse de sensibilité supplémentaire. Résultats On estime à 681 921 le nombre total de personnes atteintes de multimorbidité en C.-B. (16,9 % de la population) en 2015-2016. La prévalence de la multimorbidité à Vancouver (rapport de cotes corrigé = 0,65; IC à 95 % : 0,44 à 0,97) et à Richmond (rapport de cotes corrigé = 0,55; IC à 95 % : 0,37 à 0,82) s’est révélée beaucoup plus faible qu’à Fraser Sud (ZPSS de référence). Les résultats de l’analyse des données manquantes et de l’analyse de sensibilité étaient compatibles avec ceux de l’analyse principale. Conclusion Les estimations de prévalence de la multimorbidité varient en fonction des régions sanitaires de la C.B., les estimations les plus faibles ayant été observées à Vancouver et à Richmond, après ajustement pour divers facteurs de confusion potentiels. Il est nécessaire d’élaborer des politiques et d’établir les priorités en matière de soins liés à la multimorbidité à l’échelle provinciale et régionale. Dans ce contexte, l’ESCC constitue une source d’information précieuse pour les analyses régionales de multimorbidité au Canada.

3

Montreuil, Sylvie, Richard Halley, and Shirley Joe. "Poids à la naissance et durée de gestation manquants? La solution dans le jumelage des fichiers des naissances et des hospitalisations." Notes de recherche 25, no. 2 (March 25, 2004): 261–78. http://dx.doi.org/10.7202/010212ar.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

RÉSUMÉ Au Québec, le nombre élevé de données manquantes pour le poids à la naissance et la durée de gestation dans le fichier des naissances engendrait des problèmes dans le calcul de certains indicateurs de santé. Or ces données sont présentes dans le fichier des hospitalisations. Le jumelage des deux fichiers permet de trouver le dossier se rapportant au même individu dans chaque fichier, de compléter les données manquantes et d'améliorer la qualité du fichier des naissances. Le jumelage s'est révélé un succès puisqu'il a permis de diminuer la proportion des valeurs manquantes dans le fichier des naissances à 0,1 % pour le poids à la naissance et à 0,2% pour la durée de gestation en 1993, comparativement à 1,1 % et 3,2% respectivement en 1992. Le même travail a été fait pour le fichier des mortinaissances, avec un résultat encore plus spectaculaire : les pourcentages de valeurs manquantes sont alors passés de 10,4% et 7,7 % respectivement en 1992 à 0,3 % dans les deux cas en 1993.

4

Ben Othman, Leila, François Rioult, Sadok Ben Yahia, and Bruno Crémilleux. "Base de caractérisation des valeurs manquantes." Techniques et sciences informatiques 30, no. 10 (December 28, 2011): 1247–70. http://dx.doi.org/10.3166/tsi.30.1247-1270.

Full text

APA, Harvard, Vancouver, ISO, and other styles

5

Galimard, J. E., S. Chevret, and M. Resche-Rigon. "Imputation multiple en présence de données manquantes MNAR." Revue d'Épidémiologie et de Santé Publique 63 (May 2015): S42. http://dx.doi.org/10.1016/j.respe.2015.03.014.

Full text

APA, Harvard, Vancouver, ISO, and other styles

6

Rossel, F., and J. Garbrecht. "Analyse et amélioration d'un indice pluviométrique mensuel régional pour les grandes plaines du sud des États-Unis." Revue des sciences de l'eau 13, no. 1 (April 12, 2005): 39–46. http://dx.doi.org/10.7202/705379ar.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

L'indice pluviométrique mensuel proposé par le National Climatic Data Center (NCDC) est égal à la moyenne arithmétique des précipitations observées à certaines stations de la division climatique. Les différents problèmes d'homogénéité des données prises en compte par le NCDC pour le calcul de l'indice sont quantifiés pour la région climatique centrale de l'Oklahoma. Une amélioration de la méthode de calcul est proposée. Le calcul de ce nouvel indice utilise un nombre fixe de stations et fait appel à une méthode d'estimation des données manquantes. L'estimation des valeurs manquantes permet de disposer d'un jeu de données complet, ce qui augmente la représentativité de l'indice. Les moyennes mensuelles des valeurs absolues des différences entre l'indice NCDC et l'indice proposé sont comprises entre 6 % (mai) et 13 % (août) des précipitations moyennes et entre 9 % (novembre) et 24 % (août) des écart-types mensuels. Ces valeurs démontrent que les problèmes liés à la méthode de calcul d'un indice pluviométrique mensuel régional utilisée par le NCDC peuvent être importants. Les résultats de recherches sur la variabilité temporelle des précipitations utilisant un indice pluviométrique régional devraient être interprétés en connaissance de ces différences.

7

Aurélien, Njamen Kengdo Arsène, and Kwatcho Kengdo Steve. "Gestion Des Donnees Manquantes Dans Les Bases De Donnees En Sciences Sociales : Algorithme Nipals Ou Imputation Multiple?" European Scientific Journal, ESJ 12, no. 35 (December 31, 2016): 390. http://dx.doi.org/10.19044/esj.2016.v12n35p390.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

The main objective of this paper is to assess the robustness of imputation methods to fill up the series of secondary data in social sciences. The methodology used, especially that of mean imputation, multiple imputation and NIPALS algorithm, is based on a simulation using observed data. Results show a close similarity between the observed data and the data obtained by multiple imputation, mean imputation and NIPALS algorithm. The results also suggest that multiple imputation provides values substantially similar to observed data.

8

Doggett, Amanda, Ashok Chaurasia, Jean-Philippe Chaput, and Scott T. Leatherdale. "Utilisation des arbres de classification et de régression pour modéliser les données manquantes sur l’IMC, la taille et la masse corporelle chez les jeunes." Promotion de la santé et prévention des maladies chroniques au Canada 43, no. 5 (May 2023): 257–69. http://dx.doi.org/10.24095/hpcdp.43.5.03f.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

Introduction Les données issues de mesures de l’indice de masse corporelle (IMC) autodéclarées par les jeunes comportent souvent de graves lacunes, ce qui peut avoir un effet important sur les résultats des recherches les utilisant. La première étape du traitementdes données manquantes consiste à étudier leur niveau et leur structuration. Or les études antérieures qui ont analysé les données manquantes sur l’IMC chez les jeunes ont utilisé une régression logistique, une approche limitée dans sa capacité à discerner des sous-groupes ou à obtenir une hiérarchie dans l’importance des variables, des dimensions pourtant susceptibles de contribuer grandement à la compréhension de la structuration des données manquantes. Methods Cette étude a utilisé des modèles d’arbre de classification et de régression (CART, pour classification and regression tree) stratifiés selon le sexe pour analyser les données manquantes sur la taille, la masse corporelle et l’IMC chez 74 501 jeunes participant à l’étude COMPASS 2018-2019 (une étude de cohorte prospective qui a porté sur les comportements de santé des jeunes canadiens), dans laquelle 31 % des données sur l’IMC étaient manquantes. Des variables telles que le régime alimentaire, le mouvement, les résultats scolaires, la santé mentale et l’utilisation de substances ont été étudiées afin de vérifier leurs associations avec les données manquantes sur la taille, la masse corporelle et l’IMC. Results D’après les modèles CART, le fait d’être à la fois plus jeune, de se sentir en surpoids, d’être moins actif physiquement et d’avoir une santé mentale moins bonne a produit des sous-groupes de filles et de garçons où il était très probable que des valeurs d’IMC soient manquantes. Les données manquantes sur l’IMC étaient moins probables chez les répondants de l’enquête plus âgés et ne se sentant pas en surpoids. Conclusion Si l’on se fie aux sous-groupes produits par les modèles CART, utiliser un échantillon au sein duquel les cas dont la valeur de l’IMC est manquante ont été supprimés conduirait à tenir davantage compte des jeunes en meilleure santé sur les plans physique, émotionnel et mental. Étant donné que les modèles CART sont aptes à discerner ces sous-groupes ainsi qu’à établir une hiérarchie dans l’importance des variables, ils constituent un outil précieux pour étudier la structuration des données manquantes et la manière appropriée de gérer ces dernières.

9

Badisy, I. El, C. Nejjari, A. Naim, K. El Rhaz, M. Khalis, and R. Giorgi. "CO10.6 - Imputation des données manquantes par un méta-algorithme (metaCART): étude de simulation." Revue d'Épidémiologie et de Santé Publique 71 (May 2023): 101632. http://dx.doi.org/10.1016/j.respe.2023.101632.

Full text

APA, Harvard, Vancouver, ISO, and other styles

10

Soullier, N., E. de la Rochebrochard, and J. Bouyer. "Imputation multiple et répartition des données manquantes dans les cohortes : exemple de la fécondation in vitro." Revue d'Épidémiologie et de Santé Publique 56, no. 5 (September 2008): 276. http://dx.doi.org/10.1016/j.respe.2008.06.077.

Full text

APA, Harvard, Vancouver, ISO, and other styles

11

BAUMONT, R., P. CHAMPCIAUX, J. AGABRIEL, J. ANDRIEU, J. AUFRÈRE, B. MICHALET-DOREAU, and C. DEMARQUILLY. "Une démarche intégrée pour prévoir la valeur des aliments pour les ruminants : PrévAlim pour INRAtion." INRAE Productions Animales 12, no. 3 (June 1, 1999): 183–94. http://dx.doi.org/10.20870/productions-animales.1999.12.3.3878.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

Cet article présente les principes retenus pour élaborer le module de prévision de la valeur d’un aliment à partir des résultats de son analyse. Le module PrévAlim, proposé avec la nouvelle version d’INRAtion, permet de calculer à la fois la valeur nutritive (UF, PDI) et pour les fourrages la valeur d’encombrement (UE) à partir de la nature de l’aliment et de la mesure de certaines de ces caractéristiques. Pour la valeur nutritive, une démarche séquentielle a été adoptée, centrée sur l’estimation de la dMO et de la dégradabilité de l’azote (DT) ; le calcul des valeurs UF et PDI utilise ensuite la séquence des équations des systèmes INRA 1988. L’estimation de la dMO se fait soit préférentiellement à partir de la méthode de digestibilité enzymatique pepsine-cellulase (dCs ou dCo), soit à partir de la composition chimique ou de l’âge de la plante. L’estimation de la DT et de la valeur PDI des concentrés est basée sur la méthode enzymatique avec une protéase (DE1). La valeur d’encombrement des fourrages est calculée à partir de l’ingestibilité estimée directement à partir de la composition chimique ou de la dMO ; les équations par grandes classes d’aliments ont été déterminées sur la base des Tables INRA 1988. Ce module rassemble, coordonne et met à jour des outils déjà disponibles (Tables de prévision de 1981 et équations publiées depuis) et des outils créés spécialement (estimation des UE). Les valeurs calculées (UF, PDI et UE) sont cohérentes entre elles ainsi qu’avec celles des Tables. L’approche hiérarchisée adoptée permet de calculer les valeurs même avec des informations manquantes et de retenir la méthode d’évaluation la plus pertinente en cas d’informations redondantes.

12

Legendre, Bruno, Damiano Cerasuolo, Olivier Dejardin, and Annabel Boyer. "Comment gérer les données manquantes ? Imputation multiple par équations chaînées : recommandations et explications pour la pratique clinique." Néphrologie & Thérapeutique 19, no. 3 (June 1, 2023): 1–9. http://dx.doi.org/10.1684/ndt.2023.24.

Full text

APA, Harvard, Vancouver, ISO, and other styles

13

De Keizer, J., J. Paul, M. Albouy, A. Dupuis, V. Migeot, S. Rabouan, N. Venisse, and E. Gand. "Simulation et imputation de plusieurs variables corrélées dans un contexte de données manquantes de façon non aléatoires (MNAR)." Revue d'Épidémiologie et de Santé Publique 69 (June 2021): S32—S33. http://dx.doi.org/10.1016/j.respe.2021.04.052.

Full text

APA, Harvard, Vancouver, ISO, and other styles

14

Caron, A., G. Clément, C. Heyman, E. Aernout, E. Chazard, and A. Le Tertre. "Détermination de l’exposition de 394 979 nouveau-nés par imputation multiple de données manquantes dans une étude épidémiologique." Revue d'Épidémiologie et de Santé Publique 63 (March 2015): S9. http://dx.doi.org/10.1016/j.respe.2015.01.016.

Full text

APA, Harvard, Vancouver, ISO, and other styles

15

Rousseau, Michel, and Richard Bertrand. "Évaluation de l’efficacité des méthodes de traitement des valeurs manquantes dans le contexte d’échelles de mesure de type Likert." Mesure et évaluation en éducation 28, no. 3 (2005): 27. http://dx.doi.org/10.7202/1087029ar.

Full text

APA, Harvard, Vancouver, ISO, and other styles

16

Boyard-Micheau, Joseph, and Pierre Camberlin. "Reconstitution de séries de pluies quotidiennes en Afrique de l’est : application aux caractéristiques des saisons des pluies." Climatologie 12 (2015): 83–105. http://dx.doi.org/10.4267/climatologie.1142.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

La reconstitution de données de pluies manquantes au pas de temps quotidien et à l’échelle stationnelle est parfois nécessaire pour l’étude de changements climatiques ou des travaux de climatologie appliquée. C’est le cas, en domaine tropical, de l’analyse des variations des caractéristiques des saisons des pluies (dates de démarrage et de fin, durée, etc.). A partir d’une approche méthodologique classique fondée sur une régression linéaire multiple pas à pas, mais appliquée pour tirer le meilleur parti possible des données disponibles et incluant une correction des biais, les performances de la reconstitution des pluies obtenues sont évaluées en considérant différents descripteurs de la structure temporelle des saisons des pluies est-africaines. L’Afrique de l’Est, par sa topographie contrastée et ses deux saisons des pluies forcées par des mécanismes d’échelles spatiales différentes, constitue une zone pertinente pour tester la méthodologie de reconstitution. Les résultats montrent que l’occurrence des jours de pluies ainsi que les quantités précipitées sont reproduites correctement dans les espaces où les précipitations sont les plus abondantes et où le nombre de pluviomètres est plus important. Si au pas de temps journalier, les performances des reconstitutions restent parfois modestes, elles sont bien plus satisfaisantes lorsqu’on les évalue à partir des caractéristiques saisonnières ou intra-saisonnières comme le cumul saisonnier, le nombre de jours de pluie, ou les dates de début et de fin des saisons des pluies. L’impact du comblement des lacunes est directement associé à la proportion de lacunes dans les séries temporelles de pluie, sans qu’il soit possible d’identifier un pourcentage de lacunes au-delà duquel les performances de la méthode de reconstitution se détériorent significativement. La distribution temporelle des valeurs manquantes a également un impact non négligeable sur la qualité de la reconstitution de la saison des pluies : ainsi, lorsque l’absence de données de pluie concerne de longues périodes continues, les caractéristiques de la saison des pluies sont mal reproduites.

17

Miandrisoa, RM, B. Ramilitiana, RR Rakotonoel, W. Rasamoelina, H. Ravaoavy, SA Ralamboson, N. Rabearivony, and S. Rakotoarimanana. "CONNAISSANCES DE L’HYPERTENSION ARTERIELLE ET DE SES COMPLICATIONS AU CENTRE HOSPITALIER DE SOAVINANDRIANA." Journal of Current Medical Research and Opinion 3, no. 01 (January 24, 2020): 415–21. http://dx.doi.org/10.15520/jcmro.v3i01.253.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

Introduction : A Madagascar, on assiste actuellement à une nette augmentation de la prévalence de l'hypertension artérielle (HTA)et de ses complications. Le but de cette étudeétait d’évaluer le niveau de connaissances des patients hypertendus en matière d’HTA,de connaitre le terme HTA et ses complications ainsi que la valeur tensionnelle cible sous traitement avant l’éducation thérapeutique. Méthodes : Nous avons mené une étude transversale et descriptive des patients hypertendus vus au centre hospitalier de Soavinandriana(CENHOSOA) du mois d’août 2015 à août 2016, soit 13 mois. Résultats : Au final, 346 patients ont été sélectionnés avec un âge moyen de 57,19 11,47 ans. Parmi eux, 61,56 % étaient des femmes; 33,8 % étaient scolarisés; 61,16 % étaient pris en charge et 75,36 % étaient mariés. Dans notre série, 78,32 % des patients ont déclaré connaître le terme d’HTA, pourtant 32,47 % seulement ont répondu exactement aux valeurs de la définition de l’HTA. Sur les 87,54 % des patients informés par leur médecin sur l'HTA, seuls 33,5 % connaissaient la définition exacte. Les 66,76 % des patients surveillaient régulièrement leur HTA, et 53,8 % consultaient leur médecin en cas d’élévation de la pression artérielle.Conclusion : Notre étude montre qu'il existe de nombreuses informations manquantes sur l'HTA chez les patients hypertendus et que bon nombre d'entre eux ne suivaient pas les recommandations en matière de gestion de l’HTA.

18

Bouguerra, Sid Ahmed, Abderrazak Bouanani, and Kamila Baba-Hamed. "Transport solide dans un cours d’eau en climat semi-aride : cas du bassin versant de l’Oued Boumessaoud (nord-ouest de l’Algérie)." Revue des sciences de l’eau 29, no. 3 (February 13, 2017): 179–95. http://dx.doi.org/10.7202/1038923ar.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

L’exploitation des valeurs instantanées de débits liquides et de débits solides en suspension dans le bassin versant de l’oued Boumessaoud (118 km2), pour la période allant de septembre 1988 à août 2004, a permis de mettre en évidence la variabilité annuelle et saisonnière de l’apport solide, et d’examiner l’ampleur du phénomène pendant les périodes d’érosion active de l’année dans ce bassin des régions méditerranéennes semi-arides où la contribution des crues s’est élevée à 71 % durant la saison de l’automne, pour atteindre 97 % de la charge globale moyenne au printemps. Les résultats de cette analyse montrent que la dégradation spécifique moyenne est de l’ordre de 518 t∙km-2∙an-1. L’approche statistique abordée, qui est une régression reliant les deux variables débit liquide (QL) et débit solide (QS), a été testée à différentes échelles temporelles; les modèles générés sont de type puissance (QS = aQLb), où les débits liquides expliquent globalement plus de 80 % de la variance du transport solide. L’identification des périodes productives de sédiments dans cette dynamique érosive a été étudiée en analysant l’évolution de la concentration des particules en suspension dans le cours d’eau. Cette modélisation aura pour application la reconstitution de données manquantes au droit des stations de contrôle au niveau du bassin d’étude.

19

Romanow, NR, BE Hagel, J. Williamson, and BH Rowe. "Risque de blessures à la tête et au visage chez les cyclistes en relation avec l'ajustement du casque : une étude cas-témoins." Maladies chroniques et blessures au Canada 34, no. 1 (February 2014): 1–8. http://dx.doi.org/10.24095/hpcdp.34.1.01f.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

Introduction Nous avons examiné l'effet de l'ajustement et de la position du casque de vélo sur les blessures à la tête et au visage. Méthodologie Les cas étaient ceux de cyclistes portant un casque qui avaient subi des blessures à la tête (n = 297) ou au visage (n = 289). Les témoins étaient des cyclistes portant un casque qui avaient subi d'autres blessures, à l'exception des blessures au cou. Les participants ont été interrogés dans sept services d'urgence de l'Alberta ou par téléphone. Les données sur les blessures ont été recueillies au moyen des dossiers médicaux. Les valeurs manquantes ont été déduites à l'aide d'équations enchaînées et de modèles personnalisés d'imputation par prédiction. Résultats Comparativement aux sujets dont l'ajustement du casque était excellent, ceux dont l'ajustement était mauvais affichaient un plus grand risque de blessures à la tête (rapport de cotes [RC] = 3,38, intervalle de confiance [IC] à 95 % : 1,06 à 10,74). Comparativement aux sujets dont le casque était demeuré bien centré, ceux dont le casque s'était incliné vers l'arrière (RC = 2,90, IC à 95 % : 1,54 à 5,47) ou s'était déplacé (RC = 1,91, IC à 95 % : 1,01 à 3,63) et ceux qui avaient perdu leur casque (RC = 6,72, IC à 95 % : 2,86 à 15,82) présentaient un plus grand risque de blessures à la tête. Un casque qui s'était incliné vers l'arrière (RC = 4,81, IC à 95 % : 2,74 à 8,46), s'était déplacé (RC = 1,83, IC à 95 % : 1,04 à 3,19) ou avait été perdu (RC = 3,31, IC à 95 % : 1,24 à 8,85) augmentait aussi le risque de blessures au visage. Conclusion Nos observations ont des retombées sur les consommateurs et les programmes d'éducation des détaillants.

20

Bélanger, M., N. El-Jabi, D. Caissie, F. Ashkar, and J. M. Ribi. "Estimation de la température de l'eau de rivière en utilisant les réseaux de neurones et la régression linéaire multiple." Revue des sciences de l'eau 18, no. 3 (April 12, 2005): 403–21. http://dx.doi.org/10.7202/705565ar.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

La température de l'eau en rivière est un paramètre ayant une importance majeure pour la vie aquatique. Les séries temporelles décrivant ce paramètre thermique existent, mais elles sont moins nombreuses et souvent courtes, ou comptent parfois des valeurs manquantes. Cette étude présente la modélisation de la température de l'eau en utilisant des réseaux de neurones et la régression linéaire multiple pour relier la température de l'eau à celle de l'air et le débit du ruisseau Catamaran, situé au Nouveau-Brunswick, Canada. Une recherche multidisciplinaire à long terme se déroule présentement sur ce site. Les données utilisées sont de 1991 à 2000 et comprennent la température de l'air de la journée en cours, de la veille et de l'avant-veille, le débit ainsi que le temps transformé en série trigonométrique. Les données de 1991 à 1995 ont été utilisées pour l'entraînement ou la calibration du modèle tandis que les données de 1996 à 2000 ont été utilisées pour la validation du modèle. Les coefficients de détermination obtenus pour l'entraînement sont de 94,2 % pour les réseaux de neurones et de 92,6 % pour la régression linéaire multiple, ce qui donne un écart-type des erreurs de 1,01 C pour les réseaux de neurones et de 1,05 C pour la régression linéaire multiple. Pour la validation, les coefficients de détermination sont de 92,2 % pour les réseaux de neurones et de 91,6 % pour la régression linéaire multiple, ce qui se traduit en un écart-type des erreurs de 1,10 C pour les réseaux de neurones et de 1,25 C pour la régression linéaire multiple. Durant la période d'étude (1991-2000), le biais a été calculé à +0,11 C pour le modèle de réseaux de neurones et à -0,26 °C pour le modèle de régression. Ces résultats permettent de conclure qu'il est possible de prévoir la température de l'eau de petits cours d'eau en utilisant la température de l'air et le débit, aussi bien avec les réseaux de neurones qu'avec la régression linéaire multiple. Les réseaux de neurones semblent donner un ajustement aux données légèrement meilleur que celui offert par la régression linéaire multiple, toutefois ces deux approches de modélisation démontrent une bonne performance pour la prédiction de la température de l'eau en rivière.

21

Jami, Sylvie, Tao-Yan Jen, Dominique Laurent, Georges Loizou, and Oumar Sy. "Extraction of Association Rules for the Prediction of Missing Values." Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées Volume 3, Special Issue... (November 27, 2005). http://dx.doi.org/10.46298/arima.1834.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

International audience Missing values in databases have motivated many researches in the field of KDD, specially concerning prediction. However, to the best of our knowledge, few appraoches based on association rules have been proposed so far. In this paper, we show how to adapt the levelwise algorithm for the mining of association rules in order to mine frequent rules with a confidence equal to 1 from a relational table. In our approach, the consequents of extracted rules are either an interval or a set of values, according to whether the domain of the predicted attribute is continuous or discrete. La présence de valeurs manquantes ou valeurs nulles dans les bases de donnnées a suscité de nombreuses recherches dans le domaine de la découverte des connaissances, notamment en ce qui concerne la prédiction. Cependant, à notre connaissance, peu de telles approches utilisent les règles d'association pour la prédiction des valeurs manquantes. Dans cet article, il est montré comment adapter les différents concepts et algorithmes par niveau liés aux règles d'association, afin d'obtenir des règles fréquentes et de confiance 1, permettant la prédiction de valeurs manquantes dans une table relationnelle. La particularité des règles extraites dans notre approche est que leurs conséquents se présentent sous la forme d'intervalles ou d'ensembles de valeurs, selon que le domaine de l'attribut sur lequel les valeurs sont prédites est soit continu soit discret.

22

AINOUCHE, ALFOCEA, ASSERAF, and ESCLOZAS. "Comment prévoir le profil de l’entreprise qui va gagner un marché public européen?" Management & Data Science, 2020. http://dx.doi.org/10.36863/mds.a.14414.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

Nous présentons les résultats obtenus par des modèles entraînés sur des données issues de la commande publique de l’Union Européenne. L’objectif est de produire des prédictions permettant de savoir si un marché public peut-être remporté par une petite ou moyenne entreprise. Pour cela, un modèle de Machine Learning a été construit pour prévoir l'attribution des marchés publics. Différentes techniques de préparation de données, comme l’imputation des valeurs manquantes par la moyenne ou encore par la mode, ont été utilisées. L'algorithme de classification Random Forest a été déployé pour obtenir un résultat très satisfaisant de 0,90 en termes d’AUC (aire sous la courbe ROC).

23

Dalémat, Marie, Michel Coret, Adrien Leygue, and Erwan Verron. "Robustness of the Data-Driven Identification algorithm with incomplete input data." Journal of Theoretical, Computational and Applied Mechanics, February 21, 2024. http://dx.doi.org/10.46298/jtcam.12590.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Abstract:

Identifying the mechanical response of a material without presupposing any constitutive equation is possible thanks to the Data-Driven Identification algorithm developed by the authors. It allows to measure stresses from displacement fields and forces applied to a given structure; the peculiarity of the technique is the absence of underlying constitutive equation. In the case of real experiments, the algorithm has been successfully applied on a perforated elastomer sheet deformed under large strain. Displacements are gathered with Digital Image Correlation and net forces with a load cell. However, those real data are incomplete for two reasons: some displacement values, close to the edges or in a noise-affected area, are missing and the force information is incomplete with respect to the original DDI algorithm requirements. The present study proves that with appropriate data handling, stress fields can be identified in a robust manner. The solution relies on recovering those missing data in a way that no assumption, except the balance of linear momentum, has to be made. The influence of input parameters of the method is also discussed. The overall study is conducted on synthetic data: perfect and incomplete data are used to prove robustness of the proposed solutions. Therefore, the paper can be considered as a practical guide for implementing the DDI method. L'identification de la réponse mécanique d'un matériau sans présupposer d'équation constitutive est possible grâce à l'algorithme Data-Driven Identification développé par les auteurs. Il permet de mesurer les contraintes à partir des champs de déplacement et des forces appliquées à une structure donnée ; la particularité de la technique est l'absence d'équation constitutive sous-jacente. Dans le cas d'expériences réelles, l'algorithme a été appliqué avec succès sur une feuille d'élastomère perforée déformée sous une grande contrainte. Les déplacements sont recueillis par corrélation d'images numériques et les forces nettes à l'aide d'une cellule de charge. Cependant, ces données réelles sont incomplètes pour deux raisons : certaines valeurs de déplacement, près des bords ou dans une zone affectée par le bruit, sont manquantes et les informations sur les forces sont incomplètes par rapport aux exigences de l'algorithme DDI d'origine. La présente étude prouve qu'avec un traitement approprié des données, les champs de contrainte peuvent être identifiés de manière robuste. La solution repose sur la récupération des données manquantes de manière à ce qu'aucune hypothèse, à l'exception de l'équilibre de la quantité de mouvement linéaire, ne doive être faite. L'influence des paramètres d'entrée de la méthode est également discutée. L'étude globale est menée sur des données synthétiques : des données parfaites et incomplètes sont utilisées pour prouver la robustesse des solutions proposées. Par conséquent, le document peut être considéré comme un guide pratique pour la mise en œuvre de la méthode DDI.