Увійти

Готові списки джерел за темами / Apprentissage profond par renforcement / Статті в журналах

Щоб переглянути інші типи публікацій з цієї теми, перейдіть за посиланням: Apprentissage profond par renforcement.

Статті в журналах з теми "Apprentissage profond par renforcement"

Автор: Grafiati

Опубліковано: 1 червня 2022

Оновлено: 25 січня 2023

Оформте джерело за APA, MLA, Chicago, Harvard та іншими стилями

Оберіть тип джерела:

Ознайомтеся з топ-23 статей у журналах для дослідження на тему "Apprentissage profond par renforcement".

Біля кожної праці в переліку літератури доступна кнопка «Додати до бібліографії». Скористайтеся нею – і ми автоматично оформимо бібліографічне посилання на обрану працю в потрібному вам стилі цитування: APA, MLA, «Гарвард», «Чикаго», «Ванкувер» тощо.

Також ви можете завантажити повний текст наукової публікації у форматі «.pdf» та прочитати онлайн анотацію до роботи, якщо відповідні параметри наявні в метаданих.

Переглядайте статті в журналах для різних дисциплін та оформлюйте правильно вашу бібліографію.

1

Griffon, L., M. Chennaoui, D. Leger, and M. Strauss. "Apprentissage par renforcement dans la narcolepsie de type 1." Médecine du Sommeil 15, no. 1 (March 2018): 60. http://dx.doi.org/10.1016/j.msom.2018.01.164.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

2

Fillières-Riveau, Gauthier, Jean-Marie Favreau, Vincent Barra, and Guillaume Touya. "Génération de cartes tactiles photoréalistes pour personnes déficientes visuelles par apprentissage profond." Revue Internationale de Géomatique 30, no. 1-2 (January 2020): 105–26. http://dx.doi.org/10.3166/rig.2020.00104.

Повний текст джерела

Анотація:

Les cartes tactiles photoréalistes sont un des outils mobilisés par les personnes en situation de déficience visuelle pour appréhender leur environnement urbain proche, notamment dans le cadre de la mobilité, pour la traversée de carrefours par exemple. Ces cartes sont aujourd’hui principalement fabriquées artisanalement. Dans cet article, nous proposons une approche permettant de produire une segmentation sémantique d’une imagerie aérienne de précision, étape centrale de cette fabrication. Les différents éléments d’intérêt tels que trottoirs, passages piétons, ou îlots centraux sont ainsi localisés et tracés dans l’espace urbain. Nous présentons en particulier comment l’augmentation de cette imagerie par des données vectorielles issues d’OpenStreetMap permet d’obtenir par une technique d’apprentissage profond (réseau adverse génératif conditionnel) des résultats significatifs. Après avoir présenté les enjeux de ce travail et un état de l’art des techniques existantes, nous détaillons l’approche proposée, et nous étudions les résultats obtenus, en comparant en particulier les segmentations obtenues sans et avec enrichissement par données vectorielles. Les résultats sont très prometteurs.

Стилі APA, Harvard, Vancouver, ISO та ін.

3

Garcia, Pascal. "Exploration guidée en apprentissage par renforcement. Connaissancesa prioriet relaxation de contraintes." Revue d'intelligence artificielle 20, no. 2-3 (June 1, 2006): 235–75. http://dx.doi.org/10.3166/ria.20.235-275.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

4

Degris, Thomas, Olivier Sigaud, and Pierre-Henri Wuillemin. "Apprentissage par renforcement factorisé pour le comportement de personnages non joueurs." Revue d'intelligence artificielle 23, no. 2-3 (May 13, 2009): 221–51. http://dx.doi.org/10.3166/ria.23.221-251.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

5

Host, Shirley, and Nicolas Sabouret. "Apprentissage par renforcement d'actes de communication dans un système multi-agent." Revue d'intelligence artificielle 24, no. 2 (April 17, 2010): 159–88. http://dx.doi.org/10.3166/ria.24.159-188.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

6

Pouliquen, Geoffroy, and Catherine Oppenheim. "Débruitage par apprentissage profond: impact sur les biomarqueurs quantitatifs des tumeurs cérébrales." Journal of Neuroradiology 49, no. 2 (March 2022): 136. http://dx.doi.org/10.1016/j.neurad.2022.01.040.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

7

Caccamo, Emmanuelle, and Fabien Richert. "Les procédés algorithmiques au prisme des approches sémiotiques." Cygne noir, no. 7 (June 1, 2022): 1–16. http://dx.doi.org/10.7202/1089327ar.

Повний текст джерела

Анотація:

Assistants virtuels, objets connectés, intelligence artificielle, données massives, apprentissage machine ou apprentissage profond ; nul jour sans que les journaux ne rapportent une nouvelle spectaculaire sur les technologies algorithmiques dites « intelligentes ». Aucune activité humaine ou presque ne semble échapper à la mainmise algorithmique et à la volonté de contrôle sans limite qu’elle traduit. Ce constat sur l’emprise des technologies algorithmiques sur nos vies n’est pas nouveau, mais nous avons souhaité le transmuer en enquête en consacrant un numéro du Cygne noir à l’exploration des liens entre sémiotique et procédés algorithmiques. Relevant tantôt de la sémiotique théorique, tantôt de la sémiotique appliquée, les textes ici rassemblés travaillent à leur façon ces rapports. Ce dossier témoigne de la manière dont la sémiotique continue d’étonner par sa capacité de renouvellement conceptuel, par sa force de saisie d’objets toujours nouveaux et par sa disposition épistémologique à se « suturer » à de nombreux cadres théoriques. Il réaffirme en dernier lieu à quel point la sémiotique peut tenir un rôle éminemment critique et démystifiant, à contre-pied de la technolâtrie dominant l’espace social, dans un contexte marqué par une numérisation toujours plus croissante des activités humaines et sociales.

Стилі APA, Harvard, Vancouver, ISO та ін.

8

Choplin, Arnaud, and Julie Laporte. "Comparaison de deux stratégies pédagogiques dans l’apprentissage du toucher thérapeutique." Revue des sciences de l’éducation 42, no. 3 (June 7, 2017): 187–210. http://dx.doi.org/10.7202/1040089ar.

Повний текст джерела

Анотація:

L’objectif de cet article est de montrer que la performance pédagogique est à l’origine de modifications des pratiques professionnelles massothérapiques dans la prise en charge de la douleur fibromyalgique. Deux méthodologies quantitatives retracent le versant pédagogique. D’une part, un questionnaire montre de façon statistiquement significatif une déficience d’habiletés lors du démarrage palpatoire et lors de la palpation d’un élément précis et profond ; d’autre part, une étude expérimentale montre qu’une pédagogie par imitation modélisation-interactive est plus performante qu’un apprentissage behavioriste sur l’appropriation d’habiletés palpatoires. Un tel résultat est significatif (p < 1 %) dans l’acquisition de cinq habiletés sur six, et ce, indépendamment du genre et des connaissances théoriques anatomiques préalables. En conclusion, cette pédagogique est contributive à la performance d’un massage, base du traitement non médicamenteux de la douleur chronique de patients fibromyalgiques.

Стилі APA, Harvard, Vancouver, ISO та ін.

9

Altintas, Gulsun, and Isabelle Royer. "Renforcement de la résilience par un apprentissage post-crise : une étude longitudinale sur deux périodes de turbulence." M@n@gement 12, no. 4 (2009): 266. http://dx.doi.org/10.3917/mana.124.0266.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

10

Dutech, Alain, and Manuel Samuelides. "Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés Apprendre une extension sélective du passé." Revue d'intelligence artificielle 17, no. 4 (August 1, 2003): 559–89. http://dx.doi.org/10.3166/ria.17.559-589.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

11

Santos, Sheila Cristina dos, and Ronaldo Lima. "Faux-amis dans les activites de traduction français-portugais." Revista Letras Raras 4, no. 1 (August 31, 2015): 160–75. http://dx.doi.org/10.35572/rlr.v4i1.400.

Повний текст джерела

Анотація:

Dans le cadre de cet article, on examine quelques contraintes langagières générées par le phénomène linguistique connue comme faux amis3 . Pour ce faire, on considère le couple de langues français/portugais, et on dérive l’attention à l’enseignement et apprentissage du français des étudiants brésiliens. On met en évidence, sous l’optique de la sémantique différentielle de Rastier (1997) et Vaillant (1999), des facteurs agissant sur la sélection d’éléments linguistiques en langue source4 lors de l’interprétation du sens des textes en langue cible5. On aborde aussi bien des aspects d’ordre lexical que des questions situées au palier syntaxico-sémantique et pragmatique. On examine notamment des composants situés au niveau profond, c’est-à-dire, de nature conceptuelle, pouvant déclencher des productions instables chez les étudiants brésiliens lorsqu’ils dégagent le sens des textes en français par des interprétations influencées par le système fonctionnel de leur langue source ou de leur interlangue(s)6 (Giacobbe,1992). Nous espérons ainsi pouvoir dégager un certain nombre de questions permettant d’attirer l’attention de nos lecteurs sur des problèmes posés par l’émergence des faux amis notamment dans les activités de traduction implicites dans le processus d’apprentissage du français langue étrangère (FLE).

Стилі APA, Harvard, Vancouver, ISO та ін.

12

Serratrice, Jean François. "Suivi des déformations du massif rocheux sous la fondation de la pile VII du Pont du Gard." Revue Française de Géotechnique, no. 164 (2020): 2. http://dx.doi.org/10.1051/geotech/2020023.

Повний текст джерела

Анотація:

Le Pont du Gard est un pont-aqueduc romain construit vers 50 après JC pour assurer le franchissement des gorges du Gardon par un aqueduc d’alimentation de la ville de Nîmes (France). Le pont-aqueduc et le pont routier attenant sont édifiés sur un entablement calcaire urgonien, karstifié et fracturé. Les ouvrages enjambent le lit mineur du Gardon par une voûte qui relie les piles VII et VIII. D’un point de vue géologique, ce chenal profond constitue une incision fracturée majeure dans ce paysage rocheux. Depuis près d’un siècle, les craintes d’une déstabilisation des flancs subverticaux de ce chenal ont motivé la mise en place de protections et de dispositifs de renforcement du massif rocheux. Un appareillage constitué par deux boulons instrumentés au moyen de capteurs extensométriques et une sonde de température a été mis en place dans l’appui rocheux de la pile VII et a fait l’objet d’un suivi pendant plusieurs années. Cette auscultation révèle des déformations de la roche qui évoluent avec le régime saisonnier des températures atmosphériques. Parmi les fluctuations journalières, des petits évènements semblent pouvoir être attribués à la variation de la température de l’eau pendant certaines crues du Gardon. Un calcul approximatif de ces variations saisonnières et momentanées a été effectué au moyen d’une formulation analytique. Un premier paragraphe présente une revue bibliographique des effets thermiques dans les massifs rocheux sous l’influence des conditions climatiques. Le paragraphe suivant est consacré à la présentation du site, de ses conditions environnementales et des travaux de renforcement. Les principales caractéristiques du dispositif d’auscultation sont présentées ensuite, puis les données recueillies. Une simulation des effets de la température est proposée enfin. Les résultats permettent d’expliquer effectivement l’ordre de grandeur des déformations observées dans la roche.

Стилі APA, Harvard, Vancouver, ISO та ін.

13

Prakash, Prem, Marc Sebban, Amaury Habrard, Jean-Claude Barthelemy, Frédéric Roche, and Vincent Pichot. "Détection automatique des apnées du sommeil sur l’ECG nocturne par un apprentissage profond en réseau de neurones récurrents (RNN)." Médecine du Sommeil 18, no. 1 (March 2021): 43–44. http://dx.doi.org/10.1016/j.msom.2020.11.077.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

14

Brou Boni, K. N. D., A. Wagner, L. Vanquin, J. Klein, N. Reynaert, and D. Pasquier. "Génération de tomodensitométrie synthétique par apprentissage profond pour la radiothérapie du cancer de la prostate basée sur l’IRM seule." Cancer/Radiothérapie 23, no. 6-7 (October 2019): 797. http://dx.doi.org/10.1016/j.canrad.2019.07.022.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

15

Atak, Idil. "La coopération policière pour la lutte contre la migration irrégulière au sein de l’Union européenne." Revue générale de droit 36, no. 3 (October 27, 2014): 433–81. http://dx.doi.org/10.7202/1027116ar.

Повний текст джерела

Анотація:

La lutte contre la migration irrégulière est un élément clé de la politique européenne d’immigration et d’asile. l’Union européenne joue un rôle prééminent dans le contrôle des flux de migration irrégulière à travers la mise en œuvre d’une coopération policière. Cette coopération s’est progressivement institutionnalisée par l’établissement de structures communautaires spécifiques. L’action de la police contre la migration irrégulière couvre ainsi un vaste champ de compétences allant de la gestion des flux d’information aux politiques de visas et de retour en passant par le contrôle intégré des frontières. La synergie grandissante entre l’UE et ses États membres en matière de coopération policière contre la migration irrégulière transforme la perception des notions de « frontière » et de « sécurité intérieure ». On constate également un impact profond sur les structures, le rôle et les compétences de la police en Europe. De plus, cette coopération résulte en une criminalisation de la migration ayant pour effet de légitimer le renforcement de la coopération policière. L’auteure étudie dans le présent article le processus d’européanisation de la coopération policière dans la lutte contre la migration irrégulière vers l’UE. Elle s’emploie à démontrer que la mise en œuvre effective des programmes communautaires dans ce domaine est tributaire de la consolidation de cette coopération qui s’opère souvent au détriment de protection des droits fondamentaux. Elle analyse également les conséquences de ce processus, notamment en termes de contrôle judiciaire et de légitimité démocratique, tout en esquissant une réflexion sur les perspectives futures.

Стилі APA, Harvard, Vancouver, ISO та ін.

16

Isaac, C., D. Fouques, S. Braha Zeitoun, and D. Januel. "La remédiation cognitive dans le trouble bipolaire : une étude de cas." European Psychiatry 28, S2 (November 2013): 108–9. http://dx.doi.org/10.1016/j.eurpsy.2013.09.289.

Повний текст джерела

Анотація:

IntroductionLe trouble bipolaire est une maladie psychiatrique caractérisée par une alternance d’épisodes de dépression et/ou de manie, ainsi que de périodes de rémission plus ou moins partielles. Des études ont observé des déficits cognitifs chez les patients bipolaires, qui seraient présents dès le premier épisode et qui persisteraient tout au long de leur vie [4]. Ces troubles auraient un impact sur le fonctionnement psychosocial des patients [1]. Il n’existe actuellement aucune thérapie ciblant les déficits cognitifs des patients bipolaires. La remédiation cognitive est une thérapie permettant un entraînement des capacités cognitives et un apprentissage de stratégies de résolution de problèmes. Plusieurs études concluent à un effet bénéfique persistant de la thérapie chez les patients schizophrènes [3]. De nombreux auteurs suggèrent que la thérapie de remédiation cognitive pourrait également être bénéfique aux patients bipolaires [2].MéthodologieNotre étude a pour objectif d’observer l’intérêt que peut présenter la remédiation cognitive pour les patients bipolaires, à travers l’étude du parcours de Monsieur V., un patient bipolaire de type I, qui a suivi une thérapie individuelle de remédiation cognitive durant trois mois. Nous avons administré avant et après la thérapie un bilan clinique, un bilan neuropsychologique et le test de Rorschach.RésultatsLes résultats indiquent une amélioration des capacités cognitives et fonctionnelles du patient. Nous avons observé des améliorations comportementales, mais également un changement plus profond dans la manière dont le patient mobilise des capacités cognitives.ConclusionCes résultats suggèrent que des patients bipolaires pourraient bénéficier d’une thérapie de remédiation cognitive, et nécessiteraient d’être reproduits sur une plus large population.

Стилі APA, Harvard, Vancouver, ISO та ін.

17

Mille, C. "Le désir mimétique chez les personnes Asperger." European Psychiatry 30, S2 (November 2015): S91—S92. http://dx.doi.org/10.1016/j.eurpsy.2015.09.393.

Повний текст джерела

Анотація:

On considère généralement que les enfants autistes développent peu de conduites d’imitation et il s’agit d’ailleurs d’un des critères diagnostiques classiques. On connaît notamment leurs difficultés spécifiques constatables dans les formes différées d’imitation, comme le jeu de faire semblant et le jeu social d’imitation, et leur indifférence manifeste à toute situation les éloignant de leurs objectifs immédiats. Il s’avère pourtant qu’ils se montrent ultérieurement capables d’imiter et d’utiliser l’imitation pour s’adapter. Alors qu’ils semblent durablement ne pas se préoccuper de l’opinion d’autrui et construire leurs désirs sans médiateurs sociaux, il arrive souvent qu’à l’adolescence se déclare ce besoin de se calquer sur d’autres érigés en modèles absolus. Alors que pendant longtemps, les personnes Asperger ne se montrent aucunement sensibles aux effets de mode et ne se fient qu’à leurs propres jugements, celles qui témoignent de leur parcours décrivent souvent l’émergence secondaire d’un profond souci de normalité plus que d’originalité, les amenant à copier l’apparence, les attitudes, les inflexions de la voix de ceux qui leur donnent le sentiment d’avoir parfaitement confiance en eux. Elles sont généralement conscientes de leur aspect caméléon et peuvent se soumettre à un entraînement intensif pour s’exercer et mettre en application leur apprentissage des normes sociales les plus reconnues. Elles n’en éprouvent aucune gêne et s’enorgueillissent plutôt des résultats obtenus. Par ce mimétisme délibéré, elles se livrent ainsi à une forme caricaturale de « désirabilité sociale », mais peut-on considérer que s’agit-il alors d’un accès tardif à un désir mimétique au sens où l’entend R. Girard ? La question mérite d’être posée.

Стилі APA, Harvard, Vancouver, ISO та ін.

18

Laurent, Guillaume J., and Emmanuel Piat. "Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre. Etude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving." Revue d'intelligence artificielle 20, no. 2-3 (June 1, 2006): 275–310. http://dx.doi.org/10.3166/ria.20.275-310.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

19

Zossou, Espérance, Seth Graham-Acquaah, John Manful, Simplice D. Vodouhe, and Rigobert C. Tossou. "Les petits exploitants agricoles à l’école inclusive : cas de l’apprentissage collectif par la vidéo et la radio sur la post-récolte du riz local au Bénin." International Journal of Biological and Chemical Sciences 15, no. 4 (November 19, 2021): 1678–97. http://dx.doi.org/10.4314/ijbcs.v15i4.29.

Повний текст джерела

Анотація:

En Afrique subsaharienne, les petits exploitants agricoles ruraux ont difficilement accès aux connaissances et informations actualisées afin d’améliorer leur revenu. Pour renforcer l’apprentissage collectif au sein des acteurs des chaînes de valeur du riz local blanc et étuvé, la vidéo et la radio ont été utilisées de façon participative. La présente étude visait à comprendre l’influence de cet apprentissage collectif sur (i) le changement des pratiques des transformations et (ii) la qualité du riz local. Des interviews et suivis hebdomadaires ont été réalisés entre 2009 et 2018 au sud et nord du Bénin auprès de 240 transformateurs choisis aléatoirement. Des échantillons de riz ont été également collectés pour des analyses de qualité au laboratoire. L’analyse des données a été faite avec les tests t de Student, Wilcoxon, ANOVA, et le modèle de régression de Poisson. Les résultats ont montré une amélioration des pratiques de 14% ; 23% et 58% respectivement dans les villages contrôles, radio et vidéo. Dans le processus d’amélioration des pratiques, les transformateurs ont renforcé leur créativité en développant des technologies appropriées à leur environnement ; ce qui a eu un impact positif sur les qualités physiques et de cuisson du riz. Dans un contexte de pauvreté, d’insécurité alimentaire, de ruralité et d’analphabétisme, l’apprentissage collectif par la vidéo et la radio locale se révèle être une opportunité pour le renforcement du système d’innovation agricole. English title: Smallholder farmers at inclusive school: Lessons learnt from collective learning through video and radio on local rice processing in Benin In sub-Saharan Africa, rural smallholder farmers have limited access to timely and up-to-date knowledge and information to improve their incomes. To strengthen collective learning among rice sector’ stakeholders, videos and radio were participatory used. This study aims to assess the impact of this collective learning on (i) changing rice processors practices and (ii) the quality of local rice. Interviews and weekly follow-ups were conducted between 2009 and 2018 in southern and northern Benin with 240 randomly selected rice processors. Rice samples were also collected for quality analysis in the laboratory. Data analysis was done with Student's t-tests, Wilcoxon, one-way ANOVA, and the Poisson regression model. The results showed an improvement in rice processors practices of 14%; 23% and 58% respectively in control, video and radio villages. During the improvement of their practices, rice processors have increased their creativity by developing appropriate technologies to their environment; and this has positively impact on the physical and cooking qualities of the rice. In a context of poverty, food insecurity, rurality and illiteracy, collective learning through video and radio seems to be an opportunity to strengthen the agricultural innovation system, and a booster for change through adoption and adaptation of innovation.

Стилі APA, Harvard, Vancouver, ISO та ін.

20

Abraich, Ayoub. "Apprentissage par renforcement profond pour la réponse visuelle aux questions (Deep Reinforcement Learning for Visual Question Answering)." SSRN Electronic Journal, 2019. http://dx.doi.org/10.2139/ssrn.3530241.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

21

Outchakoucht, Aissam, Hamza Es-Samaali, Anas Abou El Kalam, and Siham Benhadou. "Apprentissage par Renforcement et Blockchain : Nouvelle approche pour sécuriser l’IoT." Internet des objets 3, no. 1 (January 2019). http://dx.doi.org/10.21494/iste.op.2019.0324.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

22

Nouibat, W., Z. A. Foitih, and F. A. Haouari. "Navigation neuro-floue d'un robot mobile dans un environment inconnu avec un apprentissage par renforcement." Technologies Avancées 16, no. 1 (September 14, 2007). http://dx.doi.org/10.4314/ta.v16i1.18474.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

23

Noulawe Tchamanbe, Landry Steve, and Paulin MELATAGIA YONTA. "Algorithms to get out of Boring Area Trap in Reinforcement Learning." Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées Volume 34 - 2020 - Special... (July 2, 2021). http://dx.doi.org/10.46298/arima.6748.

Повний текст джерела

Анотація:

International audience Reinforcement learning algorithms have succeeded over the years in achieving impressive results in a variety of fields. However, these algorithms suffer from certain weaknesses highlighted by Refael Vivanti and al. that may explain the regression of even well-trained agents in certain environments : the difference in variance on rewards between areas of the environment. This difference in variance leads to two problems : Boring Area Trap and Manipulative consultant. We note that the Adaptive Symmetric Reward Noising (ASRN) algorithm proposed by Refael Vivanti and al. has limitations for environments with the following characteristics : long game times and multiple boring area environments. To overcome these problems, we propose three algorithms derived from the ASRN algorithm called Rebooted Adaptive Symmetric Reward Noising (RASRN) : Continuous ε decay RASRN, Full RASRN and Stepwise α decay RASRN. Thanks to two series of experiments carried out on the k-armed bandit problem, we show that our algorithms can better correct the Boring Area Trap problem. Les algorithmes d'apprentissage par renforcement ont réussi au fil des années à obtenir des résultats impressionnants dans divers domaines. Cependant, ces algorithmes souffrent de certaines faiblesses mises en évidence par Refael Vivanti et al. qui peuvent expliquer la régression des agents même bien entraînés dans certains environnements : la différence de variance sur les récompenses entre les zones de l'environnement. Cette différence de variance conduit à deux problèmes : le Piège de la Zone Ennuyeuse (Boring Area Trap) et le Consultant Manipulateur. Nous observons que l'algorithme Adaptive Symmetric Reward Noising (ASRN) proposé par Refael Vivanti et al. présente des limites pour des environnements ayant les caractéristiques suivantes : longues durées de jeu et environnement à zones ennuyeuses multiples. Pour pallier ces problèmes, nous proposons trois algorithmes dérivés de l'algorithme ASRN nommés Rebooted Adaptive Symmetric Reward Noi-sing (RASRN) : Continuous ε decay RASRN, Full RASRN et Stepwise α decay RASRN. Grâce à deux séries d'expérimentations menées sur le problème du bandit à k bras, nous montrons que ces algorithmes permettent de mieux corriger le problème du piège de la zone ennuyeuse.

Стилі APA, Harvard, Vancouver, ISO та ін.

Ми пропонуємо знижки на всі преміум-плани для авторів, чиї праці увійшли до тематичних добірок літератури. Зв'яжіться з нами, щоб отримати унікальний промокод!