To see the other types of publications on this topic, follow the link: Apprentissage par renforcement mulitagent.

Journal articles on the topic 'Apprentissage par renforcement mulitagent'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 18 journal articles for your research on the topic 'Apprentissage par renforcement mulitagent.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse journal articles on a wide variety of disciplines and organise your bibliography correctly.

1

Griffon, L., M. Chennaoui, D. Leger, and M. Strauss. "Apprentissage par renforcement dans la narcolepsie de type 1." Médecine du Sommeil 15, no. 1 (March 2018): 60. http://dx.doi.org/10.1016/j.msom.2018.01.164.

Full text
APA, Harvard, Vancouver, ISO, and other styles
2

Garcia, Pascal. "Exploration guidée en apprentissage par renforcement. Connaissancesa prioriet relaxation de contraintes." Revue d'intelligence artificielle 20, no. 2-3 (June 1, 2006): 235–75. http://dx.doi.org/10.3166/ria.20.235-275.

Full text
APA, Harvard, Vancouver, ISO, and other styles
3

Degris, Thomas, Olivier Sigaud, and Pierre-Henri Wuillemin. "Apprentissage par renforcement factorisé pour le comportement de personnages non joueurs." Revue d'intelligence artificielle 23, no. 2-3 (May 13, 2009): 221–51. http://dx.doi.org/10.3166/ria.23.221-251.

Full text
APA, Harvard, Vancouver, ISO, and other styles
4

Host, Shirley, and Nicolas Sabouret. "Apprentissage par renforcement d'actes de communication dans un système multi-agent." Revue d'intelligence artificielle 24, no. 2 (April 17, 2010): 159–88. http://dx.doi.org/10.3166/ria.24.159-188.

Full text
APA, Harvard, Vancouver, ISO, and other styles
5

Villatte, Matthieu, David Scholiers, and Esteve Freixa i Baqué. "Apprentissage du comportement optimal par exposition aux contingences dans le dilemme de Monty Hall." ACTA COMPORTAMENTALIA 12, no. 1 (June 1, 2004): 5–24. http://dx.doi.org/10.32870/ac.v12i1.14548.

Full text
Abstract:
L'étude a pour objet le dilemme de Monty Hall, une situation de jugement de probabilités dans laquelle la très grande majorité des individus émet un comportement de choix non-optimal. Nous formulons l'hypothèse selon laquelle l'exposition répétée aux conséquences du comportement de choix va permettre l'apprentissage du comportement optimal. Trois conditions constituent l'expérience: une condition consistant en une procédure de renforcement positif, une condition consistant en une procédure de punition négative, et une condition consistant en une procédure de renforcement positif et de punition négative. L'ajout d'une valeur aversive en conséquence du choix non-optimal, ainsi que l'extension de la série d' essais à 100, devraient permettre une amélioration de J'efficacité de l'apprentissage par rapport aux études ayant précédemment employé des séries d' essais renforcés dans le dilemme de Monty Hall. Les résultats montrent que le taux de comportement optimal augmente avec la série d'essais, mais reste proche de 50 %. Aucune des trois conditions d'apprentissage ne se révèle plus efficace qu'une autre pour l'acquisition du choix optimal. L'hypothèse selon laquelle le comportement de choix des sujets serait gouverné par des règles verbales les rendant insensibles aux contingences changeantes est formulée.
APA, Harvard, Vancouver, ISO, and other styles
6

CHIALI, Ramzi. "Le texte littéraire comme référentiel préférentiel dans le renforcement de la compétence interculturelle en contexte institutionnel. Réflexion et dynamique didactique." Revue plurilingue : Études des Langues, Littératures et Cultures 7, no. 1 (July 14, 2023): 70–78. http://dx.doi.org/10.46325/ellic.v7i1.99.

Full text
Abstract:
Cet article se positionne comme une réflexion quant aux différents aspects de la littérature proposés en classe de FLE. Dans ce sens, notre intérêt n’est point celui de considérer la littérature comme outil d’acquisition linguistique et de performance pédagogique, mais comme objet dans le traitement didactique en situation de renforcement des compétences à mobiliser par ces mêmes apprenants. Considérer la composante culturelle du texte dépend, ainsi, du besoin des apprenants en matière de compétence interculturelle, au-delà des compétences langagières. Force est de constater que l’enseignement des langues, en général, et des langues étrangères, en particulier, nécessiterait inconditionnellement, à des degrés divergents, une connaissance de la culture souche. Le processus d’enseignement/apprentissage, ainsi, focalisera sur un ensemble marqué par les différents aspects de la langue enseignée, ce qui mènerait nécessairement vers une acquisition optimale et efficace de la langue et de son utilisation dans des contextes de globalisation et de mondialisation.
APA, Harvard, Vancouver, ISO, and other styles
7

Altintas, Gulsun, and Isabelle Royer. "Renforcement de la résilience par un apprentissage post-crise : une étude longitudinale sur deux périodes de turbulence." M@n@gement 12, no. 4 (2009): 266. http://dx.doi.org/10.3917/mana.124.0266.

Full text
APA, Harvard, Vancouver, ISO, and other styles
8

Dutech, Alain, and Manuel Samuelides. "Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés Apprendre une extension sélective du passé." Revue d'intelligence artificielle 17, no. 4 (August 1, 2003): 559–89. http://dx.doi.org/10.3166/ria.17.559-589.

Full text
APA, Harvard, Vancouver, ISO, and other styles
9

Scholiers, David, and Matthieu Villatte. "Comportement Non-optimal versus Illusion Cognitive." ACTA COMPORTAMENTALIA 11, no. 1 (June 1, 2003): 5–17. http://dx.doi.org/10.32870/ac.v11i1.14611.

Full text
Abstract:
La question du comportement de choix en situation d'incertitude est sujette à controverse. Si en sciences cognitives les erreurs que peut commettre un individu sont le reflet d'une illusion irrépressible, la recherche en Analyse Expérimentale du Comportement appréhende le comportement non-optimal du point de vue de son acquisition. L'expérience reprend le principe d'un jeu où un sujet doit trouver une pièce cachée sous l'un des 3 gobelets qui lui sont présentés. Après un premier choix, un gobelet vide et non choisi est retiré. Le sujet peut alors conserver ou modifier son choix initial (probabilités respectives de gain égales à 1 / 3 et 2 /3). Généralement, les sujets considèrent que les deux stratégies sont équivalentes; ce qui constitue un comportement non-optimal. Afin d'identifier les variables qui maintiennent ce comportement et de tester s'il peut être modifié, on augmente le taux de renforcement du comportement optimal en faisant varier le nombre de gobelets de départ, la probabilité de gain de la stratégie «Modifier » augmentant avec le nombre de gobelets. Trois groupes indépendants sont répartis dans trois conditions expérimentales (3, 5 ou 10 gobelets) et sont confrontés à l'expérience directe par un comportement d'observation, puis par un comportement de choix. Les résultats montrent que plus le nombre de gobelets augmente, plus la stratégie « Modifier » est choisie. Ils permettent d'appuyer l'hypothèse selon laquelle le comportement non-optimal est le produit d'un apprentissage.
APA, Harvard, Vancouver, ISO, and other styles
10

BOUCHET, N., L. FRENILLOT, M. DELAHAYE, M. GAILLARD, P. MESTHE, E. ESCOURROU, and L. GIMENEZ. "GESTION DES EMOTIONS VECUES PAR LES ETUDIANTS EN 3E CYCLE DE MEDECINE GENERALE DE TOULOUSE AU COURS DE LA PRISE EN CHARGE DES PATIENTS : ETUDE QUALITATIVE." EXERCER 34, no. 192 (April 1, 2023): 184–90. http://dx.doi.org/10.56746/exercer.2023.192.184.

Full text
Abstract:
Contexte. La profession de médecin confronte à des émotions intenses. Leur place dans la prise en soin est peu enseignée, relevant davantage d’un « curriculum caché ». L’objectif principal de ce travail était d’explorer les différents moyens utilisés par les étudiants en 3e cycle de médecine générale de Toulouse pour gérer, par eux-mêmes ou accompagnés, le vécu de leurs émotions lors de la prise en soin des patients au cours de leurs stages. Méthode. Étude qualitative par entretiens individuels semi-dirigés réalisés par deux chercheuses auprès d’étudiants en 3e cycle de médecine générale de la subdivision de Toulouse. Analyse intégrale selon une méthode inspirée de la théorisation ancrée et modélisation par un schéma intégratif. Résultats. Treize entretiens ont été réalisés entre octobre 2020 et juillet 2021. Le statut d’étudiant en 3e cycle générait de l’anxiété et de la frustration liées aux conditions d’exercice, à l’incertitude et à la confrontation aux limites des compétences. Pour gérer leurs émotions, les participants recouraient essentiellement à la verbalisation et à la posture réflexive. Ils identifiaient des personnes-ressources dans leur entourage personnel pour trouver soutien et réconfort et dans leur entourage professionnel pour trouver réassurance et légitimité. Ils avaient aussi recours à des stratégies personnelles : activités sportives, sociales, culturelles et de loisir. Ils formulaient des attentes : un enrichissement de la formation initiale par une valorisation des compétences humaines ; des mises en situation par l’intermédiaire de jeux de rôle et d’ateliers de simulation ; un apprentissage aux méthodes de relaxation ; un renforcement de l’accompagnement en stage ; une amélioration du dépistage en santé mentale des étudiants et un développement des mesures préventives proposées. Conclusion. La gestion des émotions faisait appel à des stratégies multiples, personnelles et professionnelles. Des études plus approfondies sur les mécanismes psychologiques et sociologiques de gestion des émotions pourraient être menées auprès des étudiants en 3e cycle ainsi que des études auprès des MSU et tuteurs permettant de préciser leurs attentes en matière de formation à l’accompagnement.
APA, Harvard, Vancouver, ISO, and other styles
11

Laurent, Guillaume J., and Emmanuel Piat. "Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre. Etude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving." Revue d'intelligence artificielle 20, no. 2-3 (June 1, 2006): 275–310. http://dx.doi.org/10.3166/ria.20.275-310.

Full text
APA, Harvard, Vancouver, ISO, and other styles
12

Zossou, Espérance, Seth Graham-Acquaah, John Manful, Simplice D. Vodouhe, and Rigobert C. Tossou. "Les petits exploitants agricoles à l’école inclusive : cas de l’apprentissage collectif par la vidéo et la radio sur la post-récolte du riz local au Bénin." International Journal of Biological and Chemical Sciences 15, no. 4 (November 19, 2021): 1678–97. http://dx.doi.org/10.4314/ijbcs.v15i4.29.

Full text
Abstract:
En Afrique subsaharienne, les petits exploitants agricoles ruraux ont difficilement accès aux connaissances et informations actualisées afin d’améliorer leur revenu. Pour renforcer l’apprentissage collectif au sein des acteurs des chaînes de valeur du riz local blanc et étuvé, la vidéo et la radio ont été utilisées de façon participative. La présente étude visait à comprendre l’influence de cet apprentissage collectif sur (i) le changement des pratiques des transformations et (ii) la qualité du riz local. Des interviews et suivis hebdomadaires ont été réalisés entre 2009 et 2018 au sud et nord du Bénin auprès de 240 transformateurs choisis aléatoirement. Des échantillons de riz ont été également collectés pour des analyses de qualité au laboratoire. L’analyse des données a été faite avec les tests t de Student, Wilcoxon, ANOVA, et le modèle de régression de Poisson. Les résultats ont montré une amélioration des pratiques de 14% ; 23% et 58% respectivement dans les villages contrôles, radio et vidéo. Dans le processus d’amélioration des pratiques, les transformateurs ont renforcé leur créativité en développant des technologies appropriées à leur environnement ; ce qui a eu un impact positif sur les qualités physiques et de cuisson du riz. Dans un contexte de pauvreté, d’insécurité alimentaire, de ruralité et d’analphabétisme, l’apprentissage collectif par la vidéo et la radio locale se révèle être une opportunité pour le renforcement du système d’innovation agricole. English title: Smallholder farmers at inclusive school: Lessons learnt from collective learning through video and radio on local rice processing in Benin In sub-Saharan Africa, rural smallholder farmers have limited access to timely and up-to-date knowledge and information to improve their incomes. To strengthen collective learning among rice sector’ stakeholders, videos and radio were participatory used. This study aims to assess the impact of this collective learning on (i) changing rice processors practices and (ii) the quality of local rice. Interviews and weekly follow-ups were conducted between 2009 and 2018 in southern and northern Benin with 240 randomly selected rice processors. Rice samples were also collected for quality analysis in the laboratory. Data analysis was done with Student's t-tests, Wilcoxon, one-way ANOVA, and the Poisson regression model. The results showed an improvement in rice processors practices of 14%; 23% and 58% respectively in control, video and radio villages. During the improvement of their practices, rice processors have increased their creativity by developing appropriate technologies to their environment; and this has positively impact on the physical and cooking qualities of the rice. In a context of poverty, food insecurity, rurality and illiteracy, collective learning through video and radio seems to be an opportunity to strengthen the agricultural innovation system, and a booster for change through adoption and adaptation of innovation.
APA, Harvard, Vancouver, ISO, and other styles
13

Outchakoucht, Aissam, Hamza Es-Samaali, Anas Abou El Kalam, and Siham Benhadou. "Apprentissage par Renforcement et Blockchain : Nouvelle approche pour sécuriser l’IoT." Internet des objets 3, no. 1 (January 2019). http://dx.doi.org/10.21494/iste.op.2019.0324.

Full text
APA, Harvard, Vancouver, ISO, and other styles
14

Rowe, Frantz, and Ojelanki Ngwenyama. "L’enfermement dans les pratiques de big data : une interprétation par la théorie sociale critique." Terminal 138 (2024). http://dx.doi.org/10.4000/12dkk.

Full text
Abstract:
Les géants du capitalisme numérique exploitent des pratiques de big data reposant sur la datafication de nos comportements, sur l’accès permanent à ces données et sur leur traitement par apprentissage automatique. Nous nous enfermons dans ces pratiques et les plateformes associées sans en être pleinement conscients. Cet article propose une théorie de la dynamique causale de cet enfermement représentée à la fois par des boucles de renforcement et synthétisée par trois propositions. L’idéologie de la technique (Marcuse, 1968) conduit le développement d’une fausse conscience (Heidegger, 1954) qui conditionne l’enfermement numérique et conduit à des marchandages faustiens. Tant la fausse conscience, que cet enfermement et les marchandages faustiens sont l’objet de boucles causales de renforcement délétères et inter-reliées constituant une explication plausible de la diminution des libertés des utilisateurs du numérique.
APA, Harvard, Vancouver, ISO, and other styles
15

Nouibat, W., Z. A. Foitih, and F. A. Haouari. "Navigation neuro-floue d'un robot mobile dans un environment inconnu avec un apprentissage par renforcement." Technologies Avancées 16, no. 1 (September 14, 2007). http://dx.doi.org/10.4314/ta.v16i1.18474.

Full text
APA, Harvard, Vancouver, ISO, and other styles
16

Abraich, Ayoub. "Apprentissage par renforcement profond pour la réponse visuelle aux questions (Deep Reinforcement Learning for Visual Question Answering)." SSRN Electronic Journal, 2019. http://dx.doi.org/10.2139/ssrn.3530241.

Full text
APA, Harvard, Vancouver, ISO, and other styles
17

Noulawe Tchamanbe, Landry Steve, and Paulin MELATAGIA YONTA. "Algorithms to get out of Boring Area Trap in Reinforcement Learning." Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées Volume 34 - 2020 - Special... (July 2, 2021). http://dx.doi.org/10.46298/arima.6748.

Full text
Abstract:
International audience Reinforcement learning algorithms have succeeded over the years in achieving impressive results in a variety of fields. However, these algorithms suffer from certain weaknesses highlighted by Refael Vivanti and al. that may explain the regression of even well-trained agents in certain environments : the difference in variance on rewards between areas of the environment. This difference in variance leads to two problems : Boring Area Trap and Manipulative consultant. We note that the Adaptive Symmetric Reward Noising (ASRN) algorithm proposed by Refael Vivanti and al. has limitations for environments with the following characteristics : long game times and multiple boring area environments. To overcome these problems, we propose three algorithms derived from the ASRN algorithm called Rebooted Adaptive Symmetric Reward Noising (RASRN) : Continuous ε decay RASRN, Full RASRN and Stepwise α decay RASRN. Thanks to two series of experiments carried out on the k-armed bandit problem, we show that our algorithms can better correct the Boring Area Trap problem. Les algorithmes d'apprentissage par renforcement ont réussi au fil des années à obtenir des résultats impressionnants dans divers domaines. Cependant, ces algorithmes souffrent de certaines faiblesses mises en évidence par Refael Vivanti et al. qui peuvent expliquer la régression des agents même bien entraînés dans certains environnements : la différence de variance sur les récompenses entre les zones de l'environnement. Cette différence de variance conduit à deux problèmes : le Piège de la Zone Ennuyeuse (Boring Area Trap) et le Consultant Manipulateur. Nous observons que l'algorithme Adaptive Symmetric Reward Noising (ASRN) proposé par Refael Vivanti et al. présente des limites pour des environnements ayant les caractéristiques suivantes : longues durées de jeu et environnement à zones ennuyeuses multiples. Pour pallier ces problèmes, nous proposons trois algorithmes dérivés de l'algorithme ASRN nommés Rebooted Adaptive Symmetric Reward Noi-sing (RASRN) : Continuous ε decay RASRN, Full RASRN et Stepwise α decay RASRN. Grâce à deux séries d'expérimentations menées sur le problème du bandit à k bras, nous montrons que ces algorithmes permettent de mieux corriger le problème du piège de la zone ennuyeuse.
APA, Harvard, Vancouver, ISO, and other styles
18

Sabahi, Kamran, Mohsin Jamil, Yaser Shokri-Kalandaragh, Mehdi Tavan, and Yogendra Arya. "Deep Deterministic Policy Gradient Reinforcement Learning Based Adaptive PID Load Frequency Control of an AC Micro-Grid Apprentissage par renforcement du gradient de la politique déterministe profonde basé sur le contrôle adaptatif de la fréquence de charge PID d’un micro-réseau de courant alternatif." IEEE Canadian Journal of Electrical and Computer Engineering, 2024, 1–7. http://dx.doi.org/10.1109/icjece.2024.3353670.

Full text
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography