Добірка наукової літератури з теми "Environnements à récompenses rares"

Оформте джерело за APA, MLA, Chicago, Harvard та іншими стилями

Оберіть тип джерела:

Ознайомтеся зі списками актуальних статей, книг, дисертацій, тез та інших наукових джерел на тему "Environnements à récompenses rares".

Біля кожної праці в переліку літератури доступна кнопка «Додати до бібліографії». Скористайтеся нею – і ми автоматично оформимо бібліографічне посилання на обрану працю в потрібному вам стилі цитування: APA, MLA, «Гарвард», «Чикаго», «Ванкувер» тощо.

Також ви можете завантажити повний текст наукової публікації у форматі «.pdf» та прочитати онлайн анотацію до роботи, якщо відповідні параметри наявні в метаданих.

Статті в журналах з теми "Environnements à récompenses rares":

1

Besnar, Jeremy, Morgane Pallone, Ghislaine Aubin, Laëtitia Ferracci, Caroline Racineux, and Philippe Allain. "Phénomènes de dépendance à l’environnement et conformisme social : intérêts d’une approche interactionniste en neuropsychologie clinique." Neuropsychologie clinique et appliquée 1, Fall 2017 (2017): 98–112. http://dx.doi.org/10.46278/j.ncacn.20170913.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Nous décrivons le cas d’un patient victime d’un traumatisme crânien, responsable de lésions frontales et temporales bilatérales. Ce patient présentait des troubles exécutifs ainsi que des perturbations comportementales, principalement sous forme d’une dépendance à l’environnement. L’objectif de la présente étude était double. D’une part, nous souhaitions évaluer la pertinence d’une interprétation socio-cognitive de la dépendance à l’environnement, au moyen d’un dispositif évaluant le conformisme social, impliquant des situations d’interaction réelle et virtuelle. D’autre part, nous souhaitions étudier l’influence du type de situation sur le conformisme social, de rares études démontrant des différences de performances selon le type d’évaluation (réel ou virtuel). Les résultats démontrent des dissociations de performance en fonction du mode d’évaluation. Le conformisme n’est constaté que lors de l’évaluation en environnement réel. L’intérêt de l’approche interactionniste pour la mise en évidence de troubles socio-comportementaux et le bénéfice des environnements virtuels pour l’évaluation neuropsychologique sont discutés.
2

Mouradi, Sara, Gérard Motte, Stéphane Torner, Pierre Lebugle, Nelly Petitboulanger, Aziz Bemmerzouk, and Pierre-Yves Charles. "Péritonite à Sphingobium yanoikuyae en dialyse péritonéale : à propos d’un cas." Bulletin de la Dialyse à Domicile 6, no. 3 (November 13, 2023): 123–27. http://dx.doi.org/10.25796/bdd.v6i3.80703.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Nous rapportons un cas clinique rare d'infection par la bactérie Sphingobium yanoikuyae chez un patient de 87 ans traité par dialyse péritonéale pour insuffisance rénale terminale. Sphingobium yanoikuyae est une bactérie aérobie, gram-négative, connue pour sa capacité à dégrader les hydrocarbures aromatiques polycycliques et son potentiel en bioremédiation. Elle fait partie de la famille des Sphingomonadaceae, identifiée dans divers environnements, y compris les équipements de dialyse.Après avoir commencé la dialyse péritonéale, le patient a développé un syndrome infectieux. L’analyse bactériologique de l’effluent péritonéal a mis en évidence la présence de Sphingobium yanoikuyae dans le dialysat. Une antibiothérapie adaptée par MEROPENEM a été institué dès obtention de l’antibiogramme du Sphyngobium. Une seconde bactérie, Shingomonas sp était également identifiée dans les suites (résistant au MEROPENEM). Du fait d’une évolution clinicobiologique favorable, seul le sphingobium a été retenu responsable de l’atteinte.Ce cas est le premier connu d'infection humaine à Sphingobium yanoikuyae et le troisième cas d'infection par une espèce de Sphingobium en contexte de dialyse péritonéale. La faible prévalence de ce germe dans les infections humaines suggère une faible virulence de cette bactérie. Cela met néanmoins en évidence le risque potentiel des infections nosocomiales liées à cette famille de bactéries. Ce germe a montré une résistance aux antibiotiques, ce qui soulève des préoccupations sur la résistance aux anti-infectieux chez les bactéries opportunistes comme les Sphingomonadaceae.Ce cas ajoute aux connaissances sur les infections rares et résistantes aux antibiotiques en milieu hospitalier, en particulier chez les patients vulnérables traités par dialyse péritonéale.
3

Sbai, Imane, and Abdelaziz Bahoussa. "La musique d’ambiance en point de vente, entre résultats de recherches et pratiques des distributeurs." Revue Management & Innovation N° 9, no. 3 (March 26, 2024): 146–64. http://dx.doi.org/10.3917/rmi.209.0146.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Les recherches antérieures se sont occupées principalement de démontrer l’effet de la musique d’ambiance le comportement du consommateur. Néanmoins, nous ne trouvons pas d’études qui cherchent à comprendre et élucider la pratique de la musique d’ambiance dans les points de vente. Dans cette perspective, notre étude cherche à combler ce manque de travaux en réalisant une étude empirique dans un contexte marocain caractérisé par un patrimoine musicale riche et diversifié. Nous avons conduit 26 entretiens individuels auprès des responsables et des vendeurs des magasins et restaurants qui diffusent de la musique de fond. Les conclusions ont révélé que la gestion de la musique d’ambiance s’effectue d’une manière intuitive, sans faire recours à des professionnels du design sonore. Les choix et décisions prises reposent sur les préférences, perceptions et volontés des responsables et des vendeurs. Ce manque de stratégie sonore peut être lié aux ressources disponibles en termes de compétences, mais surtout à la volonté de l’enseigne de mettre en valeur l’un de ses éléments atmosphériques, à savoir la musique d’ambiance. Il est recommandé aux managers de recourir à des professionnels en design sonore et d’établir des indicateurs pour mesurer les réponses des clients vis-à-vis de la musique d’ambiance. Notre recherche se distingue en tant qu’une des rares études consacrées à une analyse approfondie de la pratique de la musique d’ambiance dans les environnements commerciaux. Les conclusions ont non seulement confirmé des constats issus des travaux antérieurs, mais ont fourni des nouvelles découvertes et clarifications en ce qui concerne la mise en œuvre de la musique d’ambiance.
4

Renaud, François. "Les motivations dans une organisation partisane de circonscription." Articles 14, no. 1 (April 12, 2005): 59–79. http://dx.doi.org/10.7202/055602ar.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Le rôle d'intermédiaire entre la population et le gouvernement que LEISERSON attribue aux partis politiques ne peut être rempli de façon adéquate que si le parti politique réussit à se constituer en organisation, c'est-à-dire que si le parti réussit à regrouper plusieurs individus dont il coordonnera les activités en vue de la poursuite de certains objectifs acceptés par tous. Comme l'exprime très bien ELDERSVELD, l'organisation permettra «de recruter des leaders, d'élaborer une politique, d'organiser la prise de décision, d'assurer les communications entre les gouvernants et les gouvernés, de façonner le consensus, d'assurer la responsabilité et d'orienter la société vers la solution de ses conflits». La dimension organisationnelle des partis, même si elle est loin d'être la seule, semble donc constituer un élément fondamental pour qui veut acquérir une meilleure compréhension de la vie des partis politiques. D'ailleurs, les politistes qui ont le plus contribué à l'élaboration d'une théorie des partis politiques les ont d'abord envisagés comme des organisations. On perçoit dès lors que l'une des priorités des dirigeants du parti sera d'assurer le maintien et la continuité de l'organisation. En d'autres mots, l'organisation devra faire en sorte que ses membres ne quittent pas l'organisation et qu'ils continuent à participer et à poursuivre les objectifs reconnus par tous. À la suite de BARNARD et de SIMON, nous allons considérer l'organisation d'un parti politique comme un système d'échanges où des individus fournissent certaines ressources en retour de la satisfaction de certains besoins qu'ils estiment importants. Un certain équilibre doit donc s'établir entre les contributions des membres et les incitations que leur fournit leur participation à l'organisation, sinon la survie du parti est mise en danger. Si les membres constatent que les ressources qu'ils investissent dans l'organisation ne permettent pas de satisfaire certains de leurs besoins, ils remettront en question leur adhésion à l'organisation et peut-être la quitteront-ils. Les incitations doivent, par conséquent, être au centre des préoccupations des personnes responsables du maintien et de la continuité de l'organisation. Or, l'administration du stock d'incitations dont disposent les dirigeants d'une organisation est rendue difficile par les caractéristiques même des incitations. Comme toutes les ressources, elles sont rares et elles ne sont pas distribuées également entre les individus. De plus, une organisation ne pourra pas offrir à ses membres une quantité d'incitations plus grande que les ressources à sa disposition. Ces incitations devront aussi convaincre les membres d'investir, par leurs contributions, des ressources qui pourront être transformées en incitations, de telle sorte que les ressources disponibles soient plus nombreuses que les incitations. Avant d'aller plus loin, une distinction s'impose entre les concepts de motivation et d'incitation tels qu'ils sont employés dans cet article. Pour nous, une incitation doit être vue comme une ressource distribuée par l'organisation pour assurer la participation de ses adhérents. C'est dans ce sens que le terme est utilisé par CLARK et WILSON tout au long de leur article. Par contre, la motivation est la perception qu'a l'adhérent des récompenses qu'il reçoit de son activité dans une organisation. Alors que l'incitation est analysée du côté de l'organisation, la motivation se perçoit plutôt du côté du membre. Dans cet article, nous nous attacherons surtout aux motivations, c'est-à-dire aux récompenses que les individus ont l'impression de retirer de leurs activités politiques. Nous estimons en effet que l'équilibre des échanges dans l'organisation se définit surtout en fonction de l'évaluation subjective qu'en font les membres. Cela ne nous empêchera pas, cependant, de recourir au système d'incitations quand le besoin s'en fera sentir. Après avoir brièvement présenté la méthode utilisée au cours de notre recherche, nous mettrons en relief la structure générale des motivations, telle qu'elle ressort des réponses de nos informateurs, et dans une seconde partie, nous tenterons d'établir des relations entre quelques variables indépendantes et les motivations. Méthode Pour obtenir nos données, nous avons conduit une entrevue avec chacun des vingt-trois chefs de paroisse de l'Union Nationale dans une circonscription électorale rurale située non loin de la ville de Québec. Les noms de ces vingt-trois organisateurs nous avaient été fournis par le député de la circonscription. Trois des entrevues ont été faites en mars 1969 dans le cadre d'une recherche plus générale sur les organisations partisanes de circonscription dans la région de Québec. Quatre autres se sont déroulées en juillet et la majorité (seize) au mois d'août 1969. Les entrevues ont été les mêmes pour chaque informateur. Dans une première partie, l'informateur devait répondre à des questions concernant la dernière élection provinciale (celle de 1966) et les communications à l'intérieur de l'organisation depuis cette date. La seconde partie contenait surtout des questions sur les caractéristiques socio-économiques des interviewés. À la fin de cette section, nous avions inclus les trois questions touchant les motivations de nos chefs de paroisse. Si on exclut les trois premières entrevues qui ont duré environ deux heures, la presque totalité des entrevues n'a pas dépassé une heure. Les trois questions que nous avons posées aux chefs de paroisse pour découvrir leurs motivations ont été empruntées à Eldersveld. L'utilisation des questions d'Eldersveld nous permettait non seulement d'établir des comparaisons avec ses données, mais aussi avec deux autres études, l'une américaine 0 et l'autre norvégienne, n qui ont eu recours à peu près au même genre de questions.
5

FAVERDIN, P., and C. LEROUX. "Avant-propos." INRAE Productions Animales 26, no. 2 (April 16, 2013): 71–76. http://dx.doi.org/10.20870/productions-animales.2013.26.2.3137.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Le lait n’est pas tout à fait un aliment comme les autres puisqu’il est aussi produit par l’Homme. Cet aliment est indispensable à l’alimentation de l’enfant, car sa richesse nutritionnelle combinée à sa forme liquide en font une ration « tout en un » du jeune pendant ses premières semaines de vie. L’homme a très tôt domestiqué d’autres mammifères pour produire cet aliment nécessaire pour le jeune et l’a aussi intégré dans l’alimentation de l’adulte sous forme native ou après transformation. De fait, le lait est un des rares produits animaux avec l’oeuf qui est produit régulièrement et qu’il est possible d’obtenir sans tuer l’animal. Sa production fait pleinement partie de la fonction de reproduction et son prélèvement doit être géré pour ne pas handicaper le développement du jeune animal qui est également un élément d’avenir dans l’élevage. Les vaches laitières ont longtemps bénéficié de noms très personnalisés, voire de prénoms, jusqu’à ce que la traçabilité ne vienne proposer des identifiants plus proches du matricule de la sécurité sociale que des petits noms affectueux utilisés jusqu’alors. La traite est un moment particulier où l’éleveur se substitue au jeune pour prélever le lait plusieurs fois par jour. Tout ceci fait traditionnellement de l’élevage laitier un élevage qui associe étroitement l’homme et l’animal. Au commencement de la domestication et pendant longtemps, le principal défaut du lait a résidé dans sa faible aptitude à la conservation, nécessitant une consommation plutôt locale, le temps entre production et consommation devant rester le plus court possible. De fait, le développement de sa consommation dans les villes est récent et ne s’est pas fait sans quelques soucis (Fanica 2008). Bien entendu, les évolutions de l’industrie laitière et des transports ont permis de franchir ce double cap de la conservation et des distances, faisant en quelques décennies d’un produit local du peuple d’un terroir, riche d’identité, d’histoire et de culture (Faye et al 2010), un produit générique du commerce mondial qui s’échange entre continents suivant les règles de l’organisation mondiale du commerce et dont la demande augmente régulièrement. Ce passage du local au mondial ne s’effectue pas sans des changements radicaux des modes de production et de l’organisation des filières, avec des conséquences parfois importantes sur les territoires. La production de lait en France, pays traditionnel d’élevage bovin laitier, illustre parfaitement cette évolution et se trouve aujourd’hui à une période charnière. Riche d’une grande diversité de terroirs et de produits, la production française présente un profil original dont on ne sait pas aujourd’hui si c’est une force ou une faiblesse dans cette évolution. Depuis 1984, le système des quotas laitiers liés à la terre et non commercialisables en France a ralenti, comparativement aux pays voisins, l’évolution vers une spécialisation et une intensification des systèmes de production laitiers, mais il disparaîtra en 2015. Le contexte économique des prix des matières premières et du prix du lait devient beaucoup plus instable que par le passé. Le métier d’éleveur laitier, avec sa complexité, sa charge de travail importante, ses astreintes et la diminution de sa rémunération, devient moins attractif. La nécessaire prise en compte de l’impact de l’élevage sur l’environnement et plus globalement de la durabilité, constitue un nouveau défi qui est souvent vécu comme une contrainte supplémentaire. Cependant, les connaissances scientifiques et technologiques ont beaucoup progressé et offrent de nouveaux outils à l’élevage laitier pour construire une trajectoire originale dans cette évolution. Ce numéro spécial d’INRA Productions Animales se propose donc en quelques articles de faire un état des lieux des connaissances concernant la production laitière, ainsi que des nouveaux défis et des nouveaux outils qui s’offrent à la filière pour construire son avenir. Ce panorama n’est volontairement pas exhaustif et traitera prioritairement des vaches laitières avec cependant, lorsqu’il est apparu nécessaire, quelques exemples tirés de travaux réalisés chez les caprins. De même, il ne s’agit pas ici d’aborder la transformation du lait et les évolutions des nombreux produits transformés. Mais nous avons cherché à présenter un point sur un certain nombre de sujets en mettant en avant les avancées récentes et les défis scientifiques, techniques, économiques et organisationnels qui concernent la production laitière, en quatre grandes parties. La première plantera tout d’abord le décor du secteur laitier français. La deuxième présentera les nouvelles avancées des travaux sur la femelle laitière, la lactation et le lait. La troisième analysera les différents leviers que constituent la sélection génétique, la gestion de la santé, l’alimentation et la traite, pour mieux maîtriser la production de lait en élevage. Enfin, la dernière partie abordera des questions plus spécifiques concernant les systèmes d’élevage et leur futur. Le premier article de V. Chatellier et al fournit une analyse à la fois du bilan et des perspectives du secteur laitier français. Après une analyse du marché des produits laitiers au travers de la demande et de l’offre et des grandes stratégies des acteurs de la filière, cet article présente les spécificités françaises des exploitations laitières liées en particulier à la diversité des systèmes de production et des territoires. Cette double diversité se traduit également dans les écarts de productivité et des résultats économiques des exploitations dont la main-d’oeuvre reste majoritairement familiale, avec la question de son renouvellement qui se pose différemment selon les territoires. Enfin, à l’aune des changements importants de contexte qui se préparent avec la fin des quotas et les nouvelles relations qui se mettent en place entre producteurs et transformateurs, les auteurs étudient les différents scénarios qui en découlent et qui conduiront à l’écriture du futur du secteur laitier français dans les territoires et le marché mondial. La série d’articles sur l’animal et le lait débute par une approche systémique de l’animal laitier. La vache laitière est d’abord perçue au travers de sa fonction de production, et les modèles de prévision de la lactation se sont longtemps focalisés sur cette seule fonction. La notion d’animaux plus robustes et d’élevages plus durables (cf. Dossier « Robustesse... », Sauvant et Perez 2010) amène à revisiter cet angle d’approche pour l’élargir à ensemble des fonctions physiologiques en prenant mieux en compte les interactions entre les génotypes animaux et leurs environnements. La modélisation aborde cette complexité de deux façons contrastées, l’une plutôt ascendante en partant des mécanismes élémentaires et en les agrégeant, l’autre plutôt descendante, en partant de grandes propriétés émergeantes des principales fonctions et de leurs interactions, voire de leur compétition dans l’accès aux ressources nutritionnelles. La revue de Friggens et al aborde ainsi la question de la dynamique de partition des nutriments entre fonction physiologiques chez les vaches laitières en fonction du génotype en présentant plusieurs approches de modélisation. Cette revue s’attache à montrer l’intérêt de partir des propriétés émergeantes pour arriver à modéliser les réponses complexes (production, reproduction, composition du lait, état corporel…) d’une vache soumise à différentes conduites d’élevage au cours de sa carrière. Les outils de demain qui permettront d’optimiser la conduited’élevage face aux aléas économiques et climatiques dépendront de l’avancée de ces modèles et des connaissances scientifiques qui les sous-tendent. La fonction de lactation est la conséquence de nombreux mécanismes à l’échelle de l’animal, tout particulièrement au niveau de la glande mammaire. Le développement et le fonctionnement de cet organe caractérisé par sa cyclicité ont fait l’objet de nombreux travaux à l’Inra et dans de nombreuses équipes de recherches internationales. Il ne s’agissait pas ici de relater l’ensemble de ces travaux mais de consacrer un article aux dernières connaissances acquises sur les mécanismes de biosynthèse et de sécrétion des constituants du lait. L’article de Leroux et al présente les travaux sur la régulation de l’expression génique dans la glande mammaire avec un intérêt particulier pour les données acquises avec les nouveaux outils d’études globales de génomique expressionnelle. Ceux-ci apportent de nouvelles connaissances sur les effets des facteurs génétiques sur la biosynthèse et la sécrétion du lait, sur leur régulation nutritionnelle et sur l’interaction de ces facteurs. Ce dernier point constitue un champ d’investigation supplémentaire pour décrypter les secrets du fonctionnement mammaire avec notamment l’intervention de nouveaux acteurs que sont les petits ARN non codants (ou microARN) qui vient encore accroître la complexité du fonctionnement mammaire dans son rôle prépondérant lors de la lactation. Après avoir fait cet état des lieux des connaissances sur la biosynthèse et la sécrétion des constituants du lait au niveau de la glande mammaire, l’article de Léonil et al présente la complexité des fractions protéique et lipidique du lait et de leur assemblage en structures supramoléculaires. Ces structures finales sont sous la dépendance de la nature et de la variabilité des constituants, ellesmêmes dues aux polymorphismes des gènes responsables de leur synthèse. Ainsi, les auteurs font un état des lieux des connaissances sur la structure et le polymorphisme des gènes spécifiant les protéines coagulables du lait que sont les caséines pour arriver à l’organisation de ces dernières en micelles. Le rôle nutritionnel de ces protéines majeures du lait et leur fonction biologique sont revisitées à la lumière des connaissances croissantes sur les peptides bioactifs qu’elles contiennent. La fraction lipidique n’est pas en reste avec la présentation de sa complexité et de son organisation sous forme de globule gras ainsi que de son impact nutritionnel sur le consommateur. Enfin, la découverte récente, dans le lait, de petites particules (ou exosomes) véhiculant des protéines et des ARN ouvre de nouvelle voies d’investigation de l’impact du lait sur la santé du consommateur. La série d’articles consacrée aux leviers d’action dont disposent les éleveurs pour moduler la production laitière ainsi que la composition du lait débute par l’article de Brochard et al, qui retrace l’impact de la sélection génétique pour arriver aux apports de la sélection génomique des races bovines laitières. Un bref historique de la sélection génétique présente les progrès réalisés sur les caractères de production laitière mais aussi sur des caractères de robustesse (fertilité, mammites…) et permet ainsi de dresser le décor génétique des élevages français. L’avènement des outils de génomique grâce au séquençage du génome bovin a conduit à renouveler les perspectives de sélection des bovins laitiers (cf. Numéro spécial, «amélioration génétique" Mulsant et al 2011). La présentation brève de ces outils permet de mieux appréhender les retombées attendues. Les opportunités offertes par la sélection génomique sur les caractères laitiers sensu stricto se complètent et permettent également de proposer une sélection sur de nouveaux caractères. En effet, la prise en compte progressive d’autres caractères oriente la sélection vers une complexité accrue notamment grâce à l’établissement de nouvelles mesures phénotypiques. L’évolution vers une meilleure robustesse, une efficacité alimentaire optimisée mais aussi une empreinte environnementale réduite, sera d’autant plus envisageable que la sélection pourra s’appuyer sur des capacités de phénotypage de plus en plus fin et à grande échelle. Un autre facteur prépondérant dans l’élevage laitier concerne la gestion de la santé animale qui affecte, notamment, la durabilité des élevages sous l’angle socio-économique. Cette gestion complexe doit prendre en compte de nombreux paramètres tel que le nombre des traitements nécessaires, le temps passé, les pertes économiques directes à court et long terme, etc. Les infections ne touchent pas toutes directement la glande mammaire, mais en affectant l’animal, elles impactent la lactation, l’efficacité de production du troupeau et donc l’élevage. L’article de Seegers et al passe en revue sept maladies majeures classées en trois groupes affectant les bovins laitiers. Il présente les connaissances récentes acquises sur ces maladies et les perspectives qu’elles ouvrent pour mieux les maîtriser. Ces maladies ont bien souvent un impact économique fort sur les élevages et/ou sont transmissibles à l’Homme constituant ainsi des questionnements de recherche forts et pour lesquels les moyens d’actions sont aussi multiples que variés. De plus, les attentes sociétales visent à diminuer, autant que faire se peut, les intrants médicamenteux. L’alimentation est un levier de maîtrise de la production et de la composition du lait qui présente l’avantage d’avoir des effets rapides et réversibles. Bien que ce levier puisse également moduler la composition protéique du lait, l’impact prépondérant de l’alimentation sur la composition en acides gras du lait, dans le but de fournir aux consommateurs une qualité nutritionnelle du lait la plus favorable possible, a été mis en exergue par de nombreuses études. La détermination de la composition en acides gras des laits est de plus en plus précise, notamment du fait des nouvelles techniques qui permettent une meilleure caractérisation de ces profils. Outre l’impact de l’alimentation, les effets des apports nutritionnels chez le ruminant sur les teneurs en composés vitaminiques du lait sont également à prendre en compte dans la perspective de l’utilisation du lait comme source complémentaire naturelle de vitamines chez les sujets présentant une efficacité d’absorption réduite (tel que les jeunes ou à l’inverse les personnes âgées). L’article de Ferlay et al recense les principaux facteurs alimentaires (nature de la ration de base, supplémentation oléagineuse, différents types de suppléments lipidiques et leurs interactions) influençant la composition en acides gras et en vitamines du lait de vache. Enfin, la traite constitue un outil supplémentaire de pilotage des troupeaux en termes de production laitière mais aussi de qualité sanitaire, technologique et nutritionnelle du lait. De plus, une meilleure connaissance des effets des différentes pratiques de traite est cruciale dans le contexte actuel de gestion du travail dans les exploitations laitières (cf. Numéro spécial, « Travail en élevage », Hostiou et al 2012). Les moyens mis en oeuvre se situent à différents niveaux allant de la fréquence de traite aux systèmes de stockage des laits en passant par les réglages possibles ou les types de machines à traire. L’article de Guinard-Flament et al fait le point des connaissances actuelles sur les effets et les conséquences de modifications de la conduite des animaux à la traite. Il présente les effets de la fréquence de traite sur le niveau de production laitière et sur la composition du lait. Le contexte de la traite, avec les effets mécaniques de la machine à traire et celui du système de stockage, est également présenté dans ses multiples facettes pour souligner leur rôle prépondérant sur la qualité microbienne des laits. La conduite des vaches à la traite est également un moyen de gestion de la carrière d’une vache laitière à travers le pilotage de certaines phases du cycle de production (effets sur la reproduction et sur la durée de la lactation et leurs conséquences sur la santé de l’animal...). La dimension des systèmes d’élevage est dominée ces dernières années par la question environnementale, notamment depuis la parution du rapport de la FAO « Livestock’s long shadow » (Steinfeld et al 2006). L’élevage laitier, très consommateur de ressources de qualité, est concerné au premier rang par ce défi environnemental. Mais ces enjeux, peu perceptibles à l’échelle de l’élevage pourtant à l’origine de ces risques, sont difficiles à intégrer dans les objectifs des systèmes de production. L’article de Dollé et al sur les impacts environnementaux des systèmes bovins laitiers français apporte de nombreux éléments quantifiés sur les émissions des éléments à risque pour l’environnement par les élevages laitiers. Ces risques concernent bien entendu la qualité de l’eau, notamment via les excrétions d’azote et de phosphore, ce qui est connu depuis longtemps avec leurs impacts sur l’eutrophisation des cours d’eau et des côtes. Les risques liés à la qualité de l’air ont été pris en compte beaucoup plus récemment et concernent principalement les émissions d’ammoniac pouvant affecter la santé humaine et des gaz à effet de serre responsables du réchauffement climatique (cf. Dossier, « Gaz à effet de serre en élevage bovin : le méthane », Doreau et al 2011). Ensuite, l’article aborde la question de la biodiversité, auxiliaire de l’agriculture et des paysages, où l’élevage joue un rôle central au sein des territoires agricoles. L’article aborde pour finir la question de la quantification de ces impacts afin d’améliorer objectivement les performances environnementales des élevages et montre que performances environnementales et économiques en élevage laitier ne sont pas antinomiques. En guise de conclusion de ce numéro, J.L. Peyraud et K. Duhem se sont prêtés à un exercice d’analyse prospective des élevages laitiers et du lait de demain en reprenant certains des constats de l’article introductif, notamment sur la diversité des systèmes et des territoires, la restructuration rapide de la filière et la reconstruction du métier d’éleveur. La filière devra demain affronter la tension entre l’amélioration de la compétitivité et celle de la durabilité de l’élevage en tirant profit des innovations. La meilleure prise en compte des qualités nutritionnelles des produits et de l’évolution des demandes tout en améliorant l’intégration de l’élevage au sein des territoires constitue un double défi pour résoudre cette tension. L’analyse des auteurs prône cependant un maintien de la diversité et la complémentarité des systèmes dans une diversité de territoires pour mieux répondre aux enjeux de la société et des éleveurs. Ce numéro spécial montre combien la filière laitière est aujourd’hui plus que jamais à la croisée des chemins avec des défis économiques et sociétaux difficiles à relever dans un climat de plus en plus incertain. Entre diversité d'une part, et spécialisation et standardisation d'autre part, le chemin de la filière française reste complexe à définir. Les nombreuses évolutions des connaissances scientifiques permettent de disposer à court ou moyen terme de nouveaux outils pour relever ces défis. La sélection génomique pour disposer des animaux les plus adaptés à leur système, les modèles de prévision pour anticiper les aléas et leurs conséquences, les outils d’évaluation environnementale pour maîtriser les risques, les outils de monitoring et d’information des troupeaux d’élevage pour améliorer les conditions de travail et l’efficience des troupeaux, les possibilités de piloter la qualité des produits par les conduites d’élevage et en particulier l’alimentation, une meilleure connaissance des mécanismes de régulation de la lactation, la découverte de la richesse des constituants du lait et de leurs propriétés nutritionnelles et fonctionnelles sont autant d’atouts pour la filière pour affronter ces défis. A travers les articles de ce numéro, nous avons voulu illustrer quelques un de ces défis et des perspectives offertes par la recherche. L’enjeu sera de les mobiliser à bon escient dans le cadre de stratégies cohérentes. Cela nécessitera la collaboration de tous les acteurs de la recherche, de la formation, du développement et de la filière. A leur niveau, les articles de ce numéro, par les nombreuses signatures communes entre chercheurs, enseignants-chercheurs et ingénieurs de recherche-développement, témoignent de la vitalité des unités mixtes de recherche et des unités mixtes thématiques impliquées dans l’élevage laitier. De même, bon nombre de travaux relatés dans les articles de ce numéro sont le fruit de programmes de recherche co-financés et menés en collaboration étroite entre la recherche, les instituts technique et la filière. Nous y voyons un fort signe positif pour l'avenir de l'élevage laitier en France Cet avant-propos ne saurait s’achever sans remercier René Baumont et le comité de rédaction d’Inra Productions Animales pour l’initiative judicieuse de ce numéro spécial, mais aussi pour nous avoir aidés à mener à bien ce projet comprenant de nombreux auteurs, qui ont bien voulu se prêter à l’exercice difficile de la rédaction d’un article de synthèse qui conjugue la rigueur de l’information scientifique avec l’exigence de la rendre accessible à un large public. Ce numéro doit beaucoup aussi aux relectures constructives de nombreux collègues que nous remercions ici anonymement. Enfin, cet ouvrage doit aussi sa qualité à un travail remarquable d’édition technique assuré par Pascale Béraudque nous associons à ces remerciements. Nous avons eu la primeur de ces articles et nous espérons que vous partagerez l’intérêt que nous avons eu à leur lecture à la fois instructive, enrichissante et propice à nourrir notre réflexion pour le futur de la recherche-développement dans le domaine de l’élevage bovin laitier.Philippe FAVERDIN, Christine LEROUX RéférencesDoreau M., Baumont R., Perez J.M., (Eds) 2011. Dossier, Gaz à effet de serre en élevage bovin : le méthane. INRA Prod. Anim., 24, 411-474. Fanica P.O., 2008. Le lait, la vache et le citadin. Du XVIIe au XXe siècle. Editions Quae, Paris, France,520p. Faye B., Bonnet P., Corniaux C., Duteurtre G., 2010. Peuples du lait. Editions Quae, Paris France, 160p. Hostiou N., Dedieu B., Baumont R., (Eds) 2012. Numéro spécial, Travail en élevage. INRA Prod. Anim., 25, 83-220. Mulsant P., Bodin L., Coudurier B., Deretz S., Le Roy P., Quillet E., Perez J.M., (Eds) 2011. Numéro spécial, Amélioration génétique. INRA Prod. Anim., 24, 283-404. Sauvant D., Perez J.M., (Eds) 2010. Dossier, Robustesse, rusticité, flexibilité, plasticité, résilience… les nouveaux critères de qualité des animaux et des systèmes d'élevage. INRA Prod. Anim., 23, 1-102. Steinfeld H., Gerber P., Wassenaar T., Castel V., Rosales M., de Haan C., 2006. Livestock's long shadow: environmental issues and options. Food and Agriculture Organization of the United Nations,414p.
6

Ponsart, Claire, Luca Freddi, Acacia Ferreira Vicente, Vitomir Djokic, Marine Jay, Gina Zanella, and Guillaume Girault. "Brucella, un genre bactérien en expansion : nouvelles espèces, nouveaux réservoirs." Bulletin de l'Académie vétérinaire de France 173 (2020). http://dx.doi.org/10.3406/bavf.2020.70912.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Au cours des vingt dernières années, le nombre d’espèces du genre Brucella a doublé, avec l’identification de six espèces bactériennes et l’élargissement du spectre d’hôtes chez les mammifères (babouins, renards, mammifères marins) et de façon plus surprenante, chez plusieurs espèces d’anoures. L’étude phénotypique de ces espèces bactériennes montre des caractéristiques parfois originales (réactions négatives à l’oxydase), des courbes de croissance différentes et des capacités de survie améliorées dans certains environnements appauvris en nutriments ou en milieu acide. Cet article présente les connaissances acquises récemment sur ces espèces et notamment, les investigations réalisées chez les anoures, premier réservoir non mammifère hébergeant des bactéries de ce genre et associé à quelques rares infections humaines.
7

Noulawe Tchamanbe, Landry Steve, and Paulin MELATAGIA YONTA. "Algorithms to get out of Boring Area Trap in Reinforcement Learning." Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées Volume 34 - 2020 - Special... (July 2, 2021). http://dx.doi.org/10.46298/arima.6748.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
International audience Reinforcement learning algorithms have succeeded over the years in achieving impressive results in a variety of fields. However, these algorithms suffer from certain weaknesses highlighted by Refael Vivanti and al. that may explain the regression of even well-trained agents in certain environments : the difference in variance on rewards between areas of the environment. This difference in variance leads to two problems : Boring Area Trap and Manipulative consultant. We note that the Adaptive Symmetric Reward Noising (ASRN) algorithm proposed by Refael Vivanti and al. has limitations for environments with the following characteristics : long game times and multiple boring area environments. To overcome these problems, we propose three algorithms derived from the ASRN algorithm called Rebooted Adaptive Symmetric Reward Noising (RASRN) : Continuous ε decay RASRN, Full RASRN and Stepwise α decay RASRN. Thanks to two series of experiments carried out on the k-armed bandit problem, we show that our algorithms can better correct the Boring Area Trap problem. Les algorithmes d'apprentissage par renforcement ont réussi au fil des années à obtenir des résultats impressionnants dans divers domaines. Cependant, ces algorithmes souffrent de certaines faiblesses mises en évidence par Refael Vivanti et al. qui peuvent expliquer la régression des agents même bien entraînés dans certains environnements : la différence de variance sur les récompenses entre les zones de l'environnement. Cette différence de variance conduit à deux problèmes : le Piège de la Zone Ennuyeuse (Boring Area Trap) et le Consultant Manipulateur. Nous observons que l'algorithme Adaptive Symmetric Reward Noising (ASRN) proposé par Refael Vivanti et al. présente des limites pour des environnements ayant les caractéristiques suivantes : longues durées de jeu et environnement à zones ennuyeuses multiples. Pour pallier ces problèmes, nous proposons trois algorithmes dérivés de l'algorithme ASRN nommés Rebooted Adaptive Symmetric Reward Noi-sing (RASRN) : Continuous ε decay RASRN, Full RASRN et Stepwise α decay RASRN. Grâce à deux séries d'expérimentations menées sur le problème du bandit à k bras, nous montrons que ces algorithmes permettent de mieux corriger le problème du piège de la zone ennuyeuse.
8

Pottier, Laurent. "Le mixage, un maillon essentiel dans le métier de RIM." Revue Francophone Informatique et Musique 1, no. 1 (2022). http://dx.doi.org/10.56698/rfim.276.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Introduction Cette publication fait suite à un colloque qui s’est tenu les 7 et 8 octobre 2013 à l’université de Saint-Étienne, organisé par le CIEREC (EA-3068) sur le thème « Techniques et pratiques du studio audio », sous la direction scientifique de Georges Bloch, alors responsable du département son du CNSMDP, d’Olivier Colin, directeur du FIL (SMAC de Saint-Étienne) et de moi-même. Depuis la fin des années 1950, les pratiques de studio audio ont joué un rôle sans cesse croissant pour faire des produits artistiques commerciaux à partir de musiques enregistrées. Jusqu’à une époque récente, les ingénieurs du son étaient principalement formés sur le terrain et les formations dans ce domaine étaient rares (principalement des BTS). Depuis quelques années, on voit se développer des formations professionnelles de haut-niveau dans le domaine, mais les documents spécialisés restent encore rares et souvent incomplets. Par ailleurs, les outils évoluent très rapidement et avec l’avènement du tout numérique et la généralisation du home-studio, il est difficile de se repérer face à la prolifération d’environnements audionumériques divers. Ce colloque se proposait donc de faire le point sur quelques uns de ces environnements et notamment sur les pratiques qui leur sont associées, en faisant intervenir à la fois des universitaires reconnus internationalement, musicologues, compositeurs ou ingénieurs du son, mais aussi des professionnels travaillant aux différents échelons de la chaîne
9

Kerr, Andrew. "Classic Rock Tours 2. Exploring a Famous Ophiolite: A Guide to the Bay of Islands Igneous Complex in Gros Morne National Park, Western Newfoundland, Canada." Geoscience Canada, October 31, 2019, 101–36. http://dx.doi.org/10.12789/geocanj.2019.46.149.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Ophiolites are complex assemblages of ultramafic and mafic igneous rocks that are now widely considered to be pieces of ancient oceanic crust that were emplaced on to the continents courtesy of global plate tectonics. However, most examples were originally considered parts of enormous layered mafic intrusions and so were interpreted in that light. The new understanding of ophiolites in the late 1960s and early 1970s was a crucial part of the global Earth Science revolution, and they are now central to all plate tectonic models developed for ancient orogenic belts. Although their equivalence to oceanic crust is now well established, many ophiolites may not be ‘typical’ examples of such, and not all examples are identical. Most ophiolites likely formed in subduction-influenced environments rather than at mid-ocean ridges. Ophiolites remain important foci for research in the 21st century, and many questions remain about their environments of formation and especially their mechanisms of emplacement onto the continents. Although it was not the first to be seen as a relic of a vanished ocean, the Bay of Islands Igneous Complex in western Newfoundland is one of the best preserved and most easily accessible ophiolites in the world. In the late 20th century, research work in this area proved highly influential in understanding the oceanic crust, and in unravelling the diachronous events involved in the progressive destruction of an ancient stable continental margin as arcs and microcontinental blocks were accreted along it. Parts of the Tablelands Ophiolite lie within Gros Morne National Park, which is a UNESCO world heritage site because of its importance to our understanding of global tectonics. The wider region around the park also includes the Cabox Aspiring Geopark Project, now also in the process of seeking recognition through UNESCO. This article provides background information on ophiolites and the development of our ideas about them, and links this material to four self-guided field excursions that allow examination of many classic features. These excursions range from a collection of roadside outcrops, to some relatively easy hiking excursions on official National Park trails, and eventually to a more challenging off-trail hike that ascends to the summit plateau of the Tablelands to visit rare exposures of the Moho (the Mohorovičić Discontinuity, i.e. the lower boundary of the Earth’s crust) and the underlying upper mantle rocks. Collectively, the field stops should allow geologically-minded visitors to experience some amazing geology in a spectacular and sometimes surreal landscape. RÉSUMÉLes ophiolites sont des assemblages complexes de roches ignées ultramafiques et mafiques qui sont maintenant généralement considérées comme des fragments de croûte océanique ancienne qui ont été charriés sur les continents grâce à la tectoniqueglobale des plaques. Cependant, la plupart des exemples étaient à l'origine considérés comme faisant partie de vastes intrusions mafiques stratifiées et ont donc été interprétés dans ce contexte. La nouvelle compréhension des ophiolites à la fin des années 60 et au début des années 70 a été un élément crucial de la révolution des sciences de la Terre. Les ophiolites sont désormais au coeur de tous les modèles tectoniques des plaques développés pour les anciennes ceintures orogéniques. Bien que leur équivalence avec la croute océanique soit maintenant bien établie, de nombreuses ophiolites peuvent ne pas en être des exemples « typiques », et tous les exemples ne sont pas identiques. La plupart des ophiolites se sont probablement formées dans des environnements influences par la subduction plutôt qu’au niveau des dorsalis océaniques. Les ophiolites restent un thème de recherché important au XXIe siècle et de nombreuses questions subsistent quant à leurs environnements de formation et notamment à leurs mécanismes de mise en place sur les continents. Bien qu'il n’ait pas été le premier à être identifié comme un vestige d'un océan disparu, le complexe igné de la baie des Îles, dans l'ouest de Terre-Neuve, fait partie des ophiolites les mieux conservées et les plus facilement accessibles au monde. À la fin du XXe siècle, les travaux de recherche dans ce domaine ont joué un rôle déterminant dans la comprehension de la croûte océanique et dans la compréhension des événements diachrones impliqués dans la destruction progressive d'une ancienne marge continentale stable au fur et à mesure de l'accrétion d'arcs et de blocs microcontinentaux. Une partie des Tablelands Ophiolite se trouve dans le parc national du Gros-Morne, site classé au patrimoine mondial de l'UNESCO en raison de son importance pour notre compréhension de la tectonique globale. La région plus large autour du parc comprend également le projet Cabox Aspiring Geopark, qui est également à la recherche d’une reconnaissance dans le cadre de l’UNESCO. Cet article fournit des informations de base sur les ophiolites et le développement de nos idées à leur sujet, et relie ce matériel à quatre excursions autoguidées qui permettent d'examiner de nombreuses caractéristiques classiques. Ces excursions vont d’une collection de visites d’affleurements au bord de la route, à des randonnées relativement faciles sur les sentiers officiels du parc national, et finalement à une randonnée plus difficile hors-piste menant au plateau sommital des Tablelands pour visiter de rares affleurement du Moho (la discontinuité de Mohorovičić, c’est-à-dire la limite inférieure de la croûte terrestre) et des roches du manteau supérieur sousjacentes. Collectivement, les visites sur le terrain devraient permettre aux visiteurs amateurs de géologie de faire l'expérience d'une géologie remarquable dans un paysage spectaculaire et parfois surréaliste.

Дисертації з теми "Environnements à récompenses rares":

1

Gallouedec, Quentin. "Toward the generalization of reinforcement learning." Electronic Thesis or Diss., Ecully, Ecole centrale de Lyon, 2024. http://www.theses.fr/2024ECDL0013.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
L’apprentissage par renforcement conventionnel implique l’entraînement d’un agent unimodal sur une tâche unique et bien définie, guidé par un signal de récompense optimisé pour le gradient. Ce cadre ne nous permet pas d’envisager un agent d’apprentissage adapté aux problèmes du monde réel impliquant des flux de diverses modalités, des tâches multiples, souvent mal définies, voire pas définies du tout. C’est pourquoi nous préconisons une transition vers un cadre plus général, visant à créer des algorithmes d’apprentissage par renforcement plus adaptables et intrinsèquement polyvalents. Pour progresser dans cette direction, nous identifions deux domaines d’intérêt principaux. Le premier est l’amélioration de l’exploration, qui permet à l’agent d’apprendre de l’environnement en dépendant le moins possible du signal de récompense. Nous présentons Latent Go-Explore (LGE), une généralisation de l’algorithme Go-Explore qui, malgré ses résultats impressionnants, était limité par une forte contrainte de connaissance du domaine. LGE atténue ces limitations et permet une application plus large dans un cadre plus général. LGE démontre son efficacité et sa polyvalence accrues en surpassant de manière significative les lignes de base dans tous les environnements testés. Le deuxième domaine d’intérêt est celui de la conception d’un agent polyvalent qui peut fonctionner dans une variété d’environnements, impliquant ainsi une structure multimodale et transcendant même le cadre séquentiel conventionnel de l’apprentissage par renforcement. Nous présentons Jack of All Trades (JAT), une architecture multimodale basée Transformers, spécialement conçue pour les tâches de décision séquentielle. En utilisant un seul ensemble de poids, JAT démontre sa robustesse et sa polyvalence, rivalisant avec son unique référence sur plusieurs benchmarks d’apprentissage par renforcement et montrant même des performances prometteuses sur des tâches de vision et textuelles. Nous pensons que ces deux contributions constituent une étape importante vers une approche plus générale de l’apprentissage par renforcement. En outre, nous présentons d’autres avancées méthodologiques et techniques qui sont étroitement liées à notre question de recherche initiale. La première est l’introduction d’un ensemble d’environnements robotiques simulés à récompense éparse, conçus pour fournir à la communauté les outils nécessaires à l’apprentissage dans des conditions de faible supervision. Trois ans après son introduction, cette contribution a été largement adoptée par la communauté et continue de faire l’objet d’une maintenance et d’un support actifs. D’autre part, nous présentons Open RL Benchmark, notre initiative pionnière visant à fournir un ensemble complet et entièrement enregistré d’expériences d’apprentissage par renforcement, allant au-delà des données typiques pour inclure toutes les métriques spécifiques à l’algorithme et au système. Ce benchmark vise à améliorer l’efficacité de la recherche en fournissant des données prêtes à l’emploi et en v vi facilitant la reproductibilité précise des expériences. Grâce à son approche communautaire, il est rapidement devenu une ressource importante, documentant plus de 25 000 exécutions. Ces avancées techniques et méthodologiques, associées aux contributions scientifiques décrites ci-dessus, visent à promouvoir une approche plus générale de l’apprentissage par renforcement et, nous l’espérons, représentent une étape significative vers le développement à terme d’un agent plus opérationnel
Conventional Reinforcement Learning (RL) involves training a unimodal agent on a single, well-defined task, guided by a gradient-optimized reward signal. This framework does not allow us to envisage a learning agent adapted to real-world problems involving diverse modality streams, multiple tasks, often poorly defined, sometimes not defined at all. Hence, we advocate for transitioning towards a more general framework, aiming to create RL algorithms that more inherently versatile.To advance in this direction, we identify two primary areas of focus. The first aspect involves improving exploration, enabling the agent to learn from the environment with reduced dependence on the reward signal. We present Latent Go-Explore (LGE), an extension of the Go-Explore algorithm. While Go-Explore achieved impressive results, it was constrained by domain-specific knowledge. LGE overcomes these limitations, offering wider applicability within a general framework. In various tested environments, LGE consistently outperforms the baselines, showcasing its enhanced effectiveness and versatility. The second focus is to design a general-purpose agent that can operate in a variety of environments, thus involving a multimodal structure and even transcending the conventional sequential framework of RL. We introduce Jack of All Trades (JAT), a multimodal Transformer-based architecture uniquely tailored to sequential decision tasks. Using a single set of weights, JAT demonstrates robustness and versatility, competing its unique baseline on several RL benchmarks and even showing promising performance on vision and textual tasks. We believe that these two contributions are a valuable step towards a more general approach to RL. In addition, we present other methodological and technical advances that are closely related to our core research question. The first is the introduction of a set of sparsely rewarded simulated robotic environments designed to provide the community with the necessary tools for learning under conditions of low supervision. Notably, three years after its introduction, this contribution has been widely adopted by the community and continues to receive active maintenance and support. On the other hand, we present Open RL Benchmark, our pioneering initiative to provide a comprehensive and fully tracked set of RL experiments, going beyond typical data to include all algorithm-specific and system metrics. This benchmark aims to improve research efficiency by providing out-of-the-box RL data and facilitating accurate reproducibility of experiments. With its community-driven approach, it has quickly become an important resource, documenting over 25,000 runs.These technical and methodological advances, along with the scientific contributions described above, are intended to promote a more general approach to Reinforcement Learning and, we hope, represent a meaningful step toward the eventual development of a more operative RL agent
2

Paolo, Giuseppe. "Learning in Sparse Rewards setting through Quality Diversity algorithms." Electronic Thesis or Diss., Sorbonne université, 2021. http://www.theses.fr/2021SORUS400.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Les agents incarnés, qu'ils soient naturels ou artificiels, peuvent apprendre à interagir avec l'environnement dans lequel ils se trouvent par un processus d'essais et d'erreurs. Ce processus peut être formalisé dans le cadre de l'apprentissage par renforcement, dans lequel l'agent effectue une action dans l'environnement et observe son résultat par le biais d'une observation et d'un signal de récompense. C'est le signal de récompense qui indique à l'agent la qualité de l'action effectuée par rapport à la tâche. Cela signifie que plus une récompense est donnée, plus il est facile d'améliorer la solution actuelle. Lorsque ce n'est pas le cas, et que la récompense est donnée avec parcimonie, l'agent se retrouve dans une situation de récompenses éparses. Cela nécessite de se concentrer sur l'exploration, c'est-à-dire de tester différentes choses, afin de découvrir quelle action ou quel ensemble d'actions mène à la récompense. Les agents RL ont généralement du mal à le faire. L'exploration est le point central des méthodes de Qualité-Diversité, une famille d'algorithmes évolutionnaires qui recherche un ensemble de politiques dont les comportements sont aussi différents que possible, tout en améliorant leurs performances. Dans cette thèse, nous abordons le problème des récompenses éparses avec ces algorithmes, et en particulier avec Novelty Search. Il s'agit d'une méthode qui, contrairement à de nombreuses autres approches Qualité-Diversité, n'améliore pas les performances des récompenses découvertes, mais uniquement leur diversité. Grâce à cela, elle peut explorer rapidement tout l'espace des comportements possibles des politiques. La première partie de la thèse se concentre sur l'apprentissage autonome d'une représentation de l'espace de recherche dans lequel l'algorithme évalue les politiques découvertes. A cet égard, nous proposons l'algorithme Task Agnostic eXploration of Outcome spaces through Novelty and Surprise (TAXONS). Cette méthode apprend une représentation à faible dimension de l'espace de recherche dans des situations où il n'est pas facile de concevoir manuellement cette représentation. TAXONS s'est avéré efficace dans trois environnements différents mais nécessite encore des informations sur le moment où il faut saisir l'observation utilisée pour apprendre l'espace de recherche. Cette limitation est abordée en réalisant une étude sur les multiples façons d'encoder dans l'espace de recherche des informations sur la trajectoire complète des observations générées pendant une évaluation de politique. Parmi les méthodes étudiées, nous analysons en particulier la transformation mathématique appelée signature et sa pertinence pour construire des représentations au niveau de la trajectoire. Le manuscrit se poursuit par l'étude d'un problème complémentaire à celui abordé par TAXONS : comment se concentrer sur les parties les plus intéressantes de l'espace de recherche. Novelty Search est limitée par le fait que toute information sur une récompense découverte au cours du processus d'exploration est ignorée. Dans notre deuxième contribution, nous présentons l'algorithme Sparse Reward Exploration via Novelty Search and Emitters (SERENE). Cette méthode sépare l'exploration de l'espace de recherche de l'exploitation de la récompense par une approche en deux étapes alternées. L'exploration est effectuée par Novelty Search, mais lorsqu'une récompense est découverte, elle est exploitée par des instances de méthodes basées sur la récompense - appelées émetteurs - qui effectuent une optimisation locale de la récompense. Des expériences sur différents environnements montrent comment SERENE peut obtenir rapidement des solutions à forte récompense sans nuire aux performances d'exploration de la méthode. Dans notre troisième et dernière contribution, nous combinons les deux idées présentées avec TAXONS et SERENE en une seule approche :TAXONS augmentés par SERENE (STAX). Cet algorithme peut apprendre de manière autonome [...]
Embodied agents, both natural and artificial, can learn to interact with the environment they are in through a process of trial and error. This process can be formalized through the Reinforcement Learning framework, in which the agent performs an action in the environment and observes its outcome through an observation and a reward signal. It is the reward signal that tells the agent how good the performed action is with respect to the task. This means that the more often a reward is given, the easier it is to improve on the current solution. When this is not the case, and the reward is given sparingly, the agent finds itself in a situation of sparse rewards. This requires a big focus on exploration, that is on testing different things, in order to discover which action, or set of actions leads to the reward. RL agents usually struggle with this. Exploration is the focus of Quality-Diversity methods, a family of evolutionary algorithms that searches for a set of policies whose behaviors are as different as possible, while also improving on their performances. In this thesis, we approach the problem of sparse rewards with these algorithms, and in particular with Novelty Search. This is a method that, contrary to many other Quality-Diversity approaches, does not improve on the performances of the discovered rewards, but only on their diversity. Thanks to this it can quickly explore the whole space of possible policies behaviors. The first part of the thesis focuses on autonomously learning a representation of the search space in which the algorithm evaluates the discovered policies. In this regard, we propose the Task Agnostic eXploration of Outcome spaces through Novelty and Surprise (TAXONS) algorithm. This method learns a low-dimensional representation of the search space in situations in which it is not easy to hand-design said representation. TAXONS has proven effective in three different environments but still requires information on when to capture the observation used to learn the search space. This limitation is addressed by performing a study on multiple ways to encode into the search space information about the whole trajectory of observations generated during a policy evaluation. Among the studied methods, we analyze in particular the mathematical transform called signature and its relevance to build trajectory-level representations. The manuscript continues with the study of a complementary problem to the one addressed by TAXONS: how to focus on the most interesting parts of the search space. Novelty Search is limited by the fact that all information about any reward discovered during the exploration process is ignored. In our second contribution, we introduce the Sparse Reward Exploration via Novelty Search and Emitters (SERENE) algorithm. This method separates the exploration of the search space from the exploitation of the reward through a two-alternating-steps approach. The exploration is performed through Novelty Search, but whenever a reward is discovered, it is exploited by instances of reward-based methods - called emitters - that perform local optimization of the reward. Experiments on different environments show how SERENE can quickly obtain high rewarding solutions without hindering the exploration performances of the method. In our third and final contribution, we combine the two ideas presented with TAXONS and SERENE into a single approach: SERENE augmented TAXONS (STAX). This algorithm can autonomously learn a low-dimensional representation of the search space while quickly optimizing any discovered reward through emitters. Experiments conducted on various environments show how the method can i) learn a representation allowing the discovery of all rewards and ii) quickly [...]

До бібліографії