Relevant bibliographies by topics / Bandits à plusieurs bras

Journal articles
Dissertations / Theses
Book chapters
Conference papers

Academic literature on the topic 'Bandits à plusieurs bras'

Author: Grafiati

Published: 25 May 2024

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Bandits à plusieurs bras.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Bandits à plusieurs bras"

Leboyer, M., T. D’Amato, A. Malafosse, D. Campion, and F. Gheysen. "Génétique épidémiologique des troubles de l’humeur: une nouvelle voie de recherches?" Psychiatry and Psychobiology 4, no. 4 (1989): 193–202. http://dx.doi.org/10.1017/s0767399x00002753.

Full text

Abstract:

RésuméLes récents progrès de la biologie moléculaire offrent l’espoir d’une meilleure compréhension de la composante génétique des maladies mentales, la dépression en particulier. L’accès à un nombre quasiment illimité de marqueurs génétiques polymorphes et couvrant le génome, accroît l’efficacité des techniques de liaison génétique (linkage) qui permettent l’étude de la cotransmission des marqueurs génétiques et du trait clinique dans des familles dont plusieurs membres sont malades. D’ores et déjà, en ce qui concerne les troubles de l’humeur, 2 pistes ont été mises en évidence: celle d’une liaison à l’extrémité distale du bras long du chromosome X (Mendlewicz et al., 1987) et celle d’une liaison à l’extrémité du bras court du chromosome 11 (Egeland et al., 1987). Toutefois, ces résultats n’ont pas été constamment répliqués, ce qui soulève le problème de l’hétérogénéité étiologique des troubles dépressifs.

APA, Harvard, Vancouver, ISO, and other styles

Bengeni, D., P. Lim, and A. Belaud. "Qualité des eaux de trois bras morts de la Garonne variabilité spatio-temporelle)." Revue des sciences de l'eau 5, no. 2 (April 12, 2005): 131–56. http://dx.doi.org/10.7202/705125ar.

Full text

Abstract:

Pendant deux années, des mesures et analyses d'eau ont été faites mensuellement sur une station de la Garonne et sur trois bras morts différant par leur communication avec le fleuve. La variabilité spatio-temporelle a été dressée à partir de 14 variables physico-chimiques susceptibles d'influer les équilibres chimiques de l'eau et la vie aquatique. Les données ont fait l'objet d'une Analyse en Composantes principales précédée par une analyse de variance entre saisons et entre stations de mesures afin de déterminer l'importance des hétérogénéités spatiale et temporelle des données. L'eau du fleuve est soumise à un cycle climatique annuel de température et de débit. De brèves fortes eaux de printemps alternent avec de longues périodes de débits stables et inférieurs aux moyennes établies sur plusieurs décennies. Par rapport aux charges de sulfates et de chlorures prises comme référence du drainage du bassin versant, les flux de nitrates ont un pic accentué au printemps, résultant des activités agricoles. Les phosphates présentent aussi un accroissement automnal qui pourrait traduire un cycle annuel de minéralisation-déminéralisation. Les matières organiques s'élèvent en rapport au taux de chlorophylle a. L'eau de Garonne est de bonne qualité et conforme à la typologie habituelle, hormis des taux déclassants d'ammoniaque provenant de l'agglomération toulousaine et dont l'autoépuration est souvent incomplète. Par rapport à la Garonne, les trois bras morts sont caractérisés par un cycle thermique accentué en été. Mise en évidence par l'ACP, la minéralisation des eaux de ces trois bras morts évolue selon un cycle saisonnier parallèlement aux fluctuations de débit de la Garonne. Elle indique un gradient de minéralisation croissante de l'hiver au printemps. La qualité de l'eau lors des fortes eaux printanières est homogénéisée et imposée par le fleuve. En phases de faibles débits, la qualité de l'eau évolue parallèlement à celle de la Garonne (concentrations des substances) pour un bras mort ventilé par une communication amont et aval. En revanche, les deux bras morts en simple communication aval présentent un retard à la concentration de l'eau d'autant plus évident que la communication est étroite. Les substances fertilisantes (nitrates, phosphates, ...) augmentant de l'amont vers l'aval dans ces deux derniers bras morts, sont en été en concentration inférieure par rapport au fleuve, en raison : 1) du remplissage printanier par des eaux diluées, puis du retard estival à l’équilibrage par simple communication aval et 2) de la consommation par les organismes végétaux aquatiques. L'élude des différences spatio-temporelles met ainsi en évidence un gradient saisonnier de minéralisation, un gradient aval-amont de productivité et un gradient aval-amont de réchauffement estival. La productivité apparaît donc liée au réchauffement estival plutôt qu'à la minéralisation ou aux teneurs en substances fertilisantes.

APA, Harvard, Vancouver, ISO, and other styles

Marquis, Dominique. "Un homme et son journal : comment Jules-Paul Tardivel « domestiqua » La Vérité." Mens 13, no. 2 (July 23, 2014): 35–57. http://dx.doi.org/10.7202/1025982ar.

Full text

Abstract:

En 1881, Jules-Paul Tardivel lance à Québec La Vérité, un journal de combat ultramontain. Tardivel porte ce journal à bout de bras, mais il n'est pas seul : il est soutenu par un réseau ultramontain encore très actif à cette époque. En 1890, Tardivel fait face à des difficultés matérielles telles que la survie du journal est sérieusement mise en péril. Les amis ultramontains de Tardivel sont alors mis à contribution pour trouver une solution. Plusieurs propositions sont évoquées, mais Tardivel, ne voulant pas partager la direction du journal, trouvera finalement une solution lui permettant de demeurer le seul maître à bord. Cette incursion dans l'histoire de ce journal, rendue possible grâce à une volumineuse correspondance, permet de comprendre un aspect du rôle du réseau ultramontain dans la construction de La Vérité.

APA, Harvard, Vancouver, ISO, and other styles

Dejean, Frédéric. "De la visibilité des lieux du religieux en contexte urbain : l’exemple des églises protestantes évangéliques à Montréal." Studies in Religion/Sciences Religieuses 49, no. 3 (June 9, 2020): 408–31. http://dx.doi.org/10.1177/0008429820924012.

Full text

Abstract:

Dans des pages restées fameuses du tome 2 de ses Études de sociologie religieuse, Gabriel Le Bras affirmait que « l’attraction des villes a une influence ruineuse sur la religion des ruraux (…) Je suis pour ma part convaincu que, sur cent ruraux qui s’établissent à Paris, il y en a à peu près quatre-vingt-dix qui, au sortir de la gare Montparnasse cessent d’être des pratiquants » (Le Bras, 1956 : 480). Cette citation souligne la place de la ville dans des travaux de recherche qui ont fait de l’espace urbain la scène privilégiée du processus de sécularisation. Il s’agissait alors de montrer l’effacement progressif de la religion, de même que la difficulté des institutions religieuses à composer avec des réalités sociales nouvelles. Pourtant, des sociologues, historiens ou géographes, insistent désormais sur le rôle pivot que les villes occupent dans les dynamiques religieuses contemporaines. Plusieurs d’entre eux montrent avec raison que les groupes religieux acquièrent une visibilité inédite et s’adaptent aux réalités urbaines et à leurs mutations rapides. Dans les pages qui suivent, je traite des Églises protestantes évangéliques montréalaises et met en lumière leurs dimensions spatiales. À travers cet exemple je souhaite montrer que ces Églises s’insèrent dans la trame urbaine existante en déployant un « régime de visibilité » (Lussault, 2003) largement fondé sur une logique d’invisibilisation, qui résulte à la fois de qualités propres au protestantisme et d’un effort d’adaptation à des contraintes urbaines externes.

APA, Harvard, Vancouver, ISO, and other styles

Le Bras, Hervé. "Dix ans de perspectives de la population étrangère : une perspective." Population Vol. 52, no. 1 (January 1, 1997): 103–33. http://dx.doi.org/10.3917/popu.p1997.52n1.0133.

Full text

Abstract:

Résumé Le Bras (Hervé). -Dix ans de perspectives de la population étrangère : une perspective Depuis une dizaine d'années, plusieurs projections de la population étrangère résidant en France ont vu le jour. Avec le recul du temps, il est possible de les comparer aux observations et aux estimations de cette même population étrangère qu'elles cherchaient à prévoir. On montrera que les désaccords ou les accords tiennent à la manière dont le code de la nationalité est pris en compte dans les projections. Par ce biais, les attentes implicites ou explicites des projecteurs se matérialisent dans leurs résultats. On verra aussi comment s'effectue à cette occasion le passage d'une conception démographique centrée sur l'« immigré » à une conception juridique centrée sur la « nationalité », et parfois à une conception biologique par la négation des possibilités d'acquisition de la nationalité française. On proposera pour finir un moyen simple d'effectuer des projections de population étrangère, de manière à dédramatiser la boite noire des calculs sur ordinateur.

APA, Harvard, Vancouver, ISO, and other styles

DOSTIE, GAÉTANE. "Considérations sur la forme et le sens. Pis en français québécois. Une simple variante de puis? Un simple remplaçant de et?" Journal of French Language Studies 14, no. 2 (July 2004): 113–28. http://dx.doi.org/10.1017/s0959269504001607.

Full text

Abstract:

Plusieurs travaux ont été consacrés à ce jour à puis (Chevalier et Molho, 1986; Hansen, 1998; Reyle, 1998; Bras, Le Draoulec et Vieu, 2001). En revanche, à l'exception de quelques études ciblées (Laurendeau, 1982 et 1983; Laks, 1983), pis a généralement été tenu pour une variante dans la prononciation de puis et a rarement été examiné pour lui-même. L'objectif du présent article, consacré à pis dans son usage en français québécois, est double. Il s'agit:– de dégager les spécificités sémantiques du marqueur lorsqu'il est connecteur (propositionnel et textuel). Cela conduit à le situer par rapport à et et à proposer une hypothèse, basée sur l'opposition ‘connecteur associatif/connecteur dissociatif’, susceptible d'expliquer pourquoi les marqueurs en cause se trouvent en distribution complémentaire dans l'oral familier, bien qu'ils expriment tous deux un type de connexion neutre;– d'identifier les sens de pis lorsqu'il est marqueur discursif et de mettre en évidence les liens qui les unissent entre eux, de même que les liens qui les rattachent à l'emploi où le marqueur agit à titre de connecteur.

APA, Harvard, Vancouver, ISO, and other styles

Mokhtari, Mathieu. "Capitoline Wolf or Draco? Politicizing the Ancient Past and Materializing the Autochthony in Twenty-First Century Romania." Passés politisés, no. 9 (December 15, 2023): 31–46. http://dx.doi.org/10.35562/frontieres.1833.

Full text

Abstract:

Cet article propose d’analyser l’instrumentalisation politique du passé antique en Roumanie à travers deux cas d’étude distincts mais complémentaires. Le premier porte sur les fouilles archéologiques s’étant déroulées sur la place principale de la ville de Cluj-Napoca. Mises en œuvre à l’instigation du maire d’extrême droite, leur but avoué était de mettre au jour des vestiges de l’époque romaine. S’en est suivi un véritable bras de fer entre le maire et des membres de la minorité hongroise de la ville pour qui ce lieu revêt un fort caractère symbolique. Ce chantier a ainsi subi de nombreuses interruptions en raison des vicissitudes politiques et la contestation s’est poursuivie jusqu’à la fin des années 2000. Le deuxième cas s’intéresse aux circonstances politiques qui ont mené à la construction, dans la petite ville transylvaine d’Orăștie au début de ce siècle, de plusieurs monuments ayant pour sujet commun le passé préromain de la région. Notre travail consiste à étudier les prises de position des parties en présence afin de mettre en évidence l’usage politique de l’histoire ancienne qui cherche, dans le premier cas, à relier ces vestiges romains aux Roumains actuels et donc affirmer l’antériorité de leur présence en Transylvanie face aux Hongrois et, dans le second, à soutenir l’importance de l’élément dace dans l’identité roumaine.

APA, Harvard, Vancouver, ISO, and other styles

Achilleas, Philippe. "La bataille de la 5G et le droit international." Annuaire français de droit international 66, no. 1 (2020): 709–31. http://dx.doi.org/10.3406/afdi.2020.5489.

Full text

Abstract:

Résumé : La sécurité des systèmes d’information, désormais considérée comme une question de souveraineté, a pris une soudaine dimension politique avec l’arrivée de la cinquième génération de téléphonie mobile (5G) dont le déploiement a commencé en 2020, selon le calendrier fixé par l’UIT. La prise de conscience des enjeux de cybersécurité est liée à la montée en puissance rapide de la Chine et de son fleuron technologique Huawei dans l’écosystème numérique. Les États-Unis, déjà engagés dans un bras de fer commercial avec Pékin, ont pris une série de mesures visant à limiter la dynamique technologique de la Chine. Depuis, plusieurs pays ont adopté des mesures de contrôle et de restriction visant les équipements chinois. L’objectif est double : prévenir les atteintes à la sécurité nationale par le biais des infrastructures de télécommunications et soutenir l’émergence d’écosystèmes 5G souverains. La Chine inquiète, car elle ne partage pas les valeurs des États-Unis et de l’Union européenne en matière de libertés numériques. Pourtant, aucune preuve ne permet clairement de corroborer les accusations d’espionnage numérique proférées à l’encontre de Pékin. Dès lors, cette contribution vise à déterminer si la 5G, et plus particulièrement la position dominante des équipementiers chinois, représente une menace pour les autres États et pour les personnes afin de mieux apprécier la portée et la licéité des mesures de protection adoptées par les gouvernements.

APA, Harvard, Vancouver, ISO, and other styles

Hanawalt, Barbara A., and Ben R. McRee. "The guilds of homo prudens in late medieval England." Continuity and Change 7, no. 2 (August 1992): 163–79. http://dx.doi.org/10.1017/s0268416000001557.

Full text

Abstract:

Les corporations de jeunes et les corporations carnavalesques, c'est a dire de l'homo ludens, ainsi que les corporations des métiers ou de marchands ont bénéficié d'une recherche historique abondante, alors que les corporations tant socio-religieuses que celles des paroisses n'ont retenu l'attention que depuis peu de temps. Ces derniéres sont pourtant devenues de plus en plus importantes en Europe au bas Moyen Age. Alors que ces associations bénévoles jouaient une quantité de r^les pour leurs membres ou leurs communautés cet article recherche le rôle qu'elles jouent dans le changement politique et religieux lors d'une période de crise. La période qui suit la peste noire voit des changements radicaux de la structure sociale aussi bien dans les zones rurales que dans les villes. Les corporations sont manifestement des institutions qui doivent jouer un rôle lors d'une révolution (la révolte des paysans en 1381) ou en période d'hérésie (les Lollards); elles peuvent également être des forces de stabilité et de médiation dans leurs communautés. En évaluant leur rôle politique et religieux, cet article étudie l'hypothése de Gabriel Le Bras qui déclare que les associations apportent la bonne entente dans les communautés lorsqu'elles sont accessibles à tous les résidents, elles appliquent leurs statuts et elles autorisent la participation du curé de la paroisse. Si, d'autre part, les corporations créent une oligarchie, elles peuvent contrôler la communauté à leurs propres fins. Nous avons recherché la composition de la liste des membres et les activités des corporations en matiére de religion et de politique. Notre conclusion est la suivante: les guildes rurales ont tendance à rester ouvertes quant aux membres et à être apolitiques et religieusement conservatrices. Dans les villes marchandes toutes les corporations sont religieusement conservatrices, mais dans certaines de ces villes une ou même plusieurs corporations sont formées et elles dominent l'administration de la ville. Ces corporations au nombre limité de membres ne sont pas nécessairement à l'origine des dissidences dans la communauté, comme prédit dans l'hypothése de Le Bras. A cause de la forte accentuation des régles de comportement entre membres, les villes hantées par la discorde s'addressent à la guilde d'élite pour régler les bagarres entre membres à l'intérieur même des structures de la corporation plutôt que dans le contexte de la politique de la ville.

APA, Harvard, Vancouver, ISO, and other styles

Lhomme, E., R. Sitta, V. Journot, C. Chazallon, D. Gabillard, L. Piroth, B. Lefèvre, et al. "Plateforme COVERAGE France : un essai clinique randomisé multicentrique utilisant un schéma adaptatif multi-bras multi-étape (MAMS) pour évaluer plusieurs traitements expérimentaux de la COVID-19 en ambulatoire." Revue d'Épidémiologie et de Santé Publique 69 (June 2021): S6. http://dx.doi.org/10.1016/j.respe.2021.04.005.

Full text

APA, Harvard, Vancouver, ISO, and other styles

More sources

Dissertations / Theses on the topic "Bandits à plusieurs bras"

Hadiji, Hédi. "On some adaptivity questions in stochastic multi-armed bandits." Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASM021.

Full text

Abstract:

Cette thèse s'inscrit dans le domaine des statistiques séquentielles. Le cadre principal étudié est celui des bandits stochastiques à plusieurs bras, cadre idéal qui modélise le dilemme exploration-exploitation face à des choix répétés. La thèse est composée de quatre chapitres, précédés d'une introduction. Dans la première partie du corps de la thèse, on présente un nouvel algorithme capable d'atteindre des garanties optimales à la fois d'un point de vue distribution-dépendent et distribution-free. Les deux chapitres suivants sont consacrés à des questions dites d'adaptation. D'abord, on propose un algorithme capable de s'adapter à la régularité inconnue dans des problèmes de bandits continus, mettant en évidence le coût polynomial de l'adaptation en bandits continus. Ensuite, on considère un problème d'adaptation au supports pour des problèmes de bandits à K bras, à distributions de paiements bornés dans des intervalles inconnus. Enfin, dans un dernier chapitre un peu à part, on étudie un cadre légèrement différent de bandits préservant la diversité. On montre que le regret optimal dans ce cadre croît à des vitesses différentes des vitesses classiques, avec notamment la possibilité d'atteindre un regret constant sous certaines hypothèses
The main topics adressed in this thesis lie in the general domain of sequential learning, and in particular stochastic multi-armed bandits. The thesis is divided into four chapters and an introduction. In the first part of the main body of the thesis, we design a new algorithm achieving, simultaneously, distribution-dependent and distribution-free optimal guarantees. The next two chapters are devoted to adaptivity questions. First, in the context of continuum-armed bandits, we present a new algorithm which, for the first time, does not require the knowledge of the regularity of the bandit problem it is facing. Then, we study the issue of adapting to the unknown support of the payoffs in bounded K-armed bandits. We provide a procedure that (almost) obtains the same guarantees as if it was given the support in advance. In the final chapter, we study a slightly different bandit setting, designed to enforce diversity-preserving conditions on the strategies. We show that the optimal regert in this setting at a speed that is quite different from the traditional bandit setting. In particular, we observe that bounded regret is possible under some specific hypotheses

APA, Harvard, Vancouver, ISO, and other styles

Gajane, Pratik. "Multi-armed bandits with unconventional feedback." Thesis, Lille 3, 2017. http://www.theses.fr/2017LIL30045/document.

Full text

Abstract:

Dans cette thèse, nous étudions des problèmes de prise de décisions séquentielles dans lesquels, pour chacune de ses décisions, l'apprenant reçoit une information qu'il utilise pour guider ses décisions futures. Pour aller au-delà du retour d’information conventionnel tel qu'il a été bien étudié pour des problèmes de prise de décision séquentielle tels que les bandits multi-bras, nous considérons des formes de retour d’information partielle motivées par des applications pratiques.En premier, nous considérons le problème des bandits duellistes, dans lequel l'apprenant sélectionne deux actions à chaque pas de temps et reçoit en retour une information relative (i.e. de préférence) entre les valeurs instantanées de ces deux actions.En particulier, nous proposons un algorithme optimal qui permet à l'apprenant d'obtenir un regret cumulatif quasi-optimal (le regret est la différence entre la récompense cumulative optimale et la récompense cumulative constatée de l’apprenant). Dans un second temps, nous considérons le problème des bandits corrompus, dans lequel un processus de corruption stochastique perturbe le retour d’information. Pour ce problème aussi, nous concevons des algorithmes pour obtenir un regret cumulatif asymptotiquement optimal. En outre, nous examinons la relation entre ces deux problèmes dans le cadre du monitoring partiel qui est un paradigme générique pour la prise de décision séquentielle avec retour d'information partielle
The multi-armed bandit (MAB) problem is a mathematical formulation of the exploration-exploitation trade-off inherent to reinforcement learning, in which the learner chooses an action (symbolized by an arm) from a set of available actions in a sequence of trials in order to maximize their reward. In the classical MAB problem, the learner receives absolute bandit feedback i.e. it receives as feedback the reward of the arm it selects. In many practical situations however, different kind of feedback is more readily available. In this thesis, we study two of such kinds of feedbacks, namely, relative feedback and corrupt feedback.The main practical motivation behind relative feedback arises from the task of online ranker evaluation. This task involves choosing the optimal ranker from a finite set of rankers using only pairwise comparisons, while minimizing the comparisons between sub-optimal rankers. This is formalized by the MAB problem with relative feedback, in which the learner selects two arms instead of one and receives the preference feedback. We consider the adversarial formulation of this problem which circumvents the stationarity assumption over the mean rewards for the arms. We provide a lower bound on the performance measure for any algorithm for this problem. We also provide an algorithm called "Relative Exponential-weight algorithm for Exploration and Exploitation" with performance guarantees. We present a thorough empirical study on several information retrieval datasets that confirm the validity of these theoretical results.The motivating theme behind corrupt feedback is that the feedback the learner receives is a corrupted form of the corresponding reward of the selected arm. Practically such a feedback is available in the tasks of online advertising, recommender systems etc. We consider two goals for the MAB problem with corrupt feedback: best arm identification and exploration-exploitation. For both the goals, we provide lower bounds on the performance measures for any algorithm. We also provide various algorithms for these settings. The main contribution of this module is the algorithms "KLUCB-CF" and "Thompson Sampling-CF" which asymptotically attain the best possible performance. We present experimental results to demonstrate the performance of these algorithms. We also show how this problem setting can be used for the practical application of enforcing differential privacy

APA, Harvard, Vancouver, ISO, and other styles

Besson, Lilian. "Multi-Players Bandit Algorithms for Internet of Things Networks." Thesis, CentraleSupélec, 2019. http://www.theses.fr/2019CSUP0005.

Full text

Abstract:

Dans cette thèse de doctorat, nous étudions les réseaux sans fil et les appareils reconfigurables qui peuvent accéder à des réseaux de type radio intelligente, dans des bandes non licenciées et sans supervision centrale. Nous considérons notamment des réseaux actuels ou futurs de l’Internet des Objets (IoT), avec l’objectif d’augmenter la durée de vie de la batterie des appareils, en les équipant d’algorithmes d’apprentissage machine peu coûteux mais efficaces, qui leur permettent d’améliorer automatiquement l’efficacité de leurs communications sans fil. Nous proposons deux modèles de réseaux IoT, et nous montrons empiriquement, par des simulations numériques et une validation expérimentale réaliste, le gain que peuvent apporter nos méthodes, qui se reposent sur l’apprentissage par renforcement. Les différents problèmes d’accès au réseau sont modélisés avec des Bandits Multi-Bras (MAB), mais l’analyse de la convergence d’un grand nombre d’appareils jouant à un jeu collaboratif sans communication ni aucune coordination reste délicate, lorsque les appareils suivent tous un modèle d’activation aléatoire. Le reste de ce manuscrit étudie donc deux modèles restreints, d’abord des banditsmulti-joueurs dans des problèmes stationnaires, puis des bandits mono-joueur non stationnaires. Nous détaillons également une autre contribution, la bibliothèque Python open-source SMPyBandits, qui permet des simulations numériques de problèmes MAB, qui couvre les modèles étudiés et d’autres
In this PhD thesis, we study wireless networks and reconfigurable end-devices that can access Cognitive Radio networks, in unlicensed bands and without central control. We focus on Internet of Things networks (IoT), with the objective of extending the devices’ battery life, by equipping them with low-cost but efficient machine learning algorithms, in order to let them automatically improve the efficiency of their wireless communications. We propose different models of IoT networks, and we show empirically on both numerical simulations and real-world validation the possible gain of our methods, that use Reinforcement Learning. The different network access problems are modeled as Multi-Armed Bandits (MAB), but we found that analyzing the realistic models was intractable, because proving the convergence of many IoT devices playing a collaborative game, without communication nor coordination is hard, when they all follow random activation patterns. The rest of this manuscript thus studies two restricted models, first multi-players bandits in stationary problems, then non-stationary single-player bandits. We also detail another contribution, SMPyBandits, our open-source Python library for numerical MAB simulations, that covers all the studied models and more

APA, Harvard, Vancouver, ISO, and other styles

Abeille, Marc. "Exploration-exploitation with Thompson sampling in linear systems." Thesis, Lille 1, 2017. http://www.theses.fr/2017LIL10182/document.

Full text

Abstract:

Cette thèse est dédiée à l'étude du Thompson Sampling (TS), une heuristique qui vise à surmonter le dilemme entre exploration et exploitation qui est inhérent à tout processus décisionnel face à l'incertain. Contrairement aux algorithmes issus de l'heuristique optimiste face à l'incertain (OFU), où l'exploration provient du choix du modèle le plus favorable possible au vu de la connaissance accumulée, les algorithmes TS introduisent de l'aléa dans le processus décisionnel en sélectionnant aléatoirement un modèle plausible, ce qui les rend bien moins coûteux numériquement. Cette étude se concentre sur les problèmes paramétriques linéaires, qui autorisent les espaces état-action continus (infinis), en particulier les problèmes de Bandits Linéaires (LB) et les problèmes de contrôle Linéaire et Quadratique (LQ). Nous proposons dans cette thèse de nouvelles analyses du regret des algorithmes TS pour chacun de ces deux problèmes. Bien que notre démonstration pour les LB garantisse une borne supérieure identique aux résultats préexistants, la structure de la preuve offre une nouvelle vision du fonctionnement de l'algorithme TS, et nous permet d'étendre cette analyse aux problèmes LQ. Nous démontrons la première borne supérieure pour le regret de l'algorithme TS dans les problèmes LQ, qui garantie dans le cadre fréquentiste un regret au plus d'ordre O(\sqrt{T}). Enfin, nous proposons une application des méthodes d'exploration-exploitation pour les problèmes d'optimisation de portefeuille, et discutons dans ce cadre le besoin ou non d'explorer activement
This dissertation is dedicated to the study of the Thompson Sampling (TS) algorithms designed to address the exploration-exploitation dilemma that is inherent in sequential decision-making under uncertainty. As opposed to algorithms derived from the optimism-in-the-face-of-uncertainty (OFU) principle, where the exploration is performed by selecting the most favorable model within the set of plausible one, TS algorithms rely on randomization to enhance the exploration, and thus are much more computationally efficient. We focus on linearly parametrized problems that allow for continuous state-action spaces, namely the Linear Bandit (LB) problems and the Linear Quadratic (LQ) control problems. We derive two novel analyses for the regret of TS algorithms in those settings. While the obtained regret bound for LB is similar to previous results, the proof sheds new light on the functioning of TS, and allows us to extend the analysis to LQ problems. As a result, we prove the first regret bound for TS in LQ, and show that the frequentist regret is of order O(sqrt{T}) which matches the existing guarantee for the regret of OFU algorithms in LQ. Finally, we propose an application of exploration-exploitation techniques to the practical problem of portfolio construction, and discuss the need for active exploration in this setting

APA, Harvard, Vancouver, ISO, and other styles

Lagrée, Paul. "Méthodes adaptatives pour les applications d'accès à l'information centrées sur l'utilisateur." Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLS341/document.

Full text

Abstract:

Lorsque les internautes naviguent sur le Web, ils laissent de nombreuses traces que nous nous proposons d’exploiter pour améliorer les applications d'accès à l'information. Nous étudions des techniques centrées sur les utilisateurs qui tirent parti des nombreux types de rétroaction pour perfectionner les services offerts aux utilisateurs. Nous nous concentrons sur des applications telles que la recommandation et le marketing d’influence dans lesquelles les utilisateurs génèrent des signaux (clics, "j'aime", etc.) que nous intégrons dans nos algorithmes afin de fournir des services fortement contextualisés. La première partie de cette thèse est consacrée à une approche interactive de la recherche d'information sur les médias sociaux. Le problème consiste à récupérer un ensemble de k résultats dans un réseau social sous la contrainte que la requête peut être incomplète (par exemple, si le dernier terme est un préfixe). Chaque fois que l'utilisateur met à jour sa requête, le système met à jour l'ensemble des résultats de recherche en conséquence. Nous adoptons une interprétation de la pertinence de l'information qui tient compte du réseau, selon laquelle l'information produite par les utilisateurs proches de l'utilisateur faisant la requête est jugée plus pertinente. Ensuite, nous étudions une version générique de la maximisation de l'influence, dans laquelle nous voulons maximiser l'influence des campagnes d'information ou de marketing en sélectionnant de manière adaptative les utilisateurs initiant la propagation de l'information parmi un petit sous-ensemble de la population. Notre approche ne fait aucune hypothèse sur le modèle de diffusion sous-jacent ni même sur la structure du réseau de diffusion. Notre méthode a d'importantes applications dans le marketing d’influence qui vise à s’appuyer sur les influenceurs de réseaux sociaux pour promouvoir des produits ou des idées. Enfin, nous abordons le problème bien connu du démarrage à froid auquel sont confrontés les systèmes de recommandation par une approche adaptative. Si aucune information n’est disponible concernant l'appréciation d’un article, le système de recommandation doit recueillir des signaux (clics, etc.) afin d'estimer la valeur de l'article. Cependant, afin de minimiser les mauvaises recommandations faites aux utilisateurs, le système ne doit pas recueillir ces signaux de façon négligente. Nous introduisons un algorithme dynamique qui vise à alterner intelligemment les recommandations visant à accumuler de l'information et celles s'appuyant sur les données déjà recueillies
When users interact on modern Web systems, they let numerous footprints which we propose to exploit in order to develop better applications for information access. We study a family of techniques centered on users, which take advantage of the many types of feedback to adapt and improve services provided to users. We focus on applications like recommendation and influencer marketing in which users generate discrete feedback (e.g. clicks, "likes", reposts, etc.) that we incorporate in our algorithms in order to deliver strongly contextualized services. The first part of this dissertation is dedicated to an approach for as-you-type search on social media. The problem consists in retrieving a set of k search results in a social-aware environment under the constraint that the query may be incomplete (e.g., if the last term is a prefix). Every time the user updates his / her query, the system updates the set of search results accordingly. We adopt a "network-aware" interpretation of information relevance, by which information produced by users who are closer to the user issuing a request is considered more relevant. Then, we study a generic version of influence maximization, in which we want to maximize the influence of marketing or information campaigns by adaptively selecting "spread seeds" from a small subset of the population. Influencer marketing is a straightforward application of this, in which the focus of a campaign is placed on precise key individuals who are typically able to reach millions of consumers. This represents an unprecedented tool for online marketing that we propose to improve using an adaptive approach. Notably, our approach makes no assumptions on the underlying diffusion model and no diffusion network is needed. Finally, we propose to address the well-known cold start problem faced by recommender systems with an adaptive approach. If no information is available regarding the user appreciation of an item, the recommender system needs to gather feedback (e.g., clicks) so as to estimate the value of the item. However, in order to minimize "bad" recommendations, a well-designed system should not collect feedback carelessly. We introduce a dynamic algorithm that aims to intelligently achieve the balance between "bad" and "good" recommendations

APA, Harvard, Vancouver, ISO, and other styles

Ménard, Pierre. "Sur la notion d'optimalité dans les problèmes de bandit stochastique." Thesis, Toulouse 3, 2018. http://www.theses.fr/2018TOU30087/document.

Full text

Abstract:

Cette thèse s'inscrit dans les domaines de l'apprentissage statistique et de la statistique séquentielle. Le cadre principal est celui des problèmes de bandit stochastique à plusieurs bras. Dans une première partie, on commence par revisiter les bornes inférieures sur le regret. On obtient ainsi des bornes non-asymptotiques dépendantes de la distribution que l'on prouve de manière très simple en se limitant à quelques propriétés bien connues de la divergence de Kullback-Leibler. Puis, on propose des algorithmes pour la minimisation du regret dans les problèmes de bandit stochastique paramétrique dont les bras appartiennent à une certaine famille exponentielle ou non-paramétrique en supposant seulement que les bras sont à support dans l'intervalle unité, pour lesquels on prouve l'optimalité asymptotique (au sens de la borne inférieure de Lai et Robbins) et l'optimalité minimax. On analyse aussi la complexité pour l'échantillonnage séquentielle visant à identifier la distribution ayant la moyenne la plus proche d'un seuil fixé, avec ou sans l'hypothèse que les moyennes des bras forment une suite croissante. Ce travail est motivé par l'étude des essais cliniques de phase I, où l'hypothèse de croissance est naturelle. Finalement, on étend l'inégalité de Fano qui contrôle la probabilité d'évènements disjoints avec une moyenne de divergences de Kullback-leibler à des variables aléatoires arbitraires bornées sur l'intervalle unité. Plusieurs nouvelles applications en découlent, les plus importantes étant une borne inférieure sur la vitesse de concentration de l'a posteriori Bayésien et une borne inférieure sur le regret pour un problème de bandit non-stochastique
The topics addressed in this thesis lie in statistical machine learning and sequential statistic. Our main framework is the stochastic multi-armed bandit problems. In this work we revisit lower bounds on the regret. We obtain non-asymptotic, distribution-dependent bounds and provide simple proofs based only on well-known properties of Kullback-Leibler divergence. These bounds show in particular that in the initial phase the regret grows almost linearly, and that the well-known logarithmic growth of the regret only holds in a final phase. Then, we propose algorithms for regret minimization in stochastic bandit models with exponential families of distributions or with distribution only assumed to be supported by the unit interval, that are simultaneously asymptotically optimal (in the sense of Lai and Robbins lower bound) and minimax optimal. We also analyze the sample complexity of sequentially identifying the distribution whose expectation is the closest to some given threshold, with and without the assumption that the mean values of the distributions are increasing. This work is motivated by phase I clinical trials, a practically important setting where the arm means are increasing by nature. Finally we extend Fano's inequality, which controls the average probability of (disjoint) events in terms of the average of some Kullback-Leibler divergences, to work with arbitrary unit-valued random variables. Several novel applications are provided, in which the consideration of random variables is particularly handy. The most important applications deal with the problem of Bayesian posterior concentration (minimax or distribution-dependent) rates and with a lower bound on the regret in non-stochastic sequential learning

APA, Harvard, Vancouver, ISO, and other styles

Degenne, Rémy. "Impact of structure on the design and analysis of bandit algorithms." Thesis, Université de Paris (2019-....), 2019. http://www.theses.fr/2019UNIP7179.

Full text

Abstract:

Cette thèse porte sur des problèmes d'apprentissage statistique séquentiel, dits bandits stochastiques à plusieurs bras. Dans un premier temps un algorithme de bandit est présenté. L'analyse de cet algorithme, comme la majorité des preuves usuelles de bornes de regret pour algorithmes de bandits, utilise des intervalles de confiance pour les moyennes des bras. Dans un cadre paramétrique,on prouve des inégalités de concentration quantifiant la déviation entre le paramètre d'une distribution et son estimation empirique, afin d'obtenir de tels intervalles. Ces inégalités sont exprimées en fonction de la divergence de Kullback-Leibler. Trois extensions du problème de bandits sont ensuite étudiées. Premièrement on considère le problème dit de semi-bandit combinatoire, dans lequel un algorithme choisit un ensemble de bras et la récompense de chaque bras est observée. Le regret minimal atteignable dépend alors de la corrélation entre les bras. On considère ensuite un cadre où on change le mécanisme d'obtention des observations provenant des différents bras. Une source de difficulté du problème de bandits est la rareté de l'information: seul le bras choisi est observé. On montre comment on peut tirer parti de la disponibilité d'observations supplémentaires gratuites, ne participant pas au regret. Enfin, une nouvelle famille d'algorithmes est présentée afin d'obtenir à la fois des guaranties de minimisation de regret et d'identification du meilleur bras. Chacun des algorithmes réalise un compromis entre regret et temps d'identification. On se penche dans un deuxième temps sur le problème dit d'exploration pure, dans lequel un algorithme n'est pas évalué par son regret mais par sa probabilité d'erreur quant à la réponse à une question posée sur le problème. On détermine la complexité de tels problèmes et on met au point des algorithmes approchant cette complexité
In this Thesis, we study sequential learning problems called stochastic multi-armed bandits. First a new bandit algorithm is presented. The analysis of that algorithm uses confidence intervals on the mean of the arms reward distributions, as most bandit proofs do. In a parametric setting, we derive concentration inequalities which quantify the deviation between the mean parameter of a distribution and its empirical estimation in order to obtain confidence intervals. These inequalities are presented as bounds on the Kullback-Leibler divergence. Three extensions of the stochastic multi-armed bandit problem are then studied. First we study the so-called combinatorial semi-bandit problem, in which an algorithm chooses a set of arms and the reward of each of these arms is observed. The minimal attainable regret then depends on the correlation between the arm distributions. We consider then a setting in which the observation mechanism changes. One source of difficulty of the bandit problem is the scarcity of information: only the arm pulled is observed. We show how to use efficiently eventual supplementary free information (which do not influence the regret). Finally a new family of algorithms is introduced to obtain both regret minimization and est arm identification regret guarantees. Each algorithm of the family realizes a trade-off between regret and time needed to identify the best arm. In a second part we study the so-called pure exploration problem, in which an algorithm is not evaluated on its regret but on the probability that it returns a wrong answer to a question on the arm distributions. We determine the complexity of such problems and design with performance close to that complexity

APA, Harvard, Vancouver, ISO, and other styles

Couetoux, Adrien. "Monte Carlo Tree Search for Continuous and Stochastic Sequential Decision Making Problems." Thesis, Paris 11, 2013. http://www.theses.fr/2013PA112192.

Full text

Abstract:

Dans cette thèse, nous avons étudié les problèmes de décisions séquentielles, avec comme application la gestion de stocks d'énergie. Traditionnellement, ces problèmes sont résolus par programmation dynamique stochastique. Mais la grande dimension, et la non convexité du problème, amènent à faire des simplifications sur le modèle pour pouvoir faire fonctionner ces méthodes.Nous avons donc étudié une méthode alternative, qui ne requiert pas de simplifications du modèle: Monte Carlo Tree Search (MCTS). Nous avons commencé par étendre le MCTS classique (qui s’applique aux domaines finis et déterministes) aux domaines continus et stochastiques. Pour cela, nous avons utilisé la méthode de Double Progressive Widening (DPW), qui permet de gérer le ratio entre largeur et profondeur de l’arbre, à l’aide de deux méta paramètres. Nous avons aussi proposé une heuristique nommée Blind Value (BV) pour améliorer la recherche de nouvelles actions, en utilisant l’information donnée par les simulations passées. D’autre part, nous avons étendu l’heuristique RAVE aux domaines continus. Enfin, nous avons proposé deux nouvelles méthodes pour faire remonter l’information dans l’arbre, qui ont beaucoup amélioré la vitesse de convergence sur deux cas tests.Une part importante de notre travail a été de proposer une façon de mêler MCTS avec des heuristiques rapides pré-existantes. C’est une idée particulièrement intéressante dans le cas de la gestion d’énergie, car ces problèmes sont pour le moment résolus de manière approchée. Nous avons montré comment utiliser Direct Policy Search (DPS) pour rechercher une politique par défaut efficace, qui est ensuite utilisée à l’intérieur de MCTS. Les résultats expérimentaux sont très encourageants.Nous avons aussi appliqué MCTS à des processus markoviens partiellement observables (POMDP), avec comme exemple le jeu de démineur. Dans ce cas, les algorithmes actuels ne sont pas optimaux, et notre approche l’est, en transformant le POMDP en MDP, par un changement de vecteur d’état.Enfin, nous avons utilisé MCTS dans un cadre de méta-bandit, pour résoudre des problèmes d’investissement. Le choix d’investissement est fait par des algorithmes de bandits à bras multiples, tandis que l’évaluation de chaque bras est faite par MCTS.Une des conclusions importantes de ces travaux est que MCTS en continu a besoin de très peu d’hypothèses (uniquement un modèle génératif du problème), converge vers l’optimum, et peut facilement améliorer des méthodes suboptimales existantes
In this thesis, we study sequential decision making problems, with a focus on the unit commitment problem. Traditionally solved by dynamic programming methods, this problem is still a challenge, due to its high dimension and to the sacrifices made on the accuracy of the model to apply state of the art methods. We investigate on the applicability of Monte Carlo Tree Search methods for this problem, and other problems that are single player, stochastic and continuous sequential decision making problems. We started by extending the traditional finite state MCTS to continuous domains, with a method called Double Progressive Widening (DPW). This method relies on two hyper parameters, and determines the ratio between width and depth in the nodes of the tree. We developed a heuristic called Blind Value (BV) to improve the exploration of new actions, using the information from past simulations. We also extended the RAVE heuristic to continuous domain. Finally, we proposed two new ways of backing up information through the tree, that improved the convergence speed considerably on two test cases.An important part of our work was to propose a way to mix MCTS with existing powerful heuristics, with the application to energy management in mind. We did so by proposing a framework that allows to learn a good default policy by Direct Policy Search (DPS), and to include it in MCTS. The experimental results are very positive.To extend the reach of MCTS, we showed how it could be used to solve Partially Observable Markovian Decision Processes, with an application to game of Mine Sweeper, for which no consistent method had been proposed before.Finally, we used MCTS in a meta-bandit framework to solve energy investment problems: the investment decision was handled by classical bandit algorithms, while the evaluation of each investment was done by MCTS.The most important take away is that continuous MCTS has almost no assumption (besides the need for a generative model), is consistent, and can easily improve existing suboptimal solvers by using a method similar to what we proposed with DPS

APA, Harvard, Vancouver, ISO, and other styles

Collet, Timothé. "Méthodes optimistes d’apprentissage actif pour la classification." Thesis, Université de Lorraine, 2016. http://www.theses.fr/2016LORR0084/document.

Full text

Abstract:

La classification se base sur un jeu de données étiquetées par un expert. Plus le jeu de données est grand, meilleure est la performance de classification. Pourtant, la requête à un expert peut parfois être coûteuse. Le but de l'apprentissage actif est alors de minimiser le nombre de requêtes à l'expert. La collection des données non-étiquetées reste aisée cependant et illimitée, il est donc nécessaire de faire un choix sur les données à annoter, l'idée est alors de profiter de ce choix pour maximiser les performances en ne lui fournissant que les données les plus informatives à étiqueter. Pourtant, le niveau d'informativité de chaque donnée ne peut pas être calculé exactement et ne peut être estimé qu'à une incertitude près. Améliorer la précision de l'estimation nécessite d'annoter de nouvelles données. Il y a donc un dilemme entre utiliser le budget d'annotations disponible pour améliorer la performance du classifieur selon l'estimation actuelle du critère ou pour améliorer la précision sur le critère. Ce dilemme est bien connu dans le cadre de l'optimisation en budget fini sous le nom de dilemme entre exploration et exploitation. Les solutions usuelles pour résoudre ce dilemme dans ce contexte font usage du principe d'Optimisme Face à l'Incertitude. Dans cette thèse, nous montrons donc qu'il est possible d'adapter ce principe au problème d'apprentissage actif pour la classification. Pour cela, plusieurs algorithmes ont été être développés pour des classifieurs de complexité croissante, chacun utilisant le principe de l'Optimisme Face à l'Incertitude, et leurs résultats ont été évalués empiriquement
A Classification problem makes use of a training set consisting of data labeled by an oracle. The larger the training set, the best the performance. However, requesting the oracle may be costly. The goal of Active Learning is thus to minimize the number of requests to the oracle while achieving the best performance. To do so, the data that are presented to the oracle must be carefully selected among a large number of unlabeled instances acquired at no cost. However, the true profitability of labeling a particular instance may not be known perfectly. It can therefore be estimated along with a measure of uncertainty. To Increase the precision on the estimate, we need to label more data. Thus, there is a dilemma between labeling data in order to increase the performance of the classifier or to better know how to select data. This dilemma is well studied in the context of finite budget optimization under the name of exploration versus exploitation dilemma. The most famous solutions make use of the principle of Optimism in the Face of Uncertainty. In this thesis, we show that it is possible to adapt this principle to the active learning problem for classification. Several algorithms have been developed for classifiers of increasing complexity, each one of them using the principle of Optimism in the Face of Uncertainty, and their performances have been empirically evaluated

APA, Harvard, Vancouver, ISO, and other styles

Jedor, Matthieu. "Bandit algorithms for recommender system optimization." Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASM027.

Full text

Abstract:

Dans cette thèse de doctorat, nous étudions l'optimisation des systèmes de recommandation dans le but de fournir des suggestions de produits plus raffinées pour un utilisateur.La tâche est modélisée à l'aide du cadre des bandits multi-bras.Dans une première partie, nous abordons deux problèmes qui se posent fréquemment dans les systèmes de recommandation : le grand nombre d'éléments à traiter et la gestion des contenus sponsorisés.Dans une deuxième partie, nous étudions les performances empiriques des algorithmes de bandit et en particulier comment paramétrer les algorithmes traditionnels pour améliorer les résultats dans les environnements stationnaires et non stationnaires qui l'on rencontre en pratique.Cela nous amène à analyser à la fois théoriquement et empiriquement l'algorithme glouton qui, dans certains cas, est plus performant que l'état de l'art
In this PhD thesis, we study the optimization of recommender systems with the objective of providing more refined suggestions of items for a user to benefit.The task is modeled using the multi-armed bandit framework.In a first part, we look upon two problems that commonly occured in recommendation systems: the large number of items to handle and the management of sponsored contents.In a second part, we investigate the empirical performance of bandit algorithms and especially how to tune conventional algorithm to improve results in stationary and non-stationary environments that arise in practice.This leads us to analyze both theoretically and empirically the greedy algorithm that, in some cases, outperforms the state-of-the-art

APA, Harvard, Vancouver, ISO, and other styles

Book chapters on the topic "Bandits à plusieurs bras"

"« Les nouvelles formes habitent et conditionne en le suicide, comme pas mal de d’expression qui apparaissent partie leur scolarité et leur filles de la cité. Quand tu vis là-chez les jeunes Maghrébins de accès au monde professionnel. dedans, tu es convaincue que France portent souvent la Dans une monographie, un ça été voulu comme ça, qu’on marque d’une longue jeune qui avait vécu dans les t’as mis sur la touche [4] pour expérience et d’un profond années soixante dans le plus que t’y restes, pour que tu te sentiment d’exclusion sociale, grand bidonville de la région sentes jamais chez toi, tu es là économique et politique. […] parisienne, « La Folie » à près de la sortie, et à tout Dans l’analyse de ce sentiment Nanterre, raconte: moment, on peut te mettre d’exclusion qu’expriment un – « Vraiment, je me carrément dehors ». (Malika, 25 grand nombre de ces jeunes, demande, qui est-ce qui a pu ans, Marseille) Pour d’autres plusieurs significations inventer le bidonville? Un jeunes, ceux qui ont grandi apparaissent: ils se sentent sadique certainement (…). Les dans les grands ensembles et exclus parce qu’ils sont ordures, on les laissait; les rats, les ZUP [5] qui ont été d’origine maghrébine, enfants on les laissait; les gosses construites à tour de bras [6] de manœuvres et d’ouvriers, tombaient malades, ils avaient dans les années soixante, le jeunes dans une société pas de place pour apprendre à sentiment d’être exclu est le vieillissante que leur jeunesse marcher. On avait honte, on même, mais il est différent effraie; ce sentiment était sales, et pourtant on dans sa nature: si on les a d’exclusion commence pour essayait d’être propres pour pas parqués à la périphérie des certains très tôt à l’école, qu’on sache [2] qu’on était du villes, ce n’est pas pour les ensuite, c’est le lieu bidonville ». exclure totalement de l’espace d’habitation, le manque de Plusieurs histoires allant urbain et social, mais pour les loisirs et de moyens, des dans le même sens sont empêcher d’y entrer. frustrations quotidiennes de racontées par des jeunes des leurs désirs et rêves d’enfants cités de transit de la région." In Francotheque: A resource for French studies, 61. Routledge, 2014. http://dx.doi.org/10.4324/978020378416-8.

Full text

APA, Harvard, Vancouver, ISO, and other styles

Conference papers on the topic "Bandits à plusieurs bras"

Hascoet, E., G. Valette, G. Le Toux, and S. Boisramé. "Proposition d’un protocole de prise en charge implanto-portée de patients traités en oncologie tête et cou suite à une étude rétrospective au CHRU de Brest." In 66ème Congrès de la SFCO. Les Ulis, France: EDP Sciences, 2020. http://dx.doi.org/10.1051/sfco/20206602009.

Full text

Abstract:

L’organisation de la réhabilitation maxillo-faciale implanto-portée en oncologie tête et cou reste sujet à débat. Il n’existe pas de consensus quant au moment de la réhabilitation implantaire (pendant ou à distance de l’exérèse) ou quant aux prérequis anatomiques qui garantissent son succès. Le but de cette étude est de mettre en place un protocole de prise en charge implanto-portée de patients ayant été traités en oncologie tête et cou. Il s’agit d’une étude rétrospective entre 2013 et 2017, analysant la réhabilitation implantoportée de neuf patients traités pour un cancer tête et cou par chirurgie et radiothérapie (groupe 1 : 5 patients) ou par chirurgie seule (groupe 2 : 4 patients). Les critères étudiés étaient les données personnelles des patients, leurs antécédents oncologiques, les bilans oraux pré-opératoires effectués, les thérapeutiques utilisées ainsi que le suivi. Tous les patients ont été traités pour des carcinomes épidermödes majoritairement situés au niveau du plancher buccal. Ils présentaient tous une limitation de la mobilité linguale, une absence de vestibule et des tissus crestaux mobiles. Les projets prothétiques prévoyaient de réaliser pour sept patients une prothèse amovible complète mandibulaire stabilisée sur implants et pour deux patients des couronnes unitaires sur implant. Les patients ayant recu un lambeau libre de péroné latéral ont bénéficié d’une greffe d’apposition associée à un lambeau de FAMM. Les deux greffes ont permises la pose des implants. Sur neuf patients, cinq ont bénéficié d’une libération linguale, six ont recu une vestibuloplastie et huit ont eu une greffe épithélio-conjonctive péri-implantaire. Les implants ont été posés sous anesthésie générale avec un guide chirurgical pointeur. Il s’agissait d’implants Tissu Level RN SLA Roxolid (Straumann, Basel, Suisse). Pour les patients du groupe 2, la pose des implants a eu lieu en même temps que la vestibuloplastie. Lors de cette étude quatre patients étaient réhabilités par une prothèse sur implants. Le groupe 2 n’a pas présenté de complications. Deux patients du groupe 1 ont nécessité plusieurs libérations linguales et deux implants ne se sont pas ostéointégrés dans ce groupe. Lors de chirurgies en deux temps, des greffes épithélio-conjonctives crestales ont dû être réalisées pendant la vestibuloplastie puis pendant la pose implantaire. Deux greffes osseuses ont été réalisées chez deux patients ayant été irradiés bien que cela soit contre indiqué dans la littérature (Raoul 2009). Une greffe osseuse d’apposition peut donc être une solution viable chez ces patients afin de limiter le bras de levier prothétique. Cette étude a permis de mettre en exergue : l’importance de prévoir en amont la réhabilitation implantoportée lors de la reconstruction pour une optimisation du positionnement du greffon osseux et l’intérêt d’effectuer dans le même temps vestibuloplastie, pose des implants et aménagement péri-implantaire pour la pérennité implantaire. Cette étude rétrospective a permis de proposer un protocole de prise en charge standardisé de la réhabilitation implanto-portée de patients traités pour un cancer tête et cou.

APA, Harvard, Vancouver, ISO, and other styles

We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

Contents

Academic literature on the topic 'Bandits à plusieurs bras'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Journal articles on the topic "Bandits à plusieurs bras"

Dissertations / Theses on the topic "Bandits à plusieurs bras"

Book chapters on the topic "Bandits à plusieurs bras"

Conference papers on the topic "Bandits à plusieurs bras"