To see the other types of publications on this topic, follow the link: Interaction similarity.

Dissertations / Theses on the topic 'Interaction similarity'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Interaction similarity.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Jurgenson, Eric Donald. "Applications of the Similarity Renormalization Group to the Nuclear Interaction." The Ohio State University, 2009. http://rave.ohiolink.edu/etdc/view?acc_num=osu1250105855.

Full text
APA, Harvard, Vancouver, ISO, and other styles
2

Shen, Bin. "Explicating para-social interaction how para-social interaction interact with identification, similarity, affinity/liking, and imitation /." Thesis, [Tuscaloosa, Ala. : University of Alabama Libraries], 2009. http://purl.lib.ua.edu/60.

Full text
APA, Harvard, Vancouver, ISO, and other styles
3

Wang, Chao, and Han Pan. "Visualization of Text Duplicates in Documents." Thesis, Växjö University, School of Mathematics and Systems Engineering, 2009. http://urn.kb.se/resolve?urn=urn:nbn:se:vxu:diva-5408.

Full text
Abstract:

In this thesis, a tool to visualize duplicate parts in a series of given documents is developed.

Text duplicates are very common nowadays in all fields. This behavior severelyharms the rights of the original authors though it facilitates the work of those whocopy from them. Effective legal measures have been taken when it comes to copyrightissue. An increasing large number of people have paid serious attention to what theywrite when they refer to other people's works. Although references are properly madeby many who admire and respect others' achievements, plagiarism takes place all thetime. Therefore, an intuitive way of visualizing duplicate parts is needed so thatpeople can easily grasp the purpose and decide the legality of those duplicates. Whenit comes to computer science, software clone is very typical phenomenon amongdifferent development groups or even within one group. Since a piece of softwareusually have its hierarchy, it is also interesting to group members when they do aclone detection of their own or other software. For example, if a good overview of thehierarchies is provided in a tree representation, one can easily locate the clones of aparticular node in other trees. More interaction techniques can allow concrete codeaccesses through double clicking on a highlighted node.

To visualize duplicate parts in a nice and intuitive way, a visualization tool isdeveloped for this thesis project. By the time it is done, the following features shouldbe fulfilled. First, the tool can visualize similar or identical parts given a data set.Second, hierarchies of those files can be demonstrated with proper layout. Third, theuser can manipulate the data items on the screen in order to get a better insight of thedata set and help with analysis tasks. Forth, different levels of abstraction areprovided so that the user can either get an overview of all the files or specificallycheck the duplicate parts in the documents of interest.


Visualization of Text Duplicates in Documents
APA, Harvard, Vancouver, ISO, and other styles
4

Lei, Antonio. "Do hometown and gender similarity enahnce supportive peer relationship? The interaction effect of cooperative goal." Thesis, University of Macau, 2008. http://umaclib3.umac.mo/record=b1950732.

Full text
APA, Harvard, Vancouver, ISO, and other styles
5

Aronson, Olov. "Likhetsteorin : En teoretisk utveckling av Collins interaktionsritualer." Thesis, Karlstads universitet, Institutionen för sociala och psykologiska studier, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:kau:diva-33306.

Full text
Abstract:
Uppsatsen utgår från upptäckten av ett mönster i Collins teori om interaktionsritualer. Mönstret består i att flera av idéerna och begreppen som används i Collins teori kan förstås som upplevelser av likhet mellan de samspelande individerna. Baserat på upptäckten av detta mönster formuleras uppsatsens syfte. Syftet är att utveckla grunddragen till en ny teori om interaktionsritualer som förklarar interaktionsritualer utifrån individers upplevelser av likhet. För att uppfylla syftet diskuteras fyra aspekter av interaktionsritualer. I anslutning till den första aspekten presenteras en förklaring till varför individer som upplever likhet ger varandra stöd i sina interaktionsritualer. I diskussionen kring den andra aspekten presenteras begreppet likhetens upprymdhet, som visar hur individers upplevelse av likhet är avgörande för interaktionsritualers genererande av emotionell energi. Genom den tredje aspekten framställs en komplett beskrivning av likhetsteorin, som förklarar interaktionsritualer utifrån individers upplevelse av likhet. Slutligen, i diskussionen kring den fjärde aspekten av interaktionsritualer, prövas likhetsteorin mot empiriska studier. I uppsatsens avslutande avsnitt framhävs hur likhetsteorin ger viktiga bidrag till förståelsen av interaktionsritualer och förslag på vidare forskning presenteras.
The subject of the thesis originates in the discovery of a pattern in Collins’ theory of interaction rituals. The pattern indicates that several important ideas and concepts in Collins’ theory can be conceived as individuals’ experiences of similarity. Based upon the discovery of this pattern, the aim of the thesis is to develop the basic features of a new theory that explains interaction rituals by centering upon individuals’ experiences of similarity. In order to accomplish the aim, the essay discusses four aspects of interaction rituals. In connection to the first aspect, an explanation is presented that reveals why individuals who experience similarity give each other support in their interaction rituals. Discussing the second aspect, the concept of effervescence of similarity is presented, which explains why experiences of similarity are crucial for generating emotional energy in interaction rituals. When developing the third aspect, a complete description of similarity theory is presented. Similarity theory explains interaction rituals by referring to individuals’ experiences of similarity. Finally, in the discussion of the fourth aspect, similarity theory is tested against empirical research. The concluding sections argue for ways in which similarity theory may contribute considerably to the understanding of interaction rituals. Also, suggestions for further research are presented.
APA, Harvard, Vancouver, ISO, and other styles
6

James, Brian M. "Ethnic identity among people of Mexican descent : a comparison of self reference, perception of similarity, and interaction preference /." Thesis, This resource online, 1991. http://scholar.lib.vt.edu/theses/available/etd-06112009-063347/.

Full text
APA, Harvard, Vancouver, ISO, and other styles
7

Muhammad, Fuad Muhammad Marwan. "Similarity Search in High-dimensional Spaces with Applications to Time Series Data Mining and Information Retrieval." Phd thesis, Université de Bretagne Sud, 2011. http://tel.archives-ouvertes.fr/tel-00619953.

Full text
Abstract:
Nous présentons l'un des principaux problèmes dans la recherche d'informations et de data mining, ce qui est le problème de recherche de similarité. Nous abordons ce problème dans une perspective essentiellement métrique. Nous nous concentrons sur des données de séries temporelles, mais notre objectif général est de développer des méthodes et des algorithmes qui peuvent être étendus aux autres types de données. Nous étudions de nouvelles méthodes pour traiter le problème de recherche de similarité dans des espaces haut-dimensionnels. Les nouvelles méthodes et algorithmes que nous introduisons sont largement testés et ils montrent une supériorité sur les autres méthodes et algorithmes dans la littérature.
APA, Harvard, Vancouver, ISO, and other styles
8

Rowley, James R. "Is long-term relationship satisfaction in couples correlated with similar partner self-schema or similarity of partner's self-schema to ideal-partner schema?" CSUSB ScholarWorks, 1995. https://scholarworks.lib.csusb.edu/etd-project/1109.

Full text
APA, Harvard, Vancouver, ISO, and other styles
9

Hansson, Sofia, and Joanna Lövquist. "Samspelet mellan finansiella rådgivare och kunder." Thesis, Högskolan Kristianstad, Institutionen för ekonomi, 2011. http://urn.kb.se/resolve?urn=urn:nbn:se:hkr:diva-8260.

Full text
Abstract:
Background: Previous studies focused on customer loyalty and customer satisfaction. But no studies focused on the interaction between the financial advisor and their client. Therefore we have chosen to focus on this knowledge gap.Purpose: The purpose of this thesis is to illustrate how the interaction between financial advisors and customers affect financial advisory in investment decision making.Method: The thesis philosophy was positivistic because patterns were found with help of a survey. Furthermore is the paper quantitative since the thesis is measurable and it try to explain the interaction between the financial advisors and the clients demographic characteristics and how it influence the financial advice Conclusion: The theories thin-slicing and similarity attraction paradigm may not apply to the interaction between financial advisor and client.
Bakgrund:  Tidigare studier fokuserar på kundnöjdhet och kundlojalitet. Däremot saknas studier kring samspelet mellan finansiell rådgivare och kund. Därför har vi valt att fokusera på denna kunskapslucka Syfte: Syftet med uppsatsen är att belysa hur samspelet mellan finansiella rådgivare och kunder påverkar den finansiella rådgivningen vid ett investeringsbeslut. Metod: Uppsatsen har positivistisk undersökningsfilosofi då mönster hittades med hjälp av en undersökning. Vidare är uppsatsen kvantitativ eftersom den är mätbar och att den har undersökt om det finns några samband mellan den finansiella rådgivarens och kundens demografiska egenskaper samt om dessa påverkar rådgivningen. Slutsats: Teorierna thin-slicing och similarity attraction paradigm kan inte tillämpas i samspelet mellan finansiella rådgivare och kunder.
APA, Harvard, Vancouver, ISO, and other styles
10

Barbany, Puig Montserrat. "Three Dimensional Simulitary of Molecules with biological interest on the basis of molecular interaction potentials." Doctoral thesis, Universitat Pompeu Fabra, 2006. http://hdl.handle.net/10803/7146.

Full text
Abstract:
Una de les àrees més prometedores en recerca biomèdica i farmacèutica és el disseny molecular computacional, que intenta establir relacions entre propietats físico-químiques i activitat biològica.
L'èxit d'aquestes tècniques depen críticament de la qualitat de la descripció molecular. En aquest sentit, metodologies basades en potencials d'interacció molecular (MIP) són eines útils per la comparació de compostos que presenten comportaments biològics semblants.
Aquest projecte desenvolupa eines per comparar molècules basades en la caracterització de llurs MIPs. El programa de similaritat molecular MIPsim ha estat desenvolupat i aplicat a diferents problemes biològics.
Aquesta tesi consisteix en quatre estudis científics que mostren l'ús del MIPSim en aliniament molecular, catalisi enzimàtica, en acoratge de molècules dins el lligand i en estudis 3D-QSAR.
One of the most promising areas in biomedical and pharmaceutical research is computer assisted molecular design, which tries to stablish relationships between physicochemical properties and biological activity.
The success of these techniques depends critically on the quality of the molecular description. In this sense, methodologies based on molecular interaction potentials (MIP) are useful tools for the comparison of compounds displaying related biological behaviours.
This project aims to develop tools to compare 'molecules based on the characterization 'of their MIPs. To this end, the molecular similarity program MIPSim has been further developed and applied to different biological problems.
This thesis consists on four scientific studies showing the use of MIPSim for molecular alignment, enzymatic catalysis, ligand-protein docking and 3D-QSAR analyses.
APA, Harvard, Vancouver, ISO, and other styles
11

Voland, Mathieu. "Algorithmes pour la prédiction in silico d'interactions par similarité entre macromolécules biologiques." Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLV014/document.

Full text
Abstract:
Un médicament, ou tout autre petite molécule biologique, agit sur l’organisme via des interactions chimiques qui se produisent avec d’autres macromolécules telles que les protéines qui régissent le fonctionnement des cellules. La détermination de l’ensemble des cibles, c’est à dire de l’ensemble des macromolécules susceptibles de lier une même molécule, est essentielle pour mieux comprendre les mécanismes moléculaires à l’origine des effets d’un médicament. Cette connaissance permettrait en effet de guider la conception d’un composé pour éviter au mieux les effets secondaires indésirables, ou au contraire découvrir de nouvelles applications à des molécules connues. Les avancées de la biologie structurale nous permettent maintenant d’avoir accès à un très grand nombre de structures tridimensionnelles de protéines impliquées dans ces interactions, ce qui motive l’utilisation d’outils in silico (informatique) pour complémenter ou guider les expériences in vitro ou in vivo plus longues et plus chères.La thèse s’inscrit dans le cadre d’une collaboration entre le laboratoire DAVID de l’Université de Versailles-Saint-Quentin, et l’entreprise Bionext SA qui propose une suite logicielle permettant de visualiser et d’étudier les interactions chimiques. Les travaux de recherches ont pour objectif de développer un algorithme permettant, à partir des données structurales des protéines, de déterminer des cibles potentielles pour un composé donné. L’approche choisie consiste à utiliser la connaissance d’une première interaction entre un composé et une protéine afin de rechercher par similarité d’autres protéines pour lesquelles on peut inférer la capacité à se lier avec le même composé. Il s’agit plus précisément de rechercher une similarité locale entre un motif donné, qui est la région permettant à la cible connue de lier le composé, et un ensemble de protéines candidates.Un algorithme a été développé, BioBind, qui utilise un modèle des surfaces des macromolécules issu de la théorie des formes alpha afin de modéliser la surface accessible ainsi qu’une topologie sur cette surface permettant la définition de régions en surface. Afin de traiter le problème de la recherche d’un motif en surface, une heuristique est utilisée consistant à définir des motifs réguliers qui sont une approximation de disques géodésiques et permettant un échantillonnage exhaustif à la surface des macromolécules. Ces régions circulaires sont alors étendues à l’ensemble du motif recherché afin de déterminer une mesure de similarité.Le problème de la prédiction de cibles est ramené à un problème de classification binaire, où il s’agit pour un ensemble de protéines données de déterminer lesquelles sont susceptibles d’interagir avec le composé considéré, par similarité avec la première cible connue. Cette formalisation permet d’étudier les performances de notre approche, ainsi que de la comparer avec d’autres approches sur différents jeux de données. Nous utilisons pour cela deux jeux de données issus de la littérature ainsi qu’un troisième développé spécifiquement pour cette problématique afin d’être plus représentatif des molécules pertinentes du point de vue pharmacologique, c’est-à-dire ayant des propriétés proches des médicaments. Notre approche se compare favorablement sur ces trois jeux de données par rapport à une autre approche de prédiction par similarité, et plus généralement notre analyse confirme que les approches par docking (amarrage) sont moins performantes que les approches par similarité pour le problème de la prédiction de cibles
The action of a drug, or another small biomolecule, is induced by chemical interactions with other macromolecules such as proteins regulating the cell functions. The determination of the set of targets, the macromolecules that could bind the same small molecule, is essential in order to understand molecular mechanisms responsible for the effects of a drug. Indeed, this knowledge could help the drug design process so as to avoid side effects or to find new applications for known drugs. The advances of structural biology provides us with three-dimensional representations of many proteins involved in these interactions, motivating the use of in silico tools to complement or guide further in vitro or in vivo experiments which are both more expansive and time consuming.This research is conducted as part of a collaboration between the DAVID laboratory of the Versailles-Saint-Quentin University, and Bionext SA which offers a software suite to visualize and analyze chemical interactions between biological molecules. The objective is to design an algorithm to predict these interactions for a given compound, using the structures of potential targets. More precisely, starting from a known interaction between a drug and a protein, a new interaction can be inferred with another sufficiently similar protein. This approach consists in the search of a given pattern, the known binding site, across a collection of macromolecules.An algorithm was implemented, BioBind, which rely on a topological representation of the surface of the macromolecules based on the alpha shapes theory. Our surface representation allows to define a concept of region of any shape on the surface. In order to tackle the search of a given pattern region, a heuristic has been developed, consisting in the definition of regular region which is an approximation of a geodesic disk. This circular shape allows for an exhaustive sampling and fast comparison, and any circular region can then be extended to the actual pattern to provide a similarity evaluation with the query binding site.The target prediction problem is formalized as a binary classification problem, where a set of macromolecules is being separated between those predicted to interact and the others, based on their local similarity with the known target. With this point of view, classic metrics can be used to assess performance, and compare our approach with others. Three datasets were used, two of which were extracted from the literature and the other one was designed specifically for our problem emphasizing the pharmacological relevance of the chosen molecules. Our algorithm proves to be more efficient than another state-of-the-art similarity based approach, and our analysis confirms that docking software are not relevant for our target prediction problem when a first target is known, according to our metric
APA, Harvard, Vancouver, ISO, and other styles
12

Maaß, Ulrike. "The narcissism in situations framework for the study of narcissism in social interactions." Doctoral thesis, Humboldt-Universität zu Berlin, Lebenswissenschaftliche Fakultät, 2016. http://dx.doi.org/10.18452/17603.

Full text
Abstract:
Die Dissertation präsentiert ein konzeptuelles Rahmenmodell zur Untersuchung von Narzissmus in sozialen Interaktionen. Es differenziert zwischen situations-invarianten (z.B. Narzissmus) und situations-variierenden Variablen (z.B. positives Feedback) zur Vorhersage narzisstischen Verhaltens. Es bildete die Grundlage für drei Studien entlang der Zeitlinie von sozialen Interaktionen (d.h., zu Beginn, im täglichen Verlauf, innerhalb von langjährigen Freundschaften). Studie 1 untersuchte, ob sich der Einfluss von Narzissmus in Situationen reduziert, die starke Hinweisreize für die Angemessenheit von Selbstdarstellung beinhalten, wie die Trait Activation Theory (Tett & Burnett, 2003) vermuten würde. Es wurde geschlussfolgert, dass der grandiose Kern von Narzissmus unempfindlich gegenüber dem Einfluss situations-variierender Variablen war (hinsichtlich der Reizstärke für Selbstdarstellung). Studie 2 erforschte Narzissmus innerhalb sozialer Interaktionen im Alltag mit Hilfe eines experience-sampling Designs in drei aufeinander aufbauenden Teilstudien. Im Gegensatz zu den Befunden aus Studie 1 zeigten die Ergebnisse der zweiten Studie, dass es einen starken situativen Einfluss auf die Expression von State Narzissmus gab - unabhängig vom individuellen Narzissmus-Niveau. Zum Beispiel erhöhten sowohl positives als auch negatives Feedback das State Narzissmus Level aufgrund von Selbsterhöhungs- oder Selbstschutzmechanismen. Die Ergebnisse stellen die Rolle von Trait Selbstwert auf State Narzissmus infrage, unterstreichen aber die Wichtigkeit von State Selbstwert. Studie 3 demonstrierte, dass mit einer zunehmenden distinktiven Ähnlichkeit (d.h., die Ähnlichkeit in den normabweichenden Aspekten der beiden Freunde) im Narzissmus zweier bester Freunde die distinktive Ähnlichkeit in deren Big Five Profilen ebenfalls ansteigt. Es werden Implikationen für situations-spezifische Aspekte von Narzissmus innerhalb von langjährigen Freundschaften diskutiert.
The present dissertation presents a conceptual framework for the study of narcissism in social interactions (NARCissism In Situations: NARCIS). This framework differentiates between situation-invariant variables (e.g., trait narcissism) and situation-varying variables (e.g., positive feedback) for the prediction of narcissistic behavior. It built the theoretical basis for three studies that were placed along the time line of social interactions (i.e., at the beginning, in the daily intercourse, and within long-term friendships). Study 1 examined whether the manifestation of individual differences in narcissism reduce in situations that include strong cues for the appropriateness of self-promotional behavior, as trait activation theory (Tett & Burnett, 2003) would expect. It was concluded that the grandiose core of narcissism was insensitive to the influence of situation-varying variables in terms of cue strength for self-promotion. Study 2 investigated narcissism within social interactions in everyday life following an experience-sampling design in three consecutive substudies. In contrast to the findings from the first study, results of Study 2 showed that there was a strong situational influence on the expression of state narcissism - regardless of the individual’s narcissism trait level. For example, both negative social feedback and positive feedback increased state narcissism levels due to ego protection or ego boosting mechanisms. The results question the role of trait self-esteem but underscore the importance of state self-esteem on state narcissism. Last but not least, Study 3 demonstrated that with increasing distinctive similarity (i.e., the similarity in the two friends’ norm-deviating parts) in narcissism of two best friends’ their distinctive similarities in their Big Five profiles augmented as well. Implications for situation-specific aspects of narcissism within long-term friendships are discussed.
APA, Harvard, Vancouver, ISO, and other styles
13

Matsumiya, Kentaro. "Destabilization of protein-based emulsions caused by bacteriostatic emulsifiers." Master's thesis, Kyoto University, 2014. http://hdl.handle.net/2433/188746.

Full text
Abstract:
Kyoto University (京都大学)
0048
新制・論文博士
博士(農学)
乙第12820号
論農博第2793号
新制||農||1025(附属図書館)
学位論文||H26||N4815(農学部図書室)
31307
京都大学農学研究科農学専攻
(主査)教授 松村 康生, 教授 裏出 令子, 教授 安達 修二
学位規則第4条第2項該当
APA, Harvard, Vancouver, ISO, and other styles
14

Voland, Alice. "Algorithmes pour la prédiction in silico d'interactions par similarité entre macromolécules biologiques." Electronic Thesis or Diss., Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLV014.

Full text
Abstract:
Un médicament, ou tout autre petite molécule biologique, agit sur l’organisme via des interactions chimiques qui se produisent avec d’autres macromolécules telles que les protéines qui régissent le fonctionnement des cellules. La détermination de l’ensemble des cibles, c’est à dire de l’ensemble des macromolécules susceptibles de lier une même molécule, est essentielle pour mieux comprendre les mécanismes moléculaires à l’origine des effets d’un médicament. Cette connaissance permettrait en effet de guider la conception d’un composé pour éviter au mieux les effets secondaires indésirables, ou au contraire découvrir de nouvelles applications à des molécules connues. Les avancées de la biologie structurale nous permettent maintenant d’avoir accès à un très grand nombre de structures tridimensionnelles de protéines impliquées dans ces interactions, ce qui motive l’utilisation d’outils in silico (informatique) pour complémenter ou guider les expériences in vitro ou in vivo plus longues et plus chères. La thèse s’inscrit dans le cadre d’une collaboration entre le laboratoire DAVID de l’Université de Versailles-Saint-Quentin, et l’entreprise Bionext SA qui propose une suite logicielle permettant de visualiser et d’étudier les interactions chimiques. Les travaux de recherches ont pour objectif de développer un algorithme permettant, à partir des données structurales des protéines, de déterminer des cibles potentielles pour un composé donné. L’approche choisie consiste à utiliser la connaissance d’une première interaction entre un composé et une protéine afin de rechercher par similarité d’autres protéines pour lesquelles on peut inférer la capacité à se lier avec le même composé. Il s’agit plus précisément de rechercher une similarité locale entre un motif donné, qui est la région permettant à la cible connue de lier le composé, et un ensemble de protéines candidates.Un algorithme a été développé, BioBind, qui utilise un modèle des surfaces des macromolécules issu de la théorie des formes alpha afin de modéliser la surface accessible ainsi qu’une topologie sur cette surface permettant la définition de régions en surface. Afin de traiter le problème de la recherche d’un motif en surface, une heuristique est utilisée consistant à définir des motifs réguliers qui sont une approximation de disques géodésiques et permettant un échantillonnage exhaustif à la surface des macromolécules. Ces régions circulaires sont alors étendues à l’ensemble du motif recherché afin de déterminer une mesure de similarité.Le problème de la prédiction de cibles est ramené à un problème de classification binaire, où il s’agit pour un ensemble de protéines données de déterminer lesquelles sont susceptibles d’interagir avec le composé considéré, par similarité avec la première cible connue. Cette formalisation permet d’étudier les performances de notre approche, ainsi que de la comparer avec d’autres approches sur différents jeux de données. Nous utilisons pour cela deux jeux de données issus de la littérature ainsi qu’un troisième développé spécifiquement pour cette problématique afin d’être plus représentatif des molécules pertinentes du point de vue pharmacologique, c’est-à-dire ayant des propriétés proches des médicaments. Notre approche se compare favorablement sur ces trois jeux de données par rapport à une autre approche de prédiction par similarité, et plus généralement notre analyse confirme que les approches par docking (amarrage) sont moins performantes que les approches par similarité pour le problème de la prédiction de cibles
The action of a drug, or another small biomolecule, is induced by chemical interactions with other macromolecules such as proteins regulating the cell functions. The determination of the set of targets, the macromolecules that could bind the same small molecule, is essential in order to understand molecular mechanisms responsible for the effects of a drug. Indeed, this knowledge could help the drug design process so as to avoid side effects or to find new applications for known drugs. The advances of structural biology provides us with three-dimensional representations of many proteins involved in these interactions, motivating the use of in silico tools to complement or guide further in vitro or in vivo experiments which are both more expansive and time consuming.This research is conducted as part of a collaboration between the DAVID laboratory of the Versailles-Saint-Quentin University, and Bionext SA which offers a software suite to visualize and analyze chemical interactions between biological molecules. The objective is to design an algorithm to predict these interactions for a given compound, using the structures of potential targets. More precisely, starting from a known interaction between a drug and a protein, a new interaction can be inferred with another sufficiently similar protein. This approach consists in the search of a given pattern, the known binding site, across a collection of macromolecules.An algorithm was implemented, BioBind, which rely on a topological representation of the surface of the macromolecules based on the alpha shapes theory. Our surface representation allows to define a concept of region of any shape on the surface. In order to tackle the search of a given pattern region, a heuristic has been developed, consisting in the definition of regular region which is an approximation of a geodesic disk. This circular shape allows for an exhaustive sampling and fast comparison, and any circular region can then be extended to the actual pattern to provide a similarity evaluation with the query binding site.The target prediction problem is formalized as a binary classification problem, where a set of macromolecules is being separated between those predicted to interact and the others, based on their local similarity with the known target. With this point of view, classic metrics can be used to assess performance, and compare our approach with others. Three datasets were used, two of which were extracted from the literature and the other one was designed specifically for our problem emphasizing the pharmacological relevance of the chosen molecules. Our algorithm proves to be more efficient than another state-of-the-art similarity based approach, and our analysis confirms that docking software are not relevant for our target prediction problem when a first target is known, according to our metric
APA, Harvard, Vancouver, ISO, and other styles
15

PINARDI, STEFANO. "Movements recognition with intelligent multisensor analysis." Doctoral thesis, Università degli Studi di Milano-Bicocca, 2011. http://hdl.handle.net/10281/19297.

Full text
Abstract:
In movement science with inertial sensor many different methodologies resolving specific aspects of movement recognition have been proposed. They are very interesting, and useful, but none of them are generally explicative of what is going on in the semantic sense. When we go down to the movement recognition/classification area (for example in Ambient Intelligence) we do not have a feasible model that can be considered generally predictive or usable for activity recognition. Also, in the field of movement recognition with inertial sensors many technological issues arise: technological diversity, calibration matters, sensor model problems, orientation and position of sensors, and a lot of numerous specificities that, with all the above aspects, and the lack of public dataset of movements sufficiently generic and semantically rich, contribute to create a strong barrier to any approach to a classification matters with wearable sensors. We have also to notice that a movement is a phenomenon explicitly or implicitly (voluntary or involuntary) controlled by brain. The individual free-will introduce a further matter when we want to temporary predict the movements looking at the close past. Pattern can change at any time when ambient, psychological context, age of the subject change. Also, pathological issues, and physiological differences and the will of the subject, introduce important differences. For all these reasons I considered that a semantical /lexical approach to movement recognition with sensors, driven by machine learning techniques could be a promising way to solve some of these challenge and problems. In this Ph.D. Thesis wearable inertial sensors has been used to classify movements, the choice of inertial sensors has been driven by technological and practical advantages, they are cheap, lightweight, and - differently from video cameras - are not prone to the hidden face, or luminance problems. The main idea is to use inertial sensor to understand what a person is doing for ambient-intelligent, healthcare, medical-sport applications. My principal concerns was to propose a method that was not centered on technology issues but on data analysis, that could be a general framework and could also create a general representation of movement,that could be useful also in other area of research, like reasoning. Inertial sensors are treated just as an example, a particular type of sensors, the method is new, reusable, algorithmically simple, net and easy to understand. Accuracy is very high outperforming the best results given in literature, reducing the error rate of 4 times.
APA, Harvard, Vancouver, ISO, and other styles
16

Carlucci, Marcos Bergmann. "Padrões funcionais de organização de árvores juvenis em manchas florestais na serra do sudeste do Rio Grande do Sul." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2011. http://hdl.handle.net/10183/30192.

Full text
Abstract:
Uma das mais relevantes perspectivas que buscam explicar como as comunidades ecológicas se organizam é a teoria do nicho, que se divide em duas linhas de pesquisa com filosofias opostas. A primeira enfatiza que diferenças nas características funcionais de organismos permitem sua coexistência, enquanto que a segunda avalia até que ponto membros de uma mesma comunidade tendem a exibir similaridade em seus atributos funcionais. Uma variedade de métodos analíticos tem sido desenvolvida para avaliar mecanismos ligados a cada um dos processos. Explorando o padrão de distribuição de atributos de comunidades, a limitação de similaridade resulta em divergência de atributos, enquanto a ação local de filtros ambientais em geral produz convergência de atributos. Nesse sentido, o método para discriminação de padrões de organização por convergência ou por divergência de atributos no contexto de metacomunidades é de grande valor. Nesta dissertação, tal abordagem é utilizada para a avaliação de padrões de convergência e de divergência de atributos de plantas arbóreas juvenis em manchas florestais. Não incluímos informação filogenética ou de espécies a fim de avaliarmos até que ponto uma abordagem plenamente funcional pode explicar padrões de comunidades. O trabalho foi desenvolvido na Serra do Sudeste do RS, que consiste em um mosaico campo-floresta relativamente bem conservado. Algo instigante na Serra do Sudeste é a presença das coníferas Araucaria angustifolia (Bertol.) Kuntze e Podocarpus lambertii Klotzsch ex Endl. em várias manchas florestais, espécies reconhecidas como características da Floresta com Araucária do Planalto Sul-Brasileiro. Tal ocorrência vem sendo discutida há muitas décadas na literatura, mas nenhum estudo ecológico feito nessas áreas foi publicado ainda. Assim, nesta dissertação, tive como objetivos avançar na teoria relacionada à organização de comunidades e obter dados de qualidade para a avaliação continuada da dinâmica ecológica por trás dos mosaicos campo-floresta com presença de A. angustifolia na Serra do Sudeste. Os resultados encontrados revelaram padrões tanto de convergência quanto de divergência de atributos. A abordagem inteiramente funcional utilizada neste trabalho foi muito útil para a inferência de prováveis mecanismos de nicho envolvidos na organização das comunidades de árvores juvenis. Nós defendemos que a análise de dados de atributos referentes ao nível de indivíduos em um contexto de metacomunidades é a melhor maneira de explorar diretamente como a convergência e a divergência de atributos realmente se comporta ao longo de um dado gradiente. Com relação ao limite austral da distribuição de Araucaria angustifolia, caso as áreas da Serra do Sudeste sejam consideradas nativas, haveria uma ocorrência disjunta da espécie e, talvez, do tipo vegetacional Floresta com Araucária. Esse tema é especialmente importante no que concerne a uma possível migração da espécie ou mesmo da flora típica da formação rumo ao sul, ou alternativamente a uma possível evidência remanescente de que a espécie ou mesmo de que a formação tenham ocorrido continuamente até essas latitudes, talvez há centenas de milhares de anos atrás. A resolução desse mistério, entretanto, provavelmente só seja alcançada através de estudos paleopolínicos e genéticos. De qualquer forma, tais áreas devem ser protegidas, já que seu desconhecimento por grande parte da comunidade científica facilita a negligência de sua conservação.
Ecologists have considered niche theory one of the most relevant perspectives attempting to explain ecological community assembly. It is divided in two research programs with opposed philosophies. The first emphasises that differences in functional attributes of organisms enable their coexistence, whereas the second evaluate to which extent members of a same community tend to exhibit similarity regarding their functional traits. A variety of analytical methods have been developed for assessing mechanisms related to each of these processes. By exploring the trait distribution pattern in communities, it is generally accepted that the local action of environmental filters generates a pattern of trait convergence, whereas limiting similarity leads to trait divergence. In this sense, the method for discriminating traitconvergence and trait-divergence assembly patterns in the metacommunity context is of great value. In this dissertation, such approach is used for evaluating convergence and divergence patterns of tree sapling traits in forest patches in the Serra do Sudeste region of Rio Grande do Sul state, southern Brazil. We did not include phylogenetic or species identity information in the analysis since we wanted to evaluate to which extent an entirely functional approach could explain community patterns. The study was carried out in Serra do Sudeste, which consists of a forest-grassland mosaic relatively well conserved. Something puzzling in Serra do Sudeste is the presence of conifers such as Araucaria angustifolia (Bertol.) Kuntze and Podocarpus lambertii Klotzsch ex Endl. in several forest patches. These species are characteristic of the Araucaria forest occurring in the South-Brazilian Plateau. Such occurrence has been matter of a long-lasting debate in the regional literature, but no ecological study done in these areas has been published yet. In this dissertation I aimed at advancing on the theoretical bases of community assembly and at gathering data for continuously evaluating the ecological dynamics of the forest-grassland mosaics with presence of A. angustifolia in Serra do Sudeste. The results revealed both trait convergence and divergence patterns, which indicated mechanisms for the assembly of tree sapling communities. The entirely functional approach applied here was very useful to infer probable mechanisms underlying community assembly. We argue that the use of individual-based trait information in a metacommunity context is the best way to directly explore how trait convergence and trait divergence behave along a given gradient. With regard to the austral boundary of Araucaria angustifolia distribution, if the patches of Serra do Sudeste are considered native, there would be a disjunct occurrence of the species and perhaps of the vegetational type Araucaria forest. This issue is especially important regarding a possible migration of the species or even of the typical associated flora southwards, or alternatively, regarding a possible relict evidence that the species had continuously occurred along such latitudes in a remote past. Nonetheless, the resolution of this puzzle probably only will be achieved through genetic and paleopollen studies. Anyway, such areas must be protected as their omission in important scientific studies facilitates the negligence of their conservation.
APA, Harvard, Vancouver, ISO, and other styles
17

Saeednia, Shahrokh. "Zero Useful Knowledge Interactive Proofs of Similarity." Doctoral thesis, Universite Libre de Bruxelles, 1995. http://hdl.handle.net/2013/ULB-DIPOT:oai:dipot.ulb.ac.be:2013/212539.

Full text
APA, Harvard, Vancouver, ISO, and other styles
18

Alfraidi, Hanadi Humoud A. "Interactive System for Scientific Publication Visualization and Similarity Measurement based on Citation Network." Thesis, Université d'Ottawa / University of Ottawa, 2015. http://hdl.handle.net/10393/33135.

Full text
Abstract:
Online scientific publications are becoming more and more popular. The number of publications we can access almost instantaneously is rapidly increasing. This makes it more challenging for researchers to pursue a topic, review literature, track research history or follow research trends. Using online resources such as search engines and digital libraries is helpful to find scientific publications, however most of the time the user ends up with an overwhelming amount of linear results to go through. This thesis proposes an alternative system, which takes advantage of citation/reference relations between publications. This demonstrates better insight of the hierarchy distribution of publications around a given topic. We also utilize information visualization techniques to represent the publications as a network. Our system is designed to automatically retrieve publications from Google Scholar and visualize them as a 2-dimensional graph representation using the citation relations. In this, the nodes represent the documents while the links represent the citation/reference relations between them. Our visualization system provides a better view of publications, making it easier to identify the research flow, connect publications, and assess similarities/differences between them. It is an interactive web based system, which allows the users to get more information about any selected publication and calculate a similarity score between two selected publications. Traditionally, similar documents are found using Natural Language Processing (NLP), which compares documents based on matching their contents. In the proposed method, similar documents are found using the citation/reference relations which are iii represented by the relationship that was originally inputted by the authors. We propose a new path based metric for measuring the similarity scores between any pair of publications. This is based on both the number of paths and the length of each path. More paths and shorter lengths increase the similarity score. We compare our similarity score results with another similarity score from Scurtu’s Document Similarity [1] that uses the NLP method. We then use the average of the similarity scores collected from 15 users as a ground truth to validate the efficiency of our method. The results indicate that our Citation Network approach yielded better scores than Scurtu’s approach.
APA, Harvard, Vancouver, ISO, and other styles
19

Chiesa, Luca. "Development of artificial intelligence methods to help the design of new ligands of G-protein coupled receptors." Electronic Thesis or Diss., Strasbourg, 2024. http://www.theses.fr/2024STRAF020.

Full text
Abstract:
Les récepteurs couplés aux protéines G représentent l'une des familles de protéines les plus importantes pour la découverte de médicaments. Les techniques de conception de médicaments assistée par ordinateur ont été largement appliquées pour cibler les membres de cette famille, conduisant à la découverte de multiples molécules bioactives. Cette thèse décrit le développement, le test et l'application de différents outils informatiques et d'apprentissage automatique pour aider à la découverte de nouveaux composés présentant un profil pharmacologique souhaité. Divers aspects du processus de découverte de médicaments in silico ont été abordés dans ce travail, depuis la modélisation d'une protéine cible jusqu'à l'évaluation systématique des molécules identifiées par criblage virtuel
G-protein coupled receptor represent one of the most important protein families for drug discovery. Computer aided drug design techniques have been extensively applied to target members of this family, leading to the discovery of multiple bioactive molecules. This thesis describes the development, testing, and application of different computational and machine learning tools to assist in the discovery of new compounds with a desired pharmacological profile. Different aspects of the in silico drug discovery pipeline were covered in this work, from the modelling of a target protein, to the systematic evaluation of molecules identified by virtual screening
APA, Harvard, Vancouver, ISO, and other styles
20

Helgadóttir, Hanna Sigrún. "Using semantic similarity measures across Gene Ontology to predict protein-protein interactions." Thesis, University of Skövde, School of Humanities and Informatics, 2005. http://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-971.

Full text
Abstract:

Living cells are controlled by proteins and genes that interact through complex molecular pathways to achieve a specific function. Therefore, determination of protein-protein interaction is fundamental for the understanding of the cell’s lifecycle and functions. The function of a protein is also largely determined by its interactions with other proteins. The amount of protein-protein interaction data available has multiplied by the emergence of large-scale technologies for detecting them, but the drawback of such measures is the relatively high amount of noise present in the data. It is time consuming to experimentally determine protein-protein interactions and therefore the aim of this project is to create a computational method that predicts interactions with high sensitivity and specificity. Semantic similarity measures were applied across the Gene Ontology terms assigned to proteins in S. cerevisiae to predict protein-protein interactions. Three semantic similarity measures were tested to see which one performs best in predicting such interactions. Based on the results, a method that predicts function of proteins in connection with connectivity was devised. The results show that semantic similarity is a useful measure for predicting protein-protein interactions.

APA, Harvard, Vancouver, ISO, and other styles
21

Garutti, Claudio. "Prediction of Protein-Ligand and Protein-Protein Interactions based on Local Surface Similarity." Doctoral thesis, Università degli studi di Padova, 2009. http://hdl.handle.net/11577/3426155.

Full text
Abstract:
The three-dimensional structure of a protein determines its function. This thesis describes a suite of methods for the problem of protein binding site recognition, based on a spin-images representation of the molecular surface. A procedure for cavity detection is coupled with a procedure for the recog- nition of similar regions in two proteins, and applied to the comparison of two protein's cavities, the all-to-all pairwise comparison of a set of cavities, and the recognition of multiple binding sites in one cavity. All the presented methods can be used to screen large collections of proteins.
La struttura tridimensionale di una proteina determina la sua funzione. Questa tesi descrive una suite di metodi per il problema del riconoscimento di siti di legame di proteine, basati su una rappresentazione a spin-images della supercie molecolare. Una procedura per l'identicazione di cavita' integrata con una procedura per il riconoscimento di regioni simili in due proteine, e applicata al confronto delle cavita' di due proteine, il confronto all-to-all pairwise di un insieme di cavita', e il riconoscimento di siti di legame multipli in una cavita'. I metodi presentato possono essere usati per analizzare vaste collezioni di proteine.
APA, Harvard, Vancouver, ISO, and other styles
22

Wendt, Kyle Andrew. "Advances in the Application of the Similarity Renormalization Group to Strongly Interacting Systems." The Ohio State University, 2013. http://rave.ohiolink.edu/etdc/view?acc_num=osu1375205117.

Full text
APA, Harvard, Vancouver, ISO, and other styles
23

Fangerau, Jens [Verfasser], and Heike [Akademischer Betreuer] Leitte. "Interactive Similarity Analysis for 3D+t Cell Trajectory Data / Jens Fangerau ; Betreuer: Heike Leitte." Heidelberg : Universitätsbibliothek Heidelberg, 2015. http://d-nb.info/1180301900/34.

Full text
APA, Harvard, Vancouver, ISO, and other styles
24

Watson, Paul. "Calculating the knowledge-based similarity and complementarity of functional groups based on their non-bonded interactions." Thesis, University of Sheffield, 2001. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.392463.

Full text
APA, Harvard, Vancouver, ISO, and other styles
25

Yella, Jaswanth. "Machine Learning-based Prediction and Characterization of Drug-drug Interactions." University of Cincinnati / OhioLINK, 2018. http://rave.ohiolink.edu/etdc/view?acc_num=ucin154399419112613.

Full text
APA, Harvard, Vancouver, ISO, and other styles
26

Matthews, Chad Robert. "Host Bacterial Interactions During Early Plaque Formation in Current and Never Smokers." The Ohio State University, 2010. http://rave.ohiolink.edu/etdc/view?acc_num=osu1274112198.

Full text
APA, Harvard, Vancouver, ISO, and other styles
27

Alborzi, Seyed Ziaeddin. "Automatic Discovery of Hidden Associations Using Vector Similarity : Application to Biological Annotation Prediction." Thesis, Université de Lorraine, 2018. http://www.theses.fr/2018LORR0035/document.

Full text
Abstract:
Cette thèse présente: 1) le développement d'une nouvelle approche pour trouver des associations directes entre des paires d'éléments liés indirectement à travers diverses caractéristiques communes, 2) l'utilisation de cette approche pour associer directement des fonctions biologiques aux domaines protéiques (ECDomainMiner et GODomainMiner) et pour découvrir des interactions domaine-domaine, et enfin 3) l'extension de cette approche pour annoter de manière complète à partir des domaines les structures et les séquences des protéines. Au total, 20 728 et 20 318 associations EC-Pfam et GO-Pfam non redondantes ont été découvertes, avec des F-mesures de plus de 0,95 par rapport à un ensemble de référence Gold Standard extrait d'une source d'associations connues (InterPro). Par rapport à environ 1500 associations déterminées manuellement dans InterPro, ECDomainMiner et GODomainMiner produisent une augmentation de 13 fois le nombre d'associations EC-Pfam et GO-Pfam disponibles. Ces associations domaine-fonction sont ensuite utilisées pour annoter des milliers de structures de protéines et des millions de séquences de protéines pour lesquelles leur composition de domaine est connue mais qui manquent actuellement d'annotations fonctionnelles. En utilisant des associations de domaines ayant acquis des annotations fonctionnelles inférées, et en tenant compte des informations de taxonomie, des milliers de règles d'annotation ont été générées automatiquement. Ensuite, ces règles ont été utilisées pour annoter des séquences de protéines dans la base de données TrEMBL
This thesis presents: 1) the development of a novel approach to find direct associations between pairs of elements linked indirectly through various common features, 2) the use of this approach to directly associate biological functions to protein domains (ECDomainMiner and GODomainMiner), and to discover domain-domain interactions, and finally 3) the extension of this approach to comprehensively annotate protein structures and sequences. ECDomainMiner and GODomainMiner are two applications to discover new associations between EC Numbers and GO terms to protein domains, respectively. They find a total of 20,728 and 20,318 non-redundant EC-Pfam and GO-Pfam associations, respectively, with F-measures of more than 0.95 with respect to a “Gold Standard” test set extracted from InterPro. Compared to around 1500 manually curated associations in InterPro, ECDomainMiner and GODomainMiner infer a 13-fold increase in the number of available EC-Pfam and GO-Pfam associations. These function-domain associations are then used to annotate thousands of protein structures and millions of protein sequences for which their domain composition is known but that currently lack experimental functional annotations. Using inferred function-domain associations and considering taxonomy information, thousands of annotation rules have automatically been generated. Then, these rules have been utilized to annotate millions of protein sequences in the TrEMBL database
APA, Harvard, Vancouver, ISO, and other styles
28

Michaud, Dorian. "Indexation bio-inspirée pour la recherche d'images par similarité." Thesis, Poitiers, 2018. http://www.theses.fr/2018POIT2288/document.

Full text
Abstract:
La recherche d'images basée sur le contenu visuel est un domaine très actif de la vision par ordinateur, car le nombre de bases d'images disponibles ne cesse d'augmenter.L’objectif de ce type d’approche est de retourner les images les plus proches d'une requête donnée en terme de contenu visuel.Notre travail s'inscrit dans un contexte applicatif spécifique qui consiste à indexer des petites bases d'images expertes sur lesquelles nous n'avons aucune connaissance a priori.L’une de nos contributions pour palier ce problème consiste à choisir un ensemble de descripteurs visuels et de les placer en compétition directe. Nous utilisons deux stratégies pour combiner ces caractéristiques : la première, est pyschovisuelle, et la seconde, est statistique.Dans ce contexte, nous proposons une approche adaptative non supervisée, basée sur les sacs de mots et phrases visuels, dont le principe est de sélectionner les caractéristiques pertinentes pour chaque point d'intérêt dans le but de renforcer la représentation de l'image.Les tests effectués montrent l'intérêt d'utiliser ce type de méthodes malgré la domination des méthodes basées réseaux de neurones convolutifs dans la littérature.Nous proposons également une étude, ainsi que les résultats de nos premiers tests concernant le renforcement de la recherche en utilisant des méthodes semi-interactives basées sur l’expertise de l'utilisateur
Image Retrieval is still a very active field of image processing as the number of available image datasets continuously increases.One of the principal objectives of Content-Based Image Retrieval (CBIR) is to return the most similar images to a given query with respect to their visual content.Our work fits in a very specific application context: indexing small expert image datasets, with no prior knowledge on the images. Because of the image complexity, one of our contributions is the choice of effective descriptors from literature placed in direct competition.Two strategies are used to combine features: a psycho-visual one and a statistical one.In this context, we propose an unsupervised and adaptive framework based on the well-known bags of visual words and phrases models that select relevant visual descriptors for each keypoint to construct a more discriminative image representation.Experiments show the interest of using this this type of methodologies during a time when convolutional neural networks are ubiquitous.We also propose a study about semi interactive retrieval to improve the accuracy of CBIR systems by using the knowledge of the expert users
APA, Harvard, Vancouver, ISO, and other styles
29

Smith, Morgan M. Mr. "The Role of Wave Self-Similarity in Nearshore Wave Spectra." UNF Digital Commons, 2018. https://digitalcommons.unf.edu/etd/787.

Full text
Abstract:
Nonlinear wave-wave interactions and wave breaking contribute to nearshore wave energy dissipation. These factors can be analyzed by the principles of wave self-similarity. The equilibrium range can be shown in wind-driven wave spectra that exist in the form ( ) and However, the appropriate methods used to determine this loss of energy are controversial. This study examines an approach that reinvestigates the self-similarity principles. Wave spectra with lower peak periods are dominated by nonlinear wave-wave interactions which produce a scaling in shallow water. This thesis investigates the relative role of spectral similarity in different conditions in the nearshore region of the U.S. Army Corps of Engineers Field Research Facility in Duck, North Carolina. The results show young sea waves (wave spectra in which the propagation speed of waves at the spectral peak is much smaller than the wind speed) are dominated by nonlinear wave-wave interactions in the nearshore while older waves (wave spectra in which the propagation speed of waves at the spectral peak is equal to or greater than the wind speed) are dominated by wave breaking in deep water. Furthermore, nearshore wave models need to incorporate the self-similarity concept in deep and shallow water to better understand and quantify important aspects of wave physics in shallow water.
APA, Harvard, Vancouver, ISO, and other styles
30

Alborzi, Seyed Ziaeddin. "Automatic Discovery of Hidden Associations Using Vector Similarity : Application to Biological Annotation Prediction." Electronic Thesis or Diss., Université de Lorraine, 2018. http://www.theses.fr/2018LORR0035.

Full text
Abstract:
Cette thèse présente: 1) le développement d'une nouvelle approche pour trouver des associations directes entre des paires d'éléments liés indirectement à travers diverses caractéristiques communes, 2) l'utilisation de cette approche pour associer directement des fonctions biologiques aux domaines protéiques (ECDomainMiner et GODomainMiner) et pour découvrir des interactions domaine-domaine, et enfin 3) l'extension de cette approche pour annoter de manière complète à partir des domaines les structures et les séquences des protéines. Au total, 20 728 et 20 318 associations EC-Pfam et GO-Pfam non redondantes ont été découvertes, avec des F-mesures de plus de 0,95 par rapport à un ensemble de référence Gold Standard extrait d'une source d'associations connues (InterPro). Par rapport à environ 1500 associations déterminées manuellement dans InterPro, ECDomainMiner et GODomainMiner produisent une augmentation de 13 fois le nombre d'associations EC-Pfam et GO-Pfam disponibles. Ces associations domaine-fonction sont ensuite utilisées pour annoter des milliers de structures de protéines et des millions de séquences de protéines pour lesquelles leur composition de domaine est connue mais qui manquent actuellement d'annotations fonctionnelles. En utilisant des associations de domaines ayant acquis des annotations fonctionnelles inférées, et en tenant compte des informations de taxonomie, des milliers de règles d'annotation ont été générées automatiquement. Ensuite, ces règles ont été utilisées pour annoter des séquences de protéines dans la base de données TrEMBL
This thesis presents: 1) the development of a novel approach to find direct associations between pairs of elements linked indirectly through various common features, 2) the use of this approach to directly associate biological functions to protein domains (ECDomainMiner and GODomainMiner), and to discover domain-domain interactions, and finally 3) the extension of this approach to comprehensively annotate protein structures and sequences. ECDomainMiner and GODomainMiner are two applications to discover new associations between EC Numbers and GO terms to protein domains, respectively. They find a total of 20,728 and 20,318 non-redundant EC-Pfam and GO-Pfam associations, respectively, with F-measures of more than 0.95 with respect to a “Gold Standard” test set extracted from InterPro. Compared to around 1500 manually curated associations in InterPro, ECDomainMiner and GODomainMiner infer a 13-fold increase in the number of available EC-Pfam and GO-Pfam associations. These function-domain associations are then used to annotate thousands of protein structures and millions of protein sequences for which their domain composition is known but that currently lack experimental functional annotations. Using inferred function-domain associations and considering taxonomy information, thousands of annotation rules have automatically been generated. Then, these rules have been utilized to annotate millions of protein sequences in the TrEMBL database
APA, Harvard, Vancouver, ISO, and other styles
31

Saikia, Himangshu. "Comparison and Tracking Methods for Interactive Visualization of Topological Structures in Scalar Fields." Doctoral thesis, KTH, Beräkningsvetenskap och beräkningsteknik (CST), 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-216375.

Full text
Abstract:
Scalar fields occur quite commonly in several application areas in both static and time-dependent forms. Hence a proper visualization of scalar fieldsneeds to be equipped with tools to extract and focus on important features of the data. Similarity detection and pattern search techniques in scalar fields present a useful way of visualizing important features in the data. This is done by isolating these features and visualizing them independently or show all similar patterns that arise from a given search pattern. Topological features are ideal for this purpose of isolating meaningful patterns in the data set and creating intuitive feature descriptors. The Merge Tree is one such topological feature which has characteristics ideally suited for this purpose. Subtrees of merge trees segment the data into hierarchical regions which are topologically defined. This kind of feature-based segmentation is more intelligent than pure data based segmentations involving windows or bounding volumes. In this thesis, we explore several different techniques using subtrees of merge trees as features in scalar field data. Firstly, we begin with a discussion on static scalar fields and devise techniques to compare features - topologically segmented regions given by the subtrees of the merge tree - against each other. Second, we delve into time-dependent scalar fields and extend the idea of feature comparison to spatio-temporal features. In this process, we also come up with a novel approach to track features in time-dependent data considering the entire global network of likely feature associations between consecutive time steps.The highlight of this thesis is the interactivity that is enabled using these feature-based techniques by the real-time computation speed of our algorithms. Our techniques are implemented in an open-source visualization framework Inviwo and are published in several peer-reviewed conferences and journals.

QC 20171020

APA, Harvard, Vancouver, ISO, and other styles
32

Kouomou-Choupo, Anicet. "Améliorer la recherche par similarité dans une grande base d'images fixes par des techniques de fouilles de données." Phd thesis, Université Rennes 1, 2006. http://tel.archives-ouvertes.fr/tel-00524418.

Full text
Abstract:
Les images fixes peuvent, entre autres, être décrites au niveau du pixel par des descripteurs visuels globaux de couleur, de texture ou de forme. La recherche par le contenu exploite et combine alors ces descripteurs dont le coût de calcul est d'autant plus important que la taille de la base d'images est grande. Les résultats de la recherche sont ensuite classés en fonction de leur similarité à la requête soumise et présentés à l'utilisateur sous forme de liste ordonnée. Un sous-ensemble de descripteurs pourrait cependant suffire à répondre à une recherche par similarité beaucoup plus rapidement, tout en gardant une qualité acceptable des résultats de recherche. Nous proposons pour cela une méthode de sélection automatique des descripteurs visuels qui exploite les règles d'association pour élaborer des stratégies d'exécution réduisant le temps de la recherche par le contenu dans de grandes bases d'images fixes. Dans cette thèse, nous présentons également comment une recherche par le contenu peut être adaptée pour proposer des résultats intermédiaires qui sont fusionnés de façon progressive avec l'avantage pour l'utilisateur, d'une part, de ne pas attendre que toute la base ait été parcourue avant de fournir un résultat et, d'autre part, de lui permettre de stopper la requête en cours d'exécution. Les expérimentations conduites sur des bases d'images réelles montrent que notre méthode améliore notablement les temps de réponse. Elles confirment aussi l'intérêt de la combinaison des descripteurs globaux pour la recherche d'images par le contenu.
APA, Harvard, Vancouver, ISO, and other styles
33

Guardiola, Mathilde. "Convergence en conversation : La similarité linguistique comme indice d'alignement et d'affiliation." Thesis, Aix-Marseille, 2014. http://www.theses.fr/2014AIXM3067.

Full text
Abstract:
Cette thèse questionne les manifestations de la convergence (i.e. le rapprochement entre les productions des participants) au niveau interactionnel. Pour cela, les termes d'alignement (défini en rapport avec l'activité en cours) et d'affiliation (l'expression d'un même stance par les participants) sont empruntés à l'Analyse Conversationnelle. Le corpus utilisé est le CID-Corpus of Interational Data, corpus de conversation (interaction non-contrainte, hautement coopérative et globalement symétrique).Nous interrogeons le lien entre la convergence et la similarité lexicale, grâce à l'analyse d'une collection de 300 hétéro-répétitions (recueillie grâce à un outil d'aide au repérage des répétitions). Nous proposons ensuite une analyse quantitative de l'évolution des réponses des auditeurs, puis une analyse qualitative de discours rapportés directs, phénomènes susceptibles de faire émerger de l'affiliation. Nous montrons que les hétéro-répétitions lexicales et les discours rapportés « en écho » (discours rapportés produits par l'auditeur de la narration) peuvent être utilisés (entre autres) pour exprimer l'alignement et l'affiliation, ce qui, en cas de ratification, crée les conditions propices à l'émergence d'un moment de convergence interactionnelle. Nous montrons également que ces mêmes phénomènes peuvent servir à créer le désalignement temporaire nécessaire à l'engagement dans une séquence oblique convergente. Ainsi, ce travail décrit l'établissement et le fonctionnement de séquences convergentes, à travers l'étude de phénomènes interactionnels méconnus
This thesis investigates the manifestations of convergence (i.e. the rapprochement between the participants' productions) at the level of interaction. With this aim, the terms of alignment (defined in relation to the current activity) and affiliation (display of the same stance by both participants) are borrowed from Conversation Analysis. The conversational corpus (non-constrained, highly cooperative and globally symmetrical interaction) used is the CID-Corpus of Interactional Data. Firstly, the link between convergence and lexical similarity is investigated thanks to the analysis of a collection of 300 other-repetitions (collected using a tool to assist in the detection of OR). Secondly, storytelling is studied and a quantitative analysis of the evolution of listeners' responses is proposed together with a qualitative analysis of direct reported speech phenomena, which are likely to make affiliation emerge. These analyses show that lexical other-repetitions and "echo" reported speech (reported speech which is produced by the listener of the narrative) can be used by participants to, inter alia, express alignment and affiliation, which, in case of ratification, creates the adequate conditions for the emergence of interactional convergence. The same phenomena can be used to create the temporary disalignment necessary to engage in an oblique (and potentially convergent) sequence. This work then describes the establishment and the conduct of convergent sequences through the analysis of interactional phenomena
APA, Harvard, Vancouver, ISO, and other styles
34

Le, Capitaine Hoel. "Opérateurs d'agrégation pour la mesure de similarité. Application à l'ambiguïté en reconnaissance de formes." Phd thesis, Université de La Rochelle, 2009. http://tel.archives-ouvertes.fr/tel-00438516.

Full text
Abstract:
Dans cette thèse, nous nous intéressons à deux problèmes de reconnaissance de formes : l'option de rejet en classification supervisée, et la détermination du nombre de classes en classification non supervisée. Le premier problème consiste à déterminer les zones de l'espace des attributs où les observations n'appartiennent pas clairement à une seule classe. Le second problème repose sur l'analyse d'un nuage d'observations pour lesquelles on ne connait pas les classes d'appartenance. L'objectif est de dégager des structures permettant de distinguer les différentes classes, et en particulier de trouver leur nombre. Pour résoudre ces problèmes, nous fondons nos propositions sur des opérateurs d'agrégation, en particulier des normes triangulaires. Nous définissons de nouvelles mesures de similarité permettant la caractérisation de situations variées. En particulier, nous proposons de nouveaux types de mesures de similarité : la similarité d'ordre, la similarité par blocs, et enfin la similarité par une approche logique. Ces différentes mesures de similarité sont ensuite appliquées aux problèmes évoqués précédemment. Le caractère générique des mesures proposées permet de retrouver de nombreuses propositions de la littérature, ainsi qu'une grande souplesse d'utilisation en pratique. Des résultats expérimentaux sur des jeux de données standard des domaines considérés viennent valider notre approche.
APA, Harvard, Vancouver, ISO, and other styles
35

Yang, Mingqiang. "Extraction d'attributs et mesures de similarité basées sur la forme." Phd thesis, INSA de Rennes, 2008. http://tel.archives-ouvertes.fr/tel-00335083.

Full text
Abstract:
Dans le contexte de la reconnaissance de forme et de l'observation de similarité d'un objet parmi d'autres, les caractéristiques de forme extraites de son image sont des outils puissants. En effet la forme de l'objet est habituellement et fortement liée à sa fonctionnalité et son identité. S'appuyant sur cette forme, un éventail de méthodes par extraction de caractéristiques et mesures de similarité a été proposé dans la littérature. De nombreuses et diverses applications sont susceptibles d'utiliser ces caractéristiques de forme. L'invariance géométrique et la résistance aux déformations sont des propriétés importantes que doivent posséder ces caractéristiques et mesures de similarité. Dans cette thèse, trois nouveaux descripteurs de forme sont développés. Les deux premiers, celui par différence de surfaces et contrôlée par l'échelle (SCAD) et celui correspondant au vecteur de surfaces partielles normalisées (NPAV), sont fondés sur une normalisation "iso-surface" (IAN). SCAD est un vecteur dont les éléments sont les différences de surface entre les principaux segments du contour original et contour filtré. Ces segments sont définis par des ensembles de points entre chaque paire de points de courbure nulle, relative au contour filtré et au contour original. En nous appuyant sur deux théorèmes que nous proposons et en prenant en considération surface partielle, transformée affine et filtrage linéaire, nous avons défini le second descripteur, NPAV. Nous prouvons alors, que pour tout contour filtré linéairement, la surface d'un triangle, dont les sommets sont le barycentre du contour et une paire de points successifs sur le contour normalisé, reste linéaire sous toutes les transformations affines. Ainsi est établie une relation entre filtrage et transformation affine. Les deux descripteurs SCAD et NPAV ont la propriété d'invariance aux transformations affines. Comparant les deux approches SCAD et NPAV, SCAD s'avère plus compact que NPAV mais les performances de NPAV sont meilleures que celles de SCAD. La dernière approche proposée est la représentation par "contexte des cordes". Cette représentation décrit une distribution des longueurs de cordes selon une orientation. L'histogramme représentant ce contexte des cordes est compacté et normalisé dans une matrice caractéristique. Une mesure de similarité est alors définie sur cette matrice. La méthode proposée est insensible à la translation, à la rotation et au changement d'échelle; de plus, elle s'avère robuste aux faibles occultations, aux déformations élastiques et au bruit. En outre, son évaluation sur des objets réels souligne tous ses atouts dans le contexte des applications de la vision. Ces nouveaux descripteurs de forme proposés sont issus d'une recherche et d'études menées sur une quarantaine de techniques de la littérature. Contrairement à la classification traditionnelle, ici, les approches de descripteurs de forme sont classées selon leurs approches de traitement: ceci facilite ainsi le choix du traitement approprié. Une description et une étude de ces approches est ici fournie, et nous reprenons certaines d'entre elles dans une évaluation comparative avec les nôtres et ce sur différentes bases de données
APA, Harvard, Vancouver, ISO, and other styles
36

Garma, L. D. (Leonardo D. ). "Structural bioinformatics tools for the comparison and classification of protein interactions." Doctoral thesis, Oulun yliopisto, 2017. http://urn.fi/urn:isbn:9789526216065.

Full text
Abstract:
Abstract Most proteins carry out their functions through interactions with other molecules. Thus, proteins taking part in similar interactions are likely to carry out related functions. One way to determine whether two proteins do take part in similar interactions is by quantifying the likeness of their structures. This work focuses on the development of methods for the comparison of protein-protein and protein-ligand interactions, as well as their application to structure-based classification schemes. A method based on the MultiMer-align (or MM-align) program was developed and used to compare all known dimeric protein complexes. The results of the comparison demonstrates that the method improves over MM-align in a significant number of cases. The data was employed to classify the complexes, resulting in 1,761 different protein-protein interaction types. Through a statistical model, the number of existing protein-protein interaction types in nature was estimated at around 4,000. The model allowed the establishment of a relationship between the number of quaternary families (sequence-based groups of protein-protein complexes) and quaternary folds (structure-based groups). The interactions between proteins and small organic ligands were studied using sequence-independent methodologies. A new method was introduced to test three similarity metrics. The best of these metrics was subsequently employed, together with five other existing methodologies, to conduct an all-to-all comparison of all the known protein-FAD (Flavin-Adenine Dinucleotide) complexes. The results demonstrates that the new methodology captures the best the similarities between complexes in terms of protein-ligand contacts. Based on the all-to-all comparison, the protein-FAD complexes were subsequently separated into 237 groups. In the majority of cases, the classification divided the complexes according to their annotated function. Using a graph-based description of the FAD-binding sites, each group could be further characterized and uniquely described. The study demonstrates that the newly developed methods are superior to the existing ones. The results indicate that both the known protein-protein and the protein-FAD interactions can be classified into a reduced number of types and that in general terms these classifications are consistent with the proteins' functions
Tiivistelmä Suurin osa proteiinien toiminnasta tapahtuu vuorovaikutuksessa muiden molekyylien kanssa. Proteiinit, jotka osallistuvat samanlaisiin vuorovaikutuksiin todennäköisesti toimivat samalla tavalla. Kahden proteiinin todennäköisyys esiintyä samanlaisissa vuorovaikutustilanteissa voidaan määrittää tutkimalla niiden rakenteellista samankaltaisuutta. Tämä väitöskirjatyö käsittelee proteiini-proteiini- ja proteiini-ligandi -vuorovaikutusten vertailuun käytettyjen menetelmien kehitystä, ja niiden soveltamista rakenteeseen perustuvissa luokittelujärjestelmissä. Tunnettuja dimeerisiä proteiinikomplekseja tutkittiin uudella MultiMer-align-ohjelmaan (MM-align) perustuvalla menetelmällä. Vertailun tulokset osoittavat, että uusi menetelmä suoriutui MM-alignia paremmin merkittävässä osassa tapauksista. Tuloksia käytettiin myös kompleksien luokitteluun, jonka tuloksena oli 1761 erilaista proteiinien välistä vuorovaikutustyyppiä. Luonnossa esiintyvien proteiinien välisten vuorovaikutusten määrän arvioitiin tilastollisen mallin avulla olevan noin 4000. Tilastollisen mallin avulla saatiin vertailtua sekä sekvenssin (”quaternary families”) sekä rakenteen (”quaternary folds”) mukaan ryhmiteltyjen proteiinikompleksien määriä. Proteiinien ja pienien orgaanisten ligandien välisiä vuorovaikutuksia tutkittiin sekvenssistä riippumattomilla menetelmillä. Uudella menetelmällä testattiin kolmea eri samankaltaisuutta mittaavaa metriikkaa. Näistä parasta käytettiin viiden muun tunnetun menetelmän kanssa vertailemaan kaikkia tunnettuja proteiini-FAD (Flavin-Adenine-Dinucleotide, flaviiniadeniinidinukleotidi) -komplekseja. Proteiini-ligandikontaktien osalta uusi menetelmä kuvasi kompleksien samankaltaisuutta muita menetelmiä paremmin. Vertailun tuloksia hyödyntäen proteiini-FAD-kompleksit luokiteltiin edelleen 237 ryhmään. Suurimmassa osassa tapauksista luokittelujärjestelmä oli onnistunut jakamaan kompleksit ryhmiin niiden toiminnallisuuden mukaisesti. Ryhmät voitiin määritellä yksikäsitteisesti kuvaamalla FAD:n sitoutumispaikka graafisesti. Väitöskirjatyö osoittaa, että siinä kehitetyt menetelmät ovat parempia kuin aikaisemmin käytetyt menetelmät. Tulokset osoittavat, että sekä proteiinien väliset että proteiini-FAD -vuorovaikutukset voidaan luokitella rajattuun määrään vuorovaikutustyyppejä ja yleisesti luokittelu on yhtenevä proteiinien toiminnan suhteen
APA, Harvard, Vancouver, ISO, and other styles
37

Hoffmann, Brice. "Développement d'approches de chémogénomique pour la prédiction des interactions protéine - ligand." Phd thesis, École Nationale Supérieure des Mines de Paris, 2011. http://pastel.archives-ouvertes.fr/pastel-00679718.

Full text
Abstract:
Cette thèse porte sur le développement de méthodes bioinformatiques permettant la prédiction des interactions protéine - ligand. L'approche employée est d'utiliser le partage entre protéines, des informations connues, à la fois sur les protéines et sur les ligands, afin d'améliorer la prédiction de ces interactions. Les méthodes proposées appartiennent aux méthodes dites de chémogénomique. La première contribution de cette thèse est le développement d'une méthode d'apprentissage statistique pour la prédiction des interactions protéines - ligands par famille. Elle est illustrée dans le cas des GPCRs. Cette méthode comprend la proposition de noyaux pour les protéines qui permettent de prendre en compte la similarité globale des GPCRs par l'utilisation de la hiérarchie issue de l'alignement des séquences de cette famille, et la similarité locale au niveau des sites de fixation des ligands de ces GPCRs grâce à l'utilisation des structures 3D connues des membres de cette famille. Pour cela un jeu de données a été créé afin d'évaluer la capacité de cette méthode à prédire correctement les interactions connues. La deuxième contribution est le développement d'une mesure de similarité entre deux sites de fixation de ligands provenant de deux protéines différentes représentés par des nuages d'atomes en 3D. Cette mesure implique la superposition des poches par rotation et la translation, avec pour but la recherche du meilleur alignement possible en maximisant le regroupement d'atomes ayant des propriétés similaires dans des régions proches de l'espace. Les performances de cette méthodes ont été mesurées à l'aide d'un premier jeu de donnés provenant de la littérature et de deux autres qui ont été créé à cet effet. L'ensemble des résultats de cette thèse montre que les approches de chémogénomique présentent de meilleures performances de prédiction que les approches classique par protéine.
APA, Harvard, Vancouver, ISO, and other styles
38

Nieto, Erick Mauricio Gomez. "Generation of semantic layouts for interactive multidimensional data visualization." Universidade de São Paulo, 2017. http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11052017-105059/.

Full text
Abstract:
Visualization methods make use of interactive graphical representations embedded on a display area in order to enable data exploration and analysis. These typically rely on geometric primitives for representing data or building more sophisticated representations to assist the visual analysis process. One of the most challenging tasks in this context is to determinate an optimal layout of these primitives which turns out to be effective and informative. Existing algorithms for building layouts from geometric primitives are typically designed to cope with requirements such as orthogonal alignment, overlap removal, optimal area usage, hierarchical organization, dynamic update among others. However, most techniques are able to tackle just a few of those requirements simultaneously, impairing their use and flexibility. In this dissertation, we propose a set of approaches for building layouts from geometric primitives that concurrently addresses a wider range of requirements. Relying on multidimensional projection and optimization formulations, our methods arrange geometric objects in the visual space so as to generate well-structured layouts that preserve the semantic relation among objects while still making an efficient use of display area. A comprehensive set of quantitative comparisons against existing methods for layout generation and applications on text, image, and video data set visualization prove the effectiveness of our approaches.
Métodos de visualização fazem uso de representações gráficas interativas embutidas em uma área de exibição para exploração e análise de dados. Esses recursos visuais usam primitivas geométricas para representar dados ou compor representações mais sofisticadas que facilitem a extração visual de informações. Uma das tarefas mais desafiadoras é determinar um layout ótimo visando explorar suas capacidades para transmitir informação dentro de uma determinada visualização. Os algoritmos existentes para construir layouts a partir de primitivas geométricas são tipicamente projetados para lidar com requisitos como alinhamento ortogonal, remoção de sobreposição, área usada, organização hierárquica, atualização dinâmica entre outros. No entanto, a maioria das técnicas são capazes de lidar com apenas alguns desses requerimentos simultaneamente, prejudicando sua utilização e flexibilidade. Nesta tese, propomos um conjunto de abordagens para construir layouts a partir de primitivas geométricas que simultaneamente lidam com uma gama mais ampla de requerimentos. Baseando-se em projeções multidimensionais e formulações de otimização, os nossos métodos organizam objetos geométricos no espaço visual para gerar layouts bem estruturados que preservam a relação semântica entre objetos enquanto ainda fazem um uso eficiente da área de exibição. Um conjunto detalhado de comparações quantitativas com métodos existentes para a geração de layouts e aplicações em visualização de conjunto de dados de texto, imagem e vídeo comprova a eficácia das técnicas propostas.
APA, Harvard, Vancouver, ISO, and other styles
39

Nilsson, Olof. "Visualization of live search." Thesis, Linköpings universitet, Interaktiva och kognitiva system, 2013. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-102448.

Full text
Abstract:
The classical search engine result page is used for many interactions with search results. While these are effective at communicating relevance, they do not present the context well. By giving the user an overview in the form of a spatialized display, in a domain that has a physical analog that the user is familiar with, context should become pre-attentive and obvious to the user. A prototype has been built that takes public medical information articles and assigns these to parts of the human body. The articles are indexed and made searchable. A visualization presents the coverage of a query on the human body and allows the user to interact with it to explore the results. Through usage cases the function and utility of the approach is shown.
APA, Harvard, Vancouver, ISO, and other styles
40

Haugeard, Jean-Emmanuel. "Extraction et reconnaissance de primitives dans les façades de Paris à l'aide de similarités de graphes." Phd thesis, Université de Cergy Pontoise, 2010. http://tel.archives-ouvertes.fr/tel-00593985.

Full text
Abstract:
Cette dernière décennie, la modélisation des villes 3D est devenue l'un des enjeux de la recherche multimédia et un axe important en reconnaissance d'objets. Dans cette thèse nous nous sommes intéressés à localiser différentes primitives, plus particulièrement les fenêtres, dans les façades de Paris. Dans un premier temps, nous présentons une analyse des façades et des différentes propriétés des fenêtres. Nous en déduisons et proposons ensuite un algorithme capable d'extraire automatiquement des hypothèses de fenêtres. Dans une deuxième partie, nous abordons l'extraction et la reconnaissance des primitives à l'aide d'appariement de graphes de contours. En effet une image de contours est lisible par l'oeil humain qui effectue un groupement perceptuel et distingue les entités présentes dans la scène. C'est ce mécanisme que nous avons cherché à reproduire. L'image est représentée sous la forme d'un graphe d'adjacence de segments de contours, valué par des informations d'orientation et de proximité des segments de contours. Pour la mise en correspondance inexacte des graphes, nous proposons plusieurs variantes d'une nouvelle similarité basée sur des ensembles de chemins tracés sur les graphes, capables d'effectuer les groupements des contours et robustes aux changements d'échelle. La similarité entre chemins prend en compte la similarité des ensembles de segments de contours et la similarité des régions définies par ces chemins. La sélection des images d'une base contenant un objet particulier s'effectue à l'aide d'un classifieur SVM ou kppv. La localisation des objets dans l'image utilise un système de vote à partir des chemins sélectionnés par l'algorithme d'appariement.
APA, Harvard, Vancouver, ISO, and other styles
41

Zapletal, Eric. "Un environnement collaboratif sur Internet pour l'aide au consensus en anatomie pathologie : la plateforme IDEM." Paris 6, 2006. http://www.theses.fr/2006PA066590.

Full text
APA, Harvard, Vancouver, ISO, and other styles
42

Chartier, Matthieu. "Développement et applications d’un outil bio-informatique pour la détection de similarités de champs d’interaction moléculaire." Thèse, Université de Sherbrooke, 2016. http://hdl.handle.net/11143/8893.

Full text
Abstract:
Résumé : Les méthodes de détection de similarités de sites de liaison servent entre autres à la prédiction de fonction et à la prédiction de cibles croisées. Ces méthodes peuvent aider à prévenir les effets secondaires, suggérer le repositionnement de médicament existants, identifier des cibles polypharmacologiques et des remplacements bio-isostériques. La plupart des méthodes utilisent des représentations basées sur les atomes, même si les champs d’interaction moléculaire (MIFs) représentent plus directement ce qui cherche à être identifié. Nous avons développé une méthode bio-informatique, IsoMif, qui détecte les similarités de MIF entre différents sites de liaisons et qui ne nécessite aucun alignement de séquence ou de structure. Sa performance a été comparée à d’autres méthodes avec des bancs d’essais, ce qui n’a jamais été fait pour une méthode basée sur les MIFs. IsoMif performe mieux en moyenne et est plus robuste. Nous avons noté des limites intrinsèques à la méthodologie et d’autres qui proviennent de la nature. L’impact de choix de conception sur la performance est discuté. Nous avons développé une interface en ligne qui permet la détection de similarités entre une protéine et différents ensembles de MIFs précalculés ou à des MIFs choisis par l’utilisateur. Des sessions PyMOL peuvent être téléchargées afin de visualiser les similarités identifiées pour différentes interactions intermoléculaires. Nous avons appliqué IsoMif pour identifier des cibles croisées potentielles de drogues lors d’une analyse à large échelle (5,6 millions de comparaisons). Des simulations d’arrimage moléculaire ont également été effectuées pour les prédictions significatives. L’objectif est de générer des hypothèses de repositionnement et de mécanismes d’effets secondaires observés. Plusieurs exemples sont présentés à cet égard.
Abstract : Methods that detect binding site similarities between proteins serve for the prediction of function and the identification of potential off-targets. These methods can help prevent side-effects, suggest drug repurposing and polypharmacological strategies and suggest bioisosteric replacements. Most methods use atom-based representations despite the fact that molecular interaction fields (MIFs) represents more closely the nature of what is meant to be identified. We developped a computational algorithm, IsoMif, that detects MIF similarities between binding sites. We benchmark IsoMif to other methods which has not been previously done for a MIF-based method. IsoMif performed best in average and more consistently accross datasets. We highlight limitations intrinsic to the methodology or to nature. The impact of design choices on performance is discussed. We built a freely available web interface that allows the detection of similarities between a protein and pre-calculated MIFs or user defined MIFs. PyMOL sessions can be downloaded to visualize similarities for the different intermolecular interactions. IsoMif was applied for a large-scale analysis (5,6 millions of comparisons) to predict offtargets of drugs. Docking simulations of the drugs in the binding site of their top hits were performed. The primary objective is to generate hypotheses that can be further investigated and validated regarding drug repurposing opportunities and side-effect mechanisms.
APA, Harvard, Vancouver, ISO, and other styles
43

Calle, Didier. "Agrandissement d'images par synthèse de similarités et par induction sur un ensemble." Phd thesis, Université Joseph Fourier (Grenoble), 1999. http://tel.archives-ouvertes.fr/tel-00004813.

Full text
Abstract:
Ce mémoire porte sur l'agrandissement des images numériques fixes en niveaux de gris dans un contexte général sans connaissance a priori. Il est constitué de trois parties. La première porte sur une description détaillée des méthodes d'agrandissement que l'on peut trouver dans la littérature. Nous commençons par présenter les méthodes d'interpolation classiques ayant pour objectif de préserver les fréquences de l'image à agrandir, puis nous détaillons des méthodes récentes de préservation structurelle produisant une meilleure netteté. La deuxième partie constitue la contribution majeure de ce travail en proposant deux nouvelles méthodes d'agrandissement. La première méthode est basée sur la synthèse de similarités détectées sur une représentation pyramidale de l'image. Elle reprend à la base le zoom fractal classique en apportant de nombreuses modifications et améliorations aussi bien dans la phase d'analyse que dans celle de synthèse. Nous vérifions expérimentalement l'hypothèse de préservation des similarités. La deuxième méthode d'agrandissement que nous proposons s'intéresse à l'ensemble admissible des images agrandies d'une image initiale. La condition d'admissibilité repose ici sur la notion de réduction : une image agrandie appartient à l'ensemble des solutions si sa réduction est identique à l'image initiale. Nous étudions différents algorithmes de projection sur cet ensemble. La troisième partie concerne des améliorations et des applications de nos deux méthodes. Tout d'abord, nous améliorons la qualité de l'image agrandie par synthèse de similarités en recherchant celles-ci sur une pyramide en quinconce. Ensuite, nous exploitons la méthode d'agrandissement par induction pour régulariser, vis-à-vis de la contrainte de réduction, les images agrandies par synthèse de similarités. Enfin, nous exploitons également cette méthode pour réaliser un codage hiérarchique de l'image permettant sa transmission progressive sur réseau.
APA, Harvard, Vancouver, ISO, and other styles
44

Mazuel, Laurent. "Traitement de l'hétérogénéité sémantique dans les interactions humain-agent et agent-agent." Phd thesis, Université Pierre et Marie Curie - Paris VI, 2008. http://tel.archives-ouvertes.fr/tel-00413004.

Full text
Abstract:
Le thème général de cette thèse est le traitement de l'hétérogénéité sémantique dans les interactions humain-agent et agent-agent. Plus précisément, nous étudions le cas où un agent informatique muni d'un modèle de représentation de ses connaissances doit traiter des demandes envoyées par d'autres interlocuteurs, qu'il s'agisse d'utilisateurs humains ou d'agents informatiques.
La plupart des approches segmentent ce traitement en fonction de l'émetteur de la demande (humain ou agent). Nous pensons au contraire qu'il est possible de proposer un modèle d'interaction commun aux deux situations. Ainsi, nous présentons d'abord un algorithme d'interprétation sémantique de la commande indépendant du type d'interaction (humain-agent ou agent-agent). Cet algorithme considère le rapport entre « ce qui est compris » de la commande et « ce qui est possible » pour la machine. Ce rapport intervient dans un système de sélection de réponses basé sur une mesure de degré de relation sémantique. Nous proposons ensuite une telle mesure, conçue pour prendre en compte plus d'informations que la plupart des mesures actuelles.
Nous étudions ensuite les implémentations que nous avons faites dans les cadres humain-agent et agent-agent. Pour l'implémentation humain-agent, l'une des spécificités est l'utilisation d'une langue naturelle, impliquant le besoin d'utiliser des outils de modélisation de la langue. Pour l'implémentation agent-agent, nous proposerons une adaptation de notre architecture, en s'appuyant sur des protocoles d'interactions entre agents.
APA, Harvard, Vancouver, ISO, and other styles
45

Pérez, Nueno Violeta Isabel. "Herramientas de cribado virtual aplicadas a inhibidores de entrada del VIH. Diseño de nuevos compuestos anti-VIH." Doctoral thesis, Universitat Ramon Llull, 2009. http://hdl.handle.net/10803/9311.

Full text
Abstract:
Els inhibidors d'entrada del VIH han sorgit recentment com una nova generació de fàrmacs antiretrovirals, els quals bloquegen la unió del virus als co-receptors de membrana CXCR4 i CCR5. S'han desenvolupat diverses molècules petites antagonistes d'aquests co-receptors, algunes de les quals estan actualment en fase d'assaig clínic. No obstant això, donat que no existeixen estructures cristal·logràfiques per aquests co-receptors proteics, és necessari analitzar els modes d'unió d'inhibidors coneguts a la cavitat d'unió extracel·lular dels co-receptors mitjançant experiments de mutagènesi dirigida i estudis computacionals. En general, l'objectiu d'aquestes aproximacions computacionals és cribar un gran nombre de compostos candidats a fàrmacs ràpidament. El cribatge virtual s'ha convertit recentment en un complement útil dels mètodes de cribatge experimentals high-throughput screening per a grans llibreries de compostos. Per tant, en aquesta tesi s'ha portat a terme un protocol de cribatge virtual, mitjançant aproximacions basades en el receptor i en lligands actius coneguts, amb la finalitat de trobar antagonistes de CXCR4 i CCR5 que puguin servir com a potencials inhibidors d'entrada del VIH.
Per al cribatge virtual basat en el receptor, s'han millorat els models dels co-receptors CXCR4 i CCR5 construïts a la secció de disseny molecular de l'IQS, i s'han portat a terme assajos preliminars de mode d'unió utilitzant aquests models i lligands coneguts d'elevada afinitat. Així mateix, s'ha analitzat el comportament en el cribatge virtual i en el post-processat de resultats de docking de diferents fingerprints d'interacció en comparació amb els resultats obtinguts per un nou fingerprint d'interacció (APIF) desenvolupat a la secció de disseny molecular de l'IQS.
Per al cribatge virtual basat en lligands, s'han comparat models farmacofòrics i diverses aproximacions basades en la forma i propietats moleculars utilitzant lligands d'elevada afinitat com a molècules de referència. A més, s'ha desenvolupat una nova aproximació basada en la forma molecular, la qual s'ha utilitzat per a estudiar en profunditat la hipòtesi de la multi-regió d'unió de la cavitat d'unió extracel·lular del co-receptor CCR5.
Tots els mètodes, ja siguin basats en el receptor o en lligands coneguts, s'han aplicat en primer lloc de manera retrospectiva utilitzant una extensa base de dades d'inhibidors de CXCR4/CCR5 i suposats inactius, similars en propietats als actius, recopilada en aquesta tesi. Per a cada receptor, la quimioteca ha estat cribada utilitzat inhibidors coneguts, S'han analitzat els factors d'enriquiment i la diversitat a les llistes finals de hits. A més, s'han portat a terme anàlisis ROC per a ambdós inhibidors de CXCR4 i CCR5 amb la finalitat de comparar l'habilitat del nou algoritme basat en la igualtat de formes de lligands amb la resta d'aproximacions de cribatge utilitzades.
Una vegada validades les diferents aproximacions de cribatge i seleccionats els millors paràmetres per a cadascuna d'elles, s'han aplicat les eines de cribatge virtual de manera prospectiva sobre una quimioteca combinatòria dissenyada a la secció de disseny molecular de l'IQS, així com tècniques de disseny de novo de lligands per tal d'identificar nous bloquejadors de l'entrada del VIH a les cèl·lules.
Los inhibidores de entrada del VIH han surgido recientemente como una nueva generación de fármacos antiretrovirales, los cuales bloquean la unión del virus con los co-receptores de membrana CXCR4 y CCR5. Se han desarrollado diversas moléculas pequeñas antagonistas de estos co-receptores, algunas de las cuales están actualmente en fase de ensayo clínico. Sin embargo, dado que no existen estructuras cristalográficas para estos co-receptores proteicos, es necesario analizar los modos de unión de inhibidores conocidos a la cavidad de unión extracelular de los co-receptores mediante experimentos de mutagénesis dirigida y estudios computacionales. En general, el objetivo de estas aproximaciones computacionales es cribar un gran número de compuestos candidatos a fármacos rápidamente. El cribado virtual se ha convertido recientemente en un complemento útil de los métodos de cribado experimentales high-throughput screening para grandes librerías de compuestos. Por lo tanto, en esta tesis se ha llevado a cabo un protocolo de cribado virtual, mediante aproximaciones basadas en el receptor y en ligandos activos conocidos, con el fin de encontrar antagonistas de CXCR4 y CCR5 que puedan servir como potenciales inhibidores de entrada del VIH.
Para el cribado virtual basado en el receptor, se han mejorado los modelos de los co-receptores CXCR4 y CCR5 construidos en la sección de diseño molecular del IQS, y se han llevado a cabo ensayos preliminares de modo de unión utilizando estos modelos y ligandos conocidos de elevada afinidad. Asimismo, se ha analizado el comportamiento en el cribado virtual y en el post-procesado de resultados de docking de diferentes fingerprints de interacción en comparación con los resultados obtenidos por un nuevo fingerprint de interacción (APIF) desarrollado en la sección de diseño molecular del IQS.
Para el cribado virtual basado en ligandos, se han comparado modelos farmacofóricos y diversas aproximaciones basadas en la forma y propiedades moleculares utilizando ligandos de elevada afinidad como moléculas de referencia. Además, se ha desarrollado una nueva aproximación basada en la forma molecular, la cual se ha utilizado para estudiar en profundidad la hipótesis de la multi-región de unión de la cavidad de unión extracelular del co-receptor CCR5.
Todos los métodos, ya sean basados en el receptor o en ligandos conocidos, se han aplicado en primer lugar de manera retrospectiva utilizando una extensa base de datos de inhibidores de CXCR4/CCR5 y supuestos inactivos, similares en propiedades a los activos, recopilada en esta tesis. Para cada receptor, la quimioteca ha sido cribada utilizando inhibidores conocidos, Se han analizado los factores de enriquecimiento y la diversidad en las listas finales de hits. Además, se han llevado a cabo análisis ROC para ambos inhibidores de CXCR4 y CCR5 con el fin de comparar la habilidad del nuevo algoritmo basado en la igualdad de formas de ligandos con el resto de aproximaciones de cribado utilizadas.
Una vez validadas las diferentes aproximaciones de cribado y seleccionados los mejores parámetros para cada una de ellas, se han aplicado las herramientas de cribado virtual de manera prospectiva sobre una quimioteca combinatoria diseñada en la sección de diseño molecular del IQS, así como técnicas de diseño de novo de ligandos para identificar nuevos bloqueadores de la entrada del VIH a las células.
HIV entry inhibitors have emerged as a new generation of antiretroviral drugs that block viral fusion with the CXCR4 and CCR5 membrane co-receptors. Several small molecule antagonists for these co-receptors have been developed, some of which are currently in clinical trials. However, because no crystal structures for the co-receptor proteins are available, the binding modes of the known inhibitors within the co-receptor extracellular pockets need to be analyzed by means of site-directed mutagenesis and computational experiments. Generally, the objective of these computational approaches is to screen large numbers of candidate drug compounds rapidly. Virtual screening has recently become a useful complement to laboratory-based high-throughput screening methods for large libraries of compounds. Hence, in this thesis, a virtual screening protocol, using several receptor-based and ligand-based approaches, has been performed to find CXCR4 and CCR5 antagonists that could potentially serve as HIV entry inhibitors.
For receptor-based virtual screening, homology models of CXCR4 and CCR5 co-receptors built in our research group have been improved, and preliminary binding mode analyses using these models and high affinity known ligands have been carried out. Also, the performance in virtual screening and docking post-processing of different interaction fingerprints, compared to the results obtained with a new interaction fingerprint (APIF) developed in our research group, has been analysed.
For ligand-based virtual screening, pharmacophore modelling and several shape-based and property-based molecular comparison approaches have been compared, using high-affinity ligands as query molecules. Also, a novel consensus shape-based virtual screening approach has been developed and used to investigate and add further evidence for multiple binding sites within the CCR5 extracellular pocket hypothesis.
All the receptor-based and ligand-based methods have been firstly applied in a retrospective virtual screening, using a large database of known CXCR4/CCR5 inhibitors and similar presumed inactive molecules assembled in this thesis. For each receptor, the library has been queried using known binders, and the enrichment factors and diversity of the resulting virtual hit lists have been analyzed. Moreover, receiver-operator-characteristic analyses for both CXCR4 and CCR5 inhibitors have been carried out in order to compare the performance of the new consensus shape matching algorithm with the other screening approaches used.
Once the different virtual screening approaches have been validated and the best parameters for each one have been selected, prospective virtual screening of a combinatorial library designed by our research group and de novo design methods have been applied to identify new HIV entry blockers.
APA, Harvard, Vancouver, ISO, and other styles
46

Peterlongo, Pierre. "Filtrage de séquences d'ADN pour la recherche de longues répétitions multiples." Phd thesis, Université de Marne la Vallée, 2006. http://tel.archives-ouvertes.fr/tel-00132300.

Full text
Abstract:
La génomique moléculaire fait face en ce début de siècle à de nouvelles situations qu'elle doit prendre en compte. D'une part, depuis une dizaine d'années, la quantité de données disponibles croît
de manière exponentielle. D'autre part, la recherche dans le domaine
implique de nouvelles questions dont les formulations in silico
génèrent des problèmes algorithmiquement difficiles à résoudre.

Parmi ces problèmes, certains concernent notamment l'étude de réarrangements génomiques dont les duplications et les éléments transposables. Ils imposent que l'on soit en mesure de détecter précisément et efficacement de longues répétitions approchées et multiples dans les génomes. Par répétition multiple, nous désignons
des répétitions ayant au moins deux copies dans une séquence d'ADN, ou ayant des copies dans au moins deux séquences d'ADN distinctes. De plus, ces répétitions sont approchées dans le sens où des erreurs existent entre les copies d'une même répétition.

La recherche de répétitions approchées multiples peut être résolue par des algorithmes d'alignements multiples locaux mais ceux-ci présentent une complexité exponentielle en la taille de l'entrée, et ne sont donc pas applicables à des données aussi grandes que des génomes. C'est pourquoi, de nouvelles techniques doivent être créées pour répondre à ces nouveaux besoins.

Dans cette thèse, une approche de filtrage des séquences d'ADN est
proposée. Le but d'une telle approche est de supprimer rapidement et
efficacement, parmi des textes représentant des séquences d'ADN, de
larges portions ne pouvant pas faire partie de répétitions. Les données filtrées, limitées en majorité aux portions pertinentes, peuvent alors être fournies en entrée d'un algorithme d'alignement multiple local.


Les filtres proposés appliquent une condition nécessaire aux séquences pour n'en conserver que les portions qui la respectent. Les travaux que nous présentons ont porté sur la création de conditions de filtrage, à la fois efficaces et simples à appliquer d'un point de vue algorithmique. À partir de ces conditions de filtrage, deux filtres, Nimbus et Ed'Nimbus, ont été créés. Ces filtres sont appelés exacts car il ne suppriment jamais de données contenant effectivement des occurrences de répétitions respectant les caractéristiques fixées par un utilisateur. L'efficacité du point de vue de la simplicité d'application et de celui de la précision du filtrage obtenu, conduit à de très bons résultats en pratique. Par exemple, le temps utilisé par des algorithmiques de recherche de répétitions ou d'alignements multiples peut être réduit de plusieurs ordres de grandeur en utilisant les filtres proposés.

Il est important de noter que les travaux présentés dans cette thèse
sont inspirés par une problématique biologique mais ils sont également généraux et peuvent donc être appliqués au filtrage de tout type de textes afin d'y détecter de grandes portions répétées.
APA, Harvard, Vancouver, ISO, and other styles
47

Venceslau, Amanda Drielly Pires. "Uma abordagem para identificação de domínios de aplicação em ambiente de convergência digital." Universidade Federal da Paraí­ba, 2013. http://tede.biblioteca.ufpb.br:8080/handle/tede/6098.

Full text
Abstract:
Made available in DSpace on 2015-05-14T12:36:40Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 3026129 bytes, checksum: adbee1eaf596c14b444cb5c0d0379353 (MD5) Previous issue date: 2013-07-23
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
The emergence of the Interactive Digital Television provided, as well as advantages gain quality and optimization of the transmission, the addition of new features and services available to the user. With the advent of digital convergence between TV and Web platforms, new proposals of semantic organization of content are developed. Moreover, it was possible to introduce concepts of the Semantic Web and knowledge representation that allow semantically describe the metadata of content through ontologies. In this context, this work proposes an approach to identifying of domain of application in digital convergence environment based on the Semantic Web concepts and analysis of lexical and semantic similarity. One component integrated with Knowledge TV platform, was implemented to validate the approach.
O surgimento da Televisão Digital Interativa proporciona além de ganho de qualidade na transmissão, a adição de novos recursos e serviços disponíveis ao usuário. Com o advento da convergência digital entre as plataformas de TV e Web, novas propostas de organização semântica de conteúdo estão sendo desenvolvidas. Além disso, foi possível introduzir conceitos da Web Semântica e de representação do conhecimento que permitem descrever semanticamente os metadados de conteúdo através de ontologias. Nesse contexto, esse trabalho propõe uma abordagem para identificação de domínios de aplicação no ambiente de convergência digital baseada em conceitos da Web Semântica e nas análises de similaridade léxica e semântica. Um componente integrado a plataforma Knowledge TV, foi implementado para validar a abordagem.
APA, Harvard, Vancouver, ISO, and other styles
48

Champclaux, Yaël. "Un modèle de recherche d'information basé sur les graphes et les similarités structurelles pour l'amélioration du processus de recherche d'information." Phd thesis, Université Paul Sabatier - Toulouse III, 2009. http://tel.archives-ouvertes.fr/tel-00446372.

Full text
Abstract:
Cette thèse d'informatique s'inscrit dans le domaine de la recherche d'information (RI). Elle a pour objet la création d'un modèle de recherche utilisant les graphes pour en exploiter la structure pour la détection de similarités entre les documents textuels d'une collection donnée et une requête utilisateur en vue d'améliorer le processus de recherche d'information. Ces similarités sont dites « structurelles » et nous montrons qu'elles apportent un gain d'information bénéfique par rapport aux seules similarités directes. Le rapport de thèse est structuré en cinq chapitres. Le premier chapitre présente un état de l'art sur la comparaison et les notions connexes que sont la distance et la similarité. Le deuxième chapitre présente les concepts clés de la RI, notamment l'indexation des documents, leur comparaison, et l'évaluation des classements retournés. Le troisième chapitre est consacré à la théorie des graphes et introduit les notations et notions liées à la représentation par graphe. Le quatrième chapitre présente pas à pas la construction de notre modèle pour la RI, puis, le cinquième chapitre décrit son application dans différents cas de figure, ainsi que son évaluation sur différentes collections et sa comparaison à d'autres approches.
APA, Harvard, Vancouver, ISO, and other styles
49

Trouvilliez, Benoît. "Similarités de données textuelles pour l'apprentissage de textes courts d'opinions et la recherche de produits." Thesis, Artois, 2013. http://www.theses.fr/2013ARTO0403/document.

Full text
Abstract:
Cette thèse porte sur l'établissement de similarités de données textuelles dans le domaine de la gestion de la relation client. Elle se décline en deux parties : - l'analyse automatique de messages courts en réponse à des questionnaires de satisfaction ; - la recherche de produits à partir de l'énonciation de critères au sein d'une conversation écrite mettant en jeu un humain et un programme agent. La première partie a pour objectif la production d'informations statistiques structurées extraites des réponses aux questions. Les idées exprimées dans les réponses sont identifiées, organisées selon une taxonomie et quantifiées. La seconde partie vise à transcrire les critères de recherche de produits en requêtes compréhensibles par un système de gestion de bases de données. Les critères étudiés vont de critères relativement simples comme la matière du produit jusqu'à des critères plus complexes comme le prix ou la couleur. Les deux parties se rejoignent sur la problématique d'établissement de similarités entre données textuelles par des techniques de TAL. Les principales difficultés à surmonter sont liées aux caractéristiques des textes, rédigés en langage naturel, courts, et comportant fréquemment des fautes d'orthographe ou des négations. L'établissement de similarités sémantiques entre mots (synonymie, antonymie, etc) et l'établissement de relations syntaxiques entre syntagmes (conjonction, opposition, etc) sont également des problématiques abordées. Nous étudions également dans cette thèse des méthodes de regroupements et de classification automatique de textes afin d'analyser les réponses aux questionnaires de satisfaction
This Ph.D. thesis is about the establishment of textual data similarities in the client relation domain. Two subjects are mainly considered : - the automatic analysis of short messages in response of satisfaction surveys ; - the search of products given same criteria expressed in natural language by a human through a conversation with a program. The first subject concerns the statistical informations from the surveys answers. The ideas recognized in the answers are identified, organized according to a taxonomy and quantified. The second subject concerns the transcription of some criteria over products into queries to be interpreted by a database management system. The number of criteria under consideration is wide, from simplest criteria like material or brand, until most complex criteria like color or price. The two subjects meet on the problem of establishing textual data similarities thanks to NLP techniques. The main difficulties come from the fact that the texts to be processed, written in natural language, are short ones and with lots of spell checking errors and negations. Establishment of semantic similarities between words (synonymy, antonymy, ...) and syntactic relations between syntagms (conjunction, opposition, ...) are other issues considered in our work. We also study in this Ph. D. thesis automatic clustering and classification methods in order to analyse answers to satisfaction surveys
APA, Harvard, Vancouver, ISO, and other styles
50

Bilane, P. "Contributions a l'indexation et a la reconnaissance des manuscrits Syriaques." Phd thesis, INSA de Lyon, 2010. http://tel.archives-ouvertes.fr/tel-00499537.

Full text
Abstract:
CETTE THESE EST DEDIEE A L'EXPLORATION INFORMATIQUE DE MANUSCRITS SYRIAQUES, C'EST LA PREMIERE ETUDE DE CE TYPE MISE EN ŒUVRE. LE SYRIAQUE EST UNE LANGUE QUI S'EST DEVELOPPE A L'EST DU BASSIN MEDITERRANEEN, IL Y A PLUS DE VINGT SIECLES ET QUI AUJOURD'HUI EST ENCORE PRATIQUEE. LA PRESENTATION DE L'HISTOIRE DU DEVELOPPEMENT DE CETTE LANGUE FAIT L'OBJECT DU PREMIER CHAPITRE. LE SYRIAQUE S'ECRIT DE DROITE A GAUCHE, AVEC UN ASPECT TRES SINGULIER, UN PENCHE D'UN ANGLE D'ENVIRON 45° QUI REND LES ALGORITHMES DE TRAITEMENT ET D'ANALYSE DE DOCUMENTS DEVELOPPES POUR LES AUTRES ECRITURES INOPERANTS. DANS LE SECOND CHAPITRE, APRES NOUS ETRE INTERESSES A LA DESCRIPTION ET L'EXTRACTION DES STRUCTURES DES DOCUMENTS, NOUS AVONS ELABORE UNE METHODE DE SEGMENTATION DES MOTS QUI PREND EN COMPTE CE PENCHE; ELLE NOUS CONDUIT A UNE TRENTAINE DE FORMES STABLES QUI SONT DES LETTRES INDIVIDUELLES VERTICALES ET DES "N-GRAMMES" CONSTITUES PAR DES LETTRES PENCHEES. DANS LA DEUXIEME PARTIE DE LA THESE, NOUS NOUS SOMMES INTERESSES AU CONTENU DES DOCUMENTS POUR DES FINS D'INDEXATION. NOUS AVONS DEVELOPPE UNE METHODE DE REPERAGE DE MOTS QUI PERMET DE RETROUVER, DANS IN DOCUMENT, TOUTES LES OCCURRENCES D'UN MOT SELON PLUSIEUS MODES DE REQUETES (WORD SPOTTING, WORD RETRIEVAL). ELLE REPOSE SUR UNE SIMILARITE DE FORME EVALUEE A PARTIR D'UNE ANALYSE TRES FINE DE L'ORIENTATION DU TRACE DE L'ECRITURE. LE DERNIER CHAPITRE EST UNE PREMIERE CONTRIBUTION A LA TRANSCRIPTION ASSISTEE DES MANUSCRITS SYRIAQUES QUI REPOSE SUR LA SEGMENTATION DES MOTS DECRITE CI-DESSUS. NOUS MONTRONS QUE LA TRANSCRIPTION, QUI S'APPUIE SUR L'INTERACTION, EST EN RUPTURE AVES LES TRADITIONNELLES DEMARCHES DE RECONNAISSANCE PAR O. C. R.
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography