Thèses : « Transformation du parole »

1

Mesbahi, Larbi. « Transformation automatique de la parole - Etude des transformations acoustiques ». Phd thesis, Université Rennes 1, 2010. http://tel.archives-ouvertes.fr/tel-00547088.

Texte intégral

Résumé :

Le travail effectué dans cette thèse s'insère dans le cadre de la conversion automatique de la voix. La problématique générale est de modifier le signal d'un énoncé pour qu'il soit perçu comme prononcé par une autre personne. Les Systèmes de Conversion de Voix (SCV) de l'état de l'art utilisent pour la plupart des modèles de voix probabilistes GMM (Gaussian Mixture Models). Ces SCV utilisent des fonctions de conversion linéaires apprises à partir des GMMs. Elles permettent d'obtenir des voix converties de bonne qualité. Cependant, elles sont soumises à des défauts de conception liées à l'apprentissage de ces modèles. On peut ainsi noter le surlissage (oversmoothing) qui est une généralisation trop poussée et son opposé, le sur-apprentissage (overfitting) qui est une spécialisation trop poussée. Un aspect de cette thèse explore différentes stratégies d'apprentissage des fonctions de conversion. La première piste suivie est la réduction du nombre des paramètres libres de la fonction de conversion. La deuxième propose une alternative aux fonctions de conversion linéaires basées sur des GMMs en recourant aux modèles de transformation non-linéaire à base de réseaux de Neurones (RBF, Radial Basis Functions). Cette thèse s'intéresse d'autre part aux données utilisées pour apprendre les modèles de voix et les transformations. En effet, pour apprendre la fonction de conversion, les données issues des locuteurs source et cible doivent être mises en correspondance. Or, dans la plupart des cas d'utilisation, ces données ne sont pas parallèles. Autrement dit, les deux locuteurs n'ont pas prononcé suffisamment de phrases similaires. Notre proposition consiste à faire correspondre ces données lacunaires en les décomposant en classes acoustiques et en s'appuyant sur l'appariement, classique, des classes acoustiques cibles et sources. Enfin, notre intérêt se porte sur la paramètrisation de la voix car, pour obtenir une haute qualité de voix, il est nécessaire que cette paramètrisation conserve un maximum d'information sur le locuteur. Il s'agit en l'occurrence de l'enveloppe de son signal, obtenue fidèlement par la méthode de True-Envelope. Or, les premières études ont montré que ces données doivent être réduites pour nourrir un modèle probabiliste efficace. Pour cela, nous avons recours à la technique de réduction de dimension d'analyse par composantes principales (PCA, Principal componant analysis). Cette solution s'avère plus efficace lorsqu'on différencie les fonctions de transformation selon la classe phonétique.

Styles APA, Harvard, Vancouver, ISO, etc.

2

Mesbahi, Larbi. « Transformation automatique de la parole : étude des transformations acoustiques ». Rennes 1, 2010. https://tel.archives-ouvertes.fr/tel-00547088.

Texte intégral

Résumé :

Le travail effectué dans cette thèse présente une évaluation des techniques de transformation de voix à base de GMM. Ces techniques de transformation linéaires malgré leurs qualités obtenues, elles ne manquent pas de quelques défauts, on peut noter le sur-lissage, le problème de distorsion spectrale et le sur-apprentissage. Dans un premier volet, nous avons pris en compte ces questions pour adapter la stratégie d'apprentissage des fonctions de conversion. La première c'est la réduction du nombre des paramètres libres de la fonction de conversion. La deuxième considère que les solutions par transformation linéaire sont instables face au peu de données d'apprentissage, d'où le recours aux modèles de transformation non-linéaire de type RBF. Dans un deuxième volet, pour aligner les données non-parallèles des locuteurs source et cible, une solution consiste à correspondre ces données via une représentation récursive d'un arbre binaire. Dans un dernier volet, pour obtenir une haute qualité de voix, l'utilisation d'un modèle de true-envelope est nécessaire. Pour cela, le recours aux techniques de réduction de dimension par PCA est indispensable avant d'appliquer les méthodes de conversion
This work presents an experimental evaluation of various voice transformation techniques based on GMM models. These linear transforms, despite their quality obtained, they fail to some defects specially the oversmoothing effect, the problem of spectral distortion and the overfitting. In a first part, we proposed taking these issues into account to adapt the learning strategy of the conversion functions. The first main idea is to reduce the number of parameters describing the conversion function. The second idea considers the solutions based on linear transform are unstable face to the lack of the training data, hence the recourse to non-linear transform model like RBF. In a second part in some situations, we need to align non-parallel data from the source and target speakers, one solution consists to use a recursive representation of binary tree, whose depth depends on the learning data size. In the last part, to get a high voice quality, we have proposed a model of parameters issued from the PCA projection on the true envelope before applying the conversion methods

Styles APA, Harvard, Vancouver, ISO, etc.

3

Barreaud, Vincent. « Reconnaissance automatique de la parole continue : compensation des bruits par transformation de la parole ». Nancy 1, 2004. http://docnum.univ-lorraine.fr/public/SCD_T_2004_0175_BARREAUD.pdf.

Texte intégral

Résumé :

Les performances d'un système de reconnaissance automatique de la parole se dégradent lorsque les conditions de test et d'entraînement diffèrent. L'approche classique du Stochastic Matching (SM) propose une estimation en temps-différé d'une fonction de compensation qui maximise la vraisemblance de la parole compensée par rapport à la séquence de modèles proposée par le processus de reconnaissance. Nous proposons des techniques temps-réel basées sur SM : la compensation s'effectue en parallèle avec le processus de reconnaissance. Cela permet de compenser dans un environnement variant lentement. Deux améliorations ont été apportées: -Une structure arborescente de transformations permet de construire une fonction de compensation non-linéaire dépendant du type acoustique de la parole. -Un processus surveillant les changements dans l'environnement déclenche la réinitialisation du processus de compensation. Cela permet à notre algorithme de fonctionner dans des environnements variant abruptement
Performances of an automatic speech recognition system degrade when test and training conditions do not match. Classical Stochastic Matching (SM) method proposes an off-line estimation of a compensation function that maximizes the likelihood of the compensated speech, given the optimal sequence of models proposed by the recognition process. We developed a new frame-synchronous technic based on SM : compensation is performed in parallel with the recognition. This is suitable to cope with slowly varying noise. We proposed two additional versions of our approach: -a tree structure of transformations is used to build a state-dependant non-linear compensation function. This is motivated by the fact that similar observations will be affected similarly by the environment. -a surveillance process monitoring the fluctuations in the environment is used to trigger the reinitialisation of the compensation process. This enables our algorithm to cope with environments experiencing sudden occurrences of noise

Styles APA, Harvard, Vancouver, ISO, etc.

4

Barreaud, Vincent Haton Jean-Paul. « Reconnaissance automatique de la parole continue compensation des bruits par transformation de la parole / ». (S.l.) : (s.n.), 2004. http://www.scd.uhp-nancy.fr/docnum/SCD_T_2004_0175_BARREAUD.pdf.

Texte intégral

Styles APA, Harvard, Vancouver, ISO, etc.

5

Kastantin, Radwan. « Codage de la parole base sur une transformation en ondelettes ». Grenoble INPG, 1996. http://www.theses.fr/1996INPG0042.

Texte intégral

Résumé :

Le but de cette these est de mettre en evidence l'interet de la transformation en ondelettes pour la compression de la parole et d'elaborer un codeur de parole a debit moyen base sur cette transformation. Cette these est composee de trois parties. Dans la premiere partie, nous presentons les proprietes importantes de cette transformation vis-a-vis du codage de la parole, notamment ses aspects temps-frequence permettant de tenir compte des proprietes psychoacoustiques du systeme de perception humaine. Dans la deuxieme partie, nous cherchons a determiner la transformation en ondelettes, optimale pour la compression de la parole. Les experiences ont montre que la transformation en ondelettes discretes orthogonales a support fini constitue une solution ideale pour notre probleme. Nous proposons l'utilisation de l'algorithme des paquets d'ondelettes pour realiser notre codeur de parole. Dans la troisieme partie de cette these, l'etude de plusieurs schemas de codage est presentee. Nous nous focalisons, en particulier, sur la quantification des coefficients d'ondelettes car celle-ci constitue le veritable noyau du codeur. Nous montrons que la quantification vectorielle est particulierement efficace: une tres haute qualite de la parole codee peut etre obtenue avec un debit d'environ 12 kbits/p (bande passante telephonique), alors qu'il faut un debit de 16 kbits/s pour obtenir la meme qualite si l'on utilise la quantification scalaire. Enfin, nous montrons egalement que l'integration du masquage frequentiel permet d'ameliorer sensiblement notre codeur. L'avantage essentiel de cette technique reside dans le fait qu'elle n'utilise pas un modele de production de la parole, ce qui permet la compression de tous les signaux audio. Cette etude peut etre appliquee sur d'autres bandes passantes, plus larges que la bande telephonique, qui permettent d'obtenir de meilleurs resultats

Styles APA, Harvard, Vancouver, ISO, etc.

6

Lolive, Damien Boëffard Olivier Barbot Nelly. « Transformation de l'intonation application à la synthèse de la parole et à la transformation de voix / ». Rennes : [s.n.], 2008. ftp://ftp.irisa.fr/techreports/theses/2008/lolive.pdf.

Texte intégral

Styles APA, Harvard, Vancouver, ISO, etc.

7

Lolive, Damien. « Transformation de l'intonation : application à la synthèse de la parole et à la transformation de voix ». Rennes 1, 2008. ftp://ftp.irisa.fr/techreports/theses/2008/lolive.pdf.

Texte intégral

Résumé :

Les travaux de cette thèse se situent dans le cadre de la transformation de la prosodie en se focalisant sur la fréquence fondamentale, F0, facteur jugé proéminent dans le traitement de la prosodie. En particulier, nous nous intéressons aux différentes étapes nécessaires à la construction d'un tel système : la stylisation, la classification et la transformation des contours mélodiques. Pour chaque étape, nous proposons une méthodologie qui tient compte des problèmes qui se sont posés à l'étape précédente. Tout d'abord, un modèle B-spline est proposé pour la stylisation des contours mélodiques. Ensuite, pour représenter l'espace mélodique du locuteur, une approche par modèles de Markov est introduite. Enfin, une méthodologie de transformation de la prosodie à partir de corpus non parallèles par une technique d'adaptation au locuteur est présentée. Les résultats obtenus tendent à montrer qu'il est nécessaire de traiter la dynamique du F0 et de piloter la transformation par des informations d'ordre morphosyntaxique
The work presented in this thesis lies within the scope of prosody conversion and more particularly the fundamental frequency conversion which is considered as a prominent factor in prosody processing. This document deals with the different steps necessary to build such a conversion system : stylization, clustering and conversion of melodic contours. For each step, we propose a methodology that takes into account the issues and difficulties encountered in the previous one. A B-spline based approach is first proposed to model the melodic contours. Then to represent the melodic space of a speaker, a HMM based approach is introduced. To finish, a prosody transformation methodology using non-parallel corpora based on a speaker adaptation technique is derived. The results we obtain tend to show that it is necessary to model the evolution of the melody and to drive the transformation system by using morpho-syntactic information

Styles APA, Harvard, Vancouver, ISO, etc.

8

Brouté, Alain. « Transformation, parole et ressources de la continuité : méthodologie de l'interaction orale dans l'apprentissage d'une langue étrangère ». Rouen, 2006. http://www.theses.fr/2006ROUEL546.

Texte intégral

Résumé :

Cette thèse présente une approche phénoménologique de l’apprentissage guidé de l’interaction orale de face-à-face en langue étrangère. Une telle approche essaye de montrer comment l’apprentissage en question requiert une continuité interculturelle entre les cadres primaires socioculturels habituels des apprenants et ceux propres à la culture et la langue étrangères. En outre, elle tente de montrer en quoi cet apprentissage s’appuie fondamentalement sur une dynamique intentionnelle, et plus ou moins synchronisée, de deux ou plusieurs paroles qui ne peuvent être évaluées séparément. Il en résulte un modèle d’analyse illustrant l’articulation entre les différents indicateurs de ces paroles communes, dont notamment ceux de la gestualité communicative, et les ressources compensatoires et de traitement langagier qui permettent la continuité entre les langues et les cultures en maintenant et développant le fil de la conversation. Dans le prolongement, grâce à un corpus de deux séries de jeux de rôles enregistrés en vidéo dans des classes d’étudiants débutants en Français Langue Etrangère, cette thèse décrit un ensemble d’observations et propose des analyses en relation avec le modèle développé. Ces analyses débouchent sur quelques suggestions didactiques concrètes en termes d’évaluation et de remédiation, tout en renforçant l’idée d’une nécessaire adaptation au temps réel par le biais d’une approche pratique des interactions orales transformées ou jeux de rôles qui soit la plus improvisée possible
This thesis presents a phenomenological approach to controlled learning of a foreign language in face to face oral interaction. Such an approach endeavours to demonstrate how this type of learning requires intercultural continuity between the customary primary socio-cultural framework of the learners and that of the foreign language and culture. In addition, it attempts to prove that this learning method is based fundamentally on an intentional and more or less synchronised dynamic of two or more words which cannot be evaluated separately. From this stems an analysis model which illustrates the connection between the different indicators of these common words, in particular communicative body language, and compensatory resources and the linguistic treatment which allows there to be continuity between languages and cultures by maintaining and developing the thread of the conversation. In the same way, using a corpus of two series of role plays recorded on video in beginners’ classes of French as a Foreign Language, this thesis makes a series of observations concerning, and offers an analysis of, the model which has been developed. This analysis leads on to some specific didactic suggestions in terms of evaluation and correction, whilst reinforcing the idea of an essential adaptation to real time through a practical approach to transformed oral interaction or role plays which should be improvised to the greatest possible extent

Styles APA, Harvard, Vancouver, ISO, etc.

9

Bous, Frederik. « A neural voice transformation framework for modification of pitch and intensity ». Electronic Thesis or Diss., Sorbonne université, 2023. http://www.theses.fr/2023SORUS382.

Texte intégral

Résumé :

La voix humaine est une grande source de fascination et un objet de recherche depuis plus de 100 ans. Pendant ce temps, de nombreuses technologies ont germées autour de la voix, comme le vocodeur, qui fournit une représentation paramétrique de la voix, couramment utilisée pour la transformation de la voix. Dans cette tradition, les limites des approches basées uniquement sur le traitement du signal sont évidentes : Pour créer des transformations cohérentes, les dépendances entre les différentes propriétés vocales doivent être bien comprises et modélisées avec précision. Modéliser ces corrélations avec des heuristiques obtenues par des études empiriques ne suffit pas à créer des résultats naturels. Il est nécessaire d'extraire systématiquement des informations sur la voix et d'utiliser automatiquement ces informations lors du processus de transformation. Les progrès récents de la puissance de calcul permettent cette analyse systématique des données au moyen de l'apprentissage automatique. Cette thèse utilise donc l'apprentissage automatique pour créer un système neuronal de transformation de la voix. Le système neuronal de transformation de la voix, présenté ici, fonctionne en deux étapes : Tout d'abord, un vocodeur neuronal permet d'établir une correspondance entre la forme d'onde et une représentation mel-spectrogramme des signaux vocaux. Ensuite, un auto-encodeur avec un goulot d'étranglement permet de démêler différentes propriétés de la voix du reste de l'information. L'auto-encodeur permet de modifier une propriété de la voix tout en ajustant automatiquement d'autres caractéristiques de façon à en conserver le réalisme. Dans la première partie de cette thèse, nous comparons différentes approches du vocodage neuronal et nous expliquons pourquoi la représentation mel-spectrogramme est plus adapté pour la transformation neuronale de la voix plutôt que les espaces paramétriques du vocodeur conventionnels. Dans la deuxième partie, nous présentons l'auto-encodeur avec goulot d'étranglement de l'information. L'auto-encodeur crée un code latent indépendant du conditionnement en entrée. En utilisant ce code latent, le synthétiseur peut effectuer la transformation en combinant le code latent original avec une courbe de paramètres modifiée. Nous transformons la voix en utilisant deux paramètres de contrôle : la fréquence fondamentale et le niveau sonore vocal. La transformation de la fréquence fondamentale est un problème qui a longtemps été abordé : Notre approche est comparable aux techniques existantes puisqu'elles utilisent la fréquence fondamentale comme paramètre. Cela nous permet également d'étudier comment l'auto-encodeur modélise les dépendances entre la fréquence fondamentale et d'autres propriétés de la voix dans un environnement connu. Quant au niveau sonore vocal, nous sommes confrontés au problème de la rareté des annotations. Par conséquent, nous proposons d'abord une nouvelle technique d'estimation du niveau sonore vocal dans de grandes bases de données de voix ; puis nous utilisons ces annotations pour entraîner un auto-encodeur avec goulot d'étranglement permettant de modifier le niveau sonore vocal
Human voice has been a great source of fascination and an object of research for over 100 years. During that time numerous technologies have sprouted around the voice, such as the vocoder, which provides a parametric representation of the voice, commonly used for voice transformation. From this tradition, the limitations of purely signal processing based approaches are evident: To create meaningful transformations the codependencies between different voice properties have to be understood well and modelled precisely. Modelling these correlations with heuristics obtained by empiric studies is not sufficient to create natural results. It is necessary to extract information about the voice systematically and use this information during the transformation process automatically. Recent advances in computer hardware permit this systematic analysis of data by means of machine learning. This thesis thus uses machine learning to create a neural voice transformation framework. The proposed neural voice transformation framework works in two stages: First a neural vocoder allows mapping between a raw audio and a mel-spectrogram representation of voice signals. Secondly, an auto-encoder with information bottleneck allows disentangling various voice properties from the remaining information. The auto-encoder allows changing one voice property while automatically adjusting the remaining voice properties. In the first part of this thesis, we discuss different approaches to neural vocoding and reason why the mel-spectrogram is better suited for neural voice transformations than conventional parametric vocoder spaces. In the second part we discuss the information bottleneck auto-encoder. The auto-encoder creates a latent code that is independent of its conditional input. Using the latent code the synthesizer can perform the transformation by combining the original latent code with a modified parameter curve. We transform the voice using two control parameters: the fundamental frequency and the voice level. Transformation of the fundamental frequency is an objective with a long history. Using the fundamental frequency allows us to compare our approach to existing techniques and study how the auto-encoder models the dependency on other properties in a well known environment. For the voice level, we face the problem that annotations hardly exist. Therefore, first we provide a new estimation technique for voice level in large voice databases, and subsequently use the voice level annotations to train a bottleneck auto-encoder that allows changing the voice level

Styles APA, Harvard, Vancouver, ISO, etc.

10

Degottex, Gilles. « Glottal source and vocal-tract separation : estimation of glottal parameters, voice transformation and synthesis using a glottal model ». Paris 6, 2010. http://www.theses.fr/2010PA066399.

Texte intégral

Résumé :

Cette étude s'intéresse au problème de l'inversion d'un modèle de production de la voix étant donné un enregistrement audio de parole pour obtenir une représentation de le source sonore qui est générée au niveau de la glotte, la source glottique, ainsi qu'un représentation des résonances et anti-résonances créées par les cavités du conduit vocal. Cette séparation des éléments composants la voix donne la possibilité de manipuler indépendamment les caractéristiques de la source et le timbre des résonances. Nous supposons que la source glottique est un signal à phase mixte et que la réponse impulsionnelle du filtre du conduit vocal est un signal à minimum de phase. Puis, considérant ces propriétés, différentes méthodes sont proposées pour estimer les paramètres d'un modèle glottique qui minimisent la phase carrée moyenne du résiduel convolutif d'un spectre de parole observé et de son modèle. Une dernière méthode est décrite où un unique paramètre de forme est solution d'une forme quasi fermée du spectre observé. Ces méthodes sont évaluées et comparées avec des méthodes de l'état de l'art en utilisant des signaux synthétiques et electro-glotto-graphiques. Nous proposons également une procédure d'analyse/synthèse qui estime le filtre du conduit vocal en utilisant un spectre observé et sa source estimée. Des tests de préférences ont été menés et leurs résultats sont présentés dans cette étude pour comparer la procédure décrite et d'autres méthodes existantes.

Styles APA, Harvard, Vancouver, ISO, etc.

11

Charpentier, Francis. « Traitement de la parole par analyse-synthese de fourier : application a la synthese par diphones ». Paris, ENST, 1988. http://www.theses.fr/1988ENST0009.

Texte intégral

Résumé :

Ces techniaues sont utilisees dans le but d'obtenir une meilleure qualite de son que celle obtenue par les methodes paramagnetiques habituelles. L'accent est mis sur la double approche suivante: 1) interpretation de la transformee de fourier a court terme comme un banc de filtres et synthese par addition des sorties de ce banc filtre; 2) synthese par superposition et addition de signaux a court terme

Styles APA, Harvard, Vancouver, ISO, etc.

12

Firouzmand, Mohammad. « Modélisation Sinusoïdale à Long Terme du Signal de Parole ». Phd thesis, Grenoble INPG, 2007. http://tel.archives-ouvertes.fr/tel-00211294.

Texte intégral

Résumé :

La modélisation sinusoïdale du signal de parole est usuellement définie à « court terme », c'est-à-dire sur des trames successives de signal d'une durée de l'ordre de 10 à 30 ms. Cette thèse apporte une contribution nouvelle à ce domaine en ajoutant à ce niveau traditionnel de modélisation spectrale un niveau supplémentaire le long de l'axe temporel : on cherche à modéliser les trajectoires de paramètres sinusoïdaux (amplitudes et phases) sur des durées significativement plus longues que celles des trames à court terme (typiquement plusieurs centaines de ms ; on considère dans cette thèse des sections de parole continûment voisées). Nous proposons pour cela d'utiliser différents modèles à long terme à base de fonctions en cosinus discrets et de fonctions polynomiales. L'ajustement des trajectoires est réalisé par une régression au sens des moindres carrés pondérés, les poids de la régression étant déterminés par des critères perceptifs adaptés au traitement à long terme. Pour cette tâche, une série d'algorithmes itératifs est proposée et testée. L'approche à long terme se révèle à la fois efficace et parcimonieuse pour décrire la dynamique des signaux de parole voisés.

Styles APA, Harvard, Vancouver, ISO, etc.

13

Firouzmand, Mohammad. « Modélisation sinusoïdale à long terme du signal de parole ». Phd thesis, Grenoble INPG, 2007. http://www.theses.fr/2007INPG0038.

Texte intégral

Résumé :

La modélisation sinusoïdale du signal de parole est usuellement définie à «court terme », c'est-à-dire sur des trames successives de signal d'une durée de l'ordre de 10 à 30 ms. Cette thèse apporte une contribution nouvelle à ce domaine en ajoutant à ce niveau traditionnel de modélisation spectrale un niveau supplémentaire le long de l'axe temporel : on cherche à modéliser les trajectoires de paramètres sinusoïdaux sur des durées significativement plus longues que celles des trames à court terme (plusieurs centaines de ms). Dans cette étude, nous proposons d'utiliser différents modèles à long terme à base de fonctions en cosinus discrets et polynomiales. L'ajustement ( trajectoires est réalisé par une régression au sens des moindres carrés pondérés, les poids de la régression étant déterminés par des critères perceptifs. Pour cette tâche, une série d'algorithmes itératifs est proposée et testée. L'approche à long terme se révèle à la fois efficace et parcimonieuse pour décrire la dynamique des signaux parole
The sinusoidal modeling of speech signaIs is usually defined on a "short term" basis, i. E. On successive frames of about 10 to 30 ms. This thesis brings a new contribution to this domain by adding to this traditional level spectral modeling an additionnal level along the temporal axis: we model the trajectories of sinusoidal parameters over durations significantly longer than the short-term frames (several hundreds of ms). Ln this study, we propose to use various long term models based on discrete cosine functions and polynomials. The adjustment to the trajectories is carried out by a weighted minimum mean square error regression, the weights of the regression being determined by perceptive criteria. For this task, a series of iterative algorithms is proposed and tested. The 101 term method is shown to be an efficient and parsimonious approach to describe the dynamics of the speech signal

Styles APA, Harvard, Vancouver, ISO, etc.

14

Beller, Grégory. « Analyse et modèle génératif de l'expressivité : application à la Parole et à l'Interprétation musicale ». Phd thesis, Université Pierre et Marie Curie - Paris VI, 2009. http://tel.archives-ouvertes.fr/tel-00431104.

Texte intégral

Résumé :

Cette thèse s'inscrit dans les recherches actuelles sur les émotions et les réactions émotionnelles, sur la modélisation et la transformation de la parole, ainsi que sur l'interprétation musicale. Il semble que la capacité d'exprimer, de simuler et d'identiﬁer des émotions, des humeurs, des intentions ou des attitudes, est fondamentale dans la communication humaine. La facilité avec laquelle nous comprenons l'état d'un personnage, à partir de la seule observation du comportement des acteurs et des sons qu'ils émettent, montre que cette source d'information est essentielle et, parfois même, suffisante dans nos relations sociales. Si l'état émotionnel présente la particularité d'être idiosyncrasique, c'est-à-dire particulier à chaque individu, il n'en va pas de même de la réaction associée qui se manifeste par le geste (mouvement, posture, visage, ...), le son (voix, musique, ...), et qui, elle, est observable par autrui. Ce qui nous permet de penser qu'il est possible de transformer cette réaction dans le but de modiﬁer la perception de l'émotion associée. C'est pourquoi le paradigme d'analyse-transformation-synthèse des réactions émotionnelles est, peu à peu, introduit dans les domaines thérapeutique, commercial, scientiﬁque et artistique. Cette thèse s'inscrit dans ces deux derniers domaines et propose plusieurs contributions. D'un point de vue théorique, cette thèse propose une déﬁnition de l'expressivité (et de l'expression neutre), un nouveau mode de représentation de l'expressivité, ainsi qu'un ensemble de catégories expressives communes à la parole et à la musique. Elle situe l'expressivité parmi le recensement des niveaux d'information disponibles dans l'interprétation qui peut être vu comme un modèle de la performance artistique. Elle propose un modèle original de la parole et de ses constituants, ainsi qu'un nouveau modèle prosodique hiérarchique. D'un point de vue expérimental, cette thèse fournit un protocole pour l'acquisition de données expressives interprétées. Collatéralement, elle rend disponible trois corpus pour l'observation de l'expressivité. Elle fournit une nouvelle mesure statistique du degré d'articulation ainsi que plusieurs résultats d'analyses concernant l'inﬂuence de l'expressivité sur la parole. D'un point de vue technique, elle propose un algorithme de traitement du signal permettant la modiﬁcation du degré d'articulation. Elle présente un système de gestion de corpus novateur qui est, d'ores et déjà, utilisé par d'autres applications du traitement automatique de la parole, nécessitant la manipulation de corpus. Elle montre l'établissement d'un réseau bayésien en tant que modèle génératif de paramètres de transformation dépendants du contexte. D'un point de vue technologique, un système expérimental de transformation, de haute qualité, de l'expressivité d'une phrase neutre, en français, synthétique ou enregistrée, a été produit, ainsi qu'une interface web pour la réalisation d'un test perceptif en ligne. Enﬁn et surtout, d'un point de vue prospectif, cette thèse propose différentes pistes de recherche pour l'avenir, tant sur les plans théorique, expérimental, technique que technologique. Parmi celles-ci, la confrontation des manifestations de l'expressivité dans les interprétations verbales et musicales semble être une voie prometteuse.

Styles APA, Harvard, Vancouver, ISO, etc.

15

Bourdier, Renaud. « Analyse temps/frequence, filtrage et synthese numeriques de signaux de parole : application au filtrage, a la reduction de bruit et a la restauration d'enregistrements anciens ». Le Mans, 1988. http://www.theses.fr/1988LEMA1001.

Texte intégral

Résumé :

Etude des phenomenes temporels et frequentiels apparaissant lors d'une synthese a partir de la modification des spectres deduits de l'analyse par transformee de fourier a court terme (tfct). Les performances de l'implementation par tfct d'une analyse synthese, d'une operation de filtrage invariant ou dependant du temps, et d'une reduction de bruit ont ete caracterisees

Styles APA, Harvard, Vancouver, ISO, etc.

16

Fux, Thibaut. « Vers un système indiquant la distance d'un locuteur par transformation de sa voix ». Thesis, Grenoble, 2012. http://www.theses.fr/2012GRENT120/document.

Texte intégral

Résumé :

Cette thèse porte sur la transformation de la voix d’un locuteur dans l’objectif d’indiquer la distance de celui-ci : une transformation en voix chuchotée pour indiquer une distance proche et une transformation en voix criée pour une distance plutôt éloignée. Nous effectuons dans un premier temps des analyses approfondies pour déterminer les paramètres les plus pertinentes dans une voix chuchotée et surtout dans une voix criée (beaucoup plus difficile). La contribution principale de cette partie est de montrer la pertinence des paramètres prosodiques dans la perception de l’effort vocal dans une voix criée. Nous proposons ensuite des descripteurs permettant de mieux caractériser les contours prosodiques. Pour la transformation proprement dite, nous proposons plusieurs nouvelles règles de transformation qui contrôlent de manière primordiale la qualité des voix transformées. Les résultats ont montré une très bonne qualité des voix chuchotées transformées ainsi que pour des voix criées pour des structures linguistiques relativement simples (CVC, CVCV, etc.)
This thesis focuses on speaker voice transformation in the aim to indicate the distance of it: a spokento-whispered voice transformation to indicate a close distance and a spoken-to-shouted voicetransformation for a rather far distance. We perform at first, in-depth analysis to determine mostrelevant features in whispered voices and especially in shouted voices (much harder). The maincontribution of this part is to show the relevance of prosodic parameters in the perception of vocaleffort in a shouted voice. Then, we propose some descriptors to better characterize the prosodiccontours. For the actual transformation, we propose several new transformation rules whichimportantly control the quality of transformed voice. The results showed a very good quality oftransformed whispered voices and transformed shouted voices for relatively simple linguisticstructures (CVC, CVCV, etc.)

Styles APA, Harvard, Vancouver, ISO, etc.

17

Douros, Ioannis. « Towards a 3 dimensional dynamic generic speaker model to study geometry simplifications of the vocal tract using magnetic resonance imaging data ». Electronic Thesis or Diss., Université de Lorraine, 2020. http://www.theses.fr/2020LORR0115.

Texte intégral

Résumé :

Dans cette thèse, nous avons utilisé les données de l’IRM du conduit vocal pour étudier la production de la parole. La première partie consiste en l’étude de l’impact que le vélum, l’épiglotte et la position de la tête a sur la phonation de cinq voyelles françaises. Des simulations acoustiques ont été utilisées pour comparer les formants des cas étudiés avec la référence afin de mesurer leur impact. Pour cette partie du travail, nous avons utilisé des IRM statiques en 3D. Comme la parole est généralement une phénomène dynamique une question s’est posée, à savoir s’il serait possible de traiter les données 3D afin d’incorporer des informations temporelles de la parole continue. Par conséquent, la deuxième partie présente quelques algorithmes que l’on peut utiliser pour améliorer les données de production de la parole. Plusieurs transformations d’images ont été combinées afin de générer des estimations des formes du conduit vocal qui sont plus informatives que les originales. À ce stade, nous avons envisagé, outre l’amélioration des données de production de la parole, de créer un modèle de référence générique qui pourrait fournir des informations améliorées non pas pour un sujet spécifique, mais globalement pour la parole. C’est pourquoi nous avons consacré la troisième partie l’étude d’un algorithme permettant de créer un atlas spatio-temporel de l’appareil vocal qui peut être utilisé comme référence ou standard pour l’étude de la parole car il est indépendant du locuteur. Enfin, la dernière partie de la thèse, fait référence à une sélection de questions ouvertes du domaine qui restent encore sans réponse, quelques pistes intéressantes que l’on peut développer à partir de cette thèse et quelques approches potentielles qui pourraient être envisager afin de répondre à ces questions
In this thesis we used MRI (Magnetic Resonance Imaging) data of the vocal tract to study speech production. The first part consist of the study of the impact that the velum, the epiglottis and the head position has on the phonation of five french vowels. Acoustic simulations were used to compare the formants of the studied cases with the reference in order to measure their impact. For this part of the work, we used 3D static MR (Magnetic Resonance) images. As speech is usually a dynamic phenomenon, a question arose, whether it would be possible to process the 3D data in order to incorporate dynamic information of continuous speech. Therefore the second part presents some algorithms that one can use in order to enhance speech production data. Several image transformations were combined in order to generate estimations of vocal tract shapes which are more informative than the original ones. At this point, we envisaged apart from enhancing speech production data, to create a generic speaker model that could provide enhanced information not for a specific subject, but globally for speech. As a result, we devoted the third part in the investigation of an algorithm that one can use to create a spatiotemporal atlas of the vocal tract which can be used as a reference or standard speaker for speech studies as it is speaker independent. Finally, the last part of the thesis, refers to a selection of open questions of the field that are still left unanswered, some interesting directions that one can expand this thesis and some potential approaches that could help someone move forward towards these directions

Styles APA, Harvard, Vancouver, ISO, etc.

18

Rekik, Siwar. « Sécurisation de la communication parlée par une techhnique stéganographique ». Thesis, Brest, 2012. http://www.theses.fr/2012BRES0061.

Texte intégral

Résumé :

Une des préoccupations dans le domaine des communications sécurisées est le concept de sécurité de l'information. Aujourd’hui, la réalité a encore prouvé que la communication entre deux parties sur de longues distances a toujours été sujet au risque d'interception. Devant ces contraintes, de nombreux défis et opportunités s’ouvrent pour l'innovation. Afin de pouvoir fournir une communication sécurisée, cela a conduit les chercheurs à développer plusieurs schémas de stéganographie. La stéganographie est l’art de dissimuler un message de manière secrète dans un support anodin. L’objectif de base de la stéganographie est de permettre une communication secrète sans que personne ne puisse soupçonner son existence, le message secret est dissimulé dans un autre appelé medium de couverture qui peut être image, video, texte, audio,…. Cette propriété a motivé les chercheurs à travailler sur ce nouveau champ d’étude dans le but d’élaborer des systèmes de communication secrète résistante à tout type d’attaques. Cependant, de nombreuses techniques ont été développées pour dissimuler un message secret dans le but d’assurer une communication sécurisée. Les contributions majeures de cette thèse sont en premier lieu, de présenter une nouvelle méthode de stéganographie permettant la dissimulation d’un message secret dans un signal de parole. La dissimulation c’est le processus de cacher l’information secrète de façon à la rendre imperceptible pour une partie tierce, sans même pas soupçonner son existence. Cependant, certaines approches ont été étudiées pour aboutir à une méthode de stéganogaraphie robuste. En partant de ce contexte, on s’est intéressé à développer un système de stéganographie capable d’une part de dissimuler la quantité la plus élevée de paramètre tout en gardant la perceptibilité du signal de la parole. D’autre part nous avons opté pour la conception d’un algorithme de stéganographie assez complexe afin d’assurer l’impossibilité d’extraction de l’information secrète dans le cas ou son existence été détecter. En effet, on peut également garantir la robustesse de notre technique de stéganographie à l’aptitude de préservation du message secret face aux tentatives de détection des systèmes de stéganalyse. Notre technique de dissimulation tire son efficacité de l’utilisation de caractéristiques spécifiques aux signaux de parole et àl’imperfection du système auditif humain. Des évaluations comparatives sur des critères objectifs et subjectifs de qualité sont présentées pour plusieurs types de signaux de parole. Les résultats ont révélé l'efficacité du système développé puisque la technique de dissimulation proposée garantit l’imperceptibilité du message secret voire le soupçon de son existence. Dans la suite expérimentale et dans le même cadre de ce travail, la principale application visée par la thèse concerne la transmission de parole sécurisée par un algorithme de stéganographie. Dans ce but il s’est avéré primordial d’utiliser une des techniques de codage afin de tester la robustesse de notre algorithme stéganographique face au processus de codage et de décodage. Les résultats obtenus montrent la possibilité de reconstruction du signal original (contenant des informations secrètes) après codage. Enfin une évaluation de la robustesse de notre technique de stéganographie vis à vis des attaques est faite de façon à optimiser la technique afin d'augmenter le taux de sécurisation. Devant cette nécessité nous avons proposé une nouvelle technique de stéganalyse basée sur les réseaux de neurones AR-TDNN. La technique présentée ici ne permet pas d'extraire l'éventuel message caché, mais simplement de mettre en évidence sa présence
One of the concerns in the field of secure communication is the concept of information security. Today’s reality is still showing that communication between two parties over long distances has always been subject to interception. Providing secure communication has driven researchers to develop several cryptography schemes. Cryptography methods achieve security in order to make the information unintelligible to guarantee exclusive access for authenticated recipients. Cryptography consists of making the signal look garbled to unauthorized people. Thus, cryptography indicates the existence of a cryptographic communication in progress, which makes eavesdroppers suspect the existence of valuable data. They are thus incited to intercept the transmitted message and to attempt to decipher the secret information. This may be seen as weakness in cryptography schemes. In contrast to cryptography, steganography allows secret communication by camouflaging the secret signal in another signal (named the cover signal), to avoid suspicion. This quality motivated the researchers to work on this burning field to develop schemes ensuring better resistance to hostile attackers. The word steganography is derived from two Greek words: Stego (means cover) and graphy (means writing). The two combined words constitute steganography, which means covert writing, is the art of hiding written communications. Several steganography techniques were used to send message secretly during wars through the territories of enemies. The major contributions of this thesis are the following ones. We propose a new method to secure speech communication using the Discrete Wavelet Transforms (DWT) and the Fast Fourier Transform (FFT). Our method exploits first the high frequencies using a DWT, then exploits the low-pass spectral properties of the speech magnitude spectrum to hide another speech signal in the low-amplitude high-frequencies region of the cover speech signal. The proposed method allows hiding a large amount of secret information while rendering the steganalysis more complex. Comparative evaluation based on objective and subjective criteria is introduced for original speech signal, stego-signal and reconstructed secret speech signal after the hiding process. Experimental simulations on both female and male speakers revealed that our approach is capable of producing a stego speech that is indistinguishable from the cover speech. The receiver is still able to recover an intelligible copy of the secret speech message. We used an LPC10 coder to test the effect of the coding techniques on the stego-speech signals. Experimental results prove the efficiency of the used coding technique since intelligibility of the stego-speech is maintained after the encoding and decoding processes. We also advocate a new steganalysis technique to ensure the robustness of our steganography method. The proposed classifier is called Autoregressive time delay neural network (ARTDNN). The purpose of this steganalysis system is to identify the presence or not of embedded information, and does not actually attempt to extract or decode the hidden data. The low detecting rate prove the robustness of our hiding technique

Styles APA, Harvard, Vancouver, ISO, etc.

19

Degottex, Gilles. « Séparation de la source glottique des influences du conduit vocal ». Phd thesis, Université Pierre et Marie Curie - Paris VI, 2010. http://tel.archives-ouvertes.fr/tel-00554763.

Texte intégral

Résumé :

Cette étude s'intéresse au problème de l'inversion d'un modèle de production de la voix pour obtenir, à partir d'un enregistrement audio de parole, une représentation de le source sonore qui est générée au niveau de la glotte, la source glottique, ainsi qu'un représentation des résonances et anti-résonances créées par le conduit vocal. Cette séparation permet de manipuler les éléments composant la voix de façon indépendente. On trouve de nombreuses applications de ce sujet comme celles présentées dans cette étude (transformation de la voix et synthèse de la parole) et bien d'autres comme la conversion d'identité, la synthèse d'expressivité, la restauration de la voix qui peuvent être utilisées dans les technologies de divertissement, des installations sonores, les industries de la musique et du cinéma, les jeux vidéos et autres jouets sonores, la télécommunication, etc. Dans cette étude, nous supposons que les éléments perçus de la voix peuvent être manipulés en utilisant le modèle source-filtre. Dans le domaine spectral, la production de la voix est donc décrite comme une multiplication des spectres de ses éléments, la source glottique, le filtre du conduit vocal et la radiation. La seconde hypothèse utilisée dans cette étude concerne la composante déterministe de la source glottique. En effet, nous supposons qu'un modèle glottique peut schématiser une période de la source glottique. En utilisant une telle description analytique, les spectres d'amplitude et de phase de la source déterministe sont donc liés par les paramètres de forme du modèle glottique. Vis-à-vis de l'état de l'art des méthodes de transformation de la voix et de sa synthèse, le naturel et le contrôle de ces voix devraient donc être améliorés en utilisant un tel modèle. Par conséquent, nous essayons de répondre au trois questions suivantes dans cette étude: 1) Comment estimer un paramètre de forme d'un modèle glottique. 2) Comment estimer le filtre du conduit vocal en utilisant ce modèle glottique. 3) Comment transformer et synthétiser un signal vocal en utilisant toujours ce même modèle. Une attention toute particulière à été portée à la première question. Premièrement, nous supposons que la source glottique est un signal à phase mixte et que la réponse impulsionnelle du filtre du conduit vocal est un signal à minimum de phase. Puis, considérant ces propriétés, différentes méthodes sont proposées qui minimisent la phase carrée moyenne du résiduel convolutif d'un spectre de parole observé et de son modèle. Une dernière méthode est décrite où un unique paramètre de forme est solution d'une forme quasi fermée du spectre observé. De plus, cette étude discute les conditions qu'un modèle glottique et sa paramétrisation doivent satisfaire pour assurer que les paramètres sont estimés de façon fiable en utilisant les méthodes proposées. Ces méthodes sont également évaluées et comparées avec des méthodes de l'état de l'art en utilisant des signaux synthétiques et electro-glotto-graphiques. En utilisant une des méthodes proposées, l'estimation du paramètre de forme est indépendante de la position et de l'amplitude du modèle glottique. En plus, il est montré que cette même méthode surpasse toute les méthodes comparées en terme d'efficacité. Pour répondre à la deuxième et à la troisième question, nous proposons une procédure d'analyse/synthèse qui estime le filtre du conduit vocal en utilisant un spectre observé et sa source estimée. Des tests de préférences ont été menés et leurs résultats sont présentés dans cette étude pour comparer la procédure décrite et d'autres méthodes existantes. En terme de transposition de hauteur perçue, il est montré que la qualité globale des segments voisés d'un enregistrement peut être meilleure pour des facteurs de transposition importants en utilisant la méthode proposée. Il est aussi montré que le souffle perçu d'une voix peut être contrôlé efficacement.

Styles APA, Harvard, Vancouver, ISO, etc.

20

Montacié, Claude. « Décodage acoustico-phonétique : apport de la décomposition temporelle généralisée et de transformations spectrales non linéaires : application à la reconnaissance des mots épelés en continu / ». Paris : École nationale supérieure des télécommunications, 1991. http://catalogue.bnf.fr/ark:/12148/cb35585823n.

Texte intégral

Styles APA, Harvard, Vancouver, ISO, etc.

21

Dickow, Alexander. « Le poète en personnes : Mises en scène de soi et transformations de l'écriture chez Blaise Cendrars, Guillaume Apollinaire et Max Jacob ». Paris 8, 2011. http://www.theses.fr/2011PA083353.

Texte intégral

Résumé :

Cette thèse analyse les enjeux de la diversification des styles et des représentations du poète chez trois écrivains, Blaise Cendrars, Max Jacob et Guillaume Apollinaire. L’essentiel du corpus s’étend de 1912-1919, soit les années de guerre et l’immédiat avant- et après-guerre. La carrière de ces trois poètes prend alors son envol; ce sont des initiateurs de l’avant-garde poétique postsymboliste. L’une des caractéristiques saillantes de leur démarche est de multiplier les représentations de soi souvent divergentes ou contradictoires, accompagnées d’autodérision et/ou d’autopromotion hyperboliques, de porte-parole fictifs ou de transformations stylistiques importantes. Cela va à l’encontre d’une tendance à l’effacement du poète dans la poésie moderne et contemporaine. Mais les deux phénomènes d’effacement et de mise en scène excessive, témoignent d’une même interrogation sur la place du poète dans la société et du monde extérieur à l’art. Face au poème, poser la question « qui parle? » revient à demander à quel titre il parle, de quel droit, depuis quelle position: affaire de valeur et de légitimité. Pour peu que le poète n’ait plus de rôle social ou symbolique clair, il peut se retirer de son poème sous prétexte que la particularité de son existence n’a aucune pertinence, – ou bien profiter de l’indétermination de son statut pour jouer les rôles qui lui plaisent; mage, oracle, soldat, paria, etc. Jacob, Apollinaire et Cendrars optent pour ce jeu de masques qui témoigne à la fois d’une inquiétude – le poète n’a-t-il plus aucune place? – et d’une aspiration à l’universel: parler enfin pour tous – en devenant chacun tour à tour
This dissertation examines the diversification of styles and representations of the poet in the work of three writers, Blaise Cendrars, Max Jacob and Guillaume Apollinaire. The works studied extend from 1912 to 1919, from before to immediately after World War I, when these poets would establish their careers as initiators of the post-Symbolist avant-garde. Their work exhibits proliferating and often contradictory presentations of the poet, often assigned to fictional speakers, hyperbolically self-deprecating and/or self-glorifying, and displaying disorienting shifts in style and technique. These self-presentations run counter to a crucial trend in modern and contemporary poetry, in which the figure of the poet tends to disappear. Yet self-effacement and excessive self-display both bear witness to the same questioning of the poet’s place in society and the world beyond the boundaries of art. To ask « who is speaking » in the poem entails the question of the poet’s value and legitimacy: on what grounds, from which position, with what right the poet speaks. If the poet no longer has a clear social or symbolic role, he may choose to remove himself from the poem under the pretext that his particular existence has no relevance, – but he may also exploit the indeterminacy of his status to play all the roles he desires; mage, oracle, soldier, pariah, etc. Jacob, Apollinaire et Cendrars opt for this masquerade that manifests at once an anxiety – does the poet have no more role to play? – and an aspiration: to become universal, to speak at last for all human beings – by becoming each individual in turn

Styles APA, Harvard, Vancouver, ISO, etc.

22

Göthe, Cecilia. « Dealing with Dragons - parodi eller travesti på de klassiska sagorna ? » Thesis, Stockholm University, Stockholm University, Stockholm University, Stockholm University, 2008. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-26977.

Texte intégral

Résumé :

Uppsatsen är en närläsning av Patricia C. Wredes bok Dealing with Dragons och undersöker huruvida boken i fråga är en parodi eller travesti på de klassiska sagorna, t.ex. Törnrosa och Askungen. Jag tar också reda på om det går att läsa boken på olika sätt beroende på hur stor förkunskap man har om de gamla sagorna. Gérard Genette har skrivit boken Palimpsestes: La littérature au second degré, och jag har med hjälp av en svensk översättning använt mig av hans teorier om hypotext - hypertext, parodi, travesti och transformation. Jag tar även hjälp av Jack Zipes och hans bok The Brothers Grimm - From Enchanted Forests to the Modern World. Dessutom används Barbara Walls bok The Narrator's Voice - The Dilemma of Children's fiction för att reda ut begreppet dubbelt tilltal.

Uppsatsen är indelad i tre delar med tillhörande underrubriker: Inledning, analys och slutdiskussion. Under analysdelen tar jag upp Wredes sätt att använda sig av direkt och indirekt transformation samt om hänvisningarna till bl.a. Grimms sagor är inslag av parodi eller travesti. Metoden jag använder mig av är att visa och analysera utdrag ur boken som är direkt eller indirekt transformerade från sedan länge befintliga sagor eller legender.

Resultatet av analysen når sitt syfte och svarar på frågeställningen. Slutsatsen är att boken Dealing with Dragons till största delen är en parodi på kända sagor, men att inslagen av travesti är nödvändiga och behövs för den roliga och lite snälla tonen som boken tillhandahåller.

Styles APA, Harvard, Vancouver, ISO, etc.

23

Preux, Thibaut. « De l'agrandissement des exploitations agricoles à la transformation des paysages de bocage : analyse comparative des recompositions foncières et paysagères en Normandie ». Thesis, Normandie, 2019. http://www.theses.fr/2019NORMC036/document.

Texte intégral

Résumé :

Paysages emblématiques des campagnes de l’Ouest, les bocages ont connu une série de transformations rapides et importantes ces quarante dernières années : érosion du linéaire de haies, changements des usages du sol, rationalisation et agrandissement du parcellaire, banalisation et massification des bâtiments agricoles, enfrichement des secteurs les plus difficiles à exploiter. L’ampleur des ajustements observés souligne le décalage entre ces formes paysagères héritées d’une longue histoire agraire, et l’évolution des systèmes agricoles qui contribuent à les produire.Si la transformation des paysages de bocage est généralement attribuée au tournant « productiviste » du modèle agricole français, les processus socio-techniques à l’origine de ces évolutions sont plus rarement explicités. L’objet de ce travail est d’évaluer plus spécifiquement la contribution de l’agrandissement des exploitations agricoles à la dynamique d’évolution des paysages bocagers de l’Ouest de la France.Ce travail de géographie s’appuie dans un premier temps sur une analyse statistique à l’échelle du grand Ouest de la France, visant à étudier l’effet des transformations foncières sur les structures spatiales agricoles (assolements, parcellaire, linéaires boisés…). Dans un second temps, les dynamiques paysagères et foncières de quatre espaces d’étude (Bessin, Bocage Virois, Sud Manche, Pays d’Auge), situés en domaine laitier et bocager mais présentant des configurations agricoles variées, ont été étudiées entre 2003 et 2016. Ce travail s’appuie notamment sur un dispositif méthodologique original, articulant au sein d’un système d’information géographique à échelle parcellaire (1) la construction d’un suivi à échelle spatio-temporelle fine des dynamiques paysagères (évolution du maillage bocager, de la trame parcellaire et de l’occupation du sol) et (2) la reconstitution de l’évolution de la mosaïque des parcellaires d’exploitations par appariement de plusieurs millésimes du registre parcellaire graphique. L’exploitation de cette base de données spatio-temporelle a permis de mieux comprendre le rôle de la transformation foncière des exploitations agricoles dans la dynamique des paysages bocagers. Enfin, une enquête de terrain a été réalisée auprès de 150 agriculteurs équitablement répartis dans les quatre espaces d’étude, afin d’appréhender les conséquences sociales, techniques et productives de l’agrandissement à l’échelle des exploitations agricoles, qui diffèrent singulièrement selon le type de trajectoire foncière suivie
Symbolic landscapes of the countryside of the West of France, the bocage landscapes have undergone a series of transformations these last forty years : decrease in hedgerow density, land uses changes, plots extension, normalization and enlargement of farm buildings, spatial extension of wilderness… The intensity of landscape transformations highlights the contradiction between these landscape forms produced by a long agrarian history and the contemporary evolutions of farming systems. The transformation of hedgerow landscapes is generally attributed to the "productivist" turn of the French agricultural model. However, the socio-technical processes behind these changes are more rarely explained.The first purpose of this geography work is to study the effects of changing agricultural systems on agricultural spatial structures, based on a statistical analysis at the scale of the West of France. In a second step, the landscape and land dynamics of four study areas (Bessin, Bocage Virois, Sud Manche, Pays d'Auge), located in the dairy and bocage domain, have been studied between 2003 and 2016. This work is based on an original methodological device, set up in a geographical information system. This structuration of geographic information makes possible to (1) monitor the landscape dynamics (evolution of the hedgerow density, land cover and plot morphology changes) at a fine spatial and temporal scale and (2) to reconstruct the evolution of the mosaic of farm plots, by matching land-parcell identification systems across the time (2007, 2011, 2013). From this spatio-temporal database, we characterized the coevolution of landscape structures and farm territories across the time, in order to better understand the landscape consequences of farm enlargment.Finally, a field survey was carried out among 150 farmers equitably distributed in the four study areas, in order to apprehend the social, technical and productive consequences of the farms enlargment, which differ singularly according to the type of land trajectory followed

Styles APA, Harvard, Vancouver, ISO, etc.

24

Paulin, Pascale. « Les Baka du Gabon dans une dynamique de transformations culturelles- Perspectives linguistiques et anthropologiques ». Thesis, Lyon 2, 2010. http://www.theses.fr/2010LYO20077/document.

Texte intégral

Résumé :

Cette thèse propose une analyse approfondie de la dynamique des changements observés au sein d’une communauté de chasseurs-cueilleurs, les Baka du Gabon. Ce groupe se compose de moins de 1000 individus et parle une langue oubanguienne dans un environnement bantuphone. Une comparaison avec les autres langues du même sous-groupe linguistique met en évidence les spécificités du baka et met au jour des affinités entre cette langue et le monzombo. Ces deux groupes ethnolinguistiques semblent avoir entretenu des relations qui s’inscrivent dans une dynamique d’échange de compétences (chasse-cueillette vs pêche-maîtrise du fer). Ce type de complémentarité se retrouve dans les relations entre les Baka et leurs voisins bantu actuels, dont en particulier les Fang, pour ce qui concerne le Gabon.Le mode de vie des Baka demeure, encore aujourd’hui, largement marqué par la mobilité et la forêt. Toutefois, la sédentarisation imposée par voie gouvernementale, la contigüité avec les Fang de même que l’influence croissante de la mondialisation entraînent des transformations par rapport auxquelles les Baka cherchent à se positionner. Ces dernières touchent la langue (système et utilisation) de même que bon nombre de pratiques socioculturelles (habitat, mobilité, alimentation, subsistance, religion, etc.).La thèse s’efforce d’identifier ces transformations, de les décrire et d’en évaluer l’impact en tenant compte de la diversité des situations. Elle comporte, par ailleurs, une réflexion critique des principes de catégorisation fondée sur l’étude de plusieurs domaines lexicaux (faune, flore, maladie). Certains changements peuvent apparaître en surface sans pour autant remettre en cause, de manière fondamentale, leur attachement à la forêt et à certaines valeurs ancestrales. Toutefois, les différentes pressions exogènes (i.a. sédentarisation, mondialisation) et endogènes (i.a. attitude des individus, transmission) qui déterminent alors le degré d’avancement des différentes transformations, ne doivent pas être sous évaluées en tant qu’elles sont une menace pesant sur la langue, la connaissance de la flore et de la faune et certaines pratiques socioculturelles
This thesis proposes a detailed analysis on the dynamic of change observed among the Baka from Gabon, a hunter-gatherer community. This group is composed of less than 1000 individuals speaking an Ubangian language inside a Bantu environment. By comparing their language with others from the same linguistic sub-group, some singularities from Baka and some resemblance with the Monzombo sub-group can be seen. These two ethnolinguistic groups, Baka and Monzombo groups, seem to have kept close contact based on skill exchanges (hunting/gathering and fishing/iron skills). This interaction is witnessed in the exchanges the Baka population preserves with their current Bantu neighbors, especially with Fang in Gabon.Nowadays, the Baka way of life is still characterized by their mobility and the forest. Nevertheless, due to a non-migratory lifestyle imposed by the State, the proximity with the Fang group and the growing globalization, dramatic changes are inflicted to the Baka community. Changes at which they are trying to adapt. These constraints do not affect only their language (system and use) but also many sociocultural habits such as settlement, mobility, food and means of support or religion.The aim of this thesis is to identify these ongoing transformations, to describe and to evaluate their impact bearing in mind the singularity of many contexts. An argumentative reflection on categorization principles is also proposed on lexical domains such as fauna, flora and diseases. Certain changes could arise without necessarily questioning their bonds to the forest and ancestral values. Nonetheless, both exogenous (globalization and a sedentary life) and endogenous pressures (individual behavior and culture transmission) determining the progress of different transformations should not be under evaluated as being a threat to the language, to the knowledge of the flora and fauna and to certain sociocultural practices

Styles APA, Harvard, Vancouver, ISO, etc.

25

Benmahammed, Younes. « Les séquences figées en arabe classique : séquences figées verbales VSO, étude sémantique et morpho-syntaxique ». Paris 3, 2008. http://www.theses.fr/2008PA030021.

Texte intégral

Résumé :

Nous nous sommes limité, dans notre travail, à étudier les séquences figées arabes verbales du type : VSO =Verbe + Sujet + Objet (fiÔl + fa:Ôil + mafÔu:l bih). Notre travail s'axera sur deux principaux volets : un aperçu théorique et synthétique, d'un côté, et une partie pratique où plusieurs tests (contraintes et transformations) seront appliqués, de l'autre, suivant essentiellement deux approches : a) Approche sémantique : Notre travail consiste à essayer de déterminer les différents types de métaphores ÕalmaÞa:z, métonymies ÕalÕistiÔa:ra:(t), euphémismes Õalkina:ya:(t), etc. Des séquences figées en arabe, y compris le Coran et la Sunna (tradition du Prophète), et leur degré d'opacité/non compositionnalité sémantique. B) Approche morpho-syntaxique : Nous tentons de voir de près les contraintes sémantico-morpho-syntaxiques, d'une part, et les transformations lexico-sémantiques aussi bien que sémantico-syntaxiques, d'autre part, pour déterminer le degré de figement des séquences –selon l'acceptabilité- dans une perspective transformationnelle de la grammaire combinatoire. Le but étant pour ainsi dire d'établir une base de données numérisée des séquences figées en arabe classique, facilitant, entre autres objectifs, tant l'apprentissage de la langue arabe aux étrangers que la traduction
First, we introduce our research and the importance of the subject of frozeness treated and the method adopted in these pages. The second part, concerns the "Theoritical description and a general synthesis" organized in two chapters : one dealing with the terminology that the ancien grammarians and rhetoricians arabophones utilised in their products; the other presentig a summing up of their general and specialised works. In a third time, one will find in the "Practical application of the semantic, morpholocial and syntactic constraints and transformational operations", the tests chosen to -spot and- measure the acceptability degree of the derivative expressions: (1) determination, (2) tense, (3) number, (4) gender, (5) verbal and nominal substitution, (6) insertion, (7) permutation, (8) passivation, (9) nominalisation, (10) negation. In each group of expressions, a series of notation is employed for the degree of the lexical (sometimes semantic and syntactic) acceptability of every derivative sequence. Finally, we close our research by a synthetic conclusion in which are remind the capital points and resualts of our analysis without forgetting some difficulties encouterded and some perspectives for future researches. The objective is to facilatate the translation and the didactic operation via a digital data base

Styles APA, Harvard, Vancouver, ISO, etc.

26

Ishak, Dany. « La conception d'un système ultrasonore passif couche mince pour l'évaluation de l'état vibratoire des cordes vocales ». Thesis, Valenciennes, 2017. http://www.theses.fr/2017VALE0043/document.

Texte intégral

Résumé :

Dans ce travail, une approche de reconnaissance de l’orateur en utilisant un microphone de contact est développée et présentée. L'élément passif de contact est construit à partir d'un matériau piézoélectrique. La position du transducteur piézoélectrique sur le cou de l'individu peut affecter grandement la qualité du signal recueilli et par conséquent les informations qui en sont extraites. Ainsi, le milieu multicouche dans lequel les vibrations des cordes vocales se propagent avant d'être détectées par le transducteur est modélisé. Le meilleur emplacement sur le cou de l’individu pour attacher un élément transducteur particulier est déterminé en mettant en œuvre des techniques de simulation Monte Carlo et, par conséquent, les résultats de la simulation sont vérifiés en utilisant des expériences réelles. La reconnaissance est basée sur le signal généré par les vibrations des cordes vocales lorsqu'un individu parle et non sur le signal vocal à la sortie des lèvres qui est influencé par les résonances dans le conduit vocal. Par conséquent, en raison de la nature variable du signal recueilli, l'analyse a été effectuée en appliquant la technique de transformation de Fourier à court terme pour décomposer le signal en ses composantes de fréquence. Ces fréquences représentent les vibrations des cordes vocales (50-1000 Hz). Les caractéristiques en termes d'intervalle de fréquences sont extraites du spectrogramme résultant. Ensuite, un vecteur 1-D est formé à des fins d'identification. L'identification de l’orateur est effectuée en utilisant deux critères d'évaluation qui sont la mesure de la similarité de corrélation et l'analyse en composantes principales (ACP) en conjonction avec la distance euclidienne. Les résultats montrent qu'un pourcentage élevé de reconnaissance est atteint et que la performance est bien meilleure que de nombreuses techniques existantes dans la littérature
In this work, a speaker recognition approach using a contact microphone is developed and presented. The contact passive element is constructed from a piezoelectric material. In this context, the position of the piezoelectric transducer on the individual’s neck may greatly affect the quality of the collected signal and consequently the information extracted from it. Thus, the multilayered medium in which the sound propagates before being detected by the transducer is modeled. The best location on the individual’ neck to place a particular transducer element is determined by implementing Monte Carlo simulation techniques and consequently, the simulation results are verified using real experiments. The recognition is based on the signal generated from the vocal cords’ vibrations when an individual is speaking and not on the vocal signal at the output of the lips that is influenced by the resonances in the vocal tract. Therefore, due to the varying nature of the collected signal, the analysis was performed by applying the Short Term Fourier Transform technique to decompose the signal into its frequency components. These frequencies represent the vocal folds’ vibrations (50-1000 Hz). The features in terms of frequencies’ interval are extracted from the resulting spectrogram. Then, a 1-D vector is formed for identification purposes. The identification of the speaker is performed using two evaluation criteria, namely, the correlation similarity measure and the Principal Component Analysis (PCA) in conjunction with the Euclidean distance. The results show that a high percentage of recognition is achieved and the performance is much better than many existing techniques in the literature

Styles APA, Harvard, Vancouver, ISO, etc.

27

Aubertin, Marie-Noëlle. « La quête identitaire des livres de chef : la transformation du discours gastronomique québécois en parole originale ». Mémoire, 2010. http://www.archipel.uqam.ca/2920/1/M11371.pdf.

Texte intégral

Résumé :

Lorsque les chefs cuisiniers passent à l'écriture, le livre de cuisine se personnalise et s'articule autour d'un point de vue de praticien de la nourriture pour devenir livre de chef. Ce phénomène est nouveau au Québec et se confirme avec la publication du livre de Daniel Vézina, Ma route des saveurs au Québec (2001) bientôt suivi par ceux de Diane Tremblay, Un privilège à votre table (2004) et de Martin Picard, Restaurant Au pied de cochon: l'album (2006). Cet usage se détache des conditions matérielles de réalisation associées traditionnellement au livre de recettes, bien qu'il en conserve quelques caractéristiques génériques, et se présente plutôt comme un objet contaminé par l'art. Si la gastronomie peut être définie, comme le suggère Pascal Ory, par la combinaison de trois discours (que nous appelons technique, environnemental et esthétique), force est de constater que le livre de chef participe de la création d'une gastronomie québécoise intimement liée aux enjeux d'autorité, d'unicité et d'identité qui composent le rôle social du chef cuisinier et le définissent comme un artiste. L'objet de ce mémoire est d'étudier les discours technique, environnemental et esthétique dans les livres de chef québécois. Ceux-ci ajoutent à la recette un discours d'escorte formé de textes, qui empruntent aux codes littéraires, et d'images, qui empruntent à l'iconographie des beaux-arts. Sur le plan technique, la question du goût ressort et fait comprendre que la recette sert de prétexte au chef pour se distinguer et pour légitimer sa position dans son domaine. Si Vézina, Tremblay et Picard sont chefs autant qu'auteurs, c'est justement parce qu'ils maîtrisent une compétence technique, mais qu'ils peuvent s'en libérer et engager un discours sur leur pratique. Sur le plan environnemental, les chefs mettent de l'avant une rhétorique qui construit un environnement à leur image. Les produits qu'ils utilisent sont tirés du terroir, qui devient alors un lieu idéalisé, proche du lecteur, mais toujours unique. De ce fait, le discours du chef fait entrer la gastronomie dans un processus de patrimonialisation. Sur le plan esthétique, les chefs affirment leur originalité, évoquent leur rôle de créateur, parlent de leur démarche et intègrent différentes formes d'illustrations pour se mettre en scène ou évoquer l'art en général. Ainsi, ils se forgent une identité d'artiste, qui les distingue de l'artisan qu'est le cuisinier. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Daniel Vézina, Diane Tremblay, Martin Picard, Québec, Sociologie du goût, Livre illustré, Livre de cuisine, Chef cuisinier, Gastronomie, Restaurant, Patrimoine, Tourisme.

Styles APA, Harvard, Vancouver, ISO, etc.

28

Basirat, Anahita. « Émergence des représentations perceptives de la parole : Des transformations verbales sensorielles à des éléments de modélisation computationnelle ». Phd thesis, 2010. http://tel.archives-ouvertes.fr/tel-00565893.

Texte intégral

Résumé :

La problématique traitée dans le cadre de cette thèse est celle du liage perceptif en parole, ce qui amène à l'étude des principes de l'analyse de scène de parole (en analogie avec l'analyse de scène auditive). La littérature sur la perception de la parole met en évidence que ces principes sont en partie différents de ceux de l'analyse de scène auditive. Notre objectif dans cette thèse est de mieux caractériser ces principes « spécifiques à la parole ». Le paradigme que nous utilisons est celui de l'Effet de Transformation Verbale. À travers une série d'expériences comportementales et une étude en EEG intracrânienne, nous suggérons que cette organisation est basée sur des principes multisensoriels et perceptuo-moteurs. Nous mettons en œuvre quelques uns de ces mécanismes au sein du modèle psycholinguistique TRACE. Du point de vue théorique, les résultats obtenus dans le cadre de cette thèse s'inscrivent dans PACT (Théorie de la Perception pour le Contrôle de l'Action).

Styles APA, Harvard, Vancouver, ISO, etc.

29

Bahja, Fadoua. « Détection du fondamental de la parole en temps réel : application aux voix pathologiques ». Phd thesis, 2013. http://tel.archives-ouvertes.fr/tel-00927147.

Texte intégral

Résumé :

Cette thèse s'inscrit dans le cadre des travaux de recherche qui visent la détermination de la fréquence fondamentale du signal de parole. La première contribution est relative au développement d'algorithmes de détection du pitch en temps réel à partir d'une autocorrélation circulaire du signal d'excitation glottique. Parmi tous les algorithmes de détection du pitch, décrits dans la littérature, rares sont ceux qui peuvent résoudre correctement tous les problèmes li'es au suivi du contour du pitch. Pour cette raison, nous avons élargi notre champ d'investigation et avons proposé de nouveaux algorithmes fondés sur la transformation en ondelettes. Pour évaluer les performances des algorithmes proposés, nous avons utilisé deux bases de données : Bagshaw et Keele. Les résultats que nous avons obtenus montrent clairement que nos algorithmes surclassent les meilleurs algorithmes de référence décrits dans la littérature. La deuxième contribution de cette thèse concerne la réalisation d'un système de conversion de voix dans le but d'améliorer la voix pathologique. Nous parlons dans ce cas d'un système de correction de voix. Notre principal apport, concernant la conversion vocale, consiste en la prédiction des coefficients cepstraux de Fourier relatifs au signal d'excitation glottique. Grâce à ce nouveau type de prédiction, nous avons pu réaliser des systèmes de conversion de voix dont les résultats, qu'ils soient objectifs ou subjectifs, valident l'approche proposée.

Styles APA, Harvard, Vancouver, ISO, etc.

30

Lorange, Michel. « Sainte-Justine du futur : des patients et des parents parlent aux soignants ». Thèse, 2018. http://hdl.handle.net/1866/22315.

Texte intégral

Styles APA, Harvard, Vancouver, ISO, etc.

31

莊佳玲. « From Traditional Parade to Contemporary Hakka Festival—The Challenge and Transformation of Liujia Xinwanwu Flower Folk Drum Culture ». Thesis, 2016. http://ndltd.ncl.edu.tw/handle/65hw6h.

Texte intégral

Résumé :

碩士
國立新竹教育大學
環境與文化資源學系碩士班
104
The Flower Folk Drum originated at the Xinwawu settlement in Liujia Zhubei in Hsinchu County. At first, it was a leisure entertainment show for farmers. Due to its special form of performance, it gradually became a representative of Hakka culture in Hsinchu. During their performances, the flower folk drum teams of Xinwawu, Liujia would dress in Hakka-style clothes printed with floral patterns. The drum is carried by two people, with one in front, and the other behind it. The one standing in the middle is responsible for hitting the drum. In between, there are also gongs and cymbals. Men and women wear vivid clothes, swinging their hips. Among the drum arrays in Taiwan, it has a high representative status. In 2000, the Hsinchu County Government held the first “International Flower Folk Drum Arts Festival” to promote regional Hakka culture. At first, the festival was held biennially. In addition to promoting cultural legacy, it also aims to bring tourism benefits by attracting passionate visitors. Therefore, in 2009, the Cultural Affairs Bureau of Hsinchu County Government began to hold the International Flower Folk Drum Arts Festival annually. In October every year, during the International Flower Folk Drum Arts Festival, Hakka people would fuse their year-end good harvest seasonal activities into the flower folk drum performance, introducing the Hakka settlement culture to people through folklore activities. As Xinwawu settlement was one of the rare Hakka settlements with a single surname in Liujia, Hsinchu County International Flower Folk Drum Arts Festival demonstrates its special status among the folk arts festivals in Taiwan. This study examines the regional features and cultural implications of Liujia Xinwawe traditional flower folk drum culture. How did this traditional folk parade show culture transform into an international festival with the cultural policy of the government sector? This project explores the essence and novelty of the flower folk drum culture through it transformation. On the one hand, the subsidy of government funds helped establish the Xinwanwu Flower Folk Drum. On the other hand, it transformed the Xinwawu Flower Folk Drum to become a product of the government sector with its promotional policy. If the policy changes or the government is not going to subsidy the folk art, how will the flower folk drum of Xinwawu continue its legacy? This will be a major issue in the future. The Liujia Xinwawu Flower Folk Drum manifests the implications of regional culture, and it represents Hakka people’s belief of following heaven’s way and the principles of nature. From the flower folk drum teams of Xinwawu, we learn about our co-existence together. Between the “tradition” and “innovation”, we have discovered the new values of Liujia Xinwawu Flower Folk Drum.

Styles APA, Harvard, Vancouver, ISO, etc.

32

Booysen, Willem Matheus. « The functions of imagery in narrative preaching ». Thesis, 2001. http://hdl.handle.net/10500/2461.

Texte intégral

Résumé :

This dissertation investigates the validity of the hypothesis that biblical images [imagery] in the narrative model of preaching enhance relevance and recall possibilities of the sermon, filling the open spaces for the listener in a meaningful way. "Imagery" is researched in its application in various genres of the narrative sermon, e.g. the inductive, the narrative as such, metaphor, parable and transformational preaching. In the final analysis, the Midrash hermeneutical model as theoretical exposition and fresh proposition for homiletical possibilities for today was suggested and instruments proposed to aid in the preparaUon of Midrashic narrative sermons.
Philosophy, Practical & Systematic Theology
D.Th. (Practical theology)

Styles APA, Harvard, Vancouver, ISO, etc.

Thèses sur le sujet « Transformation du parole »

Créez une référence correcte selon les styles APA, MLA, Chicago, Harvard et plusieurs autres