Academic literature on the topic 'Alignement phonétique'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Alignement phonétique.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Dissertations / Theses on the topic "Alignement phonétique":

1

Beaudette, David. "Suivi de chansons par reconnaissance automatique de parole et alignement temporel." Mémoire, Université de Sherbrooke, 2010. http://savoirs.usherbrooke.ca/handle/11143/1582.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Le suivi de partition est défini comme étant la synchronisation sur ordinateur entre une partition musicale connue et le signal sonore de l'interprète de cette partition. Dans le cas particulier de la voix chantée, il y a encore place à l'amélioration des algorithmes existants, surtout pour le suivi de partition en temps réel. L'objectif de ce projet est donc d'arriver à mettre en oeuvre un logiciel suiveur de partition robuste et en temps-réel utilisant le signal numérisé de voix chantée et le texte des chansons. Le logiciel proposé utilise à la fois plusieurs caractéristiques de la voix chantée (énergie, correspondance avec les voyelles et nombre de passages par zéro du signal) et les met en correspondance avec la partition musicale en format MusicXML. Ces caractéristiques, extraites pour chaque trame, sont alignées aux unités phonétiques de la partition. En parallèle avec cet alignement à court terme, le système ajoute un deuxième niveau d'estimation plus fiable sur la position en associant une segmentation du signal en blocs de chant à des sections chantées en continu dans la partition. La performance du système est évaluée en présentant les alignements obtenus en différé sur 3 extraits de chansons interprétés par 2 personnes différentes, un homme et une femme, en anglais et en français.
2

Portes, Cristel. "Prosodie et économie du discours : Spécificité phonétique, écologie discursive et portée pragmatique de l'intonation d'implication." Phd thesis, Université de Provence - Aix-Marseille I, 2004. http://tel.archives-ouvertes.fr/tel-00296742.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Se situant à l'interface de la prosodie et du discours, notre recherche a pour objet de déterminer le domaine de variabilité phonétique et la valeur discursive d'un contour intonatif du français : l'intonation d'implication, au moyen de l'observation écologique de l'usage qu'en font les locuteurs dans un corpus fermé de débat radiophonique. A partir de l'identification auditive des occurrences de l'intonation d'implication du corpus en fonction de la description qu'en donne Delattre (1966) nous proposons une analyse qualitative et quantitative de la variabilité de réalisation phonétique de ce contour. Nous montrons que, contre toute attente, ces réalisations sont très souvent confondues avec celles du contour montant continuatif et que l'alignement du pic de fréquence fondamentale sur le noyau syllabique de la dernière syllabe du contour (à gauche pour l'implication, à droite pour le continuatif) est déterminant pour leur différenciation. Nous montrons également que l'intonation d'implication est souvent confondue avec un autre contour montant-descendant dont le pic de fréquence est aligné avec la syllabe pénultième. Une analyse discursive approfondie, menée grâce au modèle proposé par l'Ecole de Genève (Roulet et al., 2001) nous permet de mettre en évidence l'usage spécifique, interactif et argumentatif, que font de ce contour les participants au débat radiophonique. La synthèse de nos analyses prosodique et discursive nous permet de proposer une interprétation compositionnelle de la valeur pragmatique de l'intonation d'implication.
3

Li, Jinyu. "Interaction entre structure rythmique et sens d’agentivité en production de la parole." Electronic Thesis or Diss., Paris 3, 2023. http://www.theses.fr/2023PA030119.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Pour s'adapter aux imprévus lors de la production de la parole, le système moteur intègre les informations sensorielles (ex. le retour auditif), et bénéficie du groupement rythmique, qui est caractérisé par la prosodie. Cependant, le système sensorimoteur d'un locuteur traite différemment les événements acoustiques relatifs à sa propre voix par rapport à ceux d'autrui. Cette thèse vise à examiner la flexibilité de la production de la parole en analysant le rôle organisateur de la prosodie et la sensation subjective d'un locuteur sur le contrôle de sa voix (c.-à-d. le sens d'agentivité relatif à sa voix).Des expériences des perturbations du retour auditif ont été menées chez des locutrices francophones. Avec le retour auditif retardé (DAF), la différence de durée entre les voyelles accentuées et non accentuées s'est accrue, soulignant une plus grande flexibilité durant la production des accents. De plus, le DAF a induit une réorganisation du rythme de la parole avec un renforcement du groupement syllabique. Avec un décalage continu de la fréquence fondamentale (f0) du retour auditif, la majorité des locutrices ont aligné leur f0 sur celle modifiée du retour auditif, suggérant que leur système sensorimoteur aurait traité la voix perçue comme une entrée externe. La présence simultanée du DAF et d'un décalage de la f0 a entraîné une réduction des effets du DAF par rapport à la condition sans décalage de la f0. Cette observation suggère une réduction du sens d'agentivité relatif à la voix chez les locutrices, ainsi qu’une interaction entre l'organisation rythmique et le sens d’agentivité dans les processus sensorimoteurs de production de la parole
To adapt to unforeseen circumstances during speech production, the motor system integrates sensory information (e.g., auditory feedback) and benefits from rhythmic grouping, which is characterized by prosody. However, a speaker's sensorimotor system processes acoustic events related to their own voice differently from those of others. This thesis aims to examine the flexibility of speech production by analyzing the organizing role of both prosody and a speaker's subjective sensation of control over his voice (i.e., the sense of agency related to his voice).Experiments of auditory feedback perturbations were conducted with French-speaking female speakers. With delayed auditory feedback (DAF), the duration difference between accented and unaccented vowels increased, highlighting greater flexibility during accent production. Furthermore, DAF induced a reorganization of speech rhythm with enhanced syllabic grouping. With a constant shift in the fundamental frequency (f0) of auditory feedback, the majority of female speakers aligned their f0 with the modified auditory feedback, suggesting that their sensorimotor system processed the perceived voice as an external input. The simultaneous presence of DAF and an f0 shift resulted in a reduction of DAF effects compared to the condition without an f0 shift. This observation suggests a reduction in the sense of agency related to the voice among female speakers, as well as an interaction between rhythmic organization and sense of agency in sensorimotor processes of speech production
4

Wu, Yaru. "Étude de la réduction segmentale en français parlé à travers différents styles : apports des grands corpus et du traitement automatique de la parole à l’étude du schwa, du /ʁ/ et des réductions à segments multiples." Thesis, Sorbonne Paris Cité, 2018. http://www.theses.fr/2018USPCA078.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Ce travail sur la réduction segmentale (i.e. délétion ou réduction temporelle) en français spontané nous a permis non seulement de proposer deux méthodes de recherche pour les études en linguistique, mais également de nous interroger sur l'influence de différents facteurs de variation sur divers phénomènes de réduction et d'apporter des connaissances sur la propension à la réduction des segments. Nous avons appliqué la méthode descendante qui utilise l'alignement forcé avec variantes lorsqu’il s’agissait de phénomènes de réduction spécifiques. Lorsque ce n'était pas le cas, nous avons utilisé la méthode ascendante qui examine des segments absents et courts. Trois phénomènes de réduction ont été choisis : l'élision du schwa, la chute du /ʁ/ et la propension à la réduction des segments. La méthode descendante a été utilisée pour les deux premiers. Les facteurs en commun étudiés sont le contexte post-lexical, le style, le sexe et la profession. L’élision du schwa en syllabe initiale de mots polysyllabiques et la chute du /ʁ/ post-consonantique en finale de mots ne sont pas toujours influencées par les mêmes facteurs. De même, l’élision du schwa lexical et celle du schwa épenthétique ne sont pas conditionnées par les mêmes facteurs. L’étude sur la propension à la réduction des segments nous a permis d'appliquer la méthode ascendante et d’étudier la réduction des segments de manière générale. Les résultats suggèrent que les liquides et les glides résistent moins à la réduction que les autres consonnes et que les voyelles nasales résistent mieux à la réduction que les voyelles orales. Parmi les voyelles orales, les voyelles hautes arrondies ont tendance à être plus souvent réduites que les autres voyelles orales
This study on segmental reduction (i.e. deletion or temporal reduction) in spontaneous French allows us to propose two research methods for linguistic studies on large corpora, to investigate different factors of variation and to bring new insights on the propensity of segmental reduction. We applied the descendant method using forced alignment with variants when it concerns a specific reduction phenomena. Otherwise, we used the ascendant method using absent and short segments as indicators. Three reduction phenomena are studied: schwa elision, /ʁ/ deletion and the propensity of segmental reduction. The descendant method was used for analyzing schwa elision and /ʁ/ deletion. Common factors used for the two studies are post-lexical context, speech style, sex and profession. Schwas elision at initial syllable position in polysyllabic words and post-consonantal /ʁ/ deletion at word final position are not always conditioned by the same variation factors. Similarly, lexical schwa and epenthetic schwa are not under the influence of the same variation factors. The study on the propensity of segmental reduction allows us to apply the ascendant method and to investigate segmental reduction in general. Results suggest that liquids and glides resist less the reduction procedure than other consonants and nasal vowels resist better reduction procedure than oral vowels. Among oral vowels, high rounded vowels tend to be reduced more often than other oral vowels
5

Mesbahi, Larbi. "Transformation automatique de la parole - Etude des transformations acoustiques." Phd thesis, Université Rennes 1, 2010. http://tel.archives-ouvertes.fr/tel-00547088.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Le travail effectué dans cette thèse s'insère dans le cadre de la conversion automatique de la voix. La problématique générale est de modifier le signal d'un énoncé pour qu'il soit perçu comme prononcé par une autre personne. Les Systèmes de Conversion de Voix (SCV) de l'état de l'art utilisent pour la plupart des modèles de voix probabilistes GMM (Gaussian Mixture Models). Ces SCV utilisent des fonctions de conversion linéaires apprises à partir des GMMs. Elles permettent d'obtenir des voix converties de bonne qualité. Cependant, elles sont soumises à des défauts de conception liées à l'apprentissage de ces modèles. On peut ainsi noter le surlissage (oversmoothing) qui est une généralisation trop poussée et son opposé, le sur-apprentissage (overfitting) qui est une spécialisation trop poussée. Un aspect de cette thèse explore différentes stratégies d'apprentissage des fonctions de conversion. La première piste suivie est la réduction du nombre des paramètres libres de la fonction de conversion. La deuxième propose une alternative aux fonctions de conversion linéaires basées sur des GMMs en recourant aux modèles de transformation non-linéaire à base de réseaux de Neurones (RBF, Radial Basis Functions). Cette thèse s'intéresse d'autre part aux données utilisées pour apprendre les modèles de voix et les transformations. En effet, pour apprendre la fonction de conversion, les données issues des locuteurs source et cible doivent être mises en correspondance. Or, dans la plupart des cas d'utilisation, ces données ne sont pas parallèles. Autrement dit, les deux locuteurs n'ont pas prononcé suffisamment de phrases similaires. Notre proposition consiste à faire correspondre ces données lacunaires en les décomposant en classes acoustiques et en s'appuyant sur l'appariement, classique, des classes acoustiques cibles et sources. Enfin, notre intérêt se porte sur la paramètrisation de la voix car, pour obtenir une haute qualité de voix, il est nécessaire que cette paramètrisation conserve un maximum d'information sur le locuteur. Il s'agit en l'occurrence de l'enveloppe de son signal, obtenue fidèlement par la méthode de True-Envelope. Or, les premières études ont montré que ces données doivent être réduites pour nourrir un modèle probabiliste efficace. Pour cela, nous avons recours à la technique de réduction de dimension d'analyse par composantes principales (PCA, Principal componant analysis). Cette solution s'avère plus efficace lorsqu'on différencie les fonctions de transformation selon la classe phonétique.

To the bibliography