To see the other types of publications on this topic, follow the link: Diarisation de la parole.

Dissertations / Theses on the topic 'Diarisation de la parole'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Diarisation de la parole.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Cui, Can. "Séparation, diarisation et reconnaissance de la parole conjointes pour la transcription automatique de réunions." Electronic Thesis or Diss., Université de Lorraine, 2024. http://www.theses.fr/2024LORR0103.

Full text
Abstract:
La transcription de réunions enregistrées par une antenne de microphones distante est particulièrement difficile en raison de la superposition des locuteurs, du bruit ambiant et de la réverbération. Pour résoudre ces problèmes, nous avons exploré trois approches. Premièrement, nous utilisons un modèle de séparation de sources multicanal pour séparer les locuteurs, puis un modèle de reconnaissance automatique de la parole (ASR) monocanal et mono-locuteur pour transcrire la parole séparée et rehaussée. Deuxièmement, nous proposons un modèle multicanal multi-locuteur de bout-en-bout (MC-SA-ASR), qui s'appuie sur un modèle multi-locuteur monocanal (SA-ASR) existant et inclut un encodeur multicanal par Conformer avec un mécanisme d'attention multi-trame intercanale (MFCCA). Contrairement aux approches traditionnelles qui nécessitent un modèle de rehaussement de la parole multicanal en amont, le modèle MC-SA-ASR traite les microphones distants de bout-en-bout. Nous avons également expérimenté différentes caractéristiques d'entrée, dont le banc de filtres Mel et les caractéristiques de phase, pour ce modèle. Enfin, nous utilisons un modèle de formation de voies et de rehaussement multicanal comme pré-traitement, suivi d'un modèle SA-ASR monocanal pour traiter la parole multi-locuteur rehaussée. Nous avons testé différentes techniques de formation de voies fixe, hybride ou neuronale et proposé d'apprendre conjointement les modèles de formation de voies neuronale et de SA-ASR en utilisant le coût d'apprentissage de ce dernier. En plus de ces méthodes, nous avons développé un pipeline de transcription de réunions qui intègre la détection de l'activité vocale, la diarisation et le SA-ASR pour traiter efficacement les enregistrements de réunions réelles. Les résultats expérimentaux indiquent que, même si l'utilisation d'un modèle de séparation de sources peut améliorer la qualité de la parole, les erreurs de séparation peuvent se propager à l'ASR, entraînant des performances sous-optimales. Une approche guidée de séparation de sources s'avère plus efficace. Notre modèle MC-SA-ASR proposé démontre l'efficacité de l'intégration des informations multicanales et des informations partagées entre les modules d'ASR et de locuteur. Des expériences avec différentes catactéristiques d'entrée révèlent que les modèles appris avec les caractéristiques de Mel Filterbank fonctionnent mieux en termes de taux d'erreur sur les mots (WER) et de taux d'erreur sur les locuteurs (SER) lorsque le nombre de canaux et de locuteurs est faible (2 canaux avec 1 ou 2 locuteurs). Cependant, pour les configurations à 3 ou 4 canaux et 3 locuteurs, les modèles appris sur des caractéristiques de phase supplémentaires surpassent ceux utilisant uniquement les caractéristiques Mel. Cela suggère que les informations de phase peuvent améliorer la transcription du contenu vocal en exploitant les informations de localisation provenant de plusieurs canaux. Bien que MC-SA-ASR basé sur MFCCA surpasse les modèles SA-ASR et MC-ASR monocanal sans module de locuteur, les modèle de formation de voies et de SA-ASR conjointes permet d'obtenir des résultats encore meilleurs. Plus précisément, l'apprentissage conjoint de la formation de voies neuronale et de SA-ASR donne les meilleures performances, ce qui indique que l'amélioration de la qualité de la parole pourrait être une approche plus directe et plus efficace que l'utilisation d'un modèle MC-SA-ASR de bout-en-bout pour la transcription de réunions multicanales. En outre, l'étude du pipeline de transcription de réunions réelles souligne le potentiel pour des meilleurs modèles de bout-en-bout. Dans notre étude sur l'amélioration de l'attribution des locuteurs par SA-ASR, nous avons constaté que le module d'ASR n'est pas sensible aux modifications du module de locuteur. Cela met en évidence la nécessité d'architectures améliorées qui intègrent plus efficacement l'ASR et l'information de locuteur
Far-field microphone-array meeting transcription is particularly challenging due to overlapping speech, ambient noise, and reverberation. To address these issues, we explored three approaches. First, we employ a multichannel speaker separation model to isolate individual speakers, followed by a single-channel, single-speaker automatic speech recognition (ASR) model to transcribe the separated and enhanced audio. This method effectively enhances speech quality for ASR. Second, we propose an end-to-end multichannel speaker-attributed ASR (MC-SA-ASR) model, which builds on an existing single-channel SA-ASR model and incorporates a multichannel Conformer-based encoder with multi-frame cross-channel attention (MFCCA). Unlike traditional approaches that require a multichannel front-end speech enhancement model, the MC-SA-ASR model handles far-field microphones in an end-to-end manner. We also experimented with different input features, including Mel filterbank and phase features, for that model. Lastly, we incorporate a multichannel beamforming and enhancement model as a front-end processing step, followed by a single-channel SA-ASR model to process the enhanced multi-speaker speech signals. We tested different fixed, hybrid, and fully neural network-based beamformers and proposed to jointly optimize the neural beamformer and SA-ASR models using the training objective for the latter. In addition to these methods, we developed a meeting transcription pipeline that integrates voice activity detection, speaker diarization, and SA-ASR to process real meeting recordings effectively. Experimental results indicate that, while using a speaker separation model can enhance speech quality, separation errors can propagate to ASR, resulting in suboptimal performance. A guided speaker separation approach proves to be more effective. Our proposed MC-SA-ASR model demonstrates efficiency in integrating multichannel information and the shared information between the ASR and speaker blocks. Experiments with different input features reveal that models trained with Mel filterbank features perform better in terms of word error rate (WER) and speaker error rate (SER) when the number of channels and speakers is low (2 channels with 1 or 2 speakers). However, for settings with 3 or 4 channels and 3 speakers, models trained with additional phase information outperform those using only Mel filterbank features. This suggests that phase information can enhance ASR by leveraging localization information from multiple channels. Although MFCCA-based MC-SA-ASR outperforms the single-channel SA-ASR and MC-ASR models without a speaker block, the joint beamforming and SA-ASR model further improves the performance. Specifically, joint training of the neural beamformer and SA-ASR yields the best performance, indicating that improving speech quality might be a more direct and efficient approach than using an end-to-end MC-SA-ASR model for multichannel meeting transcription. Furthermore, the study of the real meeting transcription pipeline underscores the potential for better end-to-end models. In our investigation on improving speaker assignment in SA-ASR, we found that the speaker block does not effectively help improve the ASR performance. This highlights the need for improved architectures that more effectively integrate ASR and speaker information
APA, Harvard, Vancouver, ISO, and other styles
2

Soldi, Giovanni. "Diarisation du locuteur en temps réel pour les objets intelligents." Electronic Thesis or Diss., Paris, ENST, 2016. http://www.theses.fr/2016ENST0061.

Full text
Abstract:
La diarisation du locuteur en temps réel vise à détecter "qui parle maintenant" dans un flux audio donné. La majorité des systèmes de diarisation en ligne proposés a mis l'accent sur des domaines moins difficiles, tels que l’émission des nouvelles et discours en plénière, caractérisé par une faible spontanéité. La première contribution de cette thèse est le développement d'un système de diarisation du locuteur complètement un-supervisé et adaptatif en ligne pour les données de réunions qui sont plus difficiles et spontanées. En raison des hauts taux d’erreur de diarisation, une approche semi-supervisé pour la diarisation en ligne, ou les modèles des interlocuteurs sont initialisés avec une quantité modeste de données étiquetées manuellement et adaptées par une incrémentale maximum a-posteriori adaptation (MAP) procédure, est proposée. Les erreurs obtenues peuvent être suffisamment bas pour supporter des applications pratiques. La deuxième partie de la thèse aborde le problème de la normalisation phonétique pendant la modélisation des interlocuteurs avec petites quantités des données. Tout d'abord, Phone Adaptive Training (PAT), une technique récemment proposé, est évalué et optimisé au niveau de la modélisation des interlocuteurs et dans le cadre de la vérification automatique du locuteur (ASV) et est ensuite développée vers un système entièrement un-supervise en utilisant des transcriptions de classe acoustiques générées automatiquement, dont le nombre est contrôlé par analyse de l'arbre de régression. PAT offre des améliorations significatives dans la performance d'un système ASV iVector, même lorsque des transcriptions phonétiques précises ne sont pas disponibles
On-line speaker diarization aims to detect “who is speaking now" in a given audio stream. The majority of proposed on-line speaker diarization systems has focused on less challenging domains, such as broadcast news and plenary speeches, characterised by long speaker turns and low spontaneity. The first contribution of this thesis is the development of a completely unsupervised adaptive on-line diarization system for challenging and highly spontaneous meeting data. Due to the obtained high diarization error rates, a semi-supervised approach to on-line diarization, whereby speaker models are seeded with a modest amount of manually labelled data and adapted by an efficient incremental maximum a-posteriori adaptation (MAP) procedure, is proposed. Obtained error rates may be low enough to support practical applications. The second part of the thesis addresses instead the problem of phone normalisation when dealing with short-duration speaker modelling. First, Phone Adaptive Training (PAT), a recently proposed technique, is assessed and optimised at the speaker modelling level and in the context of automatic speaker verification (ASV) and then is further developed towards a completely unsupervised system using automatically generated acoustic class transcriptions, whose number is controlled by regression tree analysis. PAT delivers significant improvements in the performance of a state-of-the-art iVector ASV system even when accurate phonetic transcriptions are not available
APA, Harvard, Vancouver, ISO, and other styles
3

Mariotte, Théo. "Traitement automatique de la parole en réunion par dissémination de capteurs." Electronic Thesis or Diss., Le Mans, 2024. http://www.theses.fr/2024LEMA1001.

Full text
Abstract:
Ces travaux de thèse se concentrent sur le traitement automatique de la parole, et plus particulièrement sur la diarisation en locuteurs. Cette tâche nécessite de segmenter le signal afin d'identifier des évènements tels que la présence de parole, de parole superposée ou de changements de locuteur. Cette recherche se focalise sur le cas où le signal est capté par un dispositif placé au centre d'un groupe de locuteurs, comme lors de réunions. Ces conditions entraînent une dégradation de la qualité des signaux en raison de l'éloignement des sources sonores (parole distante).Afin de pallier cette dégradation, une approche consiste à enregistrer le signal à l'aide d'un ensemble de microphones formant une antenne acoustique. Le signal multicanal obtenu permet d'obtenir des informations sur la répartition spatiale du champ acoustique. Deux axes de recherche sont explorés pour la segmentation de la parole à l'aide d'antecnnes de microphones.Le premier axe introduit une méthode combinant des caractéristiques acoustiques avec des caractéristiques spatiales. Un nouveau jeu de caractéristiques, basé sur le formalisme des harmoniques circulaires, est proposé. Cette approche améliore les performances de segmentation en conditions distantes, tout en réduisant le nombre de paramètres des modèles et en garantissant une certaine robustesse en cas de désactivation de certains microphones.Le second axe propose plusieurs approches de combinaison des canaux en utilisant des mécanismes d'auto-attention. Différents modèles, inspirés d'une architecture existante, sont développés. La combinaison de canaux améliore également la segmentation en conditions distantes. Deux de ces approches rendent l'extraction de caractéristiques plus interprétable. Les systèmes de segmentation de la parole distante proposés améliorent également la diarisation en locuteurs.La combinaison de canaux montre une faible robustesse en cas de changement de géométrie de l'antenne en phase d'évaluation. Pour y remédier, une procédure d'apprentissage est proposée, qui améliore la robustesse en présence d'une antenne non conforme.Finalement, les travaux menés ont permis d'identifier un manque dans les jeux de données publics disponibles pour le traitement automatique de la parole distante. Un protocole d'acquisition est introduit pour l'acquisition de signaux en réunions et intégrant l'annotation de la position des locuteurs en plus de la segmentation.En somme, ces travaux visent à améliorer la qualité de la segmentation de la parole distante multicanale. Les méthodes proposées exploitent l'information spatiale fournie par les antennes de microphones en garantissant une certaine robustesse au nombre de microphones disponibles
This thesis work focuses on automatic speech processing, and more specifically on speaker diarization. This task requires the signal to be segmented to identify events such as voice activity, overlapped speech, or speaker changes. This work tackles the scenario where the signal is recorded by a device located in the center of a group of speakers, as in meetings. These conditions lead to a degradation in signal quality due to the distance between the speakers (distant speech).To mitigate this degradation, one approach is to record the signal using a microphone array. The resulting multichannel signal provides information on the spatial distribution of the acoustic field. Two lines of research are being explored for speech segmentation using microphone arrays.The first introduces a method combining acoustic features with spatial features. We propose a new set of features based on the circular harmonics expansion. This approach improves segmentation performance under distant speech conditions while reducing the number of model parameters and improving robustness in case of change in the array geometry.The second proposes several approaches that combine channels using self-attention. Different models, inspired by an existing architecture, are developed. Combining channels also improves segmentation under distant speech conditions. Two of these approaches make feature extraction more interpretable. The proposed distant speech segmentation systems also improve speaker diarization.Channel combination shows poor robustness to changes in the array geometry during inference. To avoid this behavior, a learning procedure is proposed, which improves the robustness in case of array mismatch.Finally, we identified a gap in the public datasets available for distant multichannel automatic speech processing. An acquisition protocol is introduced to build a new dataset, integrating speaker position annotation in addition to speaker diarization.Thus, this work aims to improve the quality of multichannel distant speech segmentation. The proposed methods exploit the spatial information provided by microphone arrays while improving the robustness in case of array mismatch
APA, Harvard, Vancouver, ISO, and other styles
4

Milner, Rosanna Margaret. "Using deep neural networks for speaker diarisation." Thesis, University of Sheffield, 2016. http://etheses.whiterose.ac.uk/16567/.

Full text
Abstract:
Speaker diarisation answers the question “who spoke when?” in an audio recording. The input may vary, but a system is required to output speaker labelled segments in time. Typical stages are Speech Activity Detection (SAD), speaker segmentation and speaker clustering. Early research focussed on Conversational Telephone Speech (CTS) and Broadcast News (BN) domains before the direction shifted to meetings and, more recently, broadcast media. The British Broadcasting Corporation (BBC) supplied data through the Multi-Genre Broadcast (MGB) Challenge in 2015 which showed the difficulties speaker diarisation systems have on broadcast media data. Diarisation is typically an unsupervised task which does not use auxiliary data or information to enhance a system. However, methods which do involve supplementary data have shown promise. Five semi-supervised methods are investigated which use a combination of inputs: different channel types and transcripts. The methods involve Deep Neural Networks (DNNs) for SAD, DNNs trained for channel detection, transcript alignment, and combinations of these approaches. However, the methods are only applicable when datasets contain the required inputs. Therefore, a method involving a pretrained Speaker Separation Deep Neural Network (ssDNN) is investigated which is applicable to every dataset. This technique performs speaker clustering and speaker segmentation using DNNs successfully for meeting data and with mixed results for broadcast media. The task of diarisation focuses on two aspects: accurate segments and speaker labels. The Diarisation Error Rate (DER) does not evaluate the segmentation quality as it does not measure the number of correctly detected segments. Other metrics exist, such as boundary and purity measures, but these also mask the segmentation quality. An alternative metric is presented based on the F-measure which considers the number of hypothesis segments correctly matched to reference segments. A deeper insight into the segment quality is shown through this metric.
APA, Harvard, Vancouver, ISO, and other styles
5

Sinclair, Mark. "Speech segmentation and speaker diarisation for transcription and translation." Thesis, University of Edinburgh, 2016. http://hdl.handle.net/1842/20970.

Full text
Abstract:
This dissertation outlines work related to Speech Segmentation – segmenting an audio recording into regions of speech and non-speech, and Speaker Diarization – further segmenting those regions into those pertaining to homogeneous speakers. Knowing not only what was said but also who said it and when, has many useful applications. As well as providing a richer level of transcription for speech, we will show how such knowledge can improve Automatic Speech Recognition (ASR) system performance and can also benefit downstream Natural Language Processing (NLP) tasks such as machine translation and punctuation restoration. While segmentation and diarization may appear to be relatively simple tasks to describe, in practise we find that they are very challenging and are, in general, ill-defined problems. Therefore, we first provide a formalisation of each of the problems as the sub-division of speech within acoustic space and time. Here, we see that the task can become very difficult when we want to partition this domain into our target classes of speakers, whilst avoiding other classes that reside in the same space, such as phonemes. We present a theoretical framework for describing and discussing the tasks as well as introducing existing state-of-the-art methods and research. Current Speaker Diarization systems are notoriously sensitive to hyper-parameters and lack robustness across datasets. Therefore, we present a method which uses a series of oracle experiments to expose the limitations of current systems and to which system components these limitations can be attributed. We also demonstrate how Diarization Error Rate (DER), the dominant error metric in the literature, is not a comprehensive or reliable indicator of overall performance or of error propagation to subsequent downstream tasks. These results inform our subsequent research. We find that, as a precursor to Speaker Diarization, the task of Speech Segmentation is a crucial first step in the system chain. Current methods typically do not account for the inherent structure of spoken discourse. As such, we explored a novel method which exploits an utterance-duration prior in order to better model the segment distribution of speech. We show how this method improves not only segmentation, but also the performance of subsequent speech recognition, machine translation and speaker diarization systems. Typical ASR transcriptions do not include punctuation and the task of enriching transcriptions with this information is known as ‘punctuation restoration’. The benefit is not only improved readability but also better compatibility with NLP systems that expect sentence-like units such as in conventional machine translation. We show how segmentation and diarization are related tasks that are able to contribute acoustic information that complements existing linguistically-based punctuation approaches. There is a growing demand for speech technology applications in the broadcast media domain. This domain presents many new challenges including diverse noise and recording conditions. We show that the capacity of existing GMM-HMM based speech segmentation systems is limited for such scenarios and present a Deep Neural Network (DNN) based method which offers a more robust speech segmentation method resulting in improved speech recognition performance for a television broadcast dataset. Ultimately, we are able to show that the speech segmentation is an inherently ill-defined problem for which the solution is highly dependent on the downstream task that it is intended for.
APA, Harvard, Vancouver, ISO, and other styles
6

Kounadis-Bastian, Dionyssos. "Quelques contributions pour la séparation et la diarisation de sources audio dans des mélanges multicanaux convolutifs." Thesis, Université Grenoble Alpes (ComUE), 2017. http://www.theses.fr/2017GREAM012/document.

Full text
Abstract:
Dans cette thèse, nous abordons le problème de la séparation de sources audio dans des mélanges convolutifs multicanaux et sous-déterminés,en utilisant une modélisation probabiliste.Nous nous concentrons sur trois aspects,et nous apportons trois contributions.D’abord, nous nous inspirons du modèle Gaussien local par factorisation en matrices non-négatives (LGM-with-NMF), qui est un modéle empiriquement validé pour représenter un signal audio.Nous proposons une extension Bayésienne de ce modèle, qui permet de surpasser certaines limitations du modèle NMF. Nous incorporons cette représentation dans un cadre de séparation audio multicanaux, et le comparons avec l’état de l’art sur des tâches de séparation. Nous obtenons des résultats prometteurs. Deuxièmement, nous étudions comment séparer des mélanges audio de sources et/ou des capteurs en mouvement. Ces déplacements rendent le chemin acoustique entre les sources et les microphones variant en cours du temps.L’adressage des mélanges convolutifs et variant au cours du temps semble rare dans la littérature. Ainsi, nous partons d’une méthode état de l’art utilisant LGM-with-NMF, développée pour la séparation de mélanges invariants (sources et microphones statiques). Nous proposons a ceci une extension qui utilise un filtre de Kalman pour suivre le chemin acoustique au cours du temps.La méthode proposée est comparée à une adaptation bloc par bloc d’une méthode de l’état de l’art appliquée sur des intervalles de temps,et adonné des résultats exceptionnels sur les mélanges simulés et les mélanges du monde réel. Enfin, nous investiguons les similitudes entre la séparation et la diarisation audio. La diarisation audio est le problème de l’annotation des intervalles d’un mélange audio, auxquels chaque locuteur/source est émettant. La plupart des méthodes de séparation supposent toutes les sources à émettant continuellement. Une hypothèse qui peut donner lieu à de fausses estimations,durant les intervalles au cours desquels cette source n’émettait pas. Notre objectif est que diarisation puisse aider à résoudre la séparation, en indiquant les sources qui émettent chaque intervalle de temps.Dans cette mesure, nous concevons une cadre commun pour traiter simultanément la diarisation et la séparation du mélange audio. Ce cadre incorpore,un modèle de Markov caché pour suivre les activités des sources,au sein d’une méthode de séparation LGM-with-NMF.Nous comparons l’algorithme proposé, à l’état de l’art sur des tâches de séparation et de diarisation. Nous obtenons des performances comparables avec l’état de l’art pour la séparation, et supérieures pour la diarisation
In this thesis we address the problem of audio source separation (ASS) for multichannel and underdetermined convolutive mixtures through probabilistic modeling. We focus on three aspects of the problem and make three contributions. Firstly, inspired from the empirically well validated representation of an audio signal, that is know as local Gaussian signal model (LGM) with non-negative matrix factorization (NMF), we propose a Bayesian extension to this, that overcomes some of the limitations of the NMF. We incorporate this representation in a multichannel ASS framework and compare it with the state of the art in ASS, yielding promising results.Secondly, we study how to separate mixtures of moving sources and/or of moving microphones.Movements make the acoustic path between sources and microphones become time-varying.Addresing time-varying audio mixtures appears is not so popular in the ASS literature.Thus, we begin from a state of the art LGM-with-NMF method designed for separating time-invariant audiomixtures and propose an extension that uses a Kalman smoother to track the acoustic path across time.The proposed method is benchmarked against a block-wise adaptation of that state of the art (ran on time segments),and delivers competitive results on both simulated and real-world mixtures.Lastly, we investigate the link between ASS and the task of audio diarisation.Audio diarisation is the recognition of the time intervals of activity of every speaker/source in the mix.Most state of the art ASS methods consider the sources ceaselssly emitting; A hypothesis that can result in spurious signal estimates for a source, in intervals where that source was not emitting.Our aim is that diarisation can aid ASS by indicating the emitting sources at each time frame.To that extent we design a joint framework for simultaneous diarization and ASS,that incorporates a hidden Markov model (HMM) to track the temporal activity of the sources, within a state of the art LGM-with-NMF ASS framework.We compare the proposed method with the state of the art in ASS and audio diarisation tasks.We obtain performances comparable, with the state of the art, in terms of separation and outperformant in terms of diarisation
APA, Harvard, Vancouver, ISO, and other styles
7

Tevissen, Yannis. "Diarisation multimodale : vers des modèles robustes et justes en contexte réel." Electronic Thesis or Diss., Institut polytechnique de Paris, 2023. http://www.theses.fr/2023IPPAS014.

Full text
Abstract:
La diarisation du locuteur, c'est à dire la tache de déterminer automatiquement « qui parle, quand ? » dans un enregistrement audio ou vidéo, est un des piliers des systèmes modernes d'analyse des conversations. A la télévision, les contenus diffusés sont divers et couvrent à peu près tous les types de conversations, de la discussion calme entre deux personnes, aux débats passionnés, en passant par les interviews en terrain de guerre. L'analyse de ces contenus, réalisée par la société Newsbridge, requiert, en vue de leur archivage et de leur indexation, des méthodes de traitement robustes et justes. Dans ce travail, nous présentons deux nouvelles méthodes permettant d'améliorer la robustesse des systèmes via des approches de fusion. La première se concentre sur la détection d'activité vocale, prétraitement nécessaire à tout système de diarisation. La seconde est une approche multimodale qui tire notamment parti des dernières avancées en traitement du langage naturel. Nous voyons également que les récentes avancées des systèmes de diarisation rendent l'utilisation de la diarisation du locuteur réaliste y compris dans des secteurs critiques tels que l'analyse de larges archives audiovisuelles ou le maintien à domicile de personnes âgées. Enfin ce travail présente une nouvelle méthode d'évaluation de la justesse algorithmique de la diarisation du locuteur en vue de rendre son utilisation plus responsable
Speaker diarization, or the task of automatically determining "who spoke, when?" in an audio or video recording, is one of the pillars of modern conversation analysis systems. On television, the content broadcasted is very diverse and covers about every type of conversation, from calm discussions between two people to impassioned debates and wartime interviews. The archiving and indexing of this content, carried out by the Newsbridge company, requires robust and fair processing methods. In this work, we present two new methods for improving systems' robustness via fusion approaches. The first method focuses on voice activity detection, a necessary pre-processing step for every diarization system. The second is a multimodal approach that takes advantage of the latest advances in natural language processing. We also show that recent advances in diarization systems make the use of speaker diarization realistic, even in critical sectors such as the analysis of large audiovisual archives or the home care of the elderly. Finally, this work shows a new method for evaluating the algorithmic fairness of speaker diarization, with the objective to make its use more responsible
APA, Harvard, Vancouver, ISO, and other styles
8

Ouni, Slim. "Parole Multimodale : de la parole articulatoire à la parole audiovisuelle." Habilitation à diriger des recherches, Université de Lorraine, 2013. http://tel.archives-ouvertes.fr/tel-00927119.

Full text
Abstract:
La communication parlée est par essence multimodale. Le signal acoustique véhicule la modalité auditive, et l'image la modalité visuelle et gestuelle (déformations du visage). Le signal de parole est en effet la conséquence des déformations du conduit vocal sous l'effet du mouvement de la mâchoire, des lèvres, de la langue, etc.. pour moduler le signal d'excitation produit par les cordes vocales ou les turbulences aérodynamiques. Ces déformations sont visibles au niveau du visage (lèvres, joues, mâchoire) grâce à la coordination des différents muscles orofaciaux et de la déformation de la peau induite par ces derniers. La modalité visuelle permet de fournir des informations complémentaires au signal acoustique, et elle devient indispensable dans le cas où le signal acoustique est dégradé, comme c'est le cas chez les malentendants, ou en milieu bruité. D'autres modalités peuvent être liées à la parole, comme les mouvements des sourcils et les différents gestes qui expriment l'émotion. Cette dernière modalité suprasegmentale peut, comme la modalité visuelle, compléter le message acoustique ou acoustique-visuel. Cet exposé présentera les travaux que je mène sur la parole multimodale. Ce caractère multimodal de la communication parlée est traité de deux façons différentes : (1) étudier les deux composantes articulatoire et acoustique de la parole. En effet, je m'intéresse à la caractérisation articulatoire des sons et à l'étude du lien entre l'espace articulatoire et l'espace acoustique. En particulier, je m'intéresse à la récupération de l'évolution temporelle du conduit vocal à partir du signal acoustique (aussi appelée inversion acoustique-articulatoire) et à l'étude de la caractérisation articulatoire de la parole par l'analyse de corpus de données articulatoires. (2) étudier les deux composantes acoustique et visuelle. Dans ce cadre, je m'intéresse à l'effet de la déformation du conduit vocal sur l'apparence du visage qui véhicule le message visuel. La synthèse acoustique-visuelle est un cadre qui permet d'étudier cet aspect. De plus, l'étude de l'intelligibilité audiovisuelle permet de mieux comprendre les mécanismes de la communication audiovisuelle, mais également d'évaluer le système de synthèse acoustique-visuelle. Enfin, je présenterai mon programme de recherche qui porte sur la parole multimodale expressive que je propose d'étudier globalement, c.-à-d. en considérant les composantes articulaire, acoustique et visuelle ainsi que l'expressivité intrinsèque de celles-ci, simultanément. Je propose en particulier d'aborder la modélisation de la dynamique articulatoire et faciale de la parole pour produire de la parole combinée avec les expressions faciales.
APA, Harvard, Vancouver, ISO, and other styles
9

Zwyssig, Erich Paul. "Speech processing using digital MEMS microphones." Thesis, University of Edinburgh, 2013. http://hdl.handle.net/1842/8287.

Full text
Abstract:
The last few years have seen the start of a unique change in microphones for consumer devices such as smartphones or tablets. Almost all analogue capacitive microphones are being replaced by digital silicon microphones or MEMS microphones. MEMS microphones perform differently to conventional analogue microphones. Their greatest disadvantage is significantly increased self-noise or decreased SNR, while their most significant benefits are ease of design and manufacturing and improved sensitivity matching. This thesis presents research on speech processing, comparing conventional analogue microphones with the newly available digital MEMS microphones. Specifically, voice activity detection, speaker diarisation (who spoke when), speech separation and speech recognition are looked at in detail. In order to carry out this research different microphone arrays were built using digital MEMS microphones and corpora were recorded to test existing algorithms and devise new ones. Some corpora that were created for the purpose of this research will be released to the public in 2013. It was found that the most commonly used VAD algorithm in current state-of-theart diarisation systems is not the best-performing one, i.e. MLP-based voice activity detection consistently outperforms the more frequently used GMM-HMM-based VAD schemes. In addition, an algorithm was derived that can determine the number of active speakers in a meeting recording given audio data from a microphone array of known geometry, leading to improved diarisation results. Finally, speech separation experiments were carried out using different post-filtering algorithms, matching or exceeding current state-of-the art results. The performance of the algorithms and methods presented in this thesis was verified by comparing their output using speech recognition tools and simple MLLR adaptation and the results are presented as word error rates, an easily comprehensible scale. To summarise, using speech recognition and speech separation experiments, this thesis demonstrates that the significantly reduced SNR of the MEMS microphone can be compensated for with well established adaptation techniques such as MLLR. MEMS microphones do not affect voice activity detection and speaker diarisation performance.
APA, Harvard, Vancouver, ISO, and other styles
10

Vermigli, Vania <1975&gt. "Parole parole parole… On connait la chanson omaggio ad Alain Resnais e alla musica francese del ‘900." Master's Degree Thesis, Università Ca' Foscari Venezia, 2020. http://hdl.handle.net/10579/17114.

Full text
Abstract:
Film musicale esilarante e sognatore nel quale si vedrà il ripercorrere la storia della più bella musica francese del '900, e il suo impiego sempre originale e innovativo nel contesto cinematografico. Intrecci amorosi, riflessioni intime sulle debolezze umane, situazioni satiriche faranno da sfondo, in una Parigi contemporanea, a playback musicali di brani celebri come Paroles, Paroles..., Et moi dans mon coin, Je m'en fous pas mal e molti altri. La musica diverrà lo strumento evocativo di stati d'animo, pensieri, emozioni dei nostri protagonisti. Un alternarsi tra bugie e realtà. Un uso diverso della musica in continuo collegamento con le immagini e l’evolversi della storia. Alain Resnais, si dimostra ancora una volta, regista poliedrico e sperimentatore del linguaggio cinematografico come forma di comunicazione diretta.
APA, Harvard, Vancouver, ISO, and other styles
11

Hénaff, Nolwenn. "Parole authentique versus parole instrumentalisée : le pouvoir communicationnel des blogs." Phd thesis, Université Rennes 2, 2008. http://tel.archives-ouvertes.fr/tel-00329927.

Full text
Abstract:
La montée en puissance des blogs comme moyen d'information et de communication n'est plus à démontrer, chaque jour des dizaines de skyblogs se créent, des chroniques hebdomadaires à la radio leur sont consacrées, sans parler des livres, des émissions télévisuelles ou des articles de presse en ligne ou pas. Cet engouement rapide pour cet outil communicationnel à usages multiples suscite bien des intérêts de la part d'acteurs provenant de sphères différentes (publique, politique, marchande, institutionnelle...). Double dispositif éditorial et communicationnel, le blog de par sa facilité d'utilisation et de mise en œuvre s'est imposé comme un support idéal du récit personnel, de la diffusion d'une parole «authentique», «libérée». Ainsi, la production d'écritures personnelles en ligne sur les blogs instaure par le double effet de la narration et de la publicité, des usages et des pratiques sociales que nous allons explorer tout an long de ce travail de recherche. Objet complexe, le blog n'est pas qu'un journal en ligne mais un complexe fait de billets, de liens, de commentaires, de règIes,...de même que ce blog ne se résume pas à un échange communicationnel ou à une diffusion d'information, mais qu'il est fait d'un hybride de dispositifs techniques qui formatent l'interaction. Ainsi, la première partie analyse le processus de construction de la catégorie blog comme objet communicationnel dans l'espace public sur Internet avec comme point de départ une circonscription de la notion de journal (de bord, intime, en ligne), notre deuxième partie questionnera, dans une approche de type exploratoire, les conditions de développement d'un contexte propice à l'instrumentalisation des blogs, enfin notre dernière partie tente quant à elle de poser les limites de ce milieu favorable à J'exploitation de la parole authentique par l'efficience des stratégies identitaires de l'individu face à lui-même et aux autres dans un espace collectif innovant. De la parole authentique à la parole citoyenne : la conclusion interroge les conditions d'un espace performatif ou l'énonciation collective permet une concrétisation des actions dans le monde réel
APA, Harvard, Vancouver, ISO, and other styles
12

Didiot, Emmanuel. "Segmentation parole/musique pour la transcription automatique de parole continue." Phd thesis, Université Henri Poincaré - Nancy I, 2007. http://tel.archives-ouvertes.fr/tel-00187941.

Full text
Abstract:
Dans cette thèse, nous étudions la segmentation d'un flux audio en parole, musique et parole sur musique (P/M). Cette étape est fondamentale pour toute application basée sur la transcription automatique de flux radiophoniques et plus généralement multimédias. L'application visée ici est un système de détection de mots clés dans les émissions radiophoniques. Les performances de ce système dépendront de la bonne segmentation du signal fournie par le système de discrimination parole/musique. En effet, une mauvaise classification du signal peut provoquer des omissions de mots clés ou des fausses alarmes. Afin d'améliorer la discrimination parole/musique, nous proposons une nouvelle méthode de paramétrisation du signal. Nous utilisons la décomposition en ondelettes qui permet une analyse des signaux non stationnaires dont la musique est un exemple. Nous calculons différentes énergies sur les coefficients d'ondelettes pour construire nos vecteurs de paramètres. Le signal est alors segmenté en quatre classes : parole (P), non-parole (NP), musique (M) et non-musique (NM) grâce à deux systèmes disjoints de classification HMM classe/non-classe. Cette architecture a été choisie car elle permet de trouver les meilleurs paramètres indépendamment pour chaque tâche P/NP et M/NM. Une fusion des sorties des classifieurs est alors effectuée pour obtenir la décision finale : parole, musique ou parole sur musique. Les résultats obtenus sur un corpus réel d'émissions de radio montrent que notre paramétrisation en ondelettes apporte une nette amélioration des performances en discrimination M/NM et P/M par rapport à la paramétrisation de référence fondée sur les coefficients cepstraux.
APA, Harvard, Vancouver, ISO, and other styles
13

Hénaff, Nolwenn Chevalier Yves. "Parole authentique versus parole instrumentalisée le pouvoir communicationnel des blogs /." Rennes : Université Rennes 2, 2008. http://tel.archives-ouvertes.fr/tel-00329927/fr.

Full text
APA, Harvard, Vancouver, ISO, and other styles
14

Travers, de Faultrier Sandra. "La parole professorale." Montpellier 1, 2007. http://www.theses.fr/2007MON10038.

Full text
APA, Harvard, Vancouver, ISO, and other styles
15

Convert, Agnès. "Parole et origine." Paris 4, 1992. http://www.theses.fr/1991PA040179.

Full text
Abstract:
Cette recherche d'ontologie originelle a pour point d'ancrage la civilisation judéo-chrétienne. Dès l'origine, la parole est là. Chercher quelles sont les relations de parole et origine est s'interroger sur un mode de présence au monde. A travers l'examen de la parole-création, de la puissance de la parole et de sa justesse, on découvre un homme à la fois un et trois, à l'image de la trinité divine. On voit comment il peut être adéquat à ce qui lui est donné à vivre
This is an inquiry about original ontology. It take place in the Judeo-Christian civilization. Since the origin, the word is there. Searching what are the relations between origin and word is inquiring about a way of being in the world. Through the creative word, its transforming power, its truth, we find a man who is together one and three, build of the divine trinity. And we see haw he can be adequate to what the has to live
APA, Harvard, Vancouver, ISO, and other styles
16

MOKDESSI, RANDA. "La parole salutaire." Paris 4, 1988. http://www.theses.fr/1988PA040122.

Full text
Abstract:
Aspect ontologique de la providence et du salut dans la "petite histoire" et la "grande". Le melange entre le bien et le mal fait partie de l'essence d'une histoire qui a lieu entre l'un et le multiple. La providence n'est pas sans ce melange. Par l'etre la du melange, nous avons, selon platon, la cle du monde sensible, mais qui va donner la cle du monde intelligible? la christologie comme union de l'homme - et avec lui le monde sensible - et dieu. La christologie constitue cette facon d'aller dans le fond du melange jusqu'a lui donner un fondement par-dela le temps. Le salut est dans l'"instant" ou s'effectue le toucher du fondement a l'origine du melange. Une metaphysique de la relation est dans un tel toucher. Contrairement au systeme hegelien, l'alterite ici est affirmee dans son etre transcendant et inalienable. Ce qui se rapproche le plus de notre lecture de l'alterite transcendante, c'est bien le "sacre" chez heidegger a partir de la poesie de holderlin.
APA, Harvard, Vancouver, ISO, and other styles
17

Spreafico, Paola. "Le parole dell'Ostalgia." Bachelor's thesis, Alma Mater Studiorum - Università di Bologna, 2014. http://amslaurea.unibo.it/7441/.

Full text
Abstract:
Questa tesi si concentra su di un attuale fenomeno culturale tedesco denominato Ostalgie,termine che designa la Nostalgia degli abitanti dell'Ex DDR (Germania dell'Est) nei confronti di vari aspetti della loro quotidianità durante la dittatura. Tra questi figurano elementi riconducibili ad ambiti quali quello politico, commerciale e culturale, che successivamente alla riunificazione tedesca furono smantellati senza ritegno dal nuovo sistema capitalista e soggetti a un processo di "Occidentalizzazione". Per dare conto di ciò è stato presentato un elenco di parole relative ai suddetti ambiti, atte a descrivere ciò che caratterizzava la realtà dell' Est della Germania e a delineare il sentimento di Nostalgia dei suoi abitanti successivamente alla loro scomparsa.
APA, Harvard, Vancouver, ISO, and other styles
18

Zerlauth, Pascale. "Le Christ, Parole créatrice." Phd thesis, Université de Strasbourg, 2013. http://tel.archives-ouvertes.fr/tel-00961175.

Full text
Abstract:
Dans la deuxième moitié du premier siècle, des auteurs chrétiens ont énoncé le rôle du Logos " au commencement ". Selon eux, Dieu n'a pas créé le monde dans une sublime solitude, auprès de lui se tenait le Logos identifié à Jésus-Christ. Ainsi, d'un côté, les chrétiens continuaient à confesser que Dieu est le Créateur et de l'autre, ils développaient une réflexion sur la médiation créatrice du Christ (1 Co 8,6, Col 1,15-20, Ep 2,10, He 1,1-14, Jn 1,1-18). Établis dans des cités cosmopolites, ils ont été amenés à affirmer la supériorité du Christ sur les êtres invisibles en lui attribuant le pouvoir sur le monde que seul Yahvé possédait. La question d'une remise en cause du monothéisme est alors posée. Un des éléments de réponse se trouve dans les descriptions du lien qui unit le Père et le Fils. Cette réflexion conduit à la conclusion que la création prend tout son sens dans l'union du Fils, Unique et Bien-aimé, à celui qu'il désigne comme Père ; elle se déploie au sein de cette relation d'amour et, loin de conduire à une rivalité entre le Père et le Fils, elle engage une " seule " œuvre où le Fils manifeste le Père parce qu'il est sa Parole.
APA, Harvard, Vancouver, ISO, and other styles
19

Leclerc, Marie-Christine. "La parole chez Hésiode." Paris 10, 1990. http://www.theses.fr/1990PA100108.

Full text
Abstract:
La question est de savoir comment Hésiode se représente la parole, et comment il inscrit son verbe poétique dans cette représentation d'ensemble. L'étude comporte quatre parties. Les deux premières présentent le dossier sémantique et stylistique : étude raisonnée des réseaux lexicaux, analyse des passages aux styles direct et indirect et de leur place dans le récit. On constate le rigueur d'Hésiode et son originalité par rapport aux passages homériques qu'il utilise dans un sens nouveau. Hésiode n'a pas de la parole une représentation générale: l'expression des hommes est imparfaite et seconde par rapport aux situations. Inversement la parole divine préfigure les actes. De cette différence entre paroles humaine et divine, la troisième partie reconstitue l'histoire, qui reste implicite, en explorant la théogonie, "histoire" du monde et des dieux. La confrontation de plusieurs séries d'occurrences fait apparaitre qu'autrefois les hommes partageaient avec les dieux une parole qu'ils ont progressivement perdue en se séparant d'eux et devenant mortels (processus qui s'achevé dans le mythe prométhéen et est confirmé par les mythes des travaux). La quatrième partie étudie les passages ou Hésiode évoque sa fonction. Elle établit que les muses restituent au poète l'antique voix, qui lui permet de révéler la vérité en restant maitre de ses formes: fictions adaptées aux capacités limitées des hommes ou vérité directe. Cette dernière est principalement constituée des noms transparents retrouves grâce au don des muses. Etant seul à maitriser la langue des hommes et des dieux, le poète installe au centre du monde son verbe, indispensable à la communication cosmique
This problem is to know what is Hesiod’s representation of speech, and in which way he integrates his own poetic speech in this view. The study is made up of four parts. The first two present the semantic and stylistic documents. It is to be noted that Hesiod gives an original touch to the homeric texts he uses to introduce new meanings. The poet has no general view of speech: the human way of speaking is defective, and comes second to situations. Reversely the gods'speech precedes actions. The third development reconstitutes the history of this difference between men's and gods' ways of speaking. In the theogony, considered as a kind of world "history", different series of expressions are collected and compared. It appears that in the past, men and gods spoke the same language, which men lost in the course of a long process of separation from gods, the end of which being the myth of prometheus. Their voice is now conform to their mortal destiny, which is not original. The myths in the works and days are in accordance with these conclusions. The fourth section studies the way hesiod tells of his job. It appears that the muses give him back the ancient voice. . Which permits him to reveal the truth. But at the same time, be remains responsible for the poetical forms, these being either tales appropriate to the small capacities of men, or clear truth. This is mostly made up of the transparent names he re-discovered thanks to be muses. Thus the poet, knowing men's and gods' language, places himself in the center of the world, for his speech is indispensable to cosmic communication
APA, Harvard, Vancouver, ISO, and other styles
20

DE, CESARE ILARIA. "LE PAROLE NELLA COSTITUZIONE." Doctoral thesis, Università degli studi di Pavia, 2019. http://hdl.handle.net/11571/1242287.

Full text
APA, Harvard, Vancouver, ISO, and other styles
21

Vilaysouk, Vilayphone. "Codage de parole par transformée pour le développement de codeurs parole-audio unifiés." Thèse, Université de Sherbrooke, 2015. http://hdl.handle.net/11143/8148.

Full text
Abstract:
La compression de tous les types de signaux audio (parole et audio) constitue un vaste domaine de recherche, car il tente de répondre à de nombreuses et différentes demandes provenant de l’industrie. Actuellement, l’industrie de la téléphonie mobile possède de nombreuses requêtes au niveau de la compression de signaux audio à faible débit (sous les 32 kbit/s). Dans cette plage de débit, deux modèles sont nécessaires pour compresser tous les types de signaux audio : les codecs temporels s’utilisent pour la compression des signaux de parole et les codecs fréquentiels (par transformée) plus généraux s’utilisent pour la compression des signaux audio tels que la musique. Les téléphones intelligents et les tablettes numériques représentent des exemples d’appareils qui doivent intégrer deux codecs différents. Idéalement, ces appareils devraient intégrer un codec unique qui compresse tous les types de signaux audio. Cependant, l’unique moyen actuel d’obtenir un «codec universel» consiste en un «codec hybride universel». Les codecs hybrides universels intègrent au moins deux modèles de codage et un classificateur, qui sélectionne le modèle à exécuter selon le signal à traiter. Ces codecs ne représentent donc pas véritablement des codecs unifiés. De plus, avec l’utilisation d’un classificateur, les codecs hybrides introduisent également la possibilité d’erreurs de classification durant l’analyse. Ces codecs hybrides ont également tendance à être plus complexes puisqu’ils doivent gérer les différents modèles de codage. Après plus de trente ans de recherche, il existe toujours une distinction entre les approches utilisées pour la compression des signaux de parole et celles utilisées pour les signaux audio. Les codecs temporels se basent sur un modèle de production de la parole tandis que les codecs fréquentiels utilisent un modèle de perception auditive pour les signaux audio. Cette thèse propose des contributions dans l’élaboration d’un modèle de codage audio universel et véritablement unifié. Ces contributions se présentent dans cette thèse par un modèle d’analyse-synthèse de type harmonique-plus-bruit pour les signaux de parole qui fonctionne entièrement dans le domaine fréquentiel. Cette thèse démontre qu’il est possible d’obtenir un signal de parole de qualité perceptuelle transparente sans nécessairement suivre l’évolution de la forme d’onde du signal original. De plus, cette thèse propose également une version quantifiée du modèle d’analyse-synthèse et démontre qu’il est possible d’obtenir un signal de synthèse de bonne qualité pour des débits autour de 24 kbit/s et de 30 kbit/s. Lors des tests subjectifs MOS, le modèle se situe dans la même catégorie de qualité que la norme G.722.2 (AMR-WB) de l’institut UIT pour un débit autour de 24 kbit/s. Le modèle possède l’avantage de fonctionner entièrement dans le domaine fréquentiel et démontre ainsi les possibilités d’un codec réellement universel puisque traditionnellement le domaine des fréquences était réservé aux signaux audio autres que les signaux de parole.
APA, Harvard, Vancouver, ISO, and other styles
22

Barreaud, Vincent. "Reconnaissance automatique de la parole continue : compensation des bruits par transformation de la parole." Nancy 1, 2004. http://docnum.univ-lorraine.fr/public/SCD_T_2004_0175_BARREAUD.pdf.

Full text
Abstract:
Les performances d'un système de reconnaissance automatique de la parole se dégradent lorsque les conditions de test et d'entraînement diffèrent. L'approche classique du Stochastic Matching (SM) propose une estimation en temps-différé d'une fonction de compensation qui maximise la vraisemblance de la parole compensée par rapport à la séquence de modèles proposée par le processus de reconnaissance. Nous proposons des techniques temps-réel basées sur SM : la compensation s'effectue en parallèle avec le processus de reconnaissance. Cela permet de compenser dans un environnement variant lentement. Deux améliorations ont été apportées: -Une structure arborescente de transformations permet de construire une fonction de compensation non-linéaire dépendant du type acoustique de la parole. -Un processus surveillant les changements dans l'environnement déclenche la réinitialisation du processus de compensation. Cela permet à notre algorithme de fonctionner dans des environnements variant abruptement
Performances of an automatic speech recognition system degrade when test and training conditions do not match. Classical Stochastic Matching (SM) method proposes an off-line estimation of a compensation function that maximizes the likelihood of the compensated speech, given the optimal sequence of models proposed by the recognition process. We developed a new frame-synchronous technic based on SM : compensation is performed in parallel with the recognition. This is suitable to cope with slowly varying noise. We proposed two additional versions of our approach: -a tree structure of transformations is used to build a state-dependant non-linear compensation function. This is motivated by the fact that similar observations will be affected similarly by the environment. -a surveillance process monitoring the fluctuations in the environment is used to trigger the reinitialisation of the compensation process. This enables our algorithm to cope with environments experiencing sudden occurrences of noise
APA, Harvard, Vancouver, ISO, and other styles
23

Barreaud, Vincent Haton Jean-Paul. "Reconnaissance automatique de la parole continue compensation des bruits par transformation de la parole /." (S.l.) : (s.n.), 2004. http://www.scd.uhp-nancy.fr/docnum/SCD_T_2004_0175_BARREAUD.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
24

Bissonnette, Beauchemin Lucie. "Une catéchèse qui tient parole." Mémoire, Université de Sherbrooke, 2007. http://savoirs.usherbrooke.ca/handle/11143/5212.

Full text
Abstract:
Proposer une catéchèse à des adultes constitue un défi qui oblige, d'une part, à délier le trio catéchèse, enfance, sacrements d'initiation, d'autre part, à tenir compte, à la fois, de la nature de la catéchèse et des aspirations humaines d'aujourd'hui liées aux valeurs d'autonomie, de liberté, d'efficacité et de gestion du temps. Pour qu'une catéchèse satisfasse ces exigences, il importe qu'elle soit un réel lieu de rencontre où l'on accepte d'accueillir et de se laisser accueillir. Un lieu, où la Parole divine et les paroles humaines circulent librement entre catéchisé-es et catéchètes sous peine de demeurer stérile et risquer de ne jamais conduire à la communion au Christ. La catéchèse tient Parole quand la parole humaine, malgré ses faiblesses, se fait conversation à la manière de Dieu, Lui donne la Parole et laisse chacun-e s'exprimer, douter, s'opposer, témoigner et même se retirer.
APA, Harvard, Vancouver, ISO, and other styles
25

Ghitti, Jean-Marc. "La parole et le lieu." Nice, 1996. http://www.theses.fr/1996NICE2005.

Full text
Abstract:
Après avoir montré le recouvrement du lieu par l'espace, ce travail s'efforce de situer, par-delà toute pensée de l'habitation, le surgissement du lieu dans la parole poétique
After showing that space covers up place, this work strives to situate, beyond all thought of dwelling, the appearence of place in poetical speech
APA, Harvard, Vancouver, ISO, and other styles
26

Amehraye, Asmaa. "Débruitage perceptuel de la parole." Télécom Bretagne, 2009. http://www.theses.fr/2009TELB0072.

Full text
Abstract:
Depuis une dizaine d’année, l’investigation des méthodes de débruitage de la parole a permis d’atteindre des résultats spectaculaires. Cependant, certaines problématiques et questions restent ouvertes. Une de ces problématiques est de parvenir à un compromis entre la réduction du bruit, la distorsion du signal et le bruit résiduel et musical. L’essor des méthodes basées sur des notions perceptuelles, essentiellement le phénomène de masquage fréquentiel, a suscité beaucoup d’intéret ces dernières décennies. L’objectif de base des filtres perceptuels est de réduire le bruit sans apporter plus de distorsion sur le signal de parole. L’une des façcons d´éviter des distorsions superflues est alors d’opérer uniquement dans les fréquences où le bruit est perceptuellement significatif. Cependant, en procédant ainsi, le bruit initialement inaudible, et par conséquent non pris en compte par le débruitage perceptuel, risque de devenir audible et genant si les masquants de ce bruit sont filtrés. C’est ce que l’on nomme dans cette thèse, le phénomène MAN (Maskee to Audible Noise). Les contributions majeures de cette thèse sont en premier lieu, de mettre en évidence ce phénomène qui, à notre connaissance, n’a jamais encore été décrit et de montrer ses effets secondaires. Ensuite, nous proposons une approche élémentaire pour remédier au phénomène MAN grace à un double filtrage atténuant le bruit dans toutes les fréquences pour éviter la production de ce phénomène. Nous proposons une deuxième approche basée sur un filtre optimal, dit anti-MAN, au sens d’un critère sélectif par zone de fréquence. A travers ce critère, nous définisssons la zone du phénomène MAN et pouvons ainsi atténuer le bruit y contribuant. Des évaluations comparatives sur des critères objectifs et subjectifs de qualité sont présentées pour plusieurs types de bruit et de rapport signal à bruit. Les résultats ont révélé la supériorité des méthodes proposées dans ce travail par rapport à des méthodes perceptuelles récentes ne considérant pas le phénomène MAN. Dans la suite expérimentale de ce travail, nous avons conçu deux systèmes de reconnaissance de la parole avec HTK (Hidden Markov Models) ; l’un est basé sur des monophones et l’autre sur des triphones. La phase d’apprentissage de ces deux systèmes s’est déroulée en absence du bruit ; ceci nous a permis d´évaluer l’impact du débruitage sur les performances de ces systèmes en présence de bruit. Les résultats montrent que les méthodes qui se distinguent par rapport à des critères objectifs et meme subjectifs ne sont pas forcément celles qui rendent les systèmes de reconnaissance plus robustes. Ces derniers sont généralement plus sensibles aux distorsions vu que le destinataire final est une machine.
APA, Harvard, Vancouver, ISO, and other styles
27

Morin, Edwige. "Tchekhov : la parole au féminin." Master's thesis, Université Laval, 2017. http://hdl.handle.net/20.500.11794/28072.

Full text
Abstract:
1ère partie : Réflexion autour de la déclinaison des motifs [1] dans le théâtre de Tchekhov. Analyse d'une méthode de création [2]. 2nde partie : La solitude des mots [3] : Recherche-création autour de la problématique de l'authenticité dans le jeu de l'acteur. A partir de la composition d'un monologue, prenant sa source dans les paroles des personnages féminins des pièces de Tchekhov, et de sa mise en espace, nous avons amorcé une réflexion sur l'authenticité du jeu de l'acteur. Nous avons décomposé cette notion pour découvrir les outils nécessaires à la création d'une partition actorale : les actions physiques, la parole-action et l'organicité. A l'aide d'une matrice de production intitulée la méthode de création en dix étapes, processus actif de la révélation consciente d'une perception intuitive, proposé par Luis Thenon, nous avons travaillé sur la mise à jour des quatre lignes d'action et de leurs composantes, permettant de constituer la vie scénique du personnage. L'objet de notre recherche-création s'établit autour d'une jeune femme. Elle attend l'homme qu'elle aime pour lui déclarer son amour. Cette attente va lui permettre de faire le point sur son existence présente mais surtout passée et future. Au travers de tout cela, c'est un monologue avec et contre elle-même qu'elle engage d'où il ne ressortira qu'une profonde solitude. A partir des thèmes de l'amour, du travail et du temps, nous avons installé une exploration de l'écriture tchekhovienne et de sa logique si précise pour faire émerger un trajet cohérent de la vie scénique du personnage. [1]Notion utilisée par André Markowicz et Françoise Morvan, traducteurs de Tchekhov en français. [2]Méthode de création en dix étapes proposée par Luis Thenon. [3]Adaptation d'Edwige Morin à partir de l'œuvre de Tchekhov.
APA, Harvard, Vancouver, ISO, and other styles
28

Cerf, Jean-Yves. "Le roman de la parole." Université Marc Bloch (Strasbourg) (1971-2008), 2008. https://publication-theses.unistra.fr/public/theses_doctorat/2008/CERF_Jean-Yves_2008.pdf.

Full text
Abstract:
Cette ethnographie de la parole est basée sur les convervations entre Alfred Weil (Mulhouse, 1909 -id. 2006) et l'auteur. L'enfance d'Alfred Weil, fils d'allemands juifs immigrés, a été bouleversée par la première guerre mondiale et ses suites. Il a été boucher, guérisseur, et il a transmis des "avertissements". Son expérience a une importante composante religieuse. Il affirme les valeurs traditionnelles judéo-alsaciennes dans une inépuisable pratique de parole. Cette pratique est l'objet de l'étude. Elle est fidèlement transcrite dans sa dimension polyglotte. Le corpus de ses blagues en judéo-alsacien et en français participe de la construction des frontières de son univers. A travers cette expérience, l'auteur s'interroge sur la place de l'oralité dans la société et dans le champ anthropologique
This ethnography of word, is based on dialogues between a inhabitant of Mulhouse (Alsace), Alfred Weil (1909-2006) and the author. The childhood of Alfred Weil, son of a couple of German Jewish immigrants, was confused by the first world war and its suites. He was a butcher, a healer, and he transmitted divine warnings. His experience has an important religious element. He asserts the Jewish-Alsatian traditional values in a bottomless practice of word. This practice is the object of study. It is truthfully transcribed in its polyglot dimension. The corpus of his jokes in Alsatian Yiddisch and in French takes part in the building of borders of his world. Across this experience, the author questions about the place of orality in the society and in the anthropological field
APA, Harvard, Vancouver, ISO, and other styles
29

Bissonnette, Beauchemin Lucie. "Une catéchèse qui tient parole." [S.l. : s.n.], 2007.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
30

Roose-Debut, Marie-Clotilde Wunenburger Jean-Jacques. "Désir d'être et parole poétique." Lyon : Université Lyon 3, 2006. http://thesesbrain.univ-lyon3.fr/sdx/theses/lyon3/2006/roose_mc.

Full text
APA, Harvard, Vancouver, ISO, and other styles
31

Fenelli, Laura <1980&gt. "Sant'Antonio Abate: parole, reliquie, immagini." Doctoral thesis, Alma Mater Studiorum - Università di Bologna, 2007. http://amsdottorato.unibo.it/245/1/TesiDottFenelli.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
32

Fenelli, Laura <1980&gt. "Sant'Antonio Abate: parole, reliquie, immagini." Doctoral thesis, Alma Mater Studiorum - Università di Bologna, 2007. http://amsdottorato.unibo.it/245/.

Full text
APA, Harvard, Vancouver, ISO, and other styles
33

Bianchi, Marina <1978&gt. "Vicente Núñez: parole come armi." Doctoral thesis, Alma Mater Studiorum - Università di Bologna, 2008. http://amsdottorato.unibo.it/1168/1/Bianchi_Marina_tesi.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
34

Bianchi, Marina <1978&gt. "Vicente Núñez: parole come armi." Doctoral thesis, Alma Mater Studiorum - Università di Bologna, 2008. http://amsdottorato.unibo.it/1168/.

Full text
APA, Harvard, Vancouver, ISO, and other styles
35

CUCINIELLO, ANTONIO. "PAROLE PROFETICHE, PAROLE DI DIO: UN'ANALISI DELLE STORIE E DEI DISCORDI DEI PROFETI NEL CORANO." Doctoral thesis, Università Cattolica del Sacro Cuore, 2016. http://hdl.handle.net/10280/11132.

Full text
Abstract:
La tesi ha come oggetto la questione dei profeti e della loro lingua nel testo coranico, conducendo un esame sistematico delle narrazioni e dei discorsi profetici, durante tutto il corso della storia, a partire da Adamo, con l’intento di introdurre una lettura simmetrica delle storie tra episodi e lingua usata. L’accento è stato posto sugli aspetti filologici, concentrando l’analisi sulla versione araba del Corano, al fine di cercare di delineare profili personali e allo stesso tempo tentare di contrastare un approccio che sostiene che tutti gli inviati coranici abbiano solo una funzione strumentale alla missione di Muhammad.
The object of the dissertation is the study of the prophets and their language in the Qur’anic text, by carrying out a systematic examination of the Qur’anic narratives of the prophets and their speeches, throughout the whole course of history, starting from Adam, with the intent to introduce a symmetrical reading of the stories between incidents and the specific language. Emphasis has been put on the philological aspects, by concentrating the analysis on the Arabic version of the Qur’an, in order to try to design personal profiles and, at the same time, to attempt to counter an approach that claims to see all the Qur’anic envoys only in their instrumental function in the mission of Muhammad.
APA, Harvard, Vancouver, ISO, and other styles
36

CUCINIELLO, ANTONIO. "PAROLE PROFETICHE, PAROLE DI DIO: UN'ANALISI DELLE STORIE E DEI DISCORDI DEI PROFETI NEL CORANO." Doctoral thesis, Università Cattolica del Sacro Cuore, 2016. http://hdl.handle.net/10280/11132.

Full text
Abstract:
La tesi ha come oggetto la questione dei profeti e della loro lingua nel testo coranico, conducendo un esame sistematico delle narrazioni e dei discorsi profetici, durante tutto il corso della storia, a partire da Adamo, con l’intento di introdurre una lettura simmetrica delle storie tra episodi e lingua usata. L’accento è stato posto sugli aspetti filologici, concentrando l’analisi sulla versione araba del Corano, al fine di cercare di delineare profili personali e allo stesso tempo tentare di contrastare un approccio che sostiene che tutti gli inviati coranici abbiano solo una funzione strumentale alla missione di Muhammad.
The object of the dissertation is the study of the prophets and their language in the Qur’anic text, by carrying out a systematic examination of the Qur’anic narratives of the prophets and their speeches, throughout the whole course of history, starting from Adam, with the intent to introduce a symmetrical reading of the stories between incidents and the specific language. Emphasis has been put on the philological aspects, by concentrating the analysis on the Arabic version of the Qur’an, in order to try to design personal profiles and, at the same time, to attempt to counter an approach that claims to see all the Qur’anic envoys only in their instrumental function in the mission of Muhammad.
APA, Harvard, Vancouver, ISO, and other styles
37

Laaridh, Imed. "Évaluation de la parole dysarthrique : Apport du traitement automatique de la parole face à l’expertise humaine." Thesis, Avignon, 2017. http://www.theses.fr/2017AVIG0218/document.

Full text
Abstract:
La dysarthrie est un trouble de la parole affectant la réalisation motrice de la parole causée par des lésions du système nerveux central ou périphérique. Elle peut être liée à différentes pathologies : la maladie de Parkinson, la Sclérose Latérale Amyotrophique(SLA), un Accident Vasculaire Cérébral (AVC), etc. Plusieurs travaux de recherche ont porté sur la caractérisation des altérations liées à chaque pathologie afin de les regrouper dans des classes de dysarthrie. La classification la plus répandue est celle établie parF. L. Darley comportant 6 classes en 1969, (complétée par deux classes supplémentaires en 2005)Actuellement, l’évaluation perceptive (à l’oreille) reste le standard utilisé dans lapratique clinique pour le diagnostique et le suivi thérapeutique des patients. Cette approcheest néanmoins reconnue comme étant subjective, non reproductible et coûteuseen temps. Ces limites la rendent inadaptée à l’évaluation de larges corpus (dans le cadred’études phonétiques par exemple) ou pour le suivi longitudinal de l’évolution des patientsdysarthriques.Face à ces limites, les professionnels expriment constamment leur besoin de méthodesobjectives d’évaluation de la parole dysarthrique. Les outils de Traitement Automatiquede la Parole (TAP) ont été rapidement considérés comme des solutions potentiellespour répondre à cette demande.Le travail présenté dans ce rapport s’inscrit dans ce cadre et étudie l’apport quepeuvent avoir ces outils dans l’évaluation de la parole dysarthrique, et plus généralementpathologique.Dans ce travail, une approche pour la détection automatique des phonèmes anormauxdans la parole dysarthrique est proposée et son comportement est analysé surdifférents corpus comportant différentes pathologies, classes dysarthriques, niveaux desévérité de la maladie et styles de parole. Contrairement à la majorité des approchesproposées dans la littérature permettant des évaluations de la qualité globale de la parole(évaluation de la sévérité, intelligibilité, etc.), l’approche proposée se focalise surle niveau phonème dans le but d’atteindre une meilleure caractérisation de la dysarthrieet de permettre un feed-back plus précis et utile pour l’utilisateur (clinicien, phonéticien,patient). L’approche s’articule autours de deux phases essentielles : (1) unepremière phase d’alignement automatique de la parole au niveau phonème (2) uneclassification de ces phonèmes en deux classes : phonèmes normaux et anormaux. L’évaluation de l’annotation réalisée par le système par rapport à une évaluationperceptive d’un expert humain considérée comme ”référence“ montre des résultats trèsencourageants et confirme la capacité de l’approche à detecter les anomalies au niveauphonème. L’approche s’est aussi révélée capable de capter l’évolution de la sévéritéde la dysarthrie suggérant une potentielle application lors du suivi longitudinal despatients ou pour la prédiction automatique de la sévérité de leur dysarthrie.Aussi, l’analyse du comportement de l’outil d’alignement automatique de la paroleface à la parole dysarthrique a révélé des comportements dépendants des pathologieset des classes dysarthriques ainsi que des différences entre les catégories phonétiques.De plus, un effet important du style de parole (parole lue et spontanée) a été constatésur les comportements de l’outil d’alignement de la parole et de l’approche de détectionautomatique d’anomalies.Finalement, les résultats d’une campagne d’évaluation de l’approche de détectiond’anomalies par un jury d’experts sont présentés et discutés permettant une mise enavant des points forts et des limites du système
Dysarthria is a speech disorder resulting from neurological impairments of the speechmotor control. It can be caused by different pathologies (Parkinson’s disease, AmyotrophicLateral Sclerosis - ALS, etc.) and affects different levels of speech production (respiratory,laryngeal and supra-laryngeal). The majority of research work dedicated tothe study of dysarthric speech relies on perceptual analyses. The most known study, byF. L. Darley in 1969, led to the organization and the classification of dysarthria within 6classes (completed with 2 additional classes in 2005).Nowadays, perceptual evaluation is still the most used method in clinical practicefor the diagnosis and the therapeutic monitoring of patients. However, this method isknown to be subjective, non reproductive and time-consuming. These limitations makeit inadequate for the evaluation of large corpora (in case of phonetic studies) or forthe follow-up of the progression of the condition of dysarthric patients. In order toovercome these limitations, professionals have been expressing their need of objectivemethods for the evaluation of disordered speech and automatic speech processing hasbeen early seen as a potential solution.The work presented in this document falls within this framework and studies thecontributions that these tools can have in the evaluation of dysarthric, and more generallypathological speech.In this work, an automatic approach for the detection of abnormal phones in dysarthricspeech is proposed and its behavior is analyzed on different speech corpora containingdifferent pathologies, dysarthric classes, dysarthria severity levels and speechstyles (read and spontaneous speech). Unlike the majority of the automatic methodsproposed in the literature that provide a global evaluation of the speech on generalitems such as dysarthria severity, intelligibility, etc., our proposed method focuses onthe phone level aiming to achieve a better characterization of dysarthria effects and toprovide a precise and useful feedback to the potential users (clinicians, phoneticians,patients). This method consists on two essential phases : (1) an automatic phone alignmentof the speech (2) an automatic classification of the resulting phones in two classes :normal and abnormal phones.When compared to an annotation of phone anomalies provided by a human expertconsidered to be the ”gold standard“, the approach showed encouraging results andproved to be able to detect anomalies on the phone level. The approach was also able to capture the evolution of the severity of the dysarthria suggesting a potential relevanceand use in the longitudinal follow-up of dysarthric patients or for the automatic predictionof their intelligibility or the severity of their dysarthria.Also, the automatic phone alignment precision was found to be dependent on the severity,the pathology, the class of the dysarthria and the phonetic category of each phone.Furthermore, the speech style was found to have an interesting effect on the behaviorsof both automatic phone alignment and anomaly detection.Finally, the results of an evaluation campaign conducted by a jury of experts on theannotations provided by the proposed approach are presented and discussed in orderto draw a panel of the strengths and limitations of the system
APA, Harvard, Vancouver, ISO, and other styles
38

Guaïtella, Isabelle. "Rythme et parole : comparaison critique du rythme de la lecture oralisée et de la parole spontanée." Aix-Marseille 1, 1991. http://www.theses.fr/1991AIX10022.

Full text
Abstract:
Notre objectif est de montrer que le rythme de la lecture oralisee et celui de la parole spontanee different en raison des processus cognitifs mis en jeu pour ces deux formes de l'oral. Ainsi, les conditions pragmatiques de production vont generer des formes orales a leur image. La lecture oralisee produit un oral structure et analysable par une theorie "metrique", la parole spontanee produit un oral non structure mais organise par une constante adaptation a la situation, et analysable par une theorie "rythmique". L'utilisation differente des canaux d'expression (vocaux, gestuels. . . ) etudiee a travers plusieurs experiences et selon des methodologies diverses manifeste et atteste l'existence de systemes opposes regissant les deux modes de production de l'oral
Our goal is to show that rhythm of reading aloud and that of spontaneous speech are different. These differences are due to the distinct cognitive processes relative to these two as@pects of the oral activity. As a consequence, the pragmatic conditions of production will generate distinct and adequate oral forms. Reading aloud produces a structured oral speech which may be analysed by a "metrical theory". Spontaneous speech, on the contrary, produces an output which is non structured, but organized by constant adaptation to the situation. This speech may be analysed by a "rhythmic theory". The use of distinct channels of communication (oral, gestual. . . ), that has been studied through different experiments according to different methodologies, show the existence of contrasting systems, which respectively rule the two modes of production of oral activity
APA, Harvard, Vancouver, ISO, and other styles
39

Bassett, Rhodri. "Parole in Sweden and Canada - A Cross-Cultural Comparison of Risk and Electronic Monitoring Parole Practices." Thesis, Malmö högskola, Fakulteten för hälsa och samhälle (HS), 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-25097.

Full text
Abstract:
Over the past few decades, new philosophies and technologies have impacted parole around the world. Most notably, predicting recidivism through risk assessments has altered the way in which clients are perceived, while electronic monitoring technology has granted the possibility of constant supervision. Due to these recent changes, there are concerns that countries with traditionally rehabilitative parole systems will become more punitive and supervisory. A thematic and metasynthetic review of two countries with rehabilitative parole systems, Sweden and Canada, revealed that risk and electronic monitoring have been integrated to serve balanced agendas that both care for and control clients.
APA, Harvard, Vancouver, ISO, and other styles
40

François, Hélène. "Synthèse de la parole par concaténation d'unités acoustiques : construction et exploitation d'une base de parole continue." Rennes 1, 2002. http://www.theses.fr/2002REN10127.

Full text
Abstract:
Ces travaux s'inscrivent dans le cadre de la synthèse de la parole par concaténation d'unités acoustiques de taille variable multi-représentées. Pour remédier à l'hétérogénéité de la qualité et de l'intelligibilité des voix synthétiques, nous utilisons une base de parole continue riche au niveau linguistique, ici un jeu de phrases naturelles. Sa construction est vue comme un problème NP-complet de recouvrement minimal d'ensemble. Les méthodes gloutonne, cracheuse et d'échange par paire condensent ainsi des corpus de 100000 à 5000 phrases. Ensuite nous cherchons dans un corpus spécifique l'ensemble des séquences d'unités acoustiques permettant la synthèse de 10 phrases tests. Pour chaque séquence trouvée ses unités sont concaténées, puis sa qualité est évaluée de façon objective en mesurant sa distance acoustique à une référence naturelle. Cela permet de spécifier et de caractériser des bases "génératives", de développer et d'évaluer de nouvelles méthodes de sélection d'unités.
APA, Harvard, Vancouver, ISO, and other styles
41

Canellopoulos, Lissy. "Une parole pour la vie. La parole parentale et son impact sur la constitution du sujet." Université Louis Pasteur (Strasbourg) (1971-2008), 1988. http://www.theses.fr/1988STR10017.

Full text
Abstract:
L'enfant est l'objet du discours de ses parents, bien avant sa naissance, discours qui nous confronte aux difficultes non resolues du parent a son desir, sa maniere de se situer face au desir de l'autre, dans le sexe, la mort, son histoire oedipienne dans ses efforts de se constituer comme sujet l'enfant rencontre l'inconscient des parents a travers leur parole qu'il vit de sa maniere a partir de ce que dans l'imaginaire elle represente pour lui. Selon la place qu'elle laisse au desir de l'enfant cette parole permet ou barre l'acces a la constitution de l'effort comme sujet parlant, desirant, sexue
Long before his birth the child is the object of his parent's talking, talking that confronts us with the non solved parent's problem, with his desire, his way to place himself in relation to the other's desire, to his sex, to the death, to his oedipian history. In his efforts to constitute itself us a subject, the child meets his parents inconscious throuh their word, that it lives its way from what this word represents for it. According to the place it lets to the child's desire, the parent's word allows or blocks the child's way to constitute itself as a talking, desiring and sexed subject
APA, Harvard, Vancouver, ISO, and other styles
42

Biétry, Catherine. "Synthèse de haute qualité de la parole étude multi-voix des caractéristiques individuelles de la parole." Lille 3 : ANRT, 1988. http://catalogue.bnf.fr/ark:/12148/cb37596036h.

Full text
APA, Harvard, Vancouver, ISO, and other styles
43

Canellopoulos, Lissy. "Une Parole pour la vie la parole parentale et son impact sur la constitution du sujet /." Lille 3 : ANRT, 1989. http://catalogue.bnf.fr/ark:/12148/cb376123853.

Full text
APA, Harvard, Vancouver, ISO, and other styles
44

TINOTHAI, KITTIPOL. "Structure de l'enonce oral spontane en thai standard (siamois) : etude prosodique et enonciative." Paris 3, 2001. http://www.theses.fr/2001PA030026.

Full text
Abstract:
Le role de la prosodie dans la structuration de discours oral spontane a fait objet de nombreuses etudes dans diverses langues. Ce present travail a comme objectif d'etudier l'interaction des faits prosodiques, syntaxiques et enonciatifs ainsi que la structuration de l'oral spontane en thai standard ou siamois a partir de corpus oral, dans le cadre theorique de m-a morel. Le rapport entre les faits prosodiques, syntaxiques et discursifs sera etudie en premier temps a partir d'un certain nombre d'enonces isoles mis en situations. Ensuite, la segmentation de l'oral spontane en unite d'analyse, paragraphe oral, preambule et rheme, par des indices prosodiques, unite de downdrift, resetting, sera effectuee a partir de corpus tire de 3 situations differentes : interview formelle, recit vecu et conversation avec interaction. L'etude sur la nature morpho-syntaxique de differents constituants discursifs et sur les facteurs prosodiques particuliers seront egalement traitee dans ce travail.
APA, Harvard, Vancouver, ISO, and other styles
45

Garaffoni, Sara. "Gruppi liberi e giochi di parole." Bachelor's thesis, Alma Mater Studiorum - Università di Bologna, 2015. http://amslaurea.unibo.it/9018/.

Full text
Abstract:
La struttura di gruppo è una delle strutture algebriche più semplici e fondamentali della matematica. Un gruppo si può descrivere in vari modi. Noi abbiamo illustrato la presentazione tramite generatori e relazioni, che consiste sostanzialmente nell'elencare le "regole di calcolo" che valgono nel gruppo considerato, oltre a quelle che derivano dagli assiomi di gruppo. L'idea principale di questa tesi è quella di mostrare come un argomento così tecnico e specifico possa essere reso "elementare" e anche divertente. Siamo partiti dalla costruzione di un gioco, inventando regole da aggiungere di volta in volta. Abbiamo poi tentato di spiegare il medesimo concetto da un punto di vista teorico, tramite la teoria dei gruppi liberi. Si tratta di gruppi che hanno un insieme di generatori soddisfacenti unicamente alle relazioni che sono conseguenza degli assiomi di gruppo.Ogni gruppo è un quoziente di un gruppo libero su un appropriato insieme di generatori per un sottogruppo normale, generato dalle relazioni. Infine si è illustrato il problema della parola formulato da Max Dhen nel 1911, e si è visto come tale problema è risolubile per i gruppi liberi.
APA, Harvard, Vancouver, ISO, and other styles
46

Dufour, Richard. "Transcription automatique de la parole spontanée." Phd thesis, Université du Maine, 2010. http://tel.archives-ouvertes.fr/tel-00595465.

Full text
Abstract:
Les systèmes de Reconnaissance Automatique de la Parole (RAP) atteignent actuellement des performances suffisantes pour être intégrés dans diverses applications (dialogue homme-machine, recherche d'information, indexation automatique...). Cependant, dans le cadre de la reconnaissance automatique de la parole continue à grand vocabulaire, que l'on utilise par exemple pour transcrire des émissions radiophoniques d'information, la qualité des transcriptions varie selon le type de parole contenu dans les documents. En effet, les systèmes de RAP ont beaucoup plus de facilité à transcrire de la parole préparée, proche d'un texte lu, que de la parole spontanée, caractérisée par de nombreuses spécificités (disfluences, agrammaticalité, baisse de la fluidité de la parole...). Le travail de cette thèse vise le traitement de la parole spontanée et s'inscrit dans le cadre du projet EPAC (Exploration de masse de documents audio pour l'extraction et le traitement de la PArole Conversationnelle). L'objectif principal est de proposer des solutions pour améliorer les performances des systèmes de RAP sur ce type de parole. Nous avons choisi d'aborder, dans notre travail, la parole spontanée en tant qu'objet d'étude particulier nécessitant des traitements spécifiques. Ainsi, dans un premier temps, nous proposons un outil de détection automatique de la parole spontanée, basé sur les spécificités de ce type de parole. Cet outil est très important puisqu'il nous permet, dans un deuxième temps, de proposer une approche d'adaptation des modèles acoustiques et des modèles de langage du système de RAP à la parole spontanée sans ajout de données, en sélectionnant automatiquement les segments contenant ce type de parole. La transcription résultant de cette adaptation propose des hypothèses de reconnaissance différentes de celles fournies par le système de base. La combinaison de ces deux propositions de transcription permet d'observer une réduction significative du taux d'erreur-mot. Ce besoin de solutions spécifiques a finalement orienté une partie de notre travail vers la correction d'un problème particulièrement présent en français : l'homophonie. Nous cherchons alors à corriger les transcriptions, fournies par un système de RAP, au moyen d'une méthode proposant des solutions spécifiques à certains problèmes particuliers de l'homophonie. L'approche se focalise sur la correction de certaines erreurs, auxquelles une solution particulière est proposée. Cette méthode, en post-traitement des systèmes de RAP, corrige certains mots et classes de mots homophones, indépendamment du système de RAP utilisé.
APA, Harvard, Vancouver, ISO, and other styles
47

Deschênes, Marjolaine. "Vérité herméneutique de la parole poétique /." Trois-Rivières : Université du Québec à Trois-Rivières, 2006. http://www.uqtr.ca/biblio/notice/tablemat/24674064TM.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
48

Pendeliau-Verdurand, Marine. "Parole disfluente : aspects phonétiques et phonologiques." Thesis, Grenoble, 2014. http://www.theses.fr/2014GRENL010/document.

Full text
Abstract:
Le bégaiement est un trouble complexe, qu'il est encore difficile de définir de manière satisfaisante et complète. Outre les symptômes secondaires, et comportements accompagnateurs, des facteurs langagiers peuvent interférer avec ce trouble. Des difficultés dans les compétence phonologiques pourraient être concomitantes, voire en interaction avec le bégaiement, avec notamment dans la parole adulte, un impact non négligeable de la complexité phonologique. Par ailleurs, des difficultés coarticulatoires seraient au cœur du bégaiement. Mais les résultats des différentes études sont très disparates, tant dans la parole des enfants que dans celle des adultes qui bégaient. Enfin, l'influence du feedback auditif est surprenante puisque toute modification de ce type de feedback a un pouvoir améliorant chez un certain nombre de personnes. Ce constat questionne la définition du bégaiement en tant que trouble de la production et l'oriente plutôt vers un trouble perceptivo-moteur. Cette thèse se propose d'étudier la parole fluente et disfluente de personnes bègues françaises et italiennes. Etant donné que les différences entre personnes qui bégaient et personnes fluentes, apparaissent essentiellement quand le système moteur est soumis à un facteur déstabilisant, nous avons choisi d'étudier l'adaptation du comportement coarticulatoire lorsque la complexité phonologique augmente. Nous avons également voulu analyser l'impact de la modification du feedback auditif sur le comportement coarticulatoire. Enfin, nous avons étudié le rôle de la complexité phonologique sur les disfluences notamment, dans une situation de dialogue autour d'une image. Des adultes et des enfants, italiens, et français, bègues et fluents ont été enregistrés dans 4 situations de parole : lectures, discours spontané, tâche de répétition, et tâche de description d'image. Toutes ces tâches ont été réalisées dans deux conditions perceptives : une condition normale, et une condition avec feedback auditif modifié. En condition perceptive normale, la coarticulation des personnes qui bégaient est plus faible que celle des personnes fluentes. La langue semble jouer également un rôle important puisque les personnes qui bégaient des deux langues ne se comportent pas toujours de la même manière vis-à-vis de leurs homologues fluents. Le comportement coarticulatoire des personnes bègues semble également sensible à l'augmentation de la complexité phonologique. Les résultats sous feedback auditifs modifiés apparaissent contradictoires. Par ailleurs, les disfluences pourraient être influencées par la complexité phonologique, mais cette influence semble dépendre de la sévérité du bégaiement et de l'âge du sujet. Des perspectives cliniques sont évoquées
Stuttering is a complex (complicated-intricate) disorder, and it is difficult to give a satisfactory and complete definition of it. As well as secondary symptoms and entailed comportments, language factors can interfere in this disorder. Difficulties in phonological competence might be concomitant if not interactive in stuttering, with, mainly in adult language, an inconsiderable impact of the phonological complexity Furthermore, the coarticulatory difficulties might be at the core of stuttering. But the results of different studies diverge on the subject when both children and adults' stuttering are considered. And let us note that the influence of the auditory-feedback is surprising as every change in this feedback seems to have an improving power in an appreciable number of patients. So the definition of stuttering, being a production disorder, can be questioned. Stuttering rather appears as a perceptual motor disorder. The aim of this thesis is to study the fluent and disfluent language in French and Italian stutterers knowing that the differences between stutterers and fluent persons mainly appear when the motor system is conditional to a destabilizing factor. We chose to study how the coarticulatory behavior adapts when the phonological complexity increases. We also tried to analyze how the modification of the auditory-feedback influences the coarticulatory behavior. And we studied the part played by the phonological complexity on disfluencies mainly in a situation of dialogue over a picture. Italian and French adults and children stutterers and their fluent counterparts were registered placed in four different situations of language: reading, spontaneous speech, repetitive task and picture description and in two perceptive conditions: a normal one and one with modified auditory-feedback. When placed in normal perceptive condition, the stutterers' coarticulation is weaker than that of their fluent counterparts. Besides, the language seems to play an important role since Italian and French stutterers have not the same response towards their fluent counterparts. Let us note that this stutterers' coarticulatory comportment is also sensitive to the increase of the phonological complexity. The results we have when the auditory-feedback is altered are contradictory. Disfluency could also be influenced by phonological complexity but this influence seems to be dependent on the acuteness of the stuttering as well as on the stutterer's age. A significant clinical breakthrough is evoked
APA, Harvard, Vancouver, ISO, and other styles
49

Dupuis, Catherine. "Langage et parole chez l’enfant dysphasique." Paris 7, 1999. http://www.theses.fr/1999PA070042.

Full text
Abstract:
La dysphasie de développement correspond a une atteinte sévère de l'organisation du langage. Dans son acception la plus fréquente elle est considérée comme un trouble isole que ne peut expliquer une atteinte neurologique, psychiatrique, sensorielle ou une carence affective. Toutefois, dans la réalité du travail clinique, ce trouble pose de nombreuses questions transnosographiques et l'investigation psychopathologique engendre l'idée d'un lien étroit entre la dysphasie de développement et les pathologies limites de l'enfance telles qu'elles furent décrites par r. Mises. D'un point de vue méthodologique, la recherche consiste a tester et a discuter cette hypothèse grâce à l'interprétation des protocoles de rorschach d'un groupe de 22 enfants dysphasiques compares a ceux d'un groupe apparie de 22 enfants témoins. Au delà, c'est la distinction entre langage et parole en psychanalyse qui permet de réfléchir a la question de la causalité psychique dans la dysphasie de développement et oriente la discussion vers l'idée d'un trouble fondamental de la représentation comme facteur d'explication de sa genèse. Dans cette perspective, il est possible d'envisager la dysphasie comme l'expression d'une difficulté d'identification au principe paternel, défini comme le pouvoir du père symboliquement contenu dans la parole
APA, Harvard, Vancouver, ISO, and other styles
50

Chérel, Emmanuelle. "Le Porte parole de Krzysztof Wodiczko." Rennes 2, 2002. http://www.theses.fr/2002REN20019.

Full text
Abstract:
Cette étude a pour thème le rôle social et politique de l'art contemporain. Pour appréhender ce sujet, nous avons décidé de nous pencher sur la manière dont Krzysztof Wodiczko conçoit l'art, qu'il définit comme une pratique socio-esthétique agissant au sein de la culture dans le but de la transformer. Ainsi, nous avons porté notre attention sur une de ses prestations esthétiques : "le Porte-parole" (1994). Pour l'artiste, cet Instrument destiné aux immigrés leur permet de prendre la parole dans l'espace public et de s'opposer à leur exclusion. Mais que peut signifier l'utilisation d'un objet esthétique? Comment se manifest-t-elle? A quelles "techniques de désaliénation" K. Wodiczko a-t-il recours? Quelles peuvent-être les conséquences de ce travail sur l'espace démocratique? En retraçant l'histoire de ce projet, nous nous attachons à décrire le mode d'apparition du Porte-parole, nous observons étape par étape (à partir notamment d'entretiens réalisés auprès des "performeurs/immigrés") les conditions de son utilisation et les effets qu'il produit sur ses utilisateurs. L'analyse des composantes et de la structure du signe, l'emploi des notions d'in situ, de performance, de fiction, l'usage de concepts appartenant aux champs de la psychanalyse, de la sociologie, de la linguistique, nous permettent de participer à la réflexion sur le rôle cognitif de l'art
This study takes as its theme the social and political role of contemporary art. In approaching this subject, we have decided to direct our attention to the way in Krzysztof Wodiczko which conceptualises art, which he defines as a social-aesthetic practice operating within the heart of culture with the idea of transforming it. We have thus focussed upon one of this artistic performances : the "Mouthpiece" (1994). For the artist, this Instrument made for immigrants allows them to speak out in the public domain and to opose their exclusion from it. But what could the use of such an aesthetic object signify? How will it present and reveal itself? To which techniques of de-alienation does Krzysztof Wodiczko have access? What could the consequences of this work be in a democratic arena? In retracing the history of the project, we commit ourselves to describing the way in which Mouthpiece presents itself we observe stage by stage (working, in particular, from the interviews that resulted from working closely with "performers/immigrants") the conditions of their use and the effects which they produce on their users. The analysis of the components and structure of the sign, the deployment of notions of the in-situ (site contextuality), performance and fiction, the use of concepts pertaining to the fields of psychoanalysis, sociology, linguistics, enable us to participate in the reflection upon the cognitive role of art
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography