logoJEPTALNRECITAL2016

JEP-TALN-RECITAL 2016, Paris, France

23ème Conférence sur le Traitement Automatique des Langues Naturelles
31ème Journées d’Études sur la Parole
18ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues

Inalco, Paris, 4-8 Juillet 2016

Vendredi 8 juillet 2016

9h00-10h15 - 10h45-12h45 - 12h45-14h00 - 14h00-16h00 - 16h00-16h30
Sessions du matin : Session commune - Posters JEP 2 (P2) - Démonstrations JEP/TALN - Salon PAREIL
Sessions de l'après-midi : Démonstrations JEP/TALN - Salon PAREIL - Table ronde - Clôture
Accueil / inscription (salle 4.15)

9h00-10h15 - Présentations orales communes

Session commune JEP/TALN 3 - Vendredi 9h00-10h15 (SC3) - amphi 4

Présidents de session : Emmanuel Ferragne et Nuria Gala

  • Bilinguismes et compliance phonique (JEP)
    Marie Philippart de Foy, Véronique Delvaux, Kathy Huet, Myriam Piccaluga, Rima Rabeh and Bernard Harmegnies
    Abstract: Certains types de bilinguisme pourraient avoir un impact positif sur l’apprentissage phonique et faciliter l’acquisition d’une L3. Certains bilingues pourraient donc présenter une meilleure compliance phonique (aptitude à produire des sons de parole non familiers) que les monolingues. Les données de quatre sujets bilingues ont été recueillies lors d’une tâche de reproduction de voyelles synthétiques précédée d’une phase de production de voyelles en langue maternelle (paradigme développé par Huet et al., 2012). Trois indices ont été calculés et comparés à ceux obtenus par des monolingues francophones lors d’une étude précédente (Delvaux et al., 2014). Les résultats n’ont pas révélé de différence significative entre monolingues et bilingues. Toutefois, le classement des bilingues variait d’un indice à l’autre, suggérant des profils plus diversifiés que chez les monolingues. En conclusion, ces résultats confirment la complexité de la compliance phonique, en particulier chez des locuteurs bilingues, et soulignent l’intérêt d’une approche multi-componentielle dans l’évaluation cette aptitude ainsi que le besoin d’ajustements ultérieurs de la réflexion théorique sous-jacente.
  • Modèles adaptatifs pour prédire automatiquement la compétence lexicale d'un apprenant de français langue étrangère (TALN)
    Anaïs Tack, Thomas François, Anne-Laure Ligozat and Cédrick Fairon
    Abstract: Cette étude examine l'utilisation de méthodes d'apprentissage incrémental supervisé afin de prédire la compétence lexicale d'apprenants de français langue étrangère (FLE). Les apprenants ciblés sont des néerlandophones ayant un niveau A2/B1 selon le Cadre européen commun de référence pour les langues (CECR). A l'instar des travaux récents portant sur la prédiction de la maîtrise lexicale à l'aide d'indices de complexité, nous élaborons deux types de modèles qui s'adaptent en fonction d'un retour d'expérience, révélant les connaissances de l'apprenant. En particulier, nous définissons (i) un modèle qui prédit la compétence lexicale de tous les apprenants du même niveau de maîtrise et (ii) un modèle qui prédit la compétence lexicale d'un apprenant individuel. Les modèles obtenus sont ensuite évalués par rapport à un modèle de référence, déterminant la compétence lexicale à partir d'un lexique spécialisé pour le FLE, et s'avèrent gagner significativement en exactitude (9%-17%).
  • Stratégies d'adaptation de la vitesse d’articulation lors de conversations spontanées entre locuteurs natifs et non-natifs (JEP)
    Barbara Kühnert and Tanja Kocjančič Antolík
    Abstract: Cet article examine la vitesse d’articulation dans un corpus de conversations spontanées entre locuteurs natifs et non-natifs. L’objectif est d’étudier en particulier (i) dans quelle mesure les locuteurs natifs adaptent leur vitesse aux apprenants L2 et (ii) dans quelle mesure les deux locuteurs en interaction ont tendance à rapprocher ou à dissocier leurs caractéristiques temporelles au cours d’une conversation. Les données proviennent du corpus SITAF d’interactions tandem en anglais-français. A ce jour, 10 sujets ont été analysés, chacun ayant été enregistré dans trois conditions différentes : en utilisant sa L1 avec un autre locuteur natif, en utilisant sa L1 avec un apprenant L2, et en utilisant sa L2. Les résultats indiquent que les propriétés de la langue maternelle ont une nette influence sur les variations de la vitesse d’articulation des locuteurs, non seulement lors des stratégies d’adaptation envers des apprenants mais également sur les caractéristiques de la vitesse en L2.

10h15-10h45 - Pause Café (hall 2ème étage)


10h45-12h45 - Présentations Posters JEP, Démos JEP/TALN, Salon PAREIL

JEP

Poster 2 - Vendredi 10h45-12h45 (P2) - salles 3.14 à 3.19

Présidente de session : Laurianne Georgeton

  • Étude de la qualité vocale post-thyroïdectomie chez des patients souffrants ou non de paralysie récurrentielle
    Ming Xiu, Camille Fauth, Béatrice Vaxelaire, Jean-François Rodier, Pierre-Philippe Volkmar and Rudolph Sock
    Abstract: L’objet d’étude principal est la qualité vocale au niveau aérodynamique, acoustique surtout des indices de la perturbation du signal après une thyroïdectomie totale (qui consiste à l’ablation complète de la glande thyroïde) ou une isthmolobectomie (qui consiste à l’exérèse de la moitié, droite ou gauche, de la glande) qui provoque souvent une dégradation de la qualité vocale de façon permanente ou temporaire.
    Deux groupes de patients sont suivis et étudiés : un premier groupe de patients pour lesquels l’examen post-opératoire a révélé un défaut de mobilité de l’un des plis vocaux ; Un second groupe de patients pour lesquels l’examen post-opératoire n’a pas révélé de perturbation de la mobilité laryngée.
  • La reconnaissance des mots dans la parole accentuée : Une étude en laboratoire et à l’extérieur.
    Delphine Deï, Page Piccinini, Isabelle Dautriche, Marieke Van Heugten and Alejandrina Cristia
    Abstract: Des travaux récents suggèrent que les enfants et les adultes sont initialement ralentis dans leur compréhension des mots qui n’ont pas été prononcés de façon standard. Néanmoins, quand ils font face à un interlocuteur qui à un discours accentué, ils développent rapidement des stratégies spécifiques qui leur permettent de comprendre même des prononciations atypiques. Cependant, ces résultats sont typiquement issus de recherches en laboratoire, où l'attention des participants se concentre sur une tâche unique qui leur demande peu de ressources. Afin de dépasser ces limitations, nous avons mené une expérience de reconnaissance de mots sur tablette tactile, en évaluant des enfants et des adultes, en laboratoire et dans l’environnement naturel de chaque groupe. Nous avons constaté que des déviations de prononciation dans la parole accentuée ralentissent la reconnaissance des mots, chez des enfants et adultes, tant dans le laboratoire que dans des environnements naturels.
  • Suivi de contours d’articulateurs orofaciaux à partir d’IRM dynamique
    Mathieu Labrunie, Pierre Badin, Laurent Lamalle, Coriandre Vilain, Louis-Jean Boë, Jens Frahm and Peter Birkholz
    Abstract: Nous présentons une méthode de prédiction de contours médiosagittaux des organes orofaciaux de la parole et la déglutition à partir d’images IRM dynamiques. Pour chaque locuteur, un ensemble de 60 images représentatives pour lesquelles les contours ont été tracés manuellement permet d’entraîner des modèles ACP d’images et de contours articulatoires, ainsi qu’un modèle multilinéaire qui prédit les paramètres des contours à partir des paramètres des images. Les contours obtenus sont ensuite corrigés par des modèles de forme actifs (ASM) modifiés utilisant les informations locales de profils d’intensité de pixels le long des normales aux contours. Les performances de cette méthode (erreurs moyennes « points à contour » entre 0,57 et 0,70 mm) sont insensibles au type de séquence IRM (écho de gradient avec échantillonnage synchronisé ou écho de gradient radial hautement sous-échantillonné), sont meilleures que celles de la littérature, et rendent possible le traitement de volumineux corpus d’images IRM dynamiques.
  • FN5, un modèle psycholinguistique informatique de la reconnaissance des mots parlés chez l’auditeur français, mis à la disposition des chercheurs et enseignants
    Nicolas Léwy
    Abstract: Voici un modèle psycholinguistique informatique pour le français. Il s’appelle FN5 et simule la reconnaissance humaine de mots parlés, présentés seuls (déterminant, adjectif antéposé, substantif) ou en suites de deux mots (déterminant et substantif, adjectif antéposé et substantif). Le modèle contient un lexique de 17 668 mots et cela dans deux versions, française et Suisse romande. Grâce à une architecture connexionniste localiste à trois niveaux (traits distinctifs, phonèmes, mots) qui est enrichie de plusieurs innovations clés (processeur de position, groupements de connexions, et point d’isolation), le modèle peut reconnaître la plupart des mots et des suites qu’on lui présente (taux de succès entre 83.6% et 99.7%), et en plus, il est capable de reproduire un grand nombre d’effets trouvés lors d’études expérimentales (ex. fréquence, longueur, effacement du schwa, liaison, etc.). Le modèle, qui possède une interface graphique, est téléchargeable, et utilisable à la fois pour la recherche et pour l’enseignement.
  • Effet de l’input auditif sur la production de voyelles : étude acoustique chez des enfants normo-entendants et des enfants porteurs d’implants cochléaires âgés de 5 à 11 ans
    Benedicte Grandon and Anne Vilain
    Abstract: Treize enfants porteurs d’implants cochléaires (CI) et vingt enfants normo-entendants (NH) ont été enregistrés dans deux conditions : répétition de mots avec un modèle audio et production des mêmes mots sans modèle audio. Notre but était d’étudier l’effet de l’input audio sur la hauteur, l’antériorité et la dispersion des dix voyelles orales du français chez ces deux populations d’enfants. Les résultats de notre étude acoustique indiquent que : (1) l’input immédiat n’influence que la hauteur du /a/ chez les enfants NH, (2) les enfants CI produisent des voyelles /y/, /ø/, /oe/ plus postérieures que les enfants NH mais que cette différence diminue à mesure que la durée d’utilisation de l’implant augmente, et (3) la dispersion de /y/, /ø/, /oe/ est plus grande chez les enfants CI que chez les enfants NH.
  • Sur les traces acoustiques de /ʃ/ et /ç/ en allemand L2
    Jane Wottawa and Martine Adda-Decker
    Abstract: Les apprenants français de l’allemand ont des difficultés à produire la fricative palatale sourde allemande /ç/ (Ich-Laut) et ont tendance à la remplacer par la fricative palato-alvéolaire /ʃ/. Des mesures acoustiques permettent de quantifier ces erreurs de production d’une manière plus objective. Trois mesures acoustiques ont été examinées afin de distinguer au mieux /ʃ/ et /ç/ dans un contexte VC en position finale de mot dans des productions germaniques natives. Elles servent ensuite à quantifier les difficultés de production des apprenants français. 285 tokens de 20 locuteurs natifs et 20 locuteurs L2 ont été analysés. Les mesures appliquées sont la transition des formants, le centre de gravité spectral et des rapports d’intensité par bande de fréquence. Sur les productions natives,les résultats montrent que la mesure la plus fiable pour distinguer acoustiquement entre /ʃ/ et /ç/ est le ratio d’intensité entre fréquences hautes (4-7 kHz) et basses (1-4 kHz). Les mesures confirment également les difficultés de production des natifs français
  • Variabilité des syllabes réalisées par des apprenants de l’anglais
    Nicolas Ballier, Philippe Martin and Maelle Amand
    Abstract: Cette contribution analyse la segmentation syllabique des francophones du corpus d’apprenant d’anglais ANGLISH (Tortel 2009). A partir d’une méthode d’alignement par programmation dynamique, on montre la pertinence d’une analyse de l’interlangue fondée sur la comparaison des syllabes. La comparaison des réalisations est ici centrée sur une typologie des syllabes fondées sur des propriétés distributionnelles, accentuelles et où l’interlangue tient sa place (risques d’isosyllabicité les plus manifestes). La variabilité des réalisations des syllabes est appréciée en fonction des propriétés positionnelles, accentuelles et structurelles des syllabes.
    L’étude démontre l’intérêt d’une approche fonctionnelle des syllabes, plus pertinentes que les intervalles interconsonantiques et intervocaliques (Ramus et al, 1999) pour la discrimination du niveau des locuteurs.
  • Syllabe CVC et cycle mandibulaire : une étude articulatoire des asymétries. Le cas du vietnamien
    Thi Thuy Hien Tran, Nathalie Vallée and Silvain Gerber
    Abstract: The present paper is part of a project that tries to establish the link between phonological and phonetic asymmetries in syllable structures and more specifically the relationship between characteristics of jaw cycle and the MOP, an empirical principle that affects consonantal segments to onset position rather than to coda position. Several previous works on American English have shown evidence of asymmetries within the jaw cycle, which could explain some syllabic structure tendencies, whereas a previous study on French showed a reverse asymmetrical pattern of jaw oscillation. We present here preliminary results on Vietnamese that we discuss in two theoretical frameworks namely Frame/Content Theory and Articulatory Phonology: the first one gives a fundamental role to the jaw in the shape of speech production, whereas the latter assigns a secondary role to the jaw in syllable phonology.
  • Contribuer au progrès solidaire des recherches et de la documentation : la Collection Pangloss et la Collection AuCo
    Alexis Michaud, Séverine Guillaume, Guillaume Jacques, Đăng-Khoa Mạc, Michel Jacobson and Thu-Hà Phạm
    Abstract: La présente communication présente les projets scientifiques et les réalisations de deux collections hébergées par la plateforme de ressources orales Cocoon : la Collection Pangloss, qui concerne principalement des langues de tradition orale (sans écriture), du monde entier ; et la Collection AuCo, dédiée aux langues du Vietnam et de pays voisins. L’objectif est un progrès solidaire des recherches et de la documentation linguistique. L’accent est mis sur les perspectives ouvertes pour la recherche phonétique par certaines réalisations récentes dans le cadre de ces deux Collections.
  • L’invasivité phonologique dans le traitement des anglicismes : une étude quantitative de trois langues
    Tomáš Duběda
    Abstract: Dans la présente étude, nous analysons, dans une perspective typologique, l’adaptation phonologique des anglicismes dans trois langues (français, allemand et tchèque). La classification des formes phonologiques, qui s’appuie sur un système de huit principes d’adaptation, a pour but d’établir le degré d’« invasivité phonologique » propre à chaque langue. L’approximation phonologique (substitution de phonèmes natifs aux phonèmes étrangers) semble être le principe fondamental dans les trois langues analysées, alors que la prononciation orthographique (phonétisation des graphèmes) intervient avant tout en français. La prononciation authentique (imitation phonologique de la langue source) n’est active qu’en allemand. Les mécanismes d’approximation phonologique sont plus invasifs en français que dans les deux autres langues, et ce notamment en ce qui concerne le système vocalique. Globalement, l’invasivité phonologique semble augmenter dans l’ordre allemand – tchèque – français.
  • Réseau de neurones convolutif pour l'évaluation automatique de la prononciation
    Thomas Pellegrini, Lionel Fontan and Halima Sahraoui
    Abstract: Dans cet article, nous comparons deux approches d'évaluation automatique de la prononciation de locuteurs japonophones apprenant le français. La première, l'algorithme standard appelé Goodness Of Pronunciation (GOP), compare les vraisemblances obtenues lors d'un alignement forcé et lors d'une reconnaissance de phones sans contrainte. La deuxième, nécessitant également un alignement préalable, fait appel à un réseau de neurones convolutif ou convolutionnel (CNN) comme classifieur binaire, avec comme entrée des trames de coefficients spectraux. Les deux approches sont évaluées sur deux phones cibles /R/ et /v/ du français, particulièrement difficiles à prononcer pour des natifs japonophones. Les paramètres du GOP (seuils) et du CNN sont estimés sur un corpus de parole lue de locuteurs natifs français, dans lequel des erreurs de prononciation artificielles sont introduites. Un gain de performance relatif de 13.4% a été obtenu avec le CNN, avec une précision globale de 72.6%, sur un corpus d'évaluation enregistré par 23 locuteurs japonophones.
  • Voyelles moyennes en français calédonien : propriétés phonétiques acoustiques
    Eleanor Lewis
    Abstract: Cette étude examine la réalisation des voyelles moyennes /e, ɛ, ø, œ, o, ɔ/ par dix locuteurs du français calédonien. Les propriétés formantiques de ces voyelles sont analysées en ce qui concerne le genre de syllabe dans lesquelles elles se produisent. La durée des voyelles mi-fermées et mi-ouvertes produites en paires minimales est statistiquement comparée. Les résultats indiquent que les locuteurs de cette variété ont tendance à respecter catégoriquement la loi de position, tel que les variantes mi-fermées se présentent dans les syllabes ouvertes et les variantes mi-ouvertes se présentent dans les syllabes fermées. Il existe pourtant une certaine variation individuelle concernant le niveau de conformité à cette loi. Cette étude met également en avant des indices de l’antériorisation du /ɔ/ (et du /o/ en syllabe fermée), une caractéristique qui a été documentée dans d’autres variétés du français.
  • Quels tests d’intelligibilité pour évaluer les troubles de production de la parole ?
    Alain Ghio, Laurence Giusti, Emilie Blanc, Serge Pinto, Lalain Muriel, Danièle Robert, Corine Fredouille and Virginie Woisard
    Abstract: L’intelligibilité de la parole se définit comme le degré de précision avec lequel un message est compris par un auditeur. A ce titre, la perte d’intelligibilité représente souvent une plainte importante pour les patients atteints de troubles de production de la parole, puisqu’elle participe à la diminution de la qualité de vie au niveau communicationnel. Plusieurs outils existent actuellement pour évaluer l’intelligibilité mais aucun ne satisfait pleinement les contraintes cliniques. Dans une première étude, nous avons adapté au français la version 2 du Frenchay Dysarthria Assessment, un test reconnu dans le milieu anglo-saxon pour l’évaluation de locuteurs dysarthriques. Nous avons créé le corpus de mots français en nous appuyant des critères définis dans le FDA-2 puis nous avons testé le protocole sur une cinquantaine de locuteurs. Les résultats sont satisfaisants mais divers biais méthodologiques nous ont conduits à poursuivre notre démarche en proposant des listes de pseudo-mots apparentant le test à du décodage acoustico-phonétique.
  • Une méthode d’évaluation de la compréhension orale par choix d’image : application à de la parole dégradée par simulation de la presbyacousie
    Magnen Cynthia, Tardieu Julien, Fontan Lionel, Gaillard Pascal and Spanghero-Gaillard Nathalie
    Abstract: Nous présentons une méthode permettant d’évaluer la compréhension de la parole dégradée par simulation des effets de la presbyacousie, dans le calme et dans le bruit. Cette méthode intègre des phrases signifiantes et implique pour l’auditeur de sélectionner, parmi un ensemble de quatre images, celle qui correspond à l’énoncé qu’il entend. Le test présente de nombreux avantages méthodologiques comme l’immédiateté du score et le fait qu’il ne nécessite pas de faire répéter la phrase entendue. Les résultats obtenus montrent un effet significatif de la dégradation et du bruit du fond. La cohérence de ces effets avec les études précédentes sur la presbyacousie permet de valider cette méthode. Par ailleurs, la nature exacte du score mesuré dans ce test est discutée en le comparant avec le score d’intelligibilité obtenu par répétition d’items dans une précédente étude.
  • Alignement de séquences phonétiques pour une analyse phonologique des erreurs de transcription automatique
    Camille Dutrey, Martine Adda-Decker and Naomi Yamaguchi
    Abstract: La transcription automatique de la parole obtient aujourd'hui des performances élevées avec des taux d'erreur qui peuvent tomber en dessous de 10\% pour une parole journalistique. Cependant, pour des conversations plus libres, ils stagnent souvent autour de 20-30\%. En français, une grande partie des erreurs sont dues à des confusions entre homophones n'impliquant pas les niveaux acoustico-phonétique et phonologique. Cependant, de nombreuses erreurs peuvent s'expliquer par des variantes de prononciations non prévues dans le lexique. Afin de mieux comprendre quels processus phonologiques pourraient expliquer ces variantes spécifiques de la parole spontanée, nous proposons une analyse des erreurs en comparant prononciations attendue (référence) et reconnue (hypothèse) \textit{via} un alignement phonétique par programmation dynamique. Les distances locales entre paires de phonèmes appariés correspondent au nombre de traits phonétiques disjoints. Nos analyses permettent d'identifier les traits phonétiques les plus fréquemment impliqués dans les erreurs et donnent des pistes pour des interprétations phonologiques.
  • Une pénalité floue fondée phonologiquement pour améliorer la Sélection d'Unité
    David Guennec and Damien Lolive
    Abstract: Les systèmes de synthèse par corpus reposent, sauf de rares exceptions, sur des coûts cibles et des coûts de concaténation pour sélectionner la meilleure séquence d'unités. Le rôle du coût de concaténation est de s'assurer que l'assemblage de deux segments de parole ne causera l'apparition d'aucun artefact acoustique. Pour cette tâche, des distances acoustiques (MFCC, F0) sont généralement utilisées, mais dans de nombreux cas cela ne suffit pas. Dans cet article, nous introduisons une pénalité héritée du domaine de la couverture de corpus dans le coût de concaténation afin de bloquer certaines concaténations en fonction de la classe phonologique des diphones à concaténer. En outre, une seconde version faisant appel à une fonction floue est proposée pour relâcher la pénalité en fonction du positionnement du coût de concaténation par rapport à sa distribution. Une évaluation objective montre que la pénalité est efficace et amène à un meilleur classement des séquences d'unités candidates au cours de la sélection. Une évaluation subjective révèle une performance supérieure de l'approche floue.
  • Pics mélodiques prétoniques en portugais brésilien : une étude quantitative
    Plínio Barbosa and Philippe Boula de Mareüil
    Abstract: Le présent travail porte sur un trait prosodique assez typique du portugais brésilien : un pic mélodique en position prétonique en fin d’énoncé déclaratif. Il vise à quantifier le phénomène, à partir d’enregistrements de cinq hommes et cinq femmes de l’état de São Paulo, en lecture et en narration. Il en résulte que des montées sur les prétoniques de 4 demi-tons suivies de descentes de 8 demi-tons, en moyenne, s’observent dans les deux styles de parole, chez les femmes. Chez les hommes, ces valeurs sont respectivement de 3 et 7 demi-tons. Ces montées-descentes d’une tierce et d’une quinte, respectivement, peuvent donner au portugais brésilien cette musicalité particulière et, puisque les descentes sont plus rapides chez les femmes, elles ouvrent des perspectives sociolinguistiques intéressantes.
  • La distinction entre les paraphasies phonétiques et phonologiques dans l’aphasie : Etude de cas de deux patients aphasiques
    Clémence Verhaegen, Véronique Delvaux, Kathy Huet, Fagniart Sophie, Myriam Piccaluga and Bernard Harmegnies
    Abstract: La spécificité phonologique ou phonétique des erreurs de production orale observées chez les patients aphasiques reste débattue. Cependant, la distinction entre ces deux types d’erreurs est fréquemment basée sur des analyses perceptives qui peuvent être influencées par le système perceptif de l’expérimentateur. Afin de pallier ce biais, nous avons réalisé des analyses acoustiques des productions de deux patients aphasiques, dans une tâche de répétition de non-mots. Nous nous sommes centrés sur l’analyse de consonnes occlusives. Les résultats ont montré la présence de difficultés de gestion du voisement chez les deux patients, indiquant la présence de troubles phonétiques. En outre, les résultats montrent une grande diversité des manifestations des troubles langagiers des patients ainsi que l’intervention potentielle de stratégies de compensation de leurs difficultés. L’intérêt de procéder à des analyses acoustiques précises utilisant des indices multiples est discuté.
  • Investigation glottographique et laryngoscopique de la transition entre les deux principaux mécanismes laryngés
    Arthur Givois, Didier Demolin, Lise Crevier-Buchman and Angélique Amelot
    Abstract: Cet article étudie par une approche descriptive la transition entre le premier et le second mécanisme laryngé. Des mesures électroglottographiques ont été réalisées simultanément à des captures d’images par laryngoscopie sur deux sujets : une femme et un homme. Des différences de comportement entre les deux sujets ont été observées. Un mouvement vertical de grande amplitude du larynx est systématiquement observé au moment de la transition chez le sujet masculin, tandis que des modifications de petite amplitude de la distance entre paroi pharyngale et épiglotte, ou de la compression des plis aryépiglottiques sont remarquées chez le sujet féminin. Ces changements de configurations s'effectuent de façon continue chez cette dernière alors qu'un changement soudain de l'activité des plis vocaux a lieu à un instant précisément localisé pour les productions des deux sujets. Cette étude qualitative met en évidence la variabilité des stratégies de contrôle neuromusculaires de la fréquence fondamentale en fonction des mécanismes laryngés.
  • Acquisition et reconnaissance automatique d’expressions et d’appels vocaux dans un habitat.
    Michel Vacher, Benjamin Lecouteux, Frédéric Aman, François Portet and Solange Rossato
    Abstract: Cet article présente un système capable de reconnaître les appels à l’aide de ersonnes âgées vivant à domicile afin de leur fournir une assistance. Le système utilise une technologie de Reconnaissance Automatique de la Parole (RAP) qui doit fonctionner en conditions de parole distante et avec de la parole expressive. Pour garantir l’intimité, le système s’exécute localement et ne reconnaît que des phrases prédéfinies. Le système a été évalué par 17 participants jouant des scénarios incluant des chutes dans un Living lab reproduisant un salon. Le taux d’erreur de détection obtenu, 29%, est encourageant et souligne les défis à surmonter pour cette tâche.
  • Analyses acoustiques des monophtongues du luxembourgeois produites dans la parole lue
    Tina Thill
    Abstract: Cet article présente une analyse acoustique de 12 monophtongues du luxembourgeois parlé dans la région centrale du Grand-duché de Luxembourg. Cette analyse fait partie du travail empirique de notre thèse de doctorat sur les productions natives et non natives des voyelles du luxembourgeois. A partir des données de 10 locuteurs natifs, nous analysons les valeurs des trois premiers formants et de la durée des voyelles longues et brèves opposées [iː]-[i], [eː]-[e], [aː]-[ɑ], [oː]-[ɔ], [uː]-[u] et de l’allophone [ɛː] réalisée lorsqu’elle est suivie d’un /r/. Les analyses montrent que (i) les voyelles longues et brèves se distinguent tant par la durée acoustique que par le timbre, (ii) la voyelle semi-ouverte [ɛː] suivie d’un /r/ vocalisé tend à se diphtonguer.
  • Comparaison de listes d'erreurs de transcription automatique de la parole : quelle complémentarité entre les différentes métriques ?
    Olivier Galibert, Juliette Kahn and Sophie Rosset
    Abstract: Le travail que nous présentons ici s'inscrit dans le domaine de l'évaluation des systèmes de reconnaissance automatique de la parole en vue de leur utilisation dans une tâche avale ici la reconnaissance des entités nommées. Plus largement, la question que nous nous posons est "que peut apporter une métrique d'évaluation en dehors d'un score ?". Nous nous intéressons particulièrement aux erreurs des systèmes et à leur analyse et éventuellement à l'utilisation de ce que nous connaissons de ces erreurs.
    Nous étudions dans ce travail les listes d'erreurs générées à partir de différentes métriques et analysons ce qui en ressort. Nous avons appliquons la même méthode sur différentes sorties de systèmes de reconnaissance de la parole. Nos expériences mettent en évidence que certaines métriques apportent une information plus stables, transverses à différents systèmes étant donné une tâche.
  • Etude acoustique et analyse phonologique sur /ə˞/ suffixe rhotique en mandarin
    Anqi Liu
    Abstract: Historiquement, le suffixe /ə˞/ est un suffixe diminutif correspondant au mot 儿 ( <er> en pinyin ) qui signifie ''petitesse''. Cependant, il relève d’une particularité du style plutôt que de la grammaire. Nous l’avons souvent trouvé dans nos enregistrements de parole conversationnelle, de locuteurs du nord de la Chine. Pour mieux comprendre le phénomène et son comportement en parole spontanée, on a d'abord fait une étude acoustique du texte lu qui nous a permis de vérifier l'analyse phonologique proposée par Duanmu (2007). Basé sur les résultats de l'étude acoustique, nous notons quelques différences de l'analyse de Duanmu et nous proposons une nouvelle-analyse basée sur la phonologie articulatoire(Browman & Goldstein1992). Dans une étude future, nous allons comparer les résultats de l'analyse acoustique du texte lu avec ceux de la parole conversationnelle pour mieux comprendre la variation phonétique dans la parole spontanée.
  • L'impact des variations temporelles intrinsèques et extrinsèques de la voyelle sur la relation consonne-voyelle : Étude translinguistique sur l'arabe jordanien et le français
    Mohammad Abuoudeh and Olivier Crouzet
    Abstract: Cette étude permet d’explorer les variations spectrales engendrées par deux types de variations temporelles qui résultent respectivement de l’opposition de longueur vocalique et des variations de débit de parole. Deux protocoles expérimentaux ont été conçus, l’un en arabe jordanien et l’autre en français, pour examiner ce phénomène. Un intérêt particulier a été porté aux occlusives produites dans des séquences CVC dans le but d’étudier la consonne en position initiale et la coarticulation anticipatoire. La durée des voyelles et la fréquence des trois premiers formants au début et au milieu de chaque séquence ont été mesurées dans chaque condition de longueur / débit. Les équations de locus ont été utilisées afin de décrire la relation CV quand elle subit ces deux types de variations.
  • Contribution à l'étude de la focalisation prosodique en français
    Rémi Godement-Berline
    Abstract: Cette étude porte sur la focalisation prosodique en français dans plusieurs styles de parole (parole spontanée et lecture ou interprétation par des acteurs). Nous attribuons à la focalisation des fonctions sémantico-pragmatiques ou emphatiques. Un groupe de dix experts en prosodie a relevé les occurrences de focalisation dans le corpus d’étude. Les résultats confirment que la focalisation est réalisée par une augmentation de hauteur et de durée. Ils diffèrent de la littérature précédente du point de vue du type de contour prosodique employé sur les occurrences de focalisation et de la présence d’accent initial. Des problèmes méthodologiques sont soulevés concernant l’analyse des contours terminaux et de la désaccentuation.
  • Voix de femmes, voix d’hommes: une étude du voice onset time, de la répartition consonnes/voyelles et du débit de parole chez des locuteurs francophones et anglophones américains
    Erwan Pépiot
    Abstract: La présente étude est une analyse acoustique de mots et pseudo-mots de type /CVCV/ produits par des locuteurs anglophones du nord-est des États-Unis (5 femmes, 5 hommes) et des francophones parisiens (5 femmes, 5 hommes). Le VOT des consonnes occlusives initiales, la durée des énoncés, ainsi que la répartition temporelle consonnes/voyelles ont été mesurés. Des différences inter-genres significatives ont été observées dans les deux langues sur chacun des paramètres testés : le contraste de VOT entre les occlusives sourdes et voisées s’est révélé plus important chez les locutrices, le débit de parole plus élevé chez les locuteurs masculins, et la proportion occupée par les consonnes plus importantes chez les femmes. Ces résultats suggèrent une tendance à la recherche d’une plus grande intelligibilité chez les locutrices. Les différences acoustiques femmes-hommes seraient donc en partie construites socialement.

Démos

Démonstrations JEP/TALN - Vendredi 11h00-16h00 (D) - salles 3.14 à 3.19

Présidents de session : Ophélie Lacroix et Corentin Ribeyre

  • Lecture bilingue augmentée par des alignements multi-niveaux
    François Yvon, Yong Xu, Marianna Apidianaki, Clément Pillias et Cubaud Pierre
    Abstract: Le travail qui a conduit à cette démonstration combine des outils de traitement des langues multilingues, en particulier l'alignement automatique, avec des techniques de visualisation et d'interaction. Il vise à proposer des pistes pour le développement d'outils permettant de lire \emph{simultanément} les différentes versions d'un texte disponible en plusieurs langues, avec des applications en lecture de loisir ou en lecture professionnelle.
  • Un système automatique de sélection de réponse en domaine ouvert intégrable à un système de dialogue social
    Franck Charras, Guillaume Dubuisson Duplessis, Vincent Letard, Anne-Laure Ligozat et Sophie Rosset.
    Abstract: Cette démonstration présente un système de dialogue en domaine ouvert qui utilise une base d’exemples de dialogue automatiquement constituée depuis un corpus de sous-titres afin de gérer un dialogue social de type « chatbot ».

    This demonstration exhibits an example-based system that uses a database of indexed dialogue examples automatically built from a television drama subtitle corpus to manage social open-domain dialogue.
  • LNE-Visu : une plateforme d’exploration et de visualisation de données d’évaluation
    Guillaume Bernard, Juliette Kahn, Olivier Galibert, Rémi Regnier et Séverine Demeyer
    Abstract: LNE-Visu est une interface de visualisation et d’exploration de données multimédia qui regroupe les données des campagnes d’évaluation organisées par le LNE. Elle propose 3 fonctionnalités principales : explorer et sélectionner des corpus, visualiser et écouter des données et effectuer des tests de significativités de différences.
  • Construction automatisée d'une base de connaissances
    Olivier Mesnard, Yoann Dupont, Jérémy Guillemot et Rashedur Rahman
    Abstract: Le système présenté démontre la construction automatisée d'une base de connaisances à partir d'une colection de documents. Il s'appuie sur de l'apprentissage distant pour l'extraction d'hypothèses de relations entre mentions d'entités et consolide ces hypothèses avec des algorithme orientés graphe.
  • Identification de lieux dans les messageries mobiles
    Clément Doumouro, Adrien Ball, Joseph Dureau et Sylvain Raybaud
    Abstract: Nous présentons un système d’identification de lieux dans les messageries typiquement utilisées sur smartphone. L’implémentation sur mobile et son cortège de contraintes, ainsi que la faible quantité de ressources disponibles pour le type de langage utilisé rendent la tâche particulièrement délicate. Ce système, implémenté sur Android, atteint une précision de 30% et un rappel de 72%.
  • ACGtk : un outil de développement et de test pour les grammaires catégorielles abstraites
    Sylvain Pogodalla
    Abstract: Nous présentons un outil, ACGtk, offrant un environnement de développement et d'utilisation des grammaires catégorielles abstraites pour l'analyse et la génération.
  • Tag Thunder : plateforme de démonstration et d'expérimentation
    Jean-Marc Lecarpentier, Elena Manishina, Maxence Busson, Fabrice Maurel et Stephane Ferrari
    Abstract: Dans cette démonstration, nous proposons un système qui permettrait aux utilisateurs non-voyants d'obtenir le {\em first glance} d'une page web. L'objectif est de réduire le temps d'accès à la structure logico-thématique de la page et de favoriser le développement de stratégies de lecture de haut niveau. Notre concept, appelé Tag Thunder, s'appuie sur une phase de segmentation de la page en zones, suivie d'une étape de représentation des zones par un mot ou groupe de mots, puis une vocalisation simultanée de ces représentants.
  • STAM : traduction des textes non structurés (dialectes du Maghreb)
    Mehdi Embarek et Soumya Embarek
    Abstract: L’utilisation des plateformes de communication (réseaux sociaux, forums de discussions, ...) a pris une ampleur considérable. Ces plateformes permettent aux internautes d’exprimer leur avis concernant un sujet, demander ou échanger des informations, commenter un événement, etc. Ainsi, nous retrouvons dans ces différentes sources d’informations une quantité importante de textes rédigés dans des dialectes locaux dont sont originaires les rédacteurs. Cependant, ces textes non structurés rendent l’exploitation des outils de traitement automatique des langues très difficile. Le système STAM aborde cette problématique en proposant un système capable de transcrire automatiquement des textes écrits dans un dialecte parlé dans les pays du Maghreb en un texte facilement interprétable et compréhensible (français ou anglais).
  • AppFM, un outil de gestion de modules TAL
    Paul Bui-Quang, Brigitte Grau et Patrick Paroubek
    Abstract: AppFM est un outil à mi chemin entre un environnement de création de chaînes modulaires de traitement de la langue et un gestionnaire de services systèmes. Il permet l'intégration d'applications comprenant des dépendances complexes en des chaînes de traitements réutilisables facilement par le biais de multiples interfaces.
  • Un analyseur de conversations pour la relation client
    Hugues de Mazancourt, Gaëlle Recourcé et Soufian Salim
    Abstract: Cette démonstration du projet ODISAE a pour objet de présenter l’utilisation d’un analyseur de conversations par email ou chat dans le cadre d’une application de support client : mise en valeur des demandes d’action, repérage des thèmes dangereux, tableau de bord pour le superviseur, alertes pour l’agent ...
  • Un outil multilingue d’extraction de collocations en ligne
    Luka Nerima, Violeta Seretan et Eric Wehrli
    Abstract: Cette démonstration présente la version web d’un outil multilingue d’extraction de collocations. Elle est destinée aux lexicographes, aux traducteurs, aux enseignants et apprenants L2 et, plus généralement, aux linguistes désireux d’analyser et d’exploiter leurs propres corpus.
  • Radarly : écouter et analyser le web conversationnel en temps réel
    Jade Copet, Christine de Carvalho, Virginie Mouilleron, Benoit Tabutiaux et Hugo Zanghi
    Abstract: De par le contexte conversationnel digital, l’outil Radarly a été conçu pour permettre de traiter de grands volumes de données hétérogènes en temps réel, de générer de nouveaux indicateurs et de les visualiser sur une interface cohérente et confortable afin d’en tirer des analyses et études pertinentes. Ce document expose les techniques et processus utilisés pour extraire et traiter toutes ces données.
  • FlexiMac 1.1. – conjugueur automatique du verbe macédonien
    Jovan Kostov
    Abstract: Cette démonstration présente la plateforme FlexiMac 1.1., générateur automatique des verbes macédoniens qui permet de conjuguer un verbe dans la plupart des modes et des temps, sans faire appel à une base de données. Après un bref exposé du fonctionnement de la plateforme, nous allons également évoquer les travaux actuels qui en ont découlé, et ceux qui sont en train d’émerger dans une perspective de traitement automatique du macédonien en tant que langue européenne peu-dotée.

    FlexiMac 1.1. – Automatic Generator of the Verbal Paradigms of the Macedonian language.
    This paper presents the FlexiMac 1.1. platform, an automatic generator of Macedonian verbs that conjugates verbs in most moods et tenses, without any use of a database. After a brief presentation of the platform’s architecture, we will also discuss the current et emerging works that resulted from this research et that can be used for a natural processing of the Macedonian language as one of the less-documented European languages.
  • CommunicoTool Advance, un prototype d’application d’aide à la communication
    Charlotte Roze
    Abstract: CommunicoTool Advance est un prototype d’application mobile d’aide à la communication destinée à des personnes qui présentent des troubles moteurs et des troubles de la parole.
  • SOFA : Une plateforme d'analyse syntaxique en ligne pour l'ancien français
    Gaël Guibon
    Abstract: SOFA une application web dédiée à l'étiquetage syntaxique de l'ancien français. Cette plateforme est une démonstration permettant d'appliquer sur n'importe quel texte, ou sur un des textes d'ancien français, des modèles de lemmatisation, d'annotation morpho-syntaxique, et d'analyse syntaxique, en plus d'en visualiser les performances.
  • Exploration de collections d’archives multimédia dans le contexte des Humanités Numériques : revisiter TALN’2015 ?
    Géraldine Damnati, Marc Denjean et Delphine Charlet
    Abstract: Cette démonstration présente un prototype d’exploration de contenus multimédias développé dans le but de faciliter l’accès aux contenus de la Connaissance. Après une extraction automatique de métadonnées, les contenus sont indexés et accessibles via un moteur de recherche spécifique. Des fonctionnalités innovantes de navigation à l’intérieur des contenus sont également présentées. La collection des enregistrements vidéo de TALN’2015 sert de support privilégié à cette démonstration.
  • E-Quotes : un outil de navigation textuelle guidée par les annotations sémantiques
    Motasem Alrahabi
    Abstract: Nous présentons E-Quotes, un outil de navigation textuelle guidée par les annotations sémantiques. Le système permet de localiser les mots clés et leurs variantes dans les citations sémantiquement catégorisés dans corpus annoté, et de naviguer entre ces citations. Nous avons expérimenté ce système sur un corpus de littérature française automatiquement annoté selon des catégories sémantiques présentes dans le contexte des citations, comme par exemple la définition, l'argumentation, l'opinion, l'ironie ou la rumeur rapportées.
  • Héloïse, une plate-forme pour développer des systèmes de TA compatibles Ariane en réseau
    Vincent Berment, Christian Boitet et Guillaume de Malézieux
    Abstract: Dans cette démo, nous montrons comment utiliser Héloïse pour développer des systèmes de TA.
  • Interface Web pour l'annotation morpho-syntaxique de textes
    Thierry Hamon
    Abstract: Nous présentons une interface Web pour la visualisation et
    l'annotation de textes avec des étiquettes morphosyntaxiques et des lemmes. Celle-ci est actuellement utilisée pour annoter des textes ukrainiens avec le jeu d'étiquettes Multext-East. Les utilisateurs peuvent rapidement visualiser les annotations associées aux mots d'un texte, modifier les annotations existantes ou en ajouter de nouvelles. Les annotations peuvent chargées et exportées en XML au format TEI, mais aussi sous forme tabulée. Des scripts de conversion de format et de chargement dans une base de données sont également mis à disposition.

Salon Partenariats Recherche et Industries de la Langue (PAREIL) - salles 3.02 à 3.04, 3.12 à 3.19


12h45-14h00 - Buffet (cafétéria) et Salon PAREIL salles 3.02 à 3.04, 3.12 à 3.19


14h00-16h00 - Démos JEP/TALN (salles 3.14 à 3.19), Salon PAREIL (salles 3.02 à 3.04, 3.12 à 3.19), Table ronde (amphi 4)


16h00-16h30 - Clôture (amphi 4)