Lecture et interaction bilingues enrichies par les données d’alignement 

Participants

Résumé

L’objectif du projet TransRead est d’étudier de nouvelles applications multilingues destinées à faciliter la consultation de documents en plusieurs langues par des utilisateurs imparfaitement bilingues. Au rebours des approches “boîte noire”, qui ciblent un public monolingue, TransRead s’intéresse donc en premier lieu à la visualisation de textes bilingues et des alignements qui les lient. Une technologie, largement banalisée, d’exploitation d’alignements bilingues est le sous-titrage, qui permet de lire dans une langue ce qu’on entend dans une autre, les deux modalités s’enrichissant mutuellement à des degrés qui varient selon les compétences linguistiques des spectateurs. Par analogie, une des visées de TransRead est l’exploration des formes que pourrait prendre le sous-titrage de livres et d’imaginer comment l’utilisation d’alignements translingues, calculés au niveau des phrases et des groupes de mots, mais également au niveau des entrées de dictionnaire, permettront de faciliter et d’enrichir et l’expérience de lecture en langue source. Nous comptons, à cet effet, mobiliser les possibilités offertes par l’arrivée de nouveaux types d’équipements mobiles (tablettes tactiles, lecteurs électroniques) et les avancées des techniques de visualisation d’information.

Entre méconnaissance totale d’une langue (traduire est indispensable) et bilinguisme parfait (traduire est inutile), il existe une multiplicité de contextes de bilinguisme partiel, qui pourraient utilement bénéficier de tels dispositifs de médiation multilingue: des apprenants d’une langue seconde, des adultes éduqués évoluant dans un contexte international, des migrants en phase d’insertion, des habitants de pays multilingues, des locuteurs de langues apparentées, ou encore, dans un cadre plus industriel, des traducteurs ou des travailleurs des métiers de l’édition littéraire, technique, juridique ou commerciale. Ce dernier contexte permettra d’explorer un second cadre applicatif, celui du contrôle de qualité de traductions humaines et/ou de mémoires de traduction. Les corpus parallèles ou bitextes, constitués d’un texte et de sa traduction, sont des ressources essentielles pour les environnements de traduction assistée par ordinateur. Il est possible d’en extraire des lexiques, des terminologies bilingues, voire des mémoires de traduction, sans parler de leur utilisation en TA statistique. La question de la qualité de ces ressources et de leur adéquation à ces utilisations est pourtant peu étudiée. Un second objectif de TransRead est d’étudier et de développer des stratégies d’exploration de bitextes qui permettront d’en mieux contrôler la qualité; un aspect important de cette étude étant le calcul d’indicateurs numériques de la validité de l’alignement entre deux versants d’un bitexte; un autre étant de trouver les techniques de visualisation adaptées au traitement efficace de ces grands corpus.

À lire aussi

Idex VoCSI-Telly (2021-2022)

Idex VoCSI-Telly (2021-2022)

The VoCSI-Telly Project Keywords: forensic voice comparison, TV series, phonetics, film studiesFunding The VoCSI-Telly project is funded by funded by Idex Université de Paris PI Emmanuel Ferragne Clillac-Arp Margaux Cecchini Anne Guyot-Talbot LARCA Martine Beugnet...

Idex SEPALE (2021-2022)

Idex SEPALE (2021-2022)

“Pedagogical innovation” project SEPALEFunding The SEPALE project is funded by funded by Idex Université de Paris Participants Core team Emmanuel Ferragne Anne Guyot-Talbot Sylvain Navarro Other members Hanane Amrane Nada Azizi Hannah King Alice Léger Francesca...

PHC Procope (2019-2021)

PHC Procope (2019-2021)

Project Procope Surprise Questions from a Comparative PerspectiveFunding Programme Hubert Curien, programme n°42412PC, 7000€ Participants Agnès Celle Andreas Trotzke (U. of Konstanz) Resume The aim of this linguistic project is to break new ground in the treatment of...

PHC Procope (2019-2021)

PHC Parrot (2019-2021)

Project Parrot Surprise Questions from a Comparative PerspectiveFunding Programme Hubert Curien, programme n° 42231NG, 6500€ Participants Agnès Celle Anu Treikelder (U. of Tartu) Resume The aim of this linguistic project is to break new ground in the treatment of...