Directrice du laboratoire CLILLAC-ARP
Présentation générale / General Information
Linguiste de corpus de la première heure, j’ai travaillé sur un corpus d’apprenants d’anglais L2 au début des années 1990, puis ai conçu un concordancier en ligne pour l’anglais spécialisé en 1998, et enfin, j’ai introduit l’utilisation de corpus et de la traduction automatique dans la formation en traduction spécialisée au début des années 2000. Mes recherches actuelles portent sur les corpus d’apprenants en traduction spécialisée et en post-édition, la traduction de la prosodie sémantique et l’évaluation de la traduction automatique neuronale dans les discours, en particulier en ce qui concerne la terminologie et la phraséologie spécialisée.
A specialist in corpus linguistics, I worked on a corpus of L2 English learners in the early 1990s, then designed an online concordancer for specialised English in 1998, and finally introduced the use of corpora and machine translation in translation training in the early 2000s. My current research focuses on learner corpora in specialised translation and post-editing, translation of semantic prosody, and the evaluation of neural machine translation in specialised languages, especially in terminology and specialised phraseology.
Domaines de recherche / Research areas
Linguistique de corpus, discours spécialisé, terminologie, phraséologie, traduction spécialisée, traduction automatique
Corpus linguistics and specialized discourse, terminology, phraseology, specialised translation, machine translation
Projets / Projects
- 2023-2026 ANR-22-CE23-0033-04 MATOS Traduction automatique pour la science ouverte – Machine Translation for Open Science,
porteur François Yvon, Paris Sorbonne et CNRS
Responsable d’un WP pour Université Paris Cité - 2021-2022 : Idex CORPUS SPECIALISES ET TRADUCTION NEURONALE specialised corpora and neural translation (SPECTRANS),
porteur Nicolas Ballier
Participation - 2015-2018 : ANR TRANSREAD : Enriching Bilingual Reading and Interaction with Cross-lingual Alignments,
porteur François Yvon LIMSI, Paris-Saclay
Responsable pour le CLILLAC-ARP - 2015-2017 : Idex Néoveille,
porteur Emmanuel Cartier, Université Sorbonne Paris Nord
Responsable pour Université Paris Diderot - 2016 : Idex SPECIALIST : Corpus en langues de spécialité
Coordinatrice - 2014-aujourd’hui : Corpus d’apprenants de la traduction spécialisée,
en collaboration avec Alexandra Mestivier (CLILLAC-ARP) et Mojca Pecman (CLILLAC-ARP), ainsi que Hanna Martikainen (ESIT, Sorbonne-Nouvelle) et Maud Bénard (CLILLAC-ARP) - 2004-2007 : Porteuse de Multilingual e Learning in Language Engineering – MeLLANGE: projet européen de dix partenaires :
– corpus multilingue et multidomaines d’apprenants de la traduction,
– formation 100% en ligne pour les traducteurs spécialisés - 2007 – aujourd’hui : Co-création de la base de données ARTES et participation constante
Co-direction : Juilliard, Kübler, Pecman, puis Pecman
Enseignements / Teaching
- L1 UFR LCAO : Introduction à la linguistique de corpus
- M1 ILTS-LSCT-CTM et ENS Saclay : Linguistique de corpus et langues de spécialité
- M1 ILTS-LSCT-CTM : Linguistique de corpus appliquée à la traduction et à la post-édition
- M2 LSCT, ENS Saclay et doctorants : Traductologie de corpus
- M2 LSCT-ILTS : Linguistique de corpus pour traducteurs
Encadrements / PhD supervision
Thèses en cours
- Margaux Guillerit : contrat doctoral ENS : Analyse pragmatique et interactionnelle des échanges entre juges et avocats lors des “oral arguments” à la Cour suprême des Etats-Unis. Co-direction 50% avec Simon Taylor, Université Paris X Nanterre. Depuis septembre 2019.
- Maud Benard : contrat doctoral Université de Paris : Difficulté de traduction automatique des groupes nominaux complexes dans les articles de recherche en langue de spécialité médicale et dans le domaine du TAL : aide à la formation des post-éditeurs professionnels et occasionnels. Depuis septembre 2020, soutenance prévue le 10 janvier 2024
- Anastasia Buturlakina : Prosodie sémantique et humour : analyse contrastive et traductologique des présentations TED en anglais et en français. Depuis novembre 2020
- Marie Serisier : contrat doctoral Université Paris Cité : La manosphère. Construction d’identités plurielles et radicales sur Reddit. Co-tutelle 50% avec Sébastien de Valériola (spécialité informatique et apprentissage profond), Université Libre de Bruxelles. Depuis septembre 2022.
- Agnès Ganet : contrat doctoral ENS : Les supports audiovisuels et l’anglais de spécialité: étude du triptyque vulgarisation-information-promotion à travers les vidéos réalisées à l’occasion d’expositions de mode. Depuis septembre 2023
- José Cornejo Carcamo : contrat doctoral ANR MaTOS : Variation terminologique et traduction automatique neuronale : étude et évaluation du traitement de la variation terminologique en santé, environnement, traitement automatique des langues. Co-direction 50% avec Alexandra Mestivier. Depuis octobre 2023
Thèses soutenues
- Soutenance: le 5 décembre 2008: Alexandra Volanschi : Étude et modélisation des phénomènes collocationnels : Implémentation dans un système d’aide à la rédaction en anglais scientifique. Mention Très Honorable avec les félicitations du Jury à l’unanimité.
- Soutenance : le 22 avril 2011 : Geneviève Bordet : Étude discursive des résumés de thèse dans une perspective d’analyse de genre. Mention Très Honorable avec Félications à l’unanimité.
- Soutenance: le 16 septembre 2011 : Yaliz Yelin : Analyse de corpus d’un domaine émergent : la formation ouverte et à distance. Mention Très Honorable.
- Soutenance: le 15 octobre 2011 : Hieu Le Chi : Les conventions internationales dans le domaine maritime : analyse de la terminologie verbale en français et vietnamien. Mention Honorable.
- Soutenance: le 10 décembre 2014 : Corinne Landure : Étude comparative de l’exploitation directe de corpus générique et spécifique par des apprenants LANSAD. Co-direction avec le Professeur Alex Boulton, Université de Lorraine Nancy 2. Taux de co-encadrement 50%.
- Soutenance: le 14 mars 2015 : Gabriella Serrone : Études des adages juridiques dans une approche contrastive français/italien. Co-tutelle avec le Professeur Mirella Connena, Université de Brescia, Italie. Taux de co-encadrement 50%.
- Soutenance: le 29 novembre 2016 : Olga Andronova : Industrialisation de l’enseignement de l’anglais à l’université : évaluation d’un dispositif hybride d’auto-formation suivie. Co-direction avec le Professeur Jean-Paul Narcy-Combes, Université Paris 3. Taux de co-encadrement 50%.
- Soutenance: le 23 novembre 2019 : Hanna Martikainen : contrat doctoral Paris Diderot : Sources de biais d’interprétation dans la traduction automatique post-éditée des résumés de revues systématiques Cochrane.
- Soutenance: le 17 avril 2020 : Coralie Schneider : contrat doctoral ENS Cachan : Étude des phénomènes de création néologique dans le domaine de la recherche médicale traitant des maladies rares. Co-tutelle avec Rosa Estopa, Université Pompeu Fabra. 50%
- Soutenance: le 25 novembre 2021 : Claire Kloppmann : contrat doctoral ENS : La révolution internet et l’anglais de spécialité : étude diachronique de la persuasion dans des genres discursifs du domaine de l’architecture. Codirection avec Shirley Carter-Thomas, 50%.
Publications
- [hal-04700009] Étude des Protocoles d' Évaluation Humaine pour la Traduction de Documentspar ano.nymous@ccsd.cnrs.fr.invalid (Maud Bénard) le septembre 17, 2024 à 13:18
Ce rapport fait le point sur les différents protocoles qui permettent d’évaluer la qualité de la traduction humaine, de la traduction […]
- [hal-04633289] Enseigner les langues en hybride à l’universitépar ano.nymous@ccsd.cnrs.fr.invalid (Isabelle Cros) le juillet 3, 2024 à 10:58
Bien avant que la crise sanitaire de la COVID-19 ne vienne bouleverser les pratiques d’enseignement et d’apprentissage en forçant la […]
- [hal-04573922] Translate your Own: a Post-Editing Experiment in the NLP domainpar ano.nymous@ccsd.cnrs.fr.invalid (Rachel Bawden) le mai 13, 2024 à 17:06
The improvements in neural machine translation make translation and post- editing pipelines ever more effective for a wider range of applications. In […]
- [hal-04131594] MaTOS: Traduction automatique pour la science ouvertepar ano.nymous@ccsd.cnrs.fr.invalid (Maud Bénard) le juin 20, 2023 à 16:48
Cette contribution présente le projet MaTOS (Machine Translation for Open Science), qui vise à développer de nouvelles méthodes pour la […]