Parcours
(à suivre/tbc)
En délégation CNRS au LLF jusqu’en août 2024.
Coordonnées
nicolas.ballier AT u-paris DOT fr
bureau 712
phone : 33+ (0)1 57 27 58 74
Présentation générale
Domaines de recherche
prosodie de corpus
traduction neuronale
analyse automatique des corpus d’apprenants
humanités numériques
épistémologie de la linguistique (3e révolution de la grammatisation)
Projets récents
PAPTAN( co-porteur avec Maria-Zimina Poirot)
plateforme pour les expériences en IA et en traduction neuronale.
MAKE-NMT VIZ : porteurs Genoble/Swansea (2023-2024)
Responsable d’un WP pour Université Paris Cité
DLLA Deep Learning for Language Assessment (2022-2023)
porteur du projet avec Helen Yannadoukakis pouir KCL
Neuroviz (2021-2022)
porteur principal: Guillame Wisniewski
SPECTRANS (2020-2022)
porteur principal de ce projet interdisciplinaire sur la traduction neuronale spécialisée (SPECTRANS)
Github du projet avec les données
Dernières publications
# communications
Ballier, N. & Helen Yannakoudakis, H. (2022) Towards crowdsourcing research for learner keylogging data, LCR 2022, Padova, 22-24 sept.
Chamoun, J. & Ballier, N. 2022, Automatic Analysis of Learner Essays based on Complexity Metrics using Machine Learning Algorithms, LCR 2022, Padova, 22-24 sept.
Ballier, N. (2022) Faut-il former à ce que voit le réseau de neurones pour l’entraînement de la traduction ?, colloque Université libre de Bruxelles, Enseigner la traduction et l’interprétation à l’heure neuronale, 28-29 septembre 2022
Namdarzadeh, B. & Ballier,N. 2022 What Does Neural Machine Translation Learn ? A Snapshot from Google Translate & DeepL (2021-February 2022), colloque Université libre de Bruxelles, Enseigner la traduction et l’interprétation à l’heure neuronale, 28-29 septembre 2022. https://tradital.ltc.ulb.be/medias/fichier/2022-colloque-tradital-programme-online_1660741236130- pdf
Ballier, Nicolas (2022), Traduire les dislocations de l’oral avec la traduction neuronale, Le cas des dislocations à gauche dans le CFPP
du Corpus de Français Parlé Parisien (CFPP) des années 2000, colloque TROL – Traduire l’oralité à l’ère de l’IA,
Université de Turin – 5-6 décembre 2022
# articles de conférences
Namdarzadeh, B. & Ballier, N. (2022a) The Neural Machine Translation of Dislocations, Antonis Botinis (ed.) Proceedings of 13th International Conference of Experimental Linguistics (EXLING), Université Paris Cité,, 17-19 October 2022, 121-125.
Namdarzadeh, B., Ballier, N., Zhu, L., Wisniewski, G., and Yunès, J.-B. (2022b) Toward a Test Set of Dislocations in Persian for Neural Machine Translation, NSUR Proceedings, ACL
Wisniewski, G., Zhu, L., Yunès, J.-B. & Ballier, N. (2022) La robustesse de la traduction neuronale: les systèmes de traduction automatique neuronale à l’épreuve de la reproductibilité de l’expérience, Actes de la journée d’étude
sur la robustesse des systèmes de TAL,
Avec le soutien de l’ATALA et du laboratoire STIH, Caio Corrovet Gaël Lejeune (éditeurs),
25 novembre, ATALA, 29-32
https://www.atala.org/sites/default/files/robustal2022.pdf
Tighidet, Z. and Ballier, N. (2022) Fine-tuning a Subtle Parsing Distinction Using a Probabilistic Decision Tree: the Case of Postnominal “that” in Noun Complement Clauses vs.
Relative Clauses, ALTA2022, ACL anthology
Wisniewski, G. Zhu, L. Ballier, N. and Yvon, F. (2022) Analyzing Gender Translation Errors to Identify Information Flows between the Encoder and Decoder of an NMT System, BlackboxNLP2022, EMNLP2022,
https://preview.aclanthology.org/emnlp-22-ingestion/2022.blackboxnlp-1.13/
Nicolas Ballier, Jean-Baptiste Yunès, Guillaume Wisniewski, Lichao Zhu, Maria Zimina-Poirot (2022)
The SPECTRANS System Description for the WMT22 Biomedical Task, WMT22.
Publications sur ACL anthology
CV sur HAL
https://cv.hal.science/nicolas-ballier?langChosen=fr
DDLP (Digital Bibliography & Library Project):
https://dblp.org/pid/203/5539.html
Publications sur HAL
- [hal-04547597] Using Whisper LLM for Automatic Phonetic Diagnosis of L2 Speech: A Case Study with French Learners of Englishpar ano.nymous@ccsd.cnrs.fr.invalid (Nicolas Ballier) le avril 15, 2024 à 21:42
This paper reports on a pilot study to use Whisper’s large language model (LLM) as a tool for potential representation of segmental (phone) […]
- [hal-04547365] Methods for Phonetic Scraping of Youtube Videospar ano.nymous@ccsd.cnrs.fr.invalid (Adrien Méli) le avril 15, 2024 à 17:00
This paper discusses two pipelines for the auto- matic collection of automatic speech recognition (ASR) transcripts and audio content from YouTube […]
- [hal-04469395] L'interopérabilité des corpus pour la modélisation des dynamiques d'acquisition de langue secondepar ano.nymous@ccsd.cnrs.fr.invalid (Thomas Gaillat) le février 21, 2024 à 16:38
L’étude de la langue d'apprenants relevant de domaines spécialisés représente un enjeu important dans l'enseignement supérieur (Braud et al., […]
- [hal-04469367] Analytics for Language Learning: Interfacing MOODLE with A4LL via LTIpar ano.nymous@ccsd.cnrs.fr.invalid (Thomas Gaillat) le février 20, 2024 à 17:46
[...]
> consulter toutes les publications
Vous serez redirigé vers HAL !