À partir d’enregistrements collectés dans le cadre du projet international DIDEROT Longdale, Charliphonia est une base de données d’annotations phonétiques et phonologiques en cours de constitution. 

Responsables

Modélisation statistique des réalisations natives et non-natives de l’anglais (le corpus CHARLIPHONIA) :

Résumé

Inscrite dans une approche corpus-driven, ce projet de recherche vise à améliorer la compréhension de la variabilité des réalisations et de leur acceptabilité chez les natifs et les non-natifs. Cette modélisation de l’acceptabilité allophonique, accentuelle et prosodique passe par plusieurs étapes et implique diverses méthodologies et champs de compétence.

1. Annotation multi-niveaux et multi-dimensionnelle de corpus d’apprenants

Au plan théorique, la constitution de jeux d’étiquette (tagsets) inédits pour la phonétique et la phonologie permet une réflexion typologisante sur les discours suivis (connected speech processes) et les marqueurs d’interférences et d’interlangue. L’hypothèse initiale est la nécessité de dé-corréler la qualité des réalisations phonétiques et prosodiques des autres domaines (lexique, syntaxe).

2. Test de perception et modélisation statistique

Tests de perception sur les seuils d’acceptabilité et modélisation de l’acceptabilité des réalisations segmentales, accentuelles et prosodiques non-natives pour des enseignants d’anglais, pour les locuteurs natifs britanniques, américains et pour des non-natifs.

Des journées annuelles de travail au sein de l’équipe font le point sur l’annotation du corpus et les travaux relatifs au corpus. La troisième journée aura lieu le mardi 3 juillet 2012. PROGRAMME

Publications

Ballier et al., Charliphonia Annotation guidelines v.2, June 2010.
Ballier, N, & Martin Ph. « Corrélats prosodiques et acoustiques de la syllabification : le cas du français et de l’anglais », 1er juillet 2010, 8e Rencontres Internationales du Réseau Français de Phonologie, Orléans.
Ballier, N. & Méli, A. “Designing an EFL learner corpus to analyse phonetic and phonological variation” communication au colloque international ICAME31, Giessen, 27 mai 2010.
Ballier N. & Martin Ph, “The Charles V phonetically annotated corpus: a research project at the University of Paris-Diderot”, communication à la Societas Lingvistica Europaea, 43rd Annual Meeting, Vilnius, 2-5 September 2010
Ballier, N. & Diaz Negrillo, A. “Multidisciplinary perspectives to learner corpora”, workshop
Ballier, N. Diaz Negrillo A. & Thompson P. . A. Eds. (in prep.) Multidisciplinary perspectives to learner corpora, tba.
Cauvin, E. & Nicolas Ballier “investigating suprasegmental features in the Charles V learner corpus, ALOES pre-conference workshop on learner corpora, Paris 13, 25 mars 2010.
Ferragne Emmanuel “The Charles V corpus: pre-processing of sound files and automatic parameter extraction” communication à la Societas Lingvistica Europaea, 43rd Annual Meeting, Vilnius, 2-5 September 2010
Gaillat Thomas “Investigating syntax in L2 spontaneous French : a preliminary approach.” ALOES pre-conference workshop on learner corpora, Paris 13, 25 mars 2010.
Méli, Adrien “read my lips” Interlanguage and lip-rounding for French speakers”, ALOES pre-conference workshop on learner corpora, Paris 13, 25 mars 2010.
Méli, A. « Interlanguage strata in L2 phonology“, communication à la Societas Lingvistica Europaea, 43rd Annual Meeting, Vilnius, 2-5 September 2010

À lire aussi

Interaction in TED Talks – TransQuest Project

Interaction in TED Talks – TransQuest Project

September 13, ODG 830 Université Paris Cité, CLILLAC-ARP Journée d'Études du projet TransQuest Organiser: Agnès Celle Accès au bâtiment Olympe de Gouges Programme 9:30-10:15 Fiona Rossette-Crake, guest speaker, Université Paris Nanterre, CREATED Talks : Oratory, “New...