Ce projet de collecte de données sur les discours oraux d’apprenants d’anglais langue étrangère s’inscrit dans le cadre de la constitution d’une base de données internationale longitudinale de productions d’apprenants d’anglais avancés écrites et orales LONGDALE international (Longitudinal Database of Learner English), projet coordonné par Fanny Meunier, et le Center for English Corpus Linguistics (CECL), UC Louvain-la-Neuve, 9 partenaires : Italie, Allemagne, Hollande, Etats-Unis, Chine (2), France (2).

Coordination du projet :

  • Pascale Goutéraux

Résumé

Depuis septembre 2009, 7 enseignants chercheurs de l’UFR Etudes Anglophones, CLILLAC-ARP, 3 doctorants + 4 transcripteurs et des assistants locuteurs natifs de l’UFR participent au projet. Une partie de la base de DIDEROT-LONGDALE sera hébergée à Louvain (productions et questionnaires sociolinguistiques), avec 44 participants suivis sur trois ans de L1 à L3, soit un total de 120 fichiers longitudinaux de conversations en anglais. La base de Louvain sera accessible aux membres du projet et fait l’objet d’un contrat signé avec le CECL quant à la diffusion des données. Les autres fichiers (conversations et lectures à voix haute) demeurent la propriété de CLILLAC-ARP, Université Paris Cité.

2016-2017 : Valorisation et diffusion des données transversales

Projet de valorisation et de diffusion des données transversale mené par Pascale Goutéraux, MCF Linguistique anglaise et Loic Liégeois, Ingénieur de recherche rattaché à CLILLAC-ARP. Ce projet est en partie financé par le consortium CORLI pour le recrutement d’un CDD : il s’agit d’aligner les fichiers sons et transcriptions au format CHAT, soit 200 fichiers et de les mettre au format TEI afin de publier le corpus sur la base de données ORTOLANG et sur CLILLAC-ARP.

La spécificité de DIDEROT-LONGDALE est sa dimension orale et longitudinale : la base est constituée de quatre vagues de prises de parole en continu, de conversations avec des locuteurs natifs autour de tâches communicatives et lectures à voix haute, avec des enregistrements et des transcriptions orthographiques sur le modèle requis par LONGDALE international et des métadonnées sociolinguistiques (plate-forme LimeSurvey). Le projet est financé en partie par le Plan Réussite en Licence (lecteurs et transcripteurs) et l’unité de recherche 3967 CLILLAC-ARP.

Conversations Lecture à voix haute
1 : 3 sujets au choix + conversation libre Extrait de The Selfish Giant (Oscar Wilde)
2 : 3 sujets au choix + conversation libre David Cameron’s speech outside n° 10 Downing Street as Prime Minister
3 : tâche de réactions à des tableaux + conversation libre Extrait de The Landlady, Roald Dhal
4 : Map Quest + conversation libre Extraits de The Selfish Giant, The Landlady, word list

Enseignants chercheurs membres du projet DIDEROT-LONGDALE

  • Pascale Goutéraux : coordination : paramètres psycholinguistiques, fluidité, exactitude et complexité, et leur combinaison en expression orale
  • Alain Diana : phénomènes prosodiques
  • Emmanuel Ferragne : phénomènes acoustiques et prosodiques
  • Anne Talbot-Guyot : phénomènes prosodiques
  • Franck Zumstein : phénomènes prosodiques
  • Jean Leoue : paramètres sociolinguistiques et interlangue (plateforme Limesurvey)
  • Nicolas Ballier : phonologie, annotations de corpus multiples : cf ; projet Charliphonia

Étudiants volontaires impliqués

1ère cohorte : septembre 2009 début de L1, 94, 2010 fin de L1, 28, avril 2011 fin de L2, 23 étudiants, juin-septembre 2012 fin de L3 début de M1.

2ème cohorte : octobre 2010 L1, 113, octobre 2011 début de L2, 39, avril 2012 fin de L2, 21, juin-septembre 2013 fin de L3 début de M1

Dimension didactique et pédagogique

Objectifs

Suivre une cohorte d’étudiants anglicistes sur 2 ou 3 ans et procéder à une analyse fine, qualitative et quantitative, pour améliorer le curriculum linguistique (oral et écrit) et pointer les remédiations à opérer au plan de l’acquisition. Les fichiers de transcriptions orthographiques sont annotés à la demande en correction d’erreurs pour des entretiens de feedback avec les étudiants.

Travaux sur Corpus

Exploitation au sein des séminaires de M1S1 Psycholinguistics and SLA (P. Goutéraux) et M1S2 Phonologie (N. Ballier).

Dimension recherche

Le corpus de 1ère année (207 fichiers) va permettre de reproduire des études transversales LINDSEI (Belgique, Bulgarie, Chine, Allemagne, Japon, Espagne, Italie, Pologne) avec des sujets conversationnels similaires en L1.

Il existe peu de corpus longitudinaux de taille moyenne, la plupart des études longitudinales impliquant moins de 10 sujets. À ce jour, DIDEROT-LONGDALE sert à analyser l’évolution de 44 apprenants avancés, au plan linguistique (phonologique, syntaxique, lexical et discursif) et psycholinguistique (exactitude, fluidité et complexité).

La base permettra aussi de confronter discours écrits et oraux d’apprenants (cf. base internationale à Louvain-la-Neuve) et de poursuivre des recherches sur l’interopérabilité des corpus.

Mémoires portant sur Diderot-Longdale

M1
  • Julien Levallois (2011- 2012) Developing oral proficiency in English for advanced learners (dir: P. Goutéraux)
  • Timéa Kutasi, (2011-2012), A study of some patterns of non-nativeness, (dir: Alain Diana)
  • Angèle Poma (2012-2013): The expression of past and present perfect tenses in ESL (dir: P. Goutéraux)
  • Zakaria Touami (2012-2013) la phonologie chez des apprenants avancés (co-direction : A. Diana & P. Goutéraux)
  • Assia Khales (2012-2013) Syllabification errors among French learners of English (dir: N. Ballier)
  • Lidia Tariket (2012-2013) Phraseological units and reliability islands in a learner corpus (dir. N. Ballier)
  • Alena Krivikhina (2014) Les Mapquests (dir. N. Ballier et P. Goutéraux)
M2
  • Alexandra Myssyk, (2011): Predicting and evaluating a speaker’s level of English : a proposal for pronunciation criteria (dir: N. Ballier)
  • Timea Kutasi: A longitudinal investigation of non-native features in French learners’ verbal productions (dir: N. Ballier)
  • Fanny Hoang (2016-17) Étude longitudinale de l’enrichissement lexical et des collocations à l’oral (dir. P. Goutéraux)

Thèses (dir. N. Ballier)

  • Thomas Gaillat (Rennes 1): Interopérabilité des corpus d’apprenants en anglais: le cas de l’annotation de THIS et THAT soutenue le 16 juin 2016.
  • Adrien Méli, The Oral Properties of the French-English Interlanguage: a longitudinal study.
  • Evelyne Cauvin : L’emphase dans l’évolution des profils prosodiques des apprenants anglicistes francophones.

Communications autour du projet Diderot-Longdale

  • Ballier N. & Martin Ph. “The Charles V phonetically annotated corpus: a research project at the University of Paris-Diderot”, communication à la Societas Lingvistica Europaea, 43rd Annual Meeting, Vilnius, 2-5 September 2010
  • Ballier N. & Martin Ph. “The Charles V phonetically annotated corpus: a research project at the University of Paris-Diderot”, la Societas Lingvistica Europaea, 43rd Annual Meeting, Vilnius, 2-5 September 2010
  • Ballier, N. & Diaz Negrillo, A. “Multidisciplinary perspectives to learner corpora”, la Societas Lingvistica Europaea, 43rd Annual Meeting, Vilnius, 2-5 September 2010
  • Cauvin, E. & Ballier N. “Investigating suprasegmental features in the Charles V learner corpus, ALOES pre-conference workshop on learner corpora, Paris 13, 25 mars 2010.
  • Cauvin, E. “Cross-dialect and inter-speaker variation in read speech prosodic typology: EFL compared with other English dialects”, Colloque PAC 2010 Phonologie de l’Anglais Contemporain, 12-13 septembre, Montpellier
  • Cauvin, E. “Intonational phrasing as a potential indicator for establishing prosodic learner profiles”. In “20 years of learner corpus research: looking back, moving ahead”, Centre for English Corpus Linguistics of the University of Louvain. 15-17/09/ 2011, Louvain-la-Neuve (Belgique)
  • Ferragne, E. “The Charles V corpus: pre-processing of sound files and automatic parameter extraction” communication à la Societas Lingvistica Europaea, 43rd Annual Meeting, Vilnius, 2-5 September 2010
  • Hervé, C. French EFL Learners’ Acquisition of Determiners: a Longitudinal Study, COULS 2016,Nantes, France, 29 juin-1er Juillet 2016. Gaillat, T., “Investigating syntax in L2 spontaneous French: a preliminary approach.” ALOES pre-conference workshop on learner corpora, Paris 13, 25 mars 2010.
  • Goutéraux, P. « Quelle authenticité langagière dans les discours interactifs d’apprenants de langue étrangère ? », Atelier didactique, Congrès de la SAES, 20-22 mai, 2011
  • Goutéraux, P. “Learners of English & conversational proficiency” LCR 2011: 20 years of learner corpus research: looking back, moving ahead, University of Louvain, September 15-17 Sept 2011, Louvain-la-Neuve, Belgique
  • Goutéraux P. “From Emotion to Cognition, Bridging the gap: French students’ attitudinal stances”, TBLT 2011, Crossing Boundaries, Nov. 18-20 2011, Auckland, New Zealand
  • Goutéraux P. « L’appréciation et sa verbalisation en anglais langue étrangère », Atelier didactique, Congrès de la SAES, 10-12 mai 2012.
  • Goutéraux, P. The Expression of Appraisal in English as a Foreign Language: an experimental approach, Colloque international Emolex, 6-8 février 2013, New directions in lexical semantics and discourse organization, Osnäbruck, Germany
  • Goutéraux, P. (17 mai 2013) Assessing Learners’ Proficiency at Producing Affect, International Colloquium Compiling and Using Learner Corpora to Teach and Assess Productive and Interactive Skills in Foreign Languages at University Level, University of Padua, Italy
  • Goutéraux, P. (28 juin 2013) Le Lexique d’émotions et des sentiments dans les discours d’apprenants d’anglais langue Etrangère, Journée d’étude Lexie, Lexèmes, Lexis, Université de Pau et des Pays de l’Adour
  • Goutéraux, P. (2-7 Octobre 2013) Assessing Conversational Proficiency: a Longitudinal Study of Learners of English Engaged in Communicative Tasks, TBLT Conference, Banff, Canada
  • Méli, A. “read my lips” Interlanguage and lip-rounding for French speakers”, ALOES pre-conference workshop on learner corpora, Paris 13, 25 mars 2010.
  • Méli, A. “Interlanguage strata in L2 phonology“, communication à la Societas Lingvistica Europaea, 43rd Annual Meeting, Vilnius, 2-5 September 2010.

Quelques publications faisant usage du projet Longdale

  • Cauvin, E. « Le CRCL et l’évaluation de la compétence phonologique : un point de vue de corpus sur l’anglais », Les Langues Modernes, L’évaluation avec le CECRL, 2012, numéro n°1-2012.
  • Goutéraux, P. l’Appréciation et sa Verbalisation en langue étrangère. In Pratiques émergentes en didactique de l’anglais: jalons, interrogations et perspectives, coord. F. Raby, Les Cahiers de l’Apliut, n°2-2014.
  • Goutéraux, P. (2015) “Assessing Advanced Learners Proficiency at Producing Affect-laden Discourse”. In Castello, E., Ackerley, C. & Concetta, F., eds. Studies in Learner Corpus Linguistics: Research and Applications for Foreign Language Teaching and Assessment, Linguistic Insights, Peter Lang, Bern: 159-178

Actes de colloques

  • Cauvin, E. “Interlanguage study: L2 learners’ reading performances and phonological competence in prosody”. In ALOES. 15ème colloque de Villetaneuse sur l’anglais oral, 26-27 mars 2010, Villetaneuse.
  • Ballier, N. et Gaillat, Th. Towards multi-corpora analysis of this and that, from manual to automatic annotation in Granger, S., Gilquin, G. & Meunier, F. (eds) (2013) 20 Years of Learner Corpus Research: Looking back, moving ahead (Corpora and Language in Use 1). Louvain-la-Neuve: Presses universitaires de Louvain.
  • Goutéraux, P. Learners of English & Conversational Proficiency in Granger, S., Gilquin, G. & Meunier, F. (eds) (2013) 20 Years of Learner Corpus Research: Looking back, moving ahead (Corpora and Language in Use 1). Louvain-la-Neuve: Presses universitaires de Louvain.

Ouvrages

  • Ballier, N., Diaz Negrillo A. & Thompson, P., A. Eds. (to appear) Multidisciplinary perspectives to learner corpora,.Benjamins.
  • Ballier, N. & Martin Ph. (2014) Developing corpus interoperability for phonetic investigation of learner corpora in Ana Díaz-Negrillo, Nicolas Ballier, and Paul Thompson (eds.) Automatic Treatment and Analysis of Learner Corpora, Benjamins, Studies in Corpus Linguistics Series.
  • Ballier, N. & Martin Ph. (2014) “Pronunciation/prosody” in Gaëtanelle Gilquin, Sylviane Granger and Fanny Meunier (eds) The Cambridge Handbook of Learner Corpus Research , CUP

À lire aussi

ANR MaTOS (2023-2026)

ANR MaTOS (2023-2026)

Près de 70 ans après l'expérience de Georgetown, MaTOS (''Machine Translation for Open Science'') revisite la traduction automatique de documents scientifiques en texte intégral afin de faciliter et d'ouvrir l'accès à la connaissance scientifique. MaTOS est soutenu...

IDEX REMEDLANG (2021-2023)

IDEX REMEDLANG (2021-2023)

« Évaluation d’un dispositif de remédiation anglaise et espagnole dans le but de favoriser l’autonomie langagière et l’autonomie d’apprentissage au niveau L1 en LEA » Projet IDEX de type « Emergence en Recherche », 2021-2023Coordination du projet Justine Paris Ismael...

CarDiBioMed (2022-2024)

CarDiBioMed (2022-2024)

Caractérisation du discours scientifique dans le domaine biomédical (CarDiBioMed)Projet IDEX « Émergence en Recherche », Campagne 2021. Membres du projets Université Paris Cité : C. Hamilton, S. Bottani, L. Zhu, C. Valdez, N. Kübler, A. Mestivier, N. Ballier...