Atelier Permanent de Réflexion Épistémologique et Méthodologique
,Responsables : Pr. Nicolas Ballier et Dr. Maria Zimina-Poirot.
L’Atelier Permanent de Réflexion Epistémologique et Méthodologique (APREM) centralise la réflexion sur les données, outils et méthodes de notre laboratoire. APREM pilote trois opérations structurantes:
- Outils, méthodes et interprétations, et organisera régulièrement des cycles de formation aux outils.sous forme de séance d’une heur ou de cycles de formation plus suivis (R, analyse en dépendance),
- Sciences des données linguistiques, multimodales, expérimentales : interopérabilité et IA,
APREM s’efforce de décrire épistémologiquement le passage des sciences du langage à une science des données linguistiques. L’atelier vise à
disséminer au sein de l’équipe (et au-delà) une culture des jeux de données et des scripts s’inscrivant dans le paradigme FAIR et permettant la réplicabilité des expériences. APREM conduit une réflexion et une pratique de l’interopérabilité des données linguistiques entre écrit et oral et explore les nouveaux types de données, telles que les traces numériques clavier (keylogs) comme par exemple dans le cadre du projet de thèse financée d’Ahood Al Swar. S’appuyant sur la plateforme expérimentale (partagée avec le LLF), nous cherchons à intégrer les nouveaux membres du laboratoire et leurs problématiques, par exemple en multimodalité. APREM s’appuie sur plusieurs projets précédant reposant sur l’intelligence artificielle, notamment en traduction neuronale (SPECTRANS, Neuroviz, DLLA) et dispose d’une plateforme pour réaliser des expériences en TAL/NLP: PAPTAN.
- La linguistique des plateformes et des projets
Présent dès la première édition de l’International Workshop on Language Technology Platforms, l’APREM développe une linguistique des plate-formes et des projets. L’APREM a vocation à servir d’incubateur pour aider les membres de l’équipe à la soumission de projets financés, pour aller de l’idée à la soumission de projet, en fournissant notamment des conseils pour la méthodologie, la structuration jeux de données, leur traitement et le plan de gestion des données (outil OPIDOR), en collaboration avec les personnels de la BU spécialistes du domaine. L’APREM s’inscrit dans le paradigme FAIR et participe au développement de la science ouverte à UPCité et à sa candidature à la labelisation (atelier de la donnée) au sein du réseau national des ateliers de la donnée. Il s’appuie sur les platefomes suivantes, avec l’appui de Brice Bricaud (IGE développeur) / Bureau Datacentre et services IaaS / et la collaboration de Jean-Baptiste Yunès (IRIF):
- Plateau iTrameur (analyse textométrique de données) : https://itrameur.clillac-arp.univ-paris-diderot.fr
- Base ARTES : https://itrameur.clillac-arp.univ-paris-diderot.fr
- Plateforme expérimentale (partagée avec le LLF)
- Pure Neural Server – CLILLAC-ARP – plateforme de traduction automatique sur serveur université https://plateformes.u-paris.fr/pure-neural-server-clillac-arp-plateforme-de-traduction-automatique-sur-serveur-universite/
- Serveur de calcul PAPTAN (Plateforme pour l’apprentissage profond pour la traduction automatique neuronale) : https://u-paris.fr/plateforme-paptan
- Dimension pédagogique : NMT literacy : ENSUPECO / MutNMT -> Lider (Erasmus+)
- Interaction enseignement/recherche : Outil de Collecte des Traductions des Apprenants en Vue de leur Exploration Scientifique (OCTAVES)