Deep Learning for Machine Translation at Université de Paris (DL4MT@UP)
Le projet a été financé en 2021 par les fonds du Comité Plateformes et Équipements Scientifiques d’Université Paris Cité.
Porteurs
Résumé
This new equipment will be used both for fundamental research to train multilingual and specialised language models and for language industry applications developed by a historical partner, the deployment of the neural translation ecosystem developed by SYSTRAN. The power of the machine allows the latest neural translation ecosystem to be run, the linguistic resources (specialised corpora, terminology and phraseology databases) developed within the team to be put into production and deep learning experiments to be conducted on the GPUs.
Objectif
Ce nouvel équipement servira à la fois à la recherche fondamentale pour entraîner des modèles de langues multilingues et spécialisés ainsi qu’aux applications des industries de la langue développées par un partenaire historique, le déploiement de l’écosystème de la traduction neuronale développé par SYSTRAN. La puissance de la machine permet à la fois de faire fonctionner le dernier écosystème de traduction neuronale, de mettre en production les ressources linguistiques (corpus spécialisés, bases de données terminologiques et phraséologiques) développées au sein de l’équipe et de conduire des expériences en apprentissage profond sur les GPU de la machine.
PAPTAN permet d’entraîner des modèles de langues multilingues et spécialisés et déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.
Architecture de la plateforme
PAPTAN est adossée à la plateforme PNS-UP utilisée pour la formation et recherche en traduction spécialisée :
- Plateforme PNS-UP (SYSTRAN Pure Neural® Server). Ce serveur de traduction permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web ;
- SYSTRAN Model Studio Lite : serveur d’entrainement de modèles spécialisés paramétré pour les applications des industries de la langue ;
- SYSTRAN Model Studio Advanced : serveur d’entrainement de modèles spécialisés avec des fonctionnalités avancées permettant d’accéder aux GPUs de la plateforme PAPTAN ;
- Accès SSH aux GPUs de la plateforme PAPTAN pour les administrateurs (après la validation de la demande par les coordinateurs).
Projets en relation avec Paptan
Systems
tbc
À lire aussi
SILES – Séminaire International sur la Langue Espagnole (2024-2025)
SILES est un groupe de travail, d’échange et de recherche autour de l’espagnol animé par l’équipe de linguistes hispanistes de l’UFR EILA de l’Université Paris Cité, rattaché à l’équipe de recherche CLILLAC-ARP. Ce séminaire se donne pour but de réunir périodiquement...
Politiques linguistiques en Europe – Séminaire de Recherche, 2009-2010
Logos de l'Observatoire Européen du plurilinguisme et de la Délégation générale à la langue française et aux langues de France (DGLFLF)2009-2010 Le professeur José Carlos Herreras anime régulièrement un séminaire de recherche intitulé Les politiques linguistiques en...
Politiques linguistiques en Europe – Séminaire de Recherche, 2010-2011
Logos de l'Observatoire Européen du plurilinguisme et de la Délégation générale à la langue française et aux langues de France (DGLFLF)2010-2011 Programme Les thèmes proposés illustrent les politiques linguistiques menées, en fonction de leur propre situation, dans un...
Politiques linguistiques en Europe – Séminaire de Recherche, 2011-2012
Logos de l'Observatoire Européen du plurilinguisme et de la Délégation générale à la langue française et aux langues de France (DGLFLF)2011-2012 Programme Les thèmes proposés illustrent les politiques linguistiques menées, en fonction de leur propre situation, dans un...