Le projet Shiitake

"Translation for all" accessible librement en ligne !

"Translation for all" est un nouveau système d'aide à la traduction accessible librement en ligne. La première partie du projet "shiitake" a été terminé le 31 Mars, 2009. La seconde partie se poursuivra à partir du 1er avril 2009 pour une durée de quatre ans. Les pages de ce site ne seront donc plus maintenues à partir cette date. Nous sommes aussi heureux de vous annoncer que le systèmes d'aide à la traduction et publication de documents traduits est désormais disponible en libre accès sur le web (L'interface est en langue Japonaise. Cependant, elle sera traduite, dans les prochains jours, en langue anglaise). "Translation for all" est un projet initié en collaboration avec le groupe de recherche "Le groupe de traduction de langues" de l'Institut National de technologies de l'Information et de Communication, et le laboratoire des sciences de l'information et Bibliothèques de l'Université de Tokyo, en coopération aussi avec l'éditeur de dictionnaire Sanseido éditeur. L'un des éditeurs de dictionnaires les plus préstigieux du Japon.

Développement d'un système d'aide à la traduction en ligne

La dissémination des informations alternatives face à la dégradation des médias est en augmentation importante sur internet. La traduction des informations et des rapports par les volontaires joue actuellement un rôle vital dans le flux alternatif d'information. Le projet "Shiitake" est créé dans le but d'aider les traducteurs volontaires pour la dissémination librement des connaissances multilingues.

Dans le domaine du traitement automatique des langues naturelles (TALN), les chercheurs en tendance à considérer le traitement de la langue comme un problème computationnel, alor que les experts humains tels que les traducteurs et les éditeurs ont une forte compréhension des activités langagières comme un processus social à lequel il se refère pour reformuler ce qui était dit et écrit précédemment

* * *

Le but du projet Shiitake est de faciliter aux traducteurs volontaires l'accès et le recyclage des données traductionnelles accumulées sur Internet par des méchanismes de collection et d'exploration de textes largement dispersés sur Internet. Les informations traductionnelles sont collectées est présentées aux traducteurs dans leurs versions,  contenus et avec des fonctionnalités de consultations adaptées. Ce que nous tentons de collecter est totalement différent d'une base d'exemple desitiné à la traduction automatique (TA) - "example-based machine translation" (EBMT) - ou d'un ensemble d'exemples dont la structure phrasique est similaire; nous nous focalisons sur la recherche et la collection des références aux expressions langagières pertinentes.

Ce système à la fin permet aux traducteurs de former un réseau sans effort additionnel. Les traducteurs qui travaillent dans des domaines similaires peuvent accumuler des données traductionnelles et les partageant de façon collective. Nous croyons que ce processus améliorera l'activité des traducteurs et encouragera de nombreux traducteurs à rejoindre ce réseau social. Le projet Shiitake est donc un projet purement social.  Pour généraliser son utilisation et faciliter son usage, nous avons commencé à développer des modules qui permettent, en particulier, d'aider les traducteurs non-avertis par des composantes logiciels conviviales.

Plusieurs systèmes CAT (Computer-Aided Translation) ont été développés depuis plusieurs années et se font exploités largement par les traducteurs professionnels et les entreprises spécialisées en traduction. Cependant, il y'a trois grandes différences entre les CAT destinés aux professionnels et notre projet : (1) le projet Shiitake offre des modules qui permettent la construction des ressources de référence à partir du web; (2) il est destiné en premier à aider les traducteurs volontaires plutôt que les professionnels; et (3) l'éditeur intégré dans sa version personnalisée est très simple (notre interface est similaire à celui du système TransType développé par le groupe de recherche RALI à l'Université de Montréal où les spécifications fonctionnelles sont tatelement différentes).

* * *

En ce qui concerne le processus de la traduction humaine (pas celui du processus congitif complexe mais plutôt celui du processus produisant des données sociales qui contribuent  à l'accumulation d'information), le dirigeants du projet ont reçus un grand nombre de conseils en prevenance de plusieurs adiministrateurs de différents sites du traduction libre des informations (anglais-japonais) Tea not war, des traducteurs volontaires impliqués dans le projet Global Voices, et d'autres traducteurs volontaires.

En relation avec l'aspect ingénierie du projet, les dérigeants du projet font leurs recherches en collaboration avec L'Université de Nagoya , L'Université de Tsukuba , L'Université d'Okayama , L'Université d'Hokkaido , L'Institut National d'Informatique (NII), LINA-CNRS, L'Université de Nantes (France) et GETALP group-LIG Laboratory-CNRS, L'Université Joseph Fourier, (France).

Les modules et fonctionnalités de base du système ont été déjà implémentés et sont en expérimentation par un nombre limité de testeurs.

Contact

Kyo Kageura
Library and Information Science Laboratory
Graduate School of Education
University of Tokyo
7-3-1 Hongo, Bunkyo-ku, Tokyo, 113-0033, Japan
Tel & fax: +81-3-5841-3973
E-mail: kyo [atmark goes here] p . u - tokyo . ac . jp

Page Top