Rechercher un article
Cahiers GUTenberg (en ligne) issn 2118-8254

Table des matières de ce fascicule | Article précédent | Article suivant
Yannis Haralambous; John Plaice
Traitement automatique des langues et composition sous $\Omega $
Cahiers Gutenberg no. 39-40 (2001), p. 139-166
Article PDF

Résumé

Alors qu’$\Omega $ ne cesse d’évoluer et ses fonctionnalités de se diversifier et de s’élargir, on s’aperçoit que les méthodes utilisées pour permettre la composition des langues orientales peuvent aussi servir à résoudre des problèmes jusqu’alors négligés des langues occidentales. Les mêmes types d’outils servent à segmenter les propositions thaï en mots puis en syllabes et serviront aussi à déterminer si une lettre « s » d’un mot allemand écrit en gothique doit être longue ou courte... Dans ces deux cas l’outil en question est un analyseur morphologique, outil d’une discipline connue sous le nom de traitement automatique des langues (TAL en français, NLP = Natural Language Processing en anglais). Grâce au mécanisme d’OTP externe (OTP = $\Omega $ Translation Process) d’$\Omega $, nous pouvons intégrer ces outils dans $\Omega $ et les utiliser en temps réel pendant la composition. Comme tout ce qui a trait aux langues dites naturelles, ces outils ne peuvent être fiables à 100 imposent donc relecture et inspection du texte composé : $\Omega $ peut, par le biais de méthodes de colorisation ou de marquage visuel, faciliter et optimiser cette relecture, en paliant ainsi les défauts d’application des outils linguistiques.

Dans cet article nous allons étudier six cas d’utilisation d’outils ou de méthodes linguistiques, de complexité très variée et couvrant un spectre de langues assez étendu : l’anglais, l’allemand, le grec, l’arabe, le thaï et le japonais. Dans chaque cas il s’agira d’introduire certaines informations supplémentaires concernant la structure syntaxique ou morphologique du texte ou sa phonologie ; ces informations peuvent évidemment être saisies par un auteur méticuleux et patient en même temps que le texte-même : un hypothétique auteur allemand peut marquer explicitement les « s » longs et les « s » courts, un auteur thaï peut, en théorie, indiquer les limites des mots et des syllabes. Mais cela devient vite pénible et ne devrait donc pas faire partie de la tâche de l’auteur mais plutôt de celle de l’imprimeur, voire dans certains cas de celle du correcteur ou du responsable éditorial.