Rechercher un article
Cahiers GUTenberg (en ligne) issn 2118-8254

Table des matières de ce fascicule | Article précédent | Article suivant
Jean-Daniel Fekete
Expérience de codage de document à intérêt graphique à l’aide de TEI
Cahiers Gutenberg no. 28-29 (1998), p. 131-142
Article PDF

Résumé

Alors que le codage numérique de documents purement textuels est maintenant bien maîtrisé, les documents textuels à intérêt graphique posent encore de nombreux problèmes. Dans cet article, nous décrivons la façon dont nous avons codé l’encyclopédie La chose imprimée en SGML à l’aide d’une adaptation de la DTD TEI. Dans cette encyclopédie, certains articles décrivent des règles de mise en page ou de typographie en les appliquant au texte de la description lui-même. En ne codant que le texte du document — c’est-à-dire en perdant la présentation originelle des exemples de mise en page ou de typographie — il perd tout son intérêt. En ne gardant que l’image du document, il perd les vertus du texte (indexation, recherche rapide, présentations multi-vues, etc). La difficulté a donc été de coder le document textuel en relation avec ses traits graphiques et typographiques pertinents. Une fois ce document codé, nous avons réalisé des traducteurs de TEI vers LaTeX et HTML. Le respect de la présentation originelle pose de problèmes de traduction spécifiques qui ne sont pas pris en compte par les traducteurs existant. En effet, la voie normale pour le traitement des documents SGML est DSSSL, qui ne dispose pas encore des mécanismes dont nous avons besoin pour gérer les documents textuels à intérêts graphiques. Nous avons donc dû développer les programmes de traduction en PERL.