Rechercher un article
Cahiers GUTenberg (en ligne) issn 2118-8254

Table des matières de ce fascicule | Article précédent | Article suivant
Heinrich Stamerjohanns; Deyan Ginev; Catalin David; Dimitar Misev; Vladimir Zamdzhiev; Michael Kohlhase
Conversion d’articles en LaTeX vers XML avec MathML : une étude comparative
(MathML-aware article conversion from LaTeX — A comparison study)
Cahiers Gutenberg no. 51 (2008), p. 7-28
Article PDF

Résumé

Depuis une vingtaine d’années, la publication de textes de mathématiques, informatique ou physique théorique s’est faite de façon prédominante à l’aide de systèmes de composition basés sur TeX/LaTeX. Ceci est à la fois un atout — LaTeX est un format à demi sémantique qui capture dans une certaine mesure les intentions de l’auteur — et un problème — TeX est à peu près Turing-complet, ce dont les auteurs abusent en recourant à des centaines d’extensions et à des millions de macros personnelles.

Plusieurs outils ont été développés pour convertir des documents TeX/LaTeX vers des dialectes XML, plus adaptés au web, mais aussi à des traitements automatisés s’appuyant sur la sémantique. Les projets DML utilisent des outils différents, la sélection ne semblant pas reposer sur des critères objectifs. Nous avons passé l’offre actuelle en revue dans le but de fonder ces choix sur des bases plus rationnelles, et d’encourager la compétition ouverte et la convergence vers un socle de fonctionnalités utiles. Dans cet article, nous passons en revue cinq programmes qui transforment des sources TeX/LaTeX en XML en passant les formules en MathML selon trois dimensions : a) les paramètres ergonomiques comme la documentation ou la facilité d’installation ; b) l’étendue des constructions supportées ; c) la qualité du document produit (notamment le code MathML).

Abstract

Publishing in Mathematics and theoretical areas in Computer Science and Physics has been predominantly using TeX/LaTeX as a formatting language in the last two decades. This large corpus of born-digital material is both a boon—LaTeX is semi-semantic format where the source often contains indications of the author’s intentions—and a problem—TeX is Turing-complete and authors use this freedom to use thousands of styles and millions of user macros.

Several tools have been developed to convert TeX/LaTeX documents to XML-based. Different DML projects use different tools, and the selection seems largely accidental. To put the choice of converters for DML projects onto a more solid footing and to encourage competition and feature convergence we survey the market. In this paper we investigate and compare five LaTeX-to-XML transformers in three dimensions: a) ergonomic factors like documentation, ease of installation, b) coverage, and c) quality of the resulting documents (in particular the MathML parts).