Lisez-moi S.V.P. 

6 Les caractères, les entités et les fontes

Table des matières : Le langage de balisage mathématique (MathML) version 2.0
Chapitre précédent : 5 La combinaison des balisages de présentation et de contenu
Chapitre suivant : 7 L'interface MathML

6.1 Introduction

La notation et les symboles se sont révélés très importants pour les mathématiques. La science mathématique a pu croître en partie à cause de la concision et du caractère suggestif de sa notation en évolution. Beaucoup de nouveaux signes ont été modifiés pour leur utilisation dans la notation des mathématiques, et les mathématiciens n'ont pas rechigné à emprunter plusieurs symboles développés d'abord ailleurs. Le résultat, c'est que les mathématiques utilisent une très grande collection de symboles. On ne peut pas écrire aisément des mathématiques si ces caractères ne sont pas disponibles pour le codage. Et il est difficile de lire des mathématiques si les glyphes correspondants ne sont pas disponibles pour la présentation sur des dispositifs d'affichage spécifiques.

Cette situation posait un problème pour le premier groupe de travail Math du W3C au moment de sa création. Cela ne s'inscrivait pas naturellement dans les limites du développement d'une spécification permettant d'utiliser des mathématiques avec HTML et de la production pour ce faire d'une définition DTD pour plus s'en soucier que les entités autorisées dans la définition DTD. Toutefois, comme l'expérience l'a montré, une longue liste d'entités sans dispositif pour les afficher revêt peu d'utilité et constitue une source de frustrations fréquentes à essayer d'appliquer un standard. Inversement, une grande collection de glyphes et de fontes représentant des caractères, sans un outil normalisé pour y référer, n'est pas d'une grande utilité non plus.

Le groupe de travail Math du W3C a donc directement entrepris la tâche de définir une partie du mécanisme entier nécessaire pour passer d'une notation à une présentation finale, et lancé une collaboration avec des organisations pour entreprendre la spécification du reste.

Ce chapitre de la spécification MathML contient une liste des noms de caractères à utiliser dans MathML, des recommandations pour leur utilisation et des avertissements concernant la forme correcte des points de code correspondants donnés dans le jeu universel de caractères (UCS) tels qu'ils sont codifiés dans Unicode et ISO 10646 (cf. l'Annexe K [Unicode] et le site Web d'Unicode). Par souci de simplicité, on désignera ce jeu de caractères par le nom abrégé Unicode. Quoique Unicode change de temps en temps de sorte qu'on le définit exactement par des numéros de version, nous ne les utiliserons pas sauf pour apporter un éclaircissement sur un certain point. Cette spécification de MathML utilise quelques caractères qui n'appartiennent pas à Unicode 3.0 mais qui ont été proposés au Comité technique Unicode (UTC), pour être donc inclus dans ISO 10646. Ces caractères sont pour l'instant prévus dans les versions Unicode 3.1 et 3.2. (Pour des précisions à ce sujet, cf. la section 6.4.4 Le statut des codages de caractères).

Bien que le processus de révision et d'adoption, par le Comité technique Unicode et l'ISO/IEC, des caractères présentant un intérêt particulier pour les mathématiques et MathML soit terminé depuis longtemps (Unicode travaux en cours), des modifications supplémentaires sont possibles pour les listes de caractères acceptés, les assignements de codes de ceux adoptés ou les noms donnés par Unicode. On peut s'assurer de la prise en compte de toutes les corrections possibles aux normes concernées et consulter les dernier tableaux de caractères et les informations concernant les fontes sur la page d'accueil du groupe de travail Math du W3C et le site Web d'Unicode.

6.2 Les caractères MathML

Un élément atomique MathML (cf. la section 3.2 Les éléments atomiques et la section 4.4.1 Les éléments atomiques) contient une séquence de caractères MathML. Les caractères MathML sont définis comme des caractères Unicode légaux dans les documents XML, soit comme des éléments mglyph. Ces derniers servent à représenter des caractères sans codage Unicode, comme décrit dans la section 3.2.9 L'ajout de nouveaux glyphes de caractères à MathML (mglyph). Dans la mesure où le jeu de caractères Unicode fournit approximativement un millier de caractères alphabétiques spéciaux pour les mathématiques (Unicode 3.1) et fournira plus de 900 symboles spéciaux dans Unicode 3.2, le recours à l'élément mglyph devrait être rare.

6.2.1 Les données de caractères Unicode

Comme toujours dans XML, tout caractère admis par XML peut servir avec MathML dans un document XML. Les caractères légaux ont les numéros de code hexadécimal 09 (tabulation = U+0009), 0A (saut de ligne = U+000A), 0D (retour chariot = U+000D), 20-D7FF (U+0020..U+D7FF), E000-FFFD (U+E000..U+FFFD) et 10000-10FFFF (U+010000..U+10FFFF). La notation entre parenthèses commençant par U+ est celle recommandée par Unicode pour désigner des caractères Unicode (cf. [Unicode], page xxviii). Les exclusions supérieures au numéro de code D7FF sont les blocs utilisés pour les paires de substitution et les deux caractères assurés de ne pas être du tout des caractères Unicode. Le numéro U+FFFE est exclu pour permettre la détermination de l'ordre des octets dans certains codages.

Il y a essentiellement trois façons différentes de coder des données textuelles :

6.2.2 Les caractères spéciaux hors Unicode

Pour des besoins particuliers, on peut être amené à utiliser un caractère qui ne se trouve pas dans Unicode, et même dans les extensions prévues. Auquel cas, l'élément mglyph peut servir pour accéder directement à un glyphe issu d'une certaine fonte et créer le caractère MathML correspondant. Tous les éléments atomiques MathML acceptant des données textuelles admettent également l'élément mglyph dans leur contenu.

Toutefois, il faut tenir compte du fait que la police choisie ne sera peut-être pas disponible pour tous les processeurs MathML.

6.2.3 Les caractères des symboles alphanumériques mathématiques

Une caractéristique remarquable de l'écriture mathématique et scientifique est l'utilisation de lettres seules pour indiquer des variables et des constantes dans un contexte donné. La complexité croissante des sciences a conduit à utiliser certaines variantes courantes dans l'alphabet et les fontes pour fournir suffisamment de symboles spéciaux de ce type pareil à une lettre (N.d.T. letter-like). Ces dénotations ne sont pas réellement des lettres utilisables pour construire des mots avec des significations reconnues, mais des porteurs individuels de sémantique en eux-mêmes. On interprète habituellement l'écriture d'une chaîne de ces symboles selon une certaine loi de composition, par exemple, la multiplication. Beaucoup de symboles pareils à des lettres peuvent être rapidement interprétés par les spécialistes dans un domaine donné comme étant d'un certain type mathématique : par exemple, les symboles en caractères gras, dérivés de lettres latines ou grecques, comme des vecteurs pour la physique ou l'ingéniérie, ou les symboles dans une fonte gothique comme une algèbre de Lie dans un secteur des mathématiques pures. Également, pour des domaines particuliers des sciences, certaines constantes ont des formes reconnaissables de lettres. Lorsqu'on étudie soigneusement l'étendue des symboles mathématiques pareils à des lettres, employés couramment aujourd'hui, comme l'a fait le projet STIX soutenu par les principaux éditeurs scientifiques et techniques, on s'aperçoit avec surprise qu'il y en a beaucoup. Une proposition d'inclure des symboles alphabétiques mathématiques dans le jeu de caractères Unicode pour faciliter l'édition mathématique a été faite, et elle a été accueillie favorablement.

Les points de code des nouveaux symboles alphanumériques mathématiques prévus pour Unicode 3.1 ont été retenus dans le Plan 1, c'est-à-dire, dans le premier plan avec des valeurs Unicode supérieures à 216. Ce plan de caractères est également connu comme le Plan multilingue complémentaire (PMC), à comparer au Plan multilingue de base (PMB), utilisé jusqu'ici par Unicode. La gestion des caractères du Plan 1 dans les logiciels déployés actuellement n'est pas toujours fiable et, en particulier, la gestion de ces caractères alphanumériques mathématiques ne se répandra probablement pas avant que les positions finales dans Unicode 3.1 n'aient été confirmées dans la norme ISO 10646.

Comme expliqué dans la section 3.2.2 Les attributs de style mathématique communs des éléments atomiques, MathML fournit un mécanisme de remplacement pour spécifier des caractères alphabétiques mathématiques, lequel facilitera le passage entre la transition vers les révisions Unicode et le déploiement correspondant des mise en œuvre logicielles et des fontes nécessaires pour cela. À savoir, on utilise l'attribut mathvariant sur l'élément atomique englobant, qui sera le plus souvent un élément mi. Dans cette section, nous précisons la correspondance que devrait appliquer un processeur MathML entre certains caractères dans le Plan 0 (PMB) Unicode, modifiés par l'attribut mathvariant, et les caractères des symboles alphanumériques mathématiques du Plan 1.

L'idée de base de cette correspondance est plutôt simple. Par exemple, on ajoute un alphabet gothique mathématique (N.d.T. Mathematical Fraktur) et le point de code du A gothique mathématique est U1D504. Ainsi, un exemple typique avec les caractères proposés :

<mi>&#x1D504;</mi>

Toutefois, un autre balisage équivalent consisterait à utiliser le A standard et à modifier l'identificateur à l'aide de l'attribut mathvariant, comme suit :

<mi mathvariant="fraktur">A</mi>

La correspondance exacte entre un caractère alphabétique mathématique et un caractère non stylé est compliquée par le fait que certains caractères, déjà présents dans Unicode, ne se trouvent pas dans la séquence prévue.

On montre les correspondances précises dans les tableaux fournis dans la section 6.3.6 Les symboles alphanumériques mathématiques.

Les caractères des symboles alphanumériques mathématiques ne devraient pas être utilisés pour un texte stylé. Par exemple, on ne doit pas utiliser un A gothique mathématique afin de sélectionner une police grasse juste pour avoir un A majuscule. Ce choix entraînerait des problèmes pour effectuer une recherche dans le texte, appliquer un nouveau style (par exemple, pour l'accessibilité) et pour beaucoup d'autres types de traitement.

6.2.4 Les caractères invisibles

Certains caractères, quoique d'importance pour la qualité de l'impression ou pour un autre rendu, n'ont pas de marques de glyphe correspondant directement. On les appelle ici caractères invisibles. On trouvera ci-dessous un tableau de ceux adoptés pour MathML. Leur rôle est expliqué respectivement dans le chapitre 3 Le balisage de présentation et le chapitre 4 Le balisage de contenu. Les valeurs proposées pour les espaces sont des recommandations. Certains caractères se trouvent parmi ceux avec de nouvelles valeurs Unicode et d'autres sont donnés comme combinaisons de caractères Unicode employant le nouveau caractère modificateur spécial des mathématiques (U0FE00). La correspondance entre les quantités d'espacement mentionnées ci-dessous et celles des descriptions Unicode n'est pas exacte, mais les références le sont.

Dans MathML 2.0, le contrôle de la composition des pages, tel que le saut de ligne, s'exerce avec des attributs adéquats sur l'élément mspace.

Les deux derniers caractères, ayant les noms d'entités mnémotechniques &InvisibleTimes; et &ApplyFunction;, ne sont pas simplement des espaceurs. Il s'agit de nouveaux ajouts au Jeu universel de caractères Unicode particulièrement importants car ils fournissent des indices textuels susceptibles d'améliorer la qualité d'un rendu imprimé, de permettre un rendu audio correct et de permettre une récupération unique de la sémantique mathématique à partir d'un texte visuellement ambigu.

Nom du caractère Unicode Description
&Tab; 00009 taquet de tabulation ; tabulation horizontale
&NewLine; 0000A force un saut de ligne ; saut de ligne
&Space; 00020 une espace d'un em dans la police courante
&NonBreakingSpace; 000A0 une espace qui n'est pas un point de rupture légal
&ZeroWidthSpace; 0200B une espace sans dimension du tout
&VeryThinSpace; 0200A une espace de chasse 1/18 em
&ThinSpace; 02009 une espace de chasse 3/18 em
&MediumSpace; 02005 une espace de chasse 4/18 em
&ThickSpace; 02009-0200A-0200A une espace de chasse 5/18 em
&NegativeVeryThinSpace; 0200A-0FE00 une espace de chasse -1/18 em errata-E15
&NegativeThinSpace; 02009-0FE00 une espace de chasse -3/18 em errata-E15
&NegativeMediumSpace; 0205F-0FE00 une espace de chasse -4/18 em errata-E15
&NegativeThickSpace; 02005-0FE00 une espace de chasse -5/18 em errata-E15
&InvisibleTimes; 02062 marque une multiplication ne comprenant pas de signe (cf. section 3.2.5 Les opérateurs, les délimiteurs, les séparateurs ou les accents (mo)
&ApplyFunction; 02061 un caractère montrant l'application d'une fonction dans un balisage de présentation (cf. section 3.2.5 Les opérateurs, les délimiteurs, les séparateurs ou les accents (mo)

6.3 Les listes des symboles de caractères

Le Jeu universel de caractères (JUC) de Unicode et ISO 10646 est en constante évolution (cf. la section 6.4.4 Le statut des codages de caractères). Quelques-uns des changements introduits récemment, relatifs aux besoins des langues asiatiques, ont justement été conçus pour faciliter l'utilisation d'Unicode dans la communauté des producteurs d'équations. Cette spécification est fondée sur l'hypothèse que les assignations de codes suggérées par le Comité technique Unicode au groupe ISO/IEC JTC1/SC2/WG2 seront confirmées puisqu'elles se trouvent dans les formes publiques des brouillons d'Unicode 3.1 et 3.2. Comme précédemment, on peut seulement réitérer le conseil de consulter la page d'accueil du groupe de travail Math du W3C pour des précisions sur les derniers développements des normes de caractères, tout au moins en ce qui concerne leur influence sur le formalisme mathématique.

Les caractères sont donnés avec leur noms d'entité et leurs numéros Unicode. Pour aider l'assimilation d'une liste de noms assez volumineuse, dépassant les 2000 dans ce cas, nous offrons plusieurs façons de trouver un caractère donné. Un jeu correspondant complet des déclarations d'entités se trouve dans la définition DTD, dans l'Annexe A [L'interprétation MathML]. Cf. cette annexe pour une discussion sur les déclarations d'entités.

Les caractères sont listés par nom et des échantillons de glyphes sont fournis pour chacun d'eux. Chaque nom de caractère est accompagné d'un code de regroupement de caractères, choisi dans une liste donnée ci-dessous, d'une brève description et d'un code hexadécimal Unicode issu de ISO 10646, maintenant augmenté conformément à la proposition transmise par le groupe de travail ISO/IEC WG2 en mars 2000.

Les listes de caractères, rangées alphabétiquement et selon Unicode dans la section 6.3.7 Les noms des caractères MathML, sont harmonisées aux jeux de caractères ISO donnés, c'est-à-dire que si une partie de jeu est incluse, alors le jeu entier l'est également.

6.3.1 Les constantes spéciales

On commence par énumérer, dans une liste distincte, quelques uns des caractères spéciaux introduits par MathML. Il leur a été accordé des nouvelles valeurs Unicode. À l'instar des caractères invisibles précédents &InvisibleTimes; et &ApplyFunction;, ils offrent des possibilités très utiles dans les contextes mathématiques automatisés. On pourrait s'attendre à trouver ci-dessous des entrées pour &true;, &false; ou &NotANumber;, mais aucun point Unicode ne leur a encore été assigné. Les mécanismes d'extension des caractères offerts par les éléments mglyph et csymbol peuvent servir à les introduire.

Nom d'entité Unicode Description
&CapitalDifferentialD; 02145 le D à utiliser dans les dérivées, par exemple dans les intégrales
&DifferentialD; 02146 le d à utiliser dans les dérivées, par exemple dans les intégrales
&ExponentialE; 02147 le e à utiliser pour la base exponentielle des logarithmes naturels
&ImaginaryI; 02148 le i à utiliser comme racine carrée de -1

6.3.2 Les tableaux de caractères (au format ASCII)

Le premier tableau offerte représente une liste de caractères ASCII très grande, intéressant tout particulièrement les mathématiques. Elle est donnée dans l'ordre Unicode (ou ordre Unicode proposé). La plupart de ces caractères, mais pas tous, ont des noms MathML définis via des déclarations d'entités dans la définition DTD. Il s'agit de symboles qui ne sont pas habituellement rattachés aux mathématiques, tels que les caractères de casseau (dingbats), les symboles graphiques mécaniques et les symboles techniques.

Un deuxième tableau liste en ordre alphabétique les caractères ayant des noms d'entités MathML, les lettres en minuscules précédant leurs contreparties en majuscules.

6.3.3 Les tableaux arrangés par bloc Unicode

Les tableaux de cette section détaillent les points de code Unicode (affichés en 256 points de code par tableau) dont les caractères ont une signification mathématique. Les exemples en images des glyphes sont liés au tableau de caractères ordonné par Unicode donné dans la section précédente. Comme annoncé en légende des tableaux, le statut de chaque caractère (par exemple, dans Unicode 3.0 ou dans les ajouts proposés) est indiqué par une classe CSS appliquée sur la cellule de tableau (affichée, par défaut, dans une autre couleur d'arrière-plan). Les noms des blocs sont ceux des blocs Unicode compris dans l'étendue numérique donnée (les crochets signalent des caractères qui n'apparaissent pas dans ces tableaux).

Étendue du bloc Description
00000 - 000FF Commandes, latin de base et supplément Latin-1
00100 - 001FF Latin étendu-A, latin étendu-B
00200 - 002FF Extensions IPA, lettres modificatrices d'espacement
00300 - 003FF Combinaisons de marques diacritiques, grec [et copte]
00400 - 004FF Cyrillique
02000 - 020FF Ponctuation générale, écritures en exposant et en indice, symboles monétaires, combinaisons de marques diacritiques pour les symboles
02100 - 021FF Symboles d'une seule lettre, formes numérales, flèches
02200 - 022FF Opérateurs mathématiques
02300 - 023FF Symboles techniques divers
02400 - 024FF Images de contrôle, reconnaissance optique des caractères, caractères alphanumériques englobés
02500 - 025FF Dessin de boîtes, éléments de bloc, formes géométriques
02600 - 026FF Symboles divers
02700 - 027FF Caractères de casseau (dingbats)
02900 - 029FF Autres flèches, symboles mathématiques divers
02A00 - 02AFF Autres opérateurs mathématiques
03000 - 030FF Symboles et ponctuation CJK, [Hiragana, Katakana]
0FB00 - 0FBFF Formes de présentation alphabétiques
0FE00 - 0FEFF [Combinaison de demi-marques, formes de compatibilité CJK, petites variantes de formes, formes de présentation-B arabe]
1D400 - 1D4FF Latin mathématique stylé (gras, italique, italique gras, cursif, début de cursif gras)
1D500 - 1D5FF Latin mathématique stylé (fin de cursif gras, gothique, ajouré, gothique gras, sans empattement, début sans empattement gras)
1D600 - 1D6FF Latin mathématique stylé (fin sans empattement gras, sans empattement italique, sans empattement italique gras, chasse fixe ou monospace, gras), grec mathématique stylé (gras, début italique)
1D700 - 1D7FF Grec mathématique stylé (italique suite, italique gras, sans empattement gras), chiffres mathématiques stylés

6.3.4 Les caractères mathématiques niés

Outre les caractères Unicode listés jusqu'ici, on peut utiliser les caractères combinatoires U0338 (/), U20D2 (|) et U20E5 (\) pour produire les formes niées ou annulées des caractères. Le caractère combinatoire devrait se placer immédiatement après son caractère de base, sans balisage ou espace intermédiaires, tout-à-fait comme pour la combinaison des accents.

En principes, les caractères de négation peuvent s'appliquer à n'importe quel caractère Unicode, même si les fontes conçues pour les mathématiques comprennent habituellement des glyphes déjà niés. Un moteur de rendu MathML devrait pouvoir utiliser ces glyphes précomposés dans ces cas. Le code de caractère composé représente un caractère du jeu de caractères Unicode déjà existant, comme c'est le cas pour la combinaison U0003D+00038 qui devient U02260, ou bien non, comme c'est le cas pour la combinaison U02202+00338. Les cas identifiés de négations courantes des deux types sont listés dans le tableau.

Remarquez que la politique du W3C et du consortium Unicode est celle-ci, que si un seul caractère est déjà défini, et qu'on peut l'obtenir par une combinaison, alors on doit utiliser ce caractère à la place de la forme décomposée. Il n'est pas prévu d'introduire de nouveaux caractères susceptibles de représenter seuls ce qui est déjà faisable avec des compositions existantes.

6.3.5 Les variantes de caractères mathématiques

Unicode essaye d'éviter d'avoir plusieurs codes de caractère pour les variantes de fontes simples. Pour qu'un point de code soit assigné, il devrait y avoir plus qu'une nuance dans les glyphes à enregistrer. Pour les variantes dignes de notation, il existe un caractère spécial, U+FE00 sélecteur de variante-1, proposé dans Unicode 3.2, qui agit comme un modificateur postfixe. Toutefois, les combinaisons admises avec ce sélecteur de variantes tiennent dans une liste limitée enregistrée comme faisant partie de Unicode. Le caractère sélecteur de variante-1 ne peut s'appliquer qu'aux caractères listés ici. Unicode ne considère pas la combinaison résultante comme un caractère séparé mais comme une variante du caractère de base. Les systèmes compatibles Unicode peuvent rendre la combinaison par le caractère de base si les fontes disponibles ne gèrent pas la forme variante du glyphe.

6.3.6 Les symboles alphanumériques mathématiques

Nous listons ici les alphabets mathématiques spéciaux. Remarquez que les noms de ces jets alphabétiques devraient être considérés comme des conventions issues d'une tradition récente de la composition des formules mathématiques, et non pas comme une fixation exacte et définitive des styles à utiliser. Bien sûr, ils correspondent aux styles les plus courants pour l'instant. Mais, par exemple, il peut exister des variantes de fontes pour les glyphes issus de fontes ajourées (N.d.T. double-struck, open-face, blackboard bold fonts), toutes ces dénominations seraient naturellement utilisées ici pour désigner des caractères ajourés. Des considérations similaires s'appliqueraient à des appellations telles que fracture (N.d.T. fraktur) et gothique, ou cursif (N.d.T. script) et calligraphique (N.d.T. calligraphic).

Comme expliqué précédemment, l'emploi de ces caractères équivaut formellement à utiliser des caractères appartenant au Plan 0 avec une valeur appropriée de l'attribut mathvariant. On donne les correspondances dans les tableaux de caractères. La plupart des caractères provient des rajouts proposés au Plan 1, toutefois quelques caractères (telles que les lettres ajourées N, P, Z, Q, R, C, H, représentant des ensembles de nombres courants), déjà présents dans Unicode 3.0, conservent leurs positions originales. Ces caractères sont mis en exergue dans les tableaux.

6.3.7 Les noms des caractères MathML

Cette section correspond étroitement aux définitions d'entités dans la définition DTD décrites dans l'Annexe A [L'interprétation MathML]. Tous les jeux d'entités sauf le dernier correspondent aux jeux d'entités définis par ISO 8879 ou ISO 9573-13.

Identificateur ISO Description
ISOAMSA Symboles mathématiques ajoutés : flèches
ISOAMSB Symboles mathématiques ajoutés : opérateurs binaires
ISOAMSC Symboles mathématiques ajoutés : délimiteurs
ISOAMSN Symboles mathématiques ajoutés : relations niées
ISOAMSO Symboles mathématiques ajoutés : ordinaire
ISOAMSR Symboles mathématiques ajoutés : relations
ISOBOX Dessin de boîtes et de traits
ISOCYR1 Cyrillique-1
ISOCYR2 Cyrillique-2
ISODIA Les marques diacritiques
ISOGRK3 Grec-3
ISOLAT1 Latin-1
ISOLAT2 Latin-2
ISOMFRK Gothique mathématique
ISOMOPF Ajouré mathématique (Open Face)
ISOMSCR Cursif mathématique
ISONUM Numérique et graphiques spéciaux
ISOPUB Édition
ISOTECH Technique générale
MMLEXTRA Noms supplémentaires ajoutés par MathML

6.4 Les différences avec les caractères de MathML 1.0

6.4.1 La couverture

Nous avons exclu un petit nombre d'autres caractères qui pouvaient apparaître dans les listes correspondantes de MathML 1.0. Ces caractères, en quelque sorte perdus, étaient très rarement utilisés par les éditeurs de mathématiques, ou qu'ils étaient tout simplement inacceptables pour une inclusion dans Unicode. Quoiqu'il en soit, MathML 2.0 fournit l'élément mglyph afin de tenir compte des nouveaux caractères que les auteurs voudraient introduire.

6.4.2 La diminution du nombre des caractères invisibles

Dans MathML 1.0, il y avait plus d'entités de caractères invisibles listées. Ceux-ci concernaient le contrôle de la composition, tel que le saut de ligne. Dans MathML 2.0, ce contrôle est réalisé par des attributs adéquats sur l'élément mspace.

6.4.3 Les tableaux ISO

Les listes de caractères, en ordre alphabétique ou en ordre Unicode, de la section 6.3.7 Les noms des caractères MathML, s'alignent désormais mieux sur les jeux de caractères ISO correspondants que dans MathML 1.0, à savoir que si une partie d'un jeu est incluse, alors tout le jeu est inclus. De surcroît, le groupe ISOCHEM a été abandonné car il concernait plutôt les chimistes. Tous les alphabets mathématiques ISO sont listés, puisqu'il existe maintenant des caractères Unicode pour les représenter, notamment les lettres grecques en caractères gras du groupe ISOGRK3. Ces changements se sont aussi répercutés sur les déclarations d'entités dans la définition DTD, cf. l'Annexe A [L'interprétation MathML].

6.4.4 Le statut des codages de caractères

Un changement significatif depuis MathML 1.0 est la tendance à adopter plus de caractères mathématiques dans le Jeu universel de caractères et la mise à disposition de fontes mathématiques publiques. Le codage des caractères du Jeu universel de caractères est un effort conjoint du Comité technique Unicode et du groupe ISO/IEC JTC1/SC2/WG2. Le processus du codage demande beaucoup de temps, depuis la délibération sur les premières propositions jusqu'à l'approbation finale. Les caractères mentionnés dans ce chapitre et listés dans les tableaux associés se placent à divers degrés dans ce processus d'approbation. Cette section fournit des informations détaillées sur les étapes concernant cette spécification et offre une vue d'ensemble des caractères affectés. Les listes, ainsi que les autres passages où il est question des caractères, signalent si les caractères ne sont pas entièrement approuvés ou bien le montrent visuellement. L'évolution du statut des caractères sera indiquée, lors des mises à jour de cette spécification, par la page des errata de la spécification et par des avis sur la page d'accueil Math du W3C. La décision finale pour toutes les questions relatives à Unicode se trouvera naturellement sur le site du consortium Unicode.

Les caractères pertinents pour MathML sont classés pour l'instant dans trois catégories : les caractères entièrement acceptés, les caractères en ballotage final (JTC1) ISO/IEC et les caractères pas encore en ballotage final ISO/IEC.

Table des matières : Le langage de balisage mathématique (MathML) version 2.0
Chapitre précédent : 5 La combinaison des balisages de présentation et de contenu
Chapitre suivant : 7 L'interface MathML