Unicode

  • by Rainer Erich Scheichelbauer
  • Tutorial

Si vous voulez avoir la certitude que vos polices fonctionneront correctement, il vous faudra attribuer correctement des Unicode à vos glyphes, ou du moins, à un certain nombre d’entre eux. Lisez ce qui suit pour découvrir ce que vous devez savoir sur Unicode en tant que designer de polices de caractères typographiques.

Caractères versus glyphes

Les designers de caractères dessinent des glyphes, c.-à-d. des images représentant des caractères. Habituellement, les designers de caractères ne créent pas de nouveaux caractères, c.-à-d. le sens de ces images, ou, exprimé plus techniquement, ‘la plus petite composante du langage écrit qui a une valeur sémantique.’ Nous n’inventons pas les alphabets, nous ne faisons que réinterpréter visuellement ceux qui existent déjà. (Bon, il est vrai que nous inventons aussi des alphabets, mais c’est une histoire différente. Restez cool et poursuivez votre lecture.)

Pour faire bref: vous tapez des caractères sur votre clavier, et des glyphes apparaissent sur la page ou l’écran.

Un glyphe correspond habituellement à un caractère, que ce soit une lettre, un chiffre ou un signe de ponctuation. Les caractères ont des Unicode. La relation glyphe-caractère est exprimée par la valeur Unicode associée au glyphe. Glyphs affiche cette valeur Unicode de différentes façons. Par exemple, dans l’aperçu Police, vous retrouverez l’Unicode juste à côté du nom de glyphe:

Un glyphe peut aussi représenter plus d’un caractère à la fois. Prenez une ligature f_f_f comme exemple. Elle représente trois caractères f consécutifs. Les ligatures n’ont pas d’Unicode, car les caractères séparés ont déjà leurs codes. Même s’ils sont dans une ligature ne change rien à la signification de ses parties. (En fait, certaines ligatures ont des codes de glyphes précomposés, mais c’est seulement pour des raisons de rétrocompatibilité avec des encodages périmés du temps révolu de l’âge des ténèbres de la programmation à 8 bits. Si ‘8 bits’ ne vous dit rien, je vous prie d’effacer immédiatement de votre mémoire tout ce texte entre parenthèses. Gardez votre calme et continuez votre lecture.)

Il arrive parfois qu’un glyphe ne serve uniquement comme partie d’autres glyphes. Vous pouvez, par exemple, utiliser des glyphes séparés pour vos empattements. En résumé, un glyphe est une image d’un ou plusieurs caractères, ou encore une partie d’autres glyphes. Les designers de caractère dessinent de telles images.

Unicode, plans et blocs

Au cours des siècles, l’alphabet est devenu plus compliqué que le a à z standard. Premièrement, il existe toutes sortes de signes diacritiques et de lettres spéciales, et (presque) tout se trouve en deux versions, bas de casse et capitales. Ensuite, il y a beaucoup, beaucoup, beaucoup, beaucoup plus que le seul script latin. En plus de centaines de milliers de symboles, chiffres, signes de ponctuation, et cætera, et cætera, et cætera.

Bref, nous avons besoin d’une façon efficace de gérer l’inventaire. Quelque chose comme une immense table pour tous les caractères de tous les scripts, essentiellement, tout ce que vous pourriez un jour vouloir dans un texte, n’importe où. Et bien, ça s’appelle Unicode.

Unicode est une table qui dresse la carte des codes attribués aux symboles; elle contient un tas de métadonnées. Il existe différentes façons de représenter les codes individuels (connus sous le nom Unicode transformation formats ou UTF), et Glyphs utilise la convention hexadécimale UTF-16. Hexadécimal, au cas où vous l’ignoriez, c’est compter avec 16 au lieu de 10 chiffres. Nous utilisons les lettres A à F comme chiffres supplémentaires, et nous comptons comme ceci: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 1A, 1B, et ainsi de suite, vous avez compris l’idée.

Unicode a dix-sept plans de 65 536 caractères chacun, et les plus importants sont le plan multilingue de base (BMP ou plan 0) qui s’étend de U+0000 à U+FFFF ainsi que le plan multilingue complémentaire (SMP ou plan 1) de U+10000 à U+1FFFF. Les plans sont sous-divisés en plusieurs blocs de caractères, comprenant habituellement un script, p. ex. le tamil de U+0B80 to U+0BFF ou quelque chose de drôle comme les émoticônes commençant à U+1F600.

Les (17 × 65 536 =) 1 114 112 codets ne sont actuellement pas tous en usage. Au moment de la rédaction de ce tutoriel, le plus récent standard Unicode est la version 11.0.0 de juin 2018 avec 137 374 caractères.

Certaines parties d’Unicode sont intentionnellement laissées libres pour l’utilisation privée. Unicode possède trois de ces zones à usage privé (PUA en anglais, pour Private Use Areas), et la plus importante s’étend de U+E000 à U+F8FF.

Pour les scripts non officiels, pour lesquels il est peu probable que des Unicode officiels soient obtenus un jour, par exemple le klingon pIqaD, les geeks ont créé le registre Unicode ConScript qui utilise les zones à usage privé.

Unicode et Glyphs

Dans Glyphs, vous n’avez habituellement pas besoin de vous soucier des Unicode, puisque le logiciel détermine le bon code (ou l’absence de code) en utilisant le nom de glyphe. Ouvrez Fenêtre > Informations de glyphe (Cmd-Opt-I) et recherchez des glyphes particuliers en inscrivant au clavier (une partie d’) un nom de glyphe dans le champ Rechercher:

Glyphs a une base de données intégrée de noms de glyphes prédéfinis. Vous pouvez ajouter vos propres définitions si cela vous intéresse. La fenêtre des Informations de glyphe affiche le nom, l’Unicode (si disponible) et des métadonnées à propos de chaque glyphe. À partir de la version 1.3.18 de Glyphs, vous pouvez rapidement ajouter un glyphe à votre police en le sélectionnant et en appuyant sur le bouton Ajouter à la police dans le coin en bas à droite.

Dans les Informations de glyphe, vous pouvez même voir la très pratique information de composition des glyphes individuels, c’est-à-dire la liste de leurs composantes (il se pourrait que vous ayez à ajuster la taille de la fenêtre):

Par exemple, si vous planifiez d’ajouter un adieresismacron à votre police, assurez-vous d’avoir dans votre police le a, le dieresis et le macron. Glyphs pourra ensuite les utiliser comme composantes pour le adieresismacron et construire sur-le-champ le glyphe complet. Trop génial.

Si vous planifiez l’ajout d’un glyphe qui n’a pas d’entrée dans la fenêtre des Informations de glyphe, vous pouvez utiliser la forme uniXXXX pour le relier à un caractère dans le plan multilingue de base. Les XXXX indiquent les quatre chiffres du code hexadécimal UTF-16. Utilisez uXXXXX pour n’importe quel plan supérieur, c’est-à-dire, un simple u au lieu de uni. Glyphs ajoutera automatiquement le bon Unicode.

Gardez en tête que ce ne sont pas tous les glyphes qui ont besoin d’un Unicode. En particulier lorsque le glyphe est sollicité par une fonction OpenType, le glyphe n’a pas besoin d’avoir été codé. Vous n’avez besoin d’un code que si vous avez besoin de le taper directement au clavier. Par exemple, vous n’avez pas besoin de coder les petites capitales ou la variante d’une lettre, puisque l’utilisateur entrera son texte au clavier sous la forme de simples bas de casse et capitales et activera la fonction désirée du logiciel par la suite.

Valeurs Unicode multiples pour une seule forme

Quoi faire si vous voulez partager la même forme de glyphe avec deux valeurs Unicode? Il existe quelques situations où vous aurez besoin de faire cela. Par exemple, le symbole incrément U+2206 et la lettre grecque delta U+0394 devraient avoir l’air pareils. Un problème semblable se pose avec ohm U+2126 et oméga U+03A9. Ou encore, si vous créez une police toute en capitales. Ou, finalement, vous voulez tout simplement réutiliser le même glyphe espace à la fois pour l’espace U+0020 et l’espace insécable U+00A0.

Deux options se présentent à vous: double association ou double glyphe.

  1. Double association: c’est lorsque vous donnez à un seul glyphe des valeurs Unicode multiples. Pour faire cela, cliquez tout simplement dans le champ Unicode et entrez la seconde valeur Unicode, p. ex., ajoutez 00A0 dans l’espace à côté de 0020 et appuyez ensuite sur la touche Retour:

    Cette solution a l’avantage de maintenir une petite taille de fichier. Ça peut donc être une bonne idée pour les polices web, car elles doivent être aussi petites que possible. L’inconvénient de cette solution est qu’un problème se présente lorsqu’un texte est copié d’un PDF qui a une police avec des doubles associations Unicode. (Pour en savoir plus à ce sujet, lisez la section ‘Problems with Double Encodings’ dans le tutoriel sur une police toute en capitales.) Nous recommandons tout de même cette méthode puisque de toute façon bien d’autres problèmes se présentent lorsqu’un texte est extrait d’un PDF. C’est déjà une cause perdue pour laquelle il ne nous sert à rien de trop s’en faire.
     

  2. Double glyphe: vous pouvez dupliquer un glyphe en tant que copie de composante avec la simple recette qui suit. Une copie de composante est un glyphe qui a exactement un seul autre glyphe comme composante. Si la composante est autoalignée, l’original et la copie sont toujours synchronisés. C’est facile de faire une copie de composante avec une recette: Sélectionnez Glyphe > Ajouter des glyphes… (Cmd-Shift-G) et tapez le nom original du glyphe, suivi d’un signe égal, suivi du nom du double.

    Par exemple: vous avez déjà le delta grec, mais vous voulez l’utiliser comme symbole incrément (et vous êtes préoccupé par les problèmes d’extraction des textes PDF mentionnés ci-dessus). Appuyez sur Cmd-Shift-G pour faire apparaître la fenêtre de dialogue Ajouter des glyphes…, entrez Delta=increment, et appuyez sur Générer:

    Si vous préférez garder les glyphes espace identiques, bien sûr, dans ce cas des composantes seraient inutiles. C’est alors bien plus futé d’utiliser une clé de mesures pour la chasse. Par exemple, si vous voulez que l’espace insécable soit le même que l’espace standard, ouvrez votre glyphe nbspace afin de l’éditer, et entrez =space dans le champ Chasse. Sélectionnez ensuite Glyphe > Actualiser les mesures (Ctrl-Cmd-M) pour vous assurer que la chasse du glyphe soit synchronisée. Ou encore, si vous avez des masters multiples, maintenez la touche Option enfoncée, et la commande changera comme par magie pour Actualiser les mesures de tous les masters. Super. Lisez davantage sur les clés de mesures dans le tutoriel sur l’espacement.

UnicodeChecker

Glyphs peut interagir avec l’outil partagiciel UnicodeChecker fait par les gens formidables de Earthling Soft. UnicodeChecker vous aide à trouver rapidement trouver toute l’information sur les caractères dont vous avez besoin. Pour accéder à l’UnicodeChecker, cliquez sur la petite flèche à côté de l’Unicode dans la zone grise des informations:

Glyphs enverra alors le code du glyphe courant à UnicodeChecker, qui a son tour vous donnera toutes sortes d’informations pratiques à propos du caractère en question:

UnicodeChecker est aussi utile pour trouver rapidement tous les caractères liés à un script. Par exemple, si vous voulez couvrir tous les caractères latins, allez dans l’UnicodeChecker et vous trouverez tous les blocs latins dans le sous-menu Character Blocks > Alphabetically: Ideographic-Lydian:

Si vous n’avez pas encore installé UnicodeChecker, Glyphs vous invitera à le faire lorsque vous cliquerez sur la flèche. Vous pouvez télécharger et installer UnicodeChecker gratuitement. Cependant, si vous l’utilisez de façon régulière, pensez à combien de temps et d’énervement que ce petit outil vous sauve et considérez un don aux créateurs. Supportez les partagiciels, car ils vous supportent.


Mise à jour 2019-02-13: changé pour l’Unicode 11.0.0 et mise à jour du lien. Réécriture de Double Mappings (maintenant intitulé Valeurs Unicode multiples pour une même forme).
Traduction française de Nathalie Dumont.