Forking from #970: JS.md parle de la normalisation Unicode .
Un exemple simple tiré de ce document : mon nom « Jean-François Bastien » peut être normalisé de deux manières avec
Ç ↔ C+◌̧
C'est un bon piège en Unicode. Lors de l'interface entre JS et wasm, il serait bon de savoir à quoi s'attendre des producteurs et des consommateurs. Nous pouvons choisir de ne pas normaliser, mais nous devons le dire .
Je vois 4 façons dont nous pouvons discuter de la normalisation dans JS.md :
Si nous choisissons 2. ou 3. nous devons spécifier quelle forme de normalisation nous attendons (car bien sûr il existe plusieurs formes de normalisation).
1, 2 et 3 semble être une bonne source de bogues ésotériques dans les moteurs JS.
Je vote 4.
Je pense que la fonction convertToJSString
Web.md#names spécifie déjà 4. Cela semble bien d'ajouter un texte de clarification pour dire qu'aucune normalisation ne se produit, cependant.
D'accord avec @lukewagner.
FWIW, CSS ne se normalise pas du tout non plus.
Oui, rien dans la plate-forme Web n'utilise la normalisation Unicode, à part string.normalize() dans JavaScript et IDNA dans les URL. 4 est certainement ce que vous voulez ici.
Doux. Je veux m'assurer que nous documentons ces décisions, et il semble que nous ayons atteint un consensus. Fermeture.
Commentaire le plus utile
Je pense que la fonction
convertToJSString
Web.md#names spécifie déjà 4. Cela semble bien d'ajouter un texte de clarification pour dire qu'aucune normalisation ne se produit, cependant.