Bifurcação de # 970: JS.md fala sobre normalização Unicode .
Um exemplo simples desse documento: meu nome "Jean-François Bastien" pode ser normalizado de duas maneiras com
Ç ↔ C + ◌̧
Este é um belo pegadinho em Unicode. Durante a interface entre JS e wasm, seria bom saber o que esperar dos produtores e consumidores. Podemos escolher não normalizar, mas devemos dizer isso .
Vejo 4 maneiras de discutir a normalização em JS.md:
Se escolhermos 2. ou 3. devemos especificar qual forma de normalização esperamos (porque é claro que existem várias formas de normalização).
1, 2 e 3 parecem ser uma boa fonte para bugs esotéricos em motores JS.
Eu voto 4.
Acho que a convertToJSString
function Web.md # names já especifica 4. Parece bom adicionar um texto esclarecedor para dizer que nenhuma normalização ocorre, no entanto.
Acordado com @lukewagner.
FWIW, CSS também não normaliza.
Sim, nada na plataforma da web usa normalização Unicode, exceto string.normalize () em JavaScript e IDNA em URLs. 4 é definitivamente o que você quer aqui.
Doce. Quero ter certeza de que documentamos essas decisões e parece que chegamos a um consenso. Fechando.
Comentários muito úteis
Acho que a
convertToJSString
function Web.md # names já especifica 4. Parece bom adicionar um texto esclarecedor para dizer que nenhuma normalização ocorre, no entanto.