Forking dari #970: JS.md berbicara tentang normalisasi Unicode .
Contoh sederhana dari dokumen itu: nama saya "Jean-François Bastien" dapat dinormalisasi dengan dua cara
C+◌̧
Ini adalah gotcha yang bagus di Unicode. Saat berinteraksi antara JS dan wasm, ada baiknya mengetahui apa yang diharapkan dari produsen dan konsumen. Kami mungkin memilih untuk tidak menormalkan, tetapi kami harus mengatakannya .
Saya melihat 4 cara di mana kita dapat mendiskusikan normalisasi di JS.md:
Jika kita memilih 2. atau 3. kita harus menentukan bentuk normalisasi mana yang kita harapkan (karena tentu saja ada beberapa bentuk normalisasi).
1, 2, dan 3 sepertinya merupakan sumber yang bagus untuk bug esoteris di mesin JS.
saya memberikan suara 4.
Saya pikir fungsi convertToJSString
Web.md#names sudah menentukan 4. Tampaknya baik-baik saja untuk menambahkan teks klarifikasi untuk mengatakan bahwa tidak ada normalisasi yang terjadi.
Setuju dengan @lukewagner.
FWIW, CSS juga tidak normal sama sekali.
Ya, tidak ada di platform web yang menggunakan normalisasi Unicode, selain string.normalize() dalam JavaScript dan IDNA di URL. 4 pasti yang Anda inginkan di sini.
Manis. Saya ingin memastikan kami mendokumentasikan keputusan ini, dan sepertinya kami telah mencapai konsensus. Penutupan.
Komentar yang paling membantu
Saya pikir fungsi
convertToJSString
Web.md#names sudah menentukan 4. Tampaknya baik-baik saja untuk menambahkan teks klarifikasi untuk mengatakan bahwa tidak ada normalisasi yang terjadi.