_Autor original: tfmorris (12 de noviembre de 2011 19:51:37) _
Actualmente, los caracteres en minúscula se ordenan después de todos los caracteres en mayúscula, por lo que 'T' y 't' están en lugares muy diferentes y los caracteres internacionales se cotejan al final, de modo que 'Österreichische' está a millas de las 'O'.
Deberíamos plegar tanto las mayúsculas como los diacríticos a sus formas básicas.
_Edición original: http://code.google.com/p/google-refine/issues/detail?id=482_
_Desde tfmorris el 12 de noviembre de 2011 20: 33: 31: _
r2371 hace que el orden de clasificación no
Después de realizar la "corrección", descubrí que esto puede ser una diferencia / error específico del navegador, pero no parece que haya habido mucho progreso para solucionarlo, por lo que probablemente deberíamos asumir que el estado actual va a existir. por un momento.
http://code.google.com/p/v8/issues/detail?id=459
Aquí hay un fragmento de código que se puede usar para eliminar los signos diacríticos: http://lehelk.com/2011/05/06/script-to-remove-diacritics/
Esperar 8 años tiene sus ventajas: ahora hay compatibilidad con ECMAscript para
La implementación predeterminada localeCompare()
recopila los signos diacríticos, al menos para la configuración regional en-US con Chrome, pero presumiblemente recopila las cosas de la manera que los usuarios esperan en todas las configuraciones regionales, así que creo que podemos cerrar esto.
Comentario más útil
Esperar 8 años tiene sus ventajas: ahora hay compatibilidad con ECMAscript para