Openrefine: La ordenación de facetas de texto por nombre debe usar una intercalación insensible a mayúsculas y minúsculas

Creado en 15 oct. 2012  ·  3Comentarios  ·  Fuente: OpenRefine/OpenRefine

_Autor original: tfmorris (12 de noviembre de 2011 19:51:37) _

Actualmente, los caracteres en minúscula se ordenan después de todos los caracteres en mayúscula, por lo que 'T' y 't' están en lugares muy diferentes y los caracteres internacionales se cotejan al final, de modo que 'Österreichische' está a millas de las 'O'.

Deberíamos plegar tanto las mayúsculas como los diacríticos a sus formas básicas.

_Edición original: http://code.google.com/p/google-refine/issues/detail?id=482_

bug facets imported from old code repo localization Medium

Comentario más útil

Esperar 8 años tiene sus ventajas: ahora hay compatibilidad con ECMAscript para

Todos 3 comentarios

_Desde tfmorris el 12 de noviembre de 2011 20: 33: 31: _
r2371 hace que el orden de clasificación no

Después de realizar la "corrección", descubrí que esto puede ser una diferencia / error específico del navegador, pero no parece que haya habido mucho progreso para solucionarlo, por lo que probablemente deberíamos asumir que el estado actual va a existir. por un momento.
http://code.google.com/p/v8/issues/detail?id=459

Aquí hay un fragmento de código que se puede usar para eliminar los signos diacríticos: http://lehelk.com/2011/05/06/script-to-remove-diacritics/

Esperar 8 años tiene sus ventajas: ahora hay compatibilidad con ECMAscript para

La implementación predeterminada localeCompare() recopila los signos diacríticos, al menos para la configuración regional en-US con Chrome, pero presumiblemente recopila las cosas de la manera que los usuarios esperan en todas las configuraciones regionales, así que creo que podemos cerrar esto.

¿Fue útil esta página
0 / 5 - 0 calificaciones