Openrefine: Le tri des facettes de texte par nom doit utiliser un classement insensible à la casse et aux signes diacritiques

Créé le 15 oct. 2012  ·  3Commentaires  ·  Source: OpenRefine/OpenRefine

_Auteur original : tfmorris (12 novembre 2011 19:51:37)_

Actuellement, les caractères minuscules sont triés après tous les caractères majuscules, de sorte que « T » et « t » sont à des endroits très différents et les caractères internationaux sont regroupés à la toute fin de sorte que « Österreichische » est à des kilomètres des « O ».

Nous devrions plier à la fois la casse et les signes diacritiques dans leurs formes de base.

_Problème d'origine : http://code.google.com/p/google-refine/issues/detail?id=482_

bug facets imported from old code repo localization Medium

Commentaire le plus utile

Attendre 8 ans a ses avantages - il y a maintenant un support ECMAscript pour Intl.Collator qui rassemble la casse des lettres et les formes diacritiques (selon les règles spécifiques aux paramètres régionaux).

Tous les 3 commentaires

_De tfmorris le 12 novembre 2011 20:33:31:_
r2371 rend l'ordre de tri insensible à la casse, mais Javascript ne semble pas avoir de méthode de pliage diacritique intégrée, ce sera donc un peu plus de travail.

Après avoir validé le "correctif", j'ai découvert qu'il s'agissait peut-être d'un bug/d'une différence spécifique au navigateur, mais il ne semble pas qu'il y ait eu beaucoup de progrès pour le corriger, nous devrions donc probablement supposer que l'état actuel va exister pendant un certain temps.
http://code.google.com/p/v8/issues/detail?id=459

Il y a un extrait de code ici qui peut être utilisé pour effacer les signes diacritiques : http://lehelk.com/2011/05/06/script-to-remove-diacritics/

Attendre 8 ans a ses avantages - il y a maintenant un support ECMAscript pour Intl.Collator qui rassemble la casse des lettres et les formes diacritiques (selon les règles spécifiques aux paramètres régionaux).

L'implémentation par défaut de localeCompare() rassemble les signes diacritiques, au moins pour les paramètres régionaux en-US avec Chrome, mais rassemble probablement les choses comme les utilisateurs s'y attendent dans tous les paramètres régionaux, donc je pense que nous pouvons fermer cela.

Cette page vous a été utile?
0 / 5 - 0 notes