Openrefine: 名前によるテキストファセットの並べ替えでは、大文字と小文字と発音区別符号の影響を受けない照合を使用する必要があります

作成日 2012年10月15日  ·  3コメント  ·  ソース: OpenRefine/OpenRefine

_原作者:tfmorris(2011年11月12日19:51:37)_

現在、小文字はすべて大文字の後にソートされるため、「T」と「t」は大きく異なる場所にあり、国際文字は最後に照合されるため、「Österreichische」は「O」から数マイル離れています。

大文字と小文字と発音区別符号の両方を基本形に折りたたむ必要があります。

_元の問題: http ://code.google.com/p/google-refine/issues/detail?id = 482_

bug facets imported from old code repo localization Medium

最も参考になるコメント

8年待つことには利点があります-大文字と発音区別符号を一緒に照合するIntl.Collat​​orのECMAscriptサポートがあります(ロケール固有のルールに従って)。

全てのコメント3件

_ 2011年11月12日のtfmorrisから20:33:31:_
r2371では、並べ替え順序で大文字と小文字が区別されませんが、Javascriptには発音区別符号の折りたたみ方法が組み込まれていないようです。そのため、もう少しかかります。

「修正」をコミットした後、これは実際にはブラウザ固有のバグ/違いである可能性があることを発見しましたが、修正はあまり進んでいないようです。したがって、現在の状態が存在すると想定する必要がありますしばらくの間。
http://code.google.com/p/v8/issues/detail?id=459

発音区別符号をスクラブするために使用できるコードスニペットがここにあります: http

8年待つことには利点があります-大文字と発音区別符号を一緒に照合するIntl.Collat​​orのECMAscriptサポートがあります(ロケール固有のルールに従って)。

デフォルトのlocaleCompare()実装は、少なくともChromeとen-USロケールでは発音区別符号を一緒に照合しますが、おそらくすべてのロケールでユーザーが期待する方法で照合するので、これを閉じることができると思います。

このページは役に立ちましたか?
0 / 5 - 0 評価