Openrefine: 按名称排序的文本方面应使用不区分大小写和变音符号的排序规则

创建于 2012-10-15  ·  3评论  ·  资料来源: OpenRefine/OpenRefine

_原作者:tfmorris (November 12, 2011 19:51:37)_

目前小写字符排在所有大写字符之后,因此 'T' 和 't' 位于完全不同的位置,国际字符在最后进行整理,因此 'Österreichische' 距离 'O's 数英里。

我们应该将大小写和变音符号折叠成它们的基本形式。

_原始问题: http :

bug facets imported from old code repo localization Medium

最有用的评论

等待 8 年有其优势 - 现在有对Intl.Collat​​or的 ECMAscript 支持,

所有3条评论

_摘自2011年11月12日tfmorris 20:33:31:_
r2371使排序顺序不区分大小写,但 Javascript 似乎没有内置的变音符号折叠方法,因此需要做更多的工作。

在我提交“修复”之后,我发现这实际上可能是一个特定于浏览器的错误/差异,但修复它似乎没有太大进展,因此我们可能应该假设当前状态将存在一阵子。
http://code.google.com/p/v8/issues/detail?id=459

这里有一个代码片段可用于清除变音符号: http :

等待 8 年有其优势 - 现在有对Intl.Collat​​or的 ECMAscript 支持,

默认的localeCompare()实现将变音符号整理在一起,至少对于使用 Chrome 的 en-US 语言环境,但大概会以用户在所有语言环境中期望的方式整理事物,所以我认为我们可以关闭它。

此页面是否有帮助?
0 / 5 - 0 等级

相关问题

antoine2711 picture antoine2711  ·  3评论

davidegiunchidiennea picture davidegiunchidiennea  ·  3评论

kushthedude picture kushthedude  ·  3评论

kushthedude picture kushthedude  ·  3评论

ettorerizza picture ettorerizza  ·  3评论