_المؤلف الأصلي: tfmorris (نوفمبر 12 ، 2011 19:51:37) _
تُصنف الأحرف الصغيرة حاليًا بعد كل الأحرف الكبيرة ، لذا فإن الحرفين "T" و "t" في أماكن مختلفة تمامًا ويتم ترتيب الأحرف الدولية في النهاية بحيث تكون "Österreichische" على بُعد أميال من حرف "O".
يجب علينا طي كل من الحالة وعلامات التشكيل في أشكالها الأساسية.
_Original المسألة: http://code.google.com/p/google-refine/issues/detail؟id=482_
_ من tfmorris في 12 نوفمبر 2011 20:33:31: _
يجعل r2371 ترتيب الفرز غير حساس لحالة الأحرف ، ولكن لا يبدو أن جافا سكريبت تحتوي على طريقة مضمنة لطي التشكيل ، لذلك سيكون هذا العمل أكثر بقليل.
بعد أن قمت بتنفيذ "الإصلاح" اكتشفت أن هذا قد يكون في الواقع خطأ / اختلافًا خاصًا بالمتصفح ، ولكن لا يبدو أنه قد تم إحراز تقدم كبير في إصلاحه ، لذلك من المحتمل أن نفترض أن الحالة الحالية ستكون للحظات.
http://code.google.com/p/v8/issues/detail؟id=459
يوجد مقتطف رمز هنا يمكن استخدامه لتنظيف علامات التشكيل: http://lehelk.com/2011/05/06/script-to-remove-diacritics/
الانتظار لمدة 8 سنوات له مميزاته - يوجد الآن دعم ECMAscript لـ Intl.Collator الذي يجمع حالة الأحرف وأشكال التشكيل معًا (وفقًا لقواعد محددة باللغة المحلية).
يجمع التطبيق الافتراضي localeCompare()
علامات التشكيل معًا ، على الأقل بالنسبة للغة الإنجليزية في الولايات المتحدة باستخدام Chrome ، ولكن يفترض أنه يجمع الأشياء بالطريقة التي يتوقعها المستخدمون في جميع المناطق ، لذلك أعتقد أنه يمكننا إغلاق هذا.
التعليق الأكثر فائدة
الانتظار لمدة 8 سنوات له مميزاته - يوجد الآن دعم ECMAscript لـ Intl.Collator الذي يجمع حالة الأحرف وأشكال التشكيل معًا (وفقًا لقواعد محددة باللغة المحلية).