Rust: "char": tambahkan tipe dan fungsi untuk Kategori Karakter Unicode

Dibuat pada 20 Des 2011  ·  6Komentar  ·  Sumber: rust-lang/rust

Untuk Kategori Karakter Unicode lihat http://www.fileformat.info/info/unicode/category/index.htm

Haskell mengimplementasikan tipe "GeneralCategory" dan fungsi untuk menentukan "GeneralCategory" karakter.
Implementasi mereka berjalan seperti ini:

Saya mengusulkan untuk menulis skrip Python, yang melakukan hal serupa.

Memiliki tipe dan fungsi seperti itu di Rust memungkinkan kita untuk mengimplementasikan fungsi dengan benar di modul "char". Lihat http://haskell.org/ghc/docs/6.12.2/html/libraries/base-4.2.0.1/src/Data-Char.html

Komentar yang paling membantu

Maaf untuk mengomentari utas yang sangat lama, saya sebenarnya baru saja mengimplementasikan banyak UCD (v9.0.0) di sini . Itu tidak tergantung pada libicu, atau perpustakaan standar, jadi mudah-mudahan itu akan mudah digunakan dengan proyek (meskipun mungkin tidak dapat diandalkan seperti ICU).

Semua 6 komentar

Modul dalam proses yang disebut 'unicode::' di libstd adalah tempat saya akan membuat sketsa antarmuka ke libicu. Keputusannya sebenarnya tidak terlalu sederhana untuk sebagian besar kelas karakter, dan ICU telah menanganinya dengan baik. Saya kira kita dapat mengeksposnya di bawah core::char jika semua orang baik-baik saja dengan mengadopsi ketergantungan pada libicu?

libicu menyediakan banyak fitur tambahan yang diinginkan, dan mungkin ada di sebagian besar komputer (Python menggunakannya, jadi itu tidak masalah bagi kami).

Apakah kami ingin menyediakan binding libicu publik atau hanya menggunakannya secara internal dalam modul seperti "char", "str" ​​dll?
Saya cenderung condong untuk yang terakhir.

Untuk mengimplementasikan fungsi di "char" Rust dengan benar menggunakan libicu, saya pikir kita hanya perlu memanggil fungsi seperti "u_isspace()", "u_isdigit()", "u_forDigit()" (http://icu-project.org/ apiref/icu4c/uchar_8h.html).

Kami belum membutuhkan ikatan libicu penuh (termasuk banyak definisi konstanta).

Saya pikir kita harus pergi untuk rute libicu. Lihat #1370

Bisakah kita membuka kembali ini? Kami tidak bergantung pada libicu lagi, tetapi masih tidak ada cara mudah untuk menemukan kategori karakter.

Maaf untuk mengomentari utas yang sangat lama, saya sebenarnya baru saja mengimplementasikan banyak UCD (v9.0.0) di sini . Itu tidak tergantung pada libicu, atau perpustakaan standar, jadi mudah-mudahan itu akan mudah digunakan dengan proyek (meskipun mungkin tidak dapat diandalkan seperti ICU).

Apakah halaman ini membantu?
0 / 5 - 0 peringkat