Xgboost: [PYTHON] Jadikan Validasi Nama Fitur Opsional

Dibuat pada 22 Sep 2016 · 4Komentar · Sumber: dmlc/xgboost

Meskipun validasi nama fitur dapat membantu dalam beberapa kasus, ini juga membawa masalah ketika data baru tidak berisi fitur yang sesuai. Ini bisa sering terjadi dalam data yang jarang dan bukan perilaku yang diinginkan. Sering memverifikasi nama fitur juga merusak kecepatan selama fase pelatihan ketika data jarang.

Saya akan mengusulkan untuk menghapus validasi nama fitur dan menjadikannya opsional. Saya ingin memahami konsekuensi dan melihat apakah yang ingin membuat PR di atasnya. @sinhrks @terrytangyuan @phunterlau

Saya berharap kami dapat menyelesaikan https://github.com/dmlc/xgboost/issues/1238 sepenuhnya dan menambahkan tes regresi untuk mencegah hal ini terjadi

Sumber

tqchen

👍2

Komentar yang paling membantu

Saya setuju dengan perubahan ini.

Saya tidak punya banyak waktu luang untuk PR baru-baru ini, tetapi saya pikir seharusnya cukup mudah untuk membuat ini opsional.

Saya tidak berpikir itu perlu untuk memvalidasinya selama setiap pembaruan dan meningkatkan panggilan. Saya merasa kita hanya perlu memvalidasinya sekali selama inisialisasi DMatrix dan Booster . Kami harus secara eksplisit memberi tahu pengguna tentang konsekuensi dan kerugian dari melewatkan validasi.