Meskipun validasi nama fitur dapat membantu dalam beberapa kasus, ini juga membawa masalah ketika data baru tidak berisi fitur yang sesuai. Ini bisa sering terjadi dalam data yang jarang dan bukan perilaku yang diinginkan. Sering memverifikasi nama fitur juga merusak kecepatan selama fase pelatihan ketika data jarang.
Saya akan mengusulkan untuk menghapus validasi nama fitur dan menjadikannya opsional. Saya ingin memahami konsekuensi dan melihat apakah yang ingin membuat PR di atasnya. @sinhrks @terrytangyuan @phunterlau
Saya berharap kami dapat menyelesaikan https://github.com/dmlc/xgboost/issues/1238 sepenuhnya dan menambahkan tes regresi untuk mencegah hal ini terjadi
Saya setuju dengan perubahan ini.
Saya tidak punya banyak waktu luang untuk PR baru-baru ini, tetapi saya pikir seharusnya cukup mudah untuk membuat ini opsional.
Saya tidak berpikir itu perlu untuk memvalidasinya selama setiap pembaruan dan meningkatkan panggilan. Saya merasa kita hanya perlu memvalidasinya sekali selama inisialisasi DMatrix
dan Booster
. Kami harus secara eksplisit memberi tahu pengguna tentang konsekuensi dan kerugian dari melewatkan validasi.
Apakah ini diselesaikan?
dito. menunggu ini diselesaikan. masih menjalankan 0.4a30
...
Penutupan, karena #3323 membahas masalah ini.
Komentar yang paling membantu
Saya setuju dengan perubahan ini.
Saya tidak punya banyak waktu luang untuk PR baru-baru ini, tetapi saya pikir seharusnya cukup mudah untuk membuat ini opsional.
Saya tidak berpikir itu perlu untuk memvalidasinya selama setiap pembaruan dan meningkatkan panggilan. Saya merasa kita hanya perlu memvalidasinya sekali selama inisialisasi
DMatrix
danBooster
. Kami harus secara eksplisit memberi tahu pengguna tentang konsekuensi dan kerugian dari melewatkan validasi.