Hdbscan: prediksi.membership_vector selalu gagal dengan kesalahan ketik

Dibuat pada 5 Jul 2017  ·  12Komentar  ·  Sumber: scikit-learn-contrib/hdbscan

probs = hdbscan.prediction.membership_vector(clusterer, X_train)
ValueError: Buffer dtype mismatch, expected 'float64_t' but got 'long'

Saya mencoba ini pada master dengan metrik berikut: manhattan , hamming , euclidean .

Komentar yang paling membantu

Terima kasih! Saya akan melihat apakah saya dapat menyusun daftar pendek dan meletakkannya di sini. Setiap dan semua bantuan sangat dihargai!

Semua 12 komentar

Ah, sepertinya ini terjadi jika data training X saya bertipe np.int64 . Ini sulit untuk di-debug. Saya sarankan menambahkan pernyataan tipe di suatu tempat.

Sebenarnya fungsi membership_vector cenderung mengembalikan banyak nan s dan nilai-nilai seperti 2.77568154e-157 , yang saya tidak tahu bagaimana menafsirkannya. Saya melihat bahwa tes untuk itu dikomentari, jadi saya akan membiarkan ini :-) Mungkin solusi terbaik adalah menghentikan fungsi ini?

+1 untuk ini, terima kasih telah mencari tahu dari mana float64_t berasal

Semuanya berfungsi, tetapi tidak pernah diuji dengan baik untuk kumpulan data yang beragam dan tentu saja ada beberapa masalah. Saya harus melihat apakah saya dapat menemukan waktu untuk memilah-milah ini dan memperbaikinya.

Maksud saya, saya pikir itu juga sebagian kesalahan numpy. Saya mendapat pesan kesalahan yang mengatakan Buffer dtype mismatch, expected 'float64_t' but got 'float64' . Agak terlalu samar untuk diketahui.

Itu pasti hanya salah ketik di suatu tempat di pihak saya, saya percaya. Saya seharusnya bisa memperbaikinya, tetapi untuk sisanya ... itu mungkin membutuhkan waktu lebih lama.

Senang membantu jika Anda dapat menentukan beberapa TODO yang konkret.

Terima kasih! Saya akan melihat apakah saya dapat menyusun daftar pendek dan meletakkannya di sini. Setiap dan semua bantuan sangat dihargai!

Apakah ini tempat yang baik untuk bertanya mengapa ini tidak ada di sklearn itu sendiri?

Saya telah berbicara dengan pengelola sklearn dan jawaban singkatnya adalah bahwa algoritme (HDBSCAN*) dianggap terlalu baru (yaitu tidak cukup kutipan dalam literatur) untuk dimasukkan saat ini. Karena algoritme memperoleh popularitas dan penyertaan kutipan dalam sklearn yang tepat diharapkan akan terjadi.

Juga ingin membantu dengan ini, karena saya ingin melihat ini diadopsi lebih luas.

Itu masuk akal; sebuah algoritma berada di sklearn menyiratkan bahwa teknik tersebut memiliki kredibilitas.

Apakah halaman ini membantu?
0 / 5 - 0 peringkat