Numpy: Tambahkan kata kunci massal ke np.hist()

Dibuat pada 25 Okt 2017  ·  3Komentar  ·  Sumber: numpy/numpy

Sebuah banyak dari orang ingin menghitung fungsi massa probabilitas menggunakan numpy.hist dan bingung bahwa hal itu tidak bisa melakukan itu.
Namun itu dapat menghitung fungsi kepadatan probabilitas dan https://github.com/numpy/numpy/issues/1043 melakukan pekerjaan dengan baik dengan mengganti nama normed menjadi density .
Analog dengan itu, saya mengusulkan untuk menambahkan kata kunci mass yang (jika True ) mengembalikan fungsi massa probabilitas.

Saya juga akan menerapkan fungsi ini, setelah saya mendapat umpan balik positif.

Komentar yang paling membantu

Mempertimbangkan seberapa sering normalisasi digunakan dalam histogram, masuk akal bagi saya untuk mengizinkan fungsionalitas hanya dari sudut pandang kenyamanan. Tentu saja baris tambahan bukan masalah besar sekali, tetapi bertambah dan implementasi saat ini dapat membuat frustasi ketika mencari norma dan menyadari parameter tidak melakukan apa yang Anda butuhkan. Secara pribadi, saya lebih menyukai parameter norm_type daripada menambahkan yang baru.

Namun perlu dicatat, bahwa Matplotlib menerima struktur pengembalian np.histogram secara langsung sebagai input ke plot/bar/etc. Hal-hal menjadi sedikit lebih mengganggu ketika bekerja dengan Pandas DataFrames, karena Anda harus mengirisnya secara manual, jalankan melalui np.histogram, lalu plot, tetapi itu juga bisa dilakukan.

Intinya, menerapkan normalisasi count/sum/pmf ke dalam np.histogram adalah sepele (satu argumen menentangnya), tetapi akan memberikan kemudahan dalam membangun modul di atasnya.

Semua 3 komentar

Kita perlu membahas fakta bahwa normalisasi dan binning adalah dua faktor independen dari histogram. PDF dan PMF adalah kategori yang tidak tepat, karena Anda dapat memiliki variabel kontinu bin yang dinormalisasi oleh area di bawah kurva (PDF), variabel yang tidak dinormalisasi sama sekali (hitung), variabel yang dinormalisasi dengan jumlah nilai bin (bukan PMF karena binned), yang dinormalisasi dengan jumlah nilai bin untuk variabel non-kontinyu (Chevy, Volvo, Ford, dll. PMF), dan mungkin lainnya. Beberapa alat tampaknya menggunakan input string sebagai pilihan.

Saya telah berdebat dengan matplotlib tentang ini. Saya tidak berpikir itu tugas numpy untuk melakukan ini karena normalisasi mudah dilakukan secara matematis post-hoc. Hanya grafiknya saja yang sulit. Pembungkusnya yang membuat sulit untuk melakukan langkah-langkah perantara pada proses seperti normalisasi. Tapi saya ngelantur.

Mempertimbangkan seberapa sering normalisasi digunakan dalam histogram, masuk akal bagi saya untuk mengizinkan fungsionalitas hanya dari sudut pandang kenyamanan. Tentu saja baris tambahan bukan masalah besar sekali, tetapi bertambah dan implementasi saat ini dapat membuat frustasi ketika mencari norma dan menyadari parameter tidak melakukan apa yang Anda butuhkan. Secara pribadi, saya lebih menyukai parameter norm_type daripada menambahkan yang baru.

Namun perlu dicatat, bahwa Matplotlib menerima struktur pengembalian np.histogram secara langsung sebagai input ke plot/bar/etc. Hal-hal menjadi sedikit lebih mengganggu ketika bekerja dengan Pandas DataFrames, karena Anda harus mengirisnya secara manual, jalankan melalui np.histogram, lalu plot, tetapi itu juga bisa dilakukan.

Intinya, menerapkan normalisasi count/sum/pmf ke dalam np.histogram adalah sepele (satu argumen menentangnya), tetapi akan memberikan kemudahan dalam membangun modul di atasnya.

Ada banyak diskusi di matplotlib/matplotlib#10398 tentang menambahkan kata kunci yang mungkin layak untuk ditinjau

Apakah halaman ini membantu?
0 / 5 - 0 peringkat