Numpy: np.hist()にmassキーワードを追加します

作成日 2017年10月25日  ·  3コメント  ·  ソース: numpy/numpy

多く人がnumpy.histを使用して確率質量関数を計算したいと思っており、それができないと混乱しています。
ただし、確率密度関数を計算することはでき、 https://github.com/numpy/numpy/issues/1043normed名前をdensity変更することで素晴らしい仕事をしました。
これと同様に、( True )確率質量関数を返すmassキーワードを追加することを提案します。

正のフィードバックが得られたら、この機能も実装します。

最も参考になるコメント

ヒストグラムで正規化が使用される頻度を考えると、単に便利な観点から機能を許可することは私には理にかなっています。 確かに、余分な行は一度は大したことではありませんが、それは合計され、現在の実装は、標準を探しているときにイライラする可能性があり、パラメーターが必要なことを実行しないことに気付きます。 個人的には、新しいパラメーターを追加するのではなく、norm_typeパラメーターを使用する方が好きです。

ただし、Matplotlibはnp.histogramの戻り構造をplot / bar / etcへの入力として直接受け入れることに注意してください。 Pandas DataFrameを手動でスライスし、np.histogramを実行してからプロットする必要があるため、Pandas DataFrameを使用する場合は、少し厄介になりますが、それも実行可能です。

結論として、count / sum / pmf正規化をnp.histogramに実装することは簡単ですが(それに対する1つの引数)、それを基に構築するモジュールで便利になります。

全てのコメント3件

正規化とビニングがヒストグラムの2つの独立した要素であるという事実について説明する必要があります。 PDFとPMFは不適切なカテゴリです。これは、曲線下の面積(PDF)で正規化された連続変数、まったく正規化されていない変数(count)、ビン値の合計で正規化された連続変数をビニングできるためです。 (ビニングされているため、実際にはPMFではありません)、非連続変数(Chevy、Volvo、FordなどのPMF)のビン値の合計によって正規化されたもの、およびおそらく他のもの。 一部のツールは、文字列入力を選択として使用しているようです。

私はこれについてmatplotlibと議論してきました。 正規化は数学的に事後的に行うのが簡単なので、これを行うのは厄介な仕事ではないと思います。 難しいのはグラフ化だけです。 正規化のようなプロセスの中間ステップを実行することを困難にするのは、それらのラッパーです。 しかし、私は逸脱します。

ヒストグラムで正規化が使用される頻度を考えると、単に便利な観点から機能を許可することは私には理にかなっています。 確かに、余分な行は一度は大したことではありませんが、それは合計され、現在の実装は、標準を探しているときにイライラする可能性があり、パラメーターが必要なことを実行しないことに気付きます。 個人的には、新しいパラメーターを追加するのではなく、norm_typeパラメーターを使用する方が好きです。

ただし、Matplotlibはnp.histogramの戻り構造をplot / bar / etcへの入力として直接受け入れることに注意してください。 Pandas DataFrameを手動でスライスし、np.histogramを実行してからプロットする必要があるため、Pandas DataFrameを使用する場合は、少し厄介になりますが、それも実行可能です。

結論として、count / sum / pmf正規化をnp.histogramに実装することは簡単ですが(それに対する1つの引数)、それを基に構築するモジュールで便利になります。

matplotlib / matplotlib#10398には、レビューする価値のあるキーワードの追加について多くの議論があります。

このページは役に立ちましたか?
0 / 5 - 0 評価

関連する問題

Kreol64 picture Kreol64  ·  3コメント

keithbriggs picture keithbriggs  ·  3コメント

toddrjen picture toddrjen  ·  4コメント

inducer picture inducer  ·  3コメント

thouis picture thouis  ·  4コメント