يرغب الكثير من الأشخاص في حساب دالة كتلة الاحتمالات باستخدام numpy.hist
وهم في حيرة من أمرهم لعدم تمكنهم من القيام بذلك.
ومع ذلك ، يمكنه حساب دالة كثافة الاحتمال و https://github.com/numpy/numpy/issues/1043 قام بعمل رائع بإعادة تسمية normed
إلى density
.
على غرار ذلك ، أقترح إضافة كلمة رئيسية mass
التي (إذا كان True
) تُرجع دالة الكتلة الاحتمالية.
سأقوم أيضًا بتنفيذ هذه الوظيفة ، بمجرد أن أحصل على تعليقات إيجابية.
نحتاج إلى مناقشة حقيقة أن التطبيع والترابط هما عاملان مستقلان في المدرج التكراري. PDF و PMF عبارة عن فئتين غير مناسبتين ، حيث يمكن أن يكون لديك متغيرات متصلة متصلة يتم تسويتها بواسطة المنطقة الواقعة أسفل المنحنى (PDF) ، وتلك التي لم يتم تطبيعها على الإطلاق (العدد) ، وتلك التي يتم تسويتها من خلال مجموع قيم الحاوية (ليست في الحقيقة PMF منذ أن تم إهمالها) ، تلك التي يتم تطبيعها بمجموع قيم سلة المتغيرات غير المستمرة (Chevy ، Volvo ، Ford ، إلخ. PMF) ، وربما أخرى. يبدو أن بعض الأدوات تستخدم إدخال سلسلة كتحديد.
لقد كنت أتجادل مع matplotlib حول هذا. لا أعتقد أن مهمة Numpy هي القيام بذلك لأن التطبيع من السهل القيام به رياضيًا بعد المخصص. إنه مجرد رسم بياني صعب. إنه غلافهم الذي يجعل من الصعب القيام بخطوات وسيطة في العملية مثل التطبيع. لكني استطرادا.
بالنظر إلى عدد مرات استخدام التطبيع في الرسوم البيانية ، سيكون من المنطقي بالنسبة لي السماح بالوظيفة من مجرد وجهة نظر مريحة. من المؤكد أن السطر الإضافي لا يمثل مشكلة كبيرة مرة واحدة ، ولكنه يضيف ويمكن أن يكون التنفيذ الحالي محبطًا عند البحث عن المعيار وإدراك أن المعلمة لا تفعل ما تحتاج إليه. أنا شخصياً أؤيد استخدام متغير معياري بدلاً من إضافة معلمة جديدة.
ومع ذلك ، تجدر الإشارة إلى أن Matplotlib يقبل بنية الإرجاع لـ np.histogram مباشرة كمدخلات للرسم / شريط / إلخ. تصبح الأمور أكثر إثارة للقلق عند العمل مع Pandas DataFrames ، حيث يتعين عليك تقطيعها يدويًا ، وتشغيلها من خلال np.histogram ، ثم التخطيط ، ولكنها أيضًا قابلة للتنفيذ.
خلاصة القول ، تنفيذ تطبيع count / sum / pmf في np.histogram أمر تافه (حجة واحدة ضده) ، ولكنه سيوفر الراحة في الوحدات التي تبني عليها.
هناك الكثير من النقاش في matplotlib / matplotlib # 10398 حول إضافة مثل هذه الكلمة الرئيسية التي قد تستحق المراجعة
التعليق الأكثر فائدة
بالنظر إلى عدد مرات استخدام التطبيع في الرسوم البيانية ، سيكون من المنطقي بالنسبة لي السماح بالوظيفة من مجرد وجهة نظر مريحة. من المؤكد أن السطر الإضافي لا يمثل مشكلة كبيرة مرة واحدة ، ولكنه يضيف ويمكن أن يكون التنفيذ الحالي محبطًا عند البحث عن المعيار وإدراك أن المعلمة لا تفعل ما تحتاج إليه. أنا شخصياً أؤيد استخدام متغير معياري بدلاً من إضافة معلمة جديدة.
ومع ذلك ، تجدر الإشارة إلى أن Matplotlib يقبل بنية الإرجاع لـ np.histogram مباشرة كمدخلات للرسم / شريط / إلخ. تصبح الأمور أكثر إثارة للقلق عند العمل مع Pandas DataFrames ، حيث يتعين عليك تقطيعها يدويًا ، وتشغيلها من خلال np.histogram ، ثم التخطيط ، ولكنها أيضًا قابلة للتنفيذ.
خلاصة القول ، تنفيذ تطبيع count / sum / pmf في np.histogram أمر تافه (حجة واحدة ضده) ، ولكنه سيوفر الراحة في الوحدات التي تبني عليها.