Pandas: बग: नकली मान सूचकांक के साथ फ्रेम के लिए _nsorted

को निर्मित 9 जून 2016 · 5टिप्पणियाँ · स्रोत: pandas-dev/pandas

नीचे दिए गए फ़ंक्शन को गलत तरीके से लागू किया गया है। यदि फ़्रेम में डुप्लिकेट मानों के साथ एक इंडेक्स है, तो आपको n पंक्तियों से अधिक के साथ परिणाम मिलेगा और ठीक से सॉर्ट नहीं किया जाएगा। इसलिए DataFrame के लिए nsmallest और nlargest इस विशेष मामले में एक सही फ्रेम वापस नहीं करता है।

def _nsorted(self, columns, n, method, keep):
    if not com.is_list_like(columns):
        columns = [columns]
    columns = list(columns)
    ser = getattr(self[columns[0]], method)(n, keep=keep)
    ascending = dict(nlargest=False, nsmallest=True)[method]
    return self.loc[ser.index].sort_values(columns, ascending=ascending,
                                           kind='mergesort')

Bug

स्रोत

Tux1

सबसे उपयोगी टिप्पणी

@ शंकरकर देखें: https://github.com/pandas-dev/pandas/issues/15297

jreback 13 मार्च 2017

❤1 👍1

सभी 5 टिप्पणियाँ

वास्तव में:

In [71]: df = pd.DataFrame({'a':[1,2,3,4], 'b':[4,3,2,1]}, index=[0,0,1,1])

In [72]: df.nlargest(1, 'a')
Out[72]:
   a  b
1  4  1
1  3  2

In [73]: df.nlargest(2, 'a')
Out[73]:
   a  b
1  4  1
1  4  1
1  3  2
1  3  2

( @ भविष्य के संदर्भ के लिए
इसे ठीक करने के लिए पीआर करने में दिलचस्पी है?

jorisvandenbossche 9 जून 2016

हां मैं जल्द ही इसे ठीक कर दूंगा
उदाहरण के लिए क्षमा करें

ले 9 जूनी 2016 अ 23:30, जोरिस वान डेन बोशे सूचनाएं
वास्तव में:
[71] में: df = pd.DataFrame ({'a': [1,2,3,4], 'b': [4,3,2,1]}, इंडेक्स = [0,0,1, 1])
[72] में: df.nlargest (1, 'a')
बाहर [72]:
अब
१ ४ १
१ ३ २
[73] में: df.nlargest (2, 'a')
बाहर [73]:
अब
१ ४ १
१ ४ १
१ ३ २
१ ३ २
( @ भविष्य के संदर्भ के लिए
इसे ठीक करने के लिए पीआर करने में दिलचस्पी है?
-
आप इसे प्राप्त कर रहे हैं क्योंकि आपका उल्लेख किया गया था।
इस ईमेल का उत्तर सीधे दें, इसे GitHub पर देखें, या थ्रेड को म्यूट करें।

Tux1 10 जून 2016

मेरा फिक्स बहुत सुरुचिपूर्ण नहीं है, लेकिन मुझे मल्टीइंडेक्स और डुप्लिकेटेड वैल्यू इंडेक्स से निपटने के लिए कोई अन्य समाधान नहीं दिखता है

Tux1 12 जून 2016

Sum .19.2 में ठीक काम करता है, लेकिन गिनती के साथ, यह समझ में नहीं आता है। डीएफ "एन" के रूप में कई बार दोहराया जाता है। क्या वह बग है या मैं कुछ गलत कर रहा हूं?

df.groupby(['a']).agg({'b':'count'}).nlargest(2, 'b')

jetpackdata 13 मार्च 2017

@ शंकरकर देखें: https://github.com/pandas-dev/pandas/issues/15297

jreback 13 मार्च 2017

❤1 👍1

क्या यह पृष्ठ उपयोगी था?

0 / 5 - 0 रेटिंग्स

Pandas: बग: नकली मान सूचकांक के साथ फ्रेम के लिए _nsorted

सबसे उपयोगी टिप्पणी

सभी 5 टिप्पणियाँ

संबंधित मुद्दों