Pandas: काम नहीं कर रहा है set_index ड्रॉप के साथ

को निर्मित 14 जुल॰ 2016 · 6टिप्पणियाँ · स्रोत: pandas-dev/pandas

यदि संभव हो तो कोड नमूना, एक कॉपी-पेस्ट करने योग्य उदाहरण

from io import StringIO
from pandas import read_csv

dtf = read_csv(StringIO("DATE_TIME,A\n2/8/2015  6:00:30,1"))

print(dtf)

dtf.set_index(dtf.DATE_TIME, drop=True, inplace=True)
print(dtf.columns)
print(dtf)

मौजूदा उत्पादन

           DATE_TIME  A
0  2/8/2015  6:00:30  1
Index(['DATE_TIME', 'A'], dtype='object')
                           DATE_TIME  A
DATE_TIME                              
2/8/2015  6:00:30  2/8/2015  6:00:30  1

अपेक्षित उत्पादन

           DATE_TIME  A
0  2/8/2015  6:00:30  1
Index(['A'], dtype='object')
                           A
DATE_TIME                              
2/8/2015  6:00:30  1

`pd.show_versions()` का आउटपुट

INSTALLED VERSIONS
------------------
commit: None
python: 3.5.1.final.0
python-bits: 64
OS: Darwin
OS-release: 15.5.0
machine: x86_64
processor: i386
byteorder: little
LC_ALL: None
LANG: None

pandas: 0.18.1
nose: None
pip: 8.1.2
setuptools: 20.6.7
Cython: None
numpy: 1.11.1
scipy: 0.16.1
statsmodels: None
xarray: None
IPython: 4.0.1
sphinx: None
patsy: None
dateutil: 2.5.3
pytz: 2016.6
blosc: None
bottleneck: None
tables: None
numexpr: None
matplotlib: 1.5.0
openpyxl: 2.3.5
xlrd: 1.0.0
xlwt: 1.0.0
xlsxwriter: None
lxml: None
bs4: 4.4.1
html5lib: None
httplib2: 0.9.2
apiclient: 1.5.0
sqlalchemy: None
pymysql: None
psycopg2: None
jinja2: 2.8
boto: None
pandas_datareader: None
None

Bug Error Reporting Reshaping

स्रोत

VelizarVESSELINOV

सबसे उपयोगी टिप्पणी

thx, यह एक बग लगता है। यदि इनपुट मूल से कटा हुआ Series , तो संबंधित कॉलम को छोड़ दिया जाना चाहिए।

यदि हम कॉलम नाम पास करते हैं तो ठीक काम करता है।

dtf.set_index('DATE_TIME', drop=True, inplace=True)
dtf.columns
# Index(['A'], dtype='object')

sinhrks 14 जुल॰ 2016

👍2

सभी 6 टिप्पणियाँ

यदि हम कॉलम नाम पास करते हैं तो ठीक काम करता है।

dtf.set_index('DATE_TIME', drop=True, inplace=True)
dtf.columns
# Index(['A'], dtype='object')

sinhrks 14 जुल॰ 2016

👍2

बग नहीं - यह set_index की गारंटी का उल्लंघन करता है

यहां वास्तविक कॉलम पास करना मान्य नहीं है -

यह वास्तव में सूचकांक को निर्दिष्ट करने के समान नहीं है

jreback 14 जुल॰ 2016

😕1

एक पीआर है जहां इस काम को करने की कोशिश की जाती है - लेकिन यह स्वाभाविक रूप से अस्पष्ट है

यह भी सुनिश्चित नहीं है कि आप इस बारे में चेतावनी दे सकते हैं
(हालांकि यह मुझे लगता है कि inplace और drop का उपयोग करने के लिए एक त्रुटि है)

jreback 14 जुल॰ 2016

😕1

बग नहीं - यह set_index की गारंटी का उल्लंघन करता है

क्या आप यह बता सकते हैं कि set_index की क्या गारंटी है? मुझे यह भ्रामक लगता है अगर मैं विशेष रूप से drop=True उपयोग करता हूं और कोई त्रुटि नहीं मिलती है जब किसी कारण से छोड़ने की अनुमति नहीं है या संभव नहीं है।

michaelaye 13 अक्तू॰ 2016

👍1

@michaelaye

जब आप कुंजियों के लिए एक सूची पास करते हैं, तो यह इंडेक्स सेट कर रहा है। हालांकि, एक संभवतः सोच सकता है कि [५]] [५।] का वास्तविक परिणाम है।

In [55]: df = pd.DataFrame({'A':range(2),'B':range(2),'C':range(2)})

In [56]: df
Out[56]: 
   A  B  C
0  0  0  0
1  1  1  1

In [57]: df.set_index(['A','B'])
Out[57]: 
     C
A B   
0 0  0
1 1  1

In [58]: df.index=['A','B']

In [59]: df
Out[59]: 
   A  B  C
A  0  0  0
B  1  1  1

In [54]: DataFrame.set_index?
Signature: DataFrame.set_index(self, keys, drop=True, append=False, inplace=False, verify_integrity=False)
Docstring:
Set the DataFrame index (row labels) using one or more existing
columns. By default yields a new object.

Parameters
----------
keys : column label or list of column labels / arrays
drop : boolean, default True
    Delete columns to be used as the new index
append : boolean, default False
    Whether to append columns to existing index
inplace : boolean, default False
    Modify the DataFrame in place (do not create a new object)
verify_integrity : boolean, default False
    Check the new index for duplicates. Otherwise defer the check until
    necessary. Setting to False will improve the performance of this
    method

Examples
--------
>>> indexed_df = df.set_index(['A', 'B'])
>>> indexed_df2 = df.set_index(['A', [0, 1, 2, 0, 1, 2]])
>>> indexed_df3 = df.set_index([[0, 1, 2, 0, 1, 2]])

Returns
-------
dataframe : DataFrame

jreback 13 अक्तू॰ 2016

😕1

इसे ठीक करने के लिए कोई योजना?

ron819 27 नव॰ 2018

👍1

क्या यह पृष्ठ उपयोगी था?

0 / 5 - 0 रेटिंग्स