Pandas: 'рдХреЙрд▓рдо' рдЗрдВрдбреЗрдХреНрд╕ рдореЗрдВ рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рдирд░рдХ рд╣реИред рдПрдХ рдмрдЧ рдХреА рддрд░рд╣ рд▓рдЧрддрд╛ рд╣реИ ...

рдХреЛ рдирд┐рд░реНрдорд┐рдд 18 рдЕрдЧре░ 2017  ┬╖  24рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: pandas-dev/pandas

рдореЗрд░реЗ рдкрд╛рд╕ рдбрд┐рд▓реАрд╡рд░реА рдирд╛рдордХ рдбреЗрдЯрд╛рдлреНрд░реЗрдо рд╣реИ рдФрд░ рдЬрдм рдореИрдВ рдкреНрд░рд┐рдВрдЯ рдХрд░рддрд╛ рд╣реВрдВ (рдбрд┐рд▓рд┐рд╡рд░реА. рдХреЙрд▓рдо) рдореБрдЭреЗ рдирд┐рдореНрди рдорд┐рд▓рддрд╛ рд╣реИ:

Index(['Complemento_endere├зo', 'cnpj', 'Data_funda├з├гo', 'N├║mero',
   'Raz├гo_social', 'CEP', 'situacao_cadastral', 'situacao_especial', 'Rua',
   'Nome_Fantasia', 'last_revenue_normalized', 'last_revenue_year',
   'Telefone', 'email', 'Capital_Social', 'Cidade', 'Estado',
   'Raz├гo_social', 'name_bairro', 'Natureza_Jur├нdica', 'CNAE', '#CNAE',
   'CNAEs_secund├бrios', 'Pessoas', 'percent'],
  dtype='object')

рдЦреИрд░, рд╣рдо рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рдПрдХ рдХреЙрд▓рдо 'рд░реБрдЖ' рд╣реИред

рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рдЕрдЧрд░ рдореИрдВ рдкреНрд░рд┐рдВрдЯ (рдбрд┐рд▓реАрд╡рд░реАред рд░реБрдЖ) рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдореБрдЭреЗ рдЙрдЪрд┐рдд рдкрд░рд┐рдгрд╛рдо рдорд┐рд▓рддрд╛ рд╣реИ:

82671                         R JUDITE MELO DOS SANTOS
817797                                R DOS GUAJAJARAS
180081           AV MARCOS PENTEADO DE ULHOA RODRIGUES
149373                                 AL MARIA TEREZA
455511                               AV RANGEL PESTANA
...

рдпрд╣рд╛рдВ рддрдХ тАЛтАЛтАЛтАЛрдХрд┐ рдЕрдЧрд░ рдореИрдВ рдбрд┐рд▓реАрд╡рд░реА рдореЗрдВ "рдЕрдЧрд░ 'рд░реБрдЖ' рд▓рд┐рдЦрддрд╛ рд╣реВрдВред рдХреЙрд▓рдо: рдкреНрд░рд┐рдВрдЯ ('рдпрд╣рд╛рдВ рдореИрдВ рд╣реВрдВ')" рдпрд╣ 'рдпрд╣рд╛рдВ рдореИрдВ рд╣реВрдВ' рдкреНрд░рд┐рдВрдЯ рдХрд░рддрд╛ рд╣реИред рддреЛ 'рд░реБрдЖ' рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рд╣реИред

рдареАрдХ рд╣реИ, рдореЗрд░реЗ рдкрд╛рд╕ рдпрд╣ рдХреЛрдб рд╣реЛрдиреЗ рдХреЗ рдмрд╛рдж рддрддреНрдХрд╛рд▓ рдкрдВрдХреНрддрд┐ рдореЗрдВ:

delivery=delivery.set_index('cnpj')[['Raz├гo_social','Nome_Fantasia','Data_funda├з├гo','CEP','Estado','Cidade','Bairro','Rua','N├║mero','Complemento_endere├зo','Telefone','email','Capital_Social', 'CNAE', '#CNAE', 'Natureza_Jur├нdica','Pessoas' ]]

рдФрд░ рд╡реЛрдЗрд▓рд╛, рдореБрдЭреЗ рдпрд╣ рдЕрдЬреАрдм рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИ:

Traceback (most recent call last):
File "/file.py", line 45, in <module>
   'Telefone', 'email', 'Capital_Social', 'Cidade', 'Estado',
   'Raz├гo_social', 'name_bairro', 'Natureza_Jur├нdica', 'CNAE', '#CNAE',
'Telefone','email','Capital_Social', 'CNAE', '#CNAE', 'Natureza_Jur├нdica','Pessoas' ]]
   'CNAEs_secund├бrios', 'Pessoas', 'percent'],
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/pandas/core/frame.py", line 1991, in __getitem__
  dtype='object')
return self._getitem_array(key)
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/pandas/core/frame.py", line 2035, in _getitem_array
indexer = self.ix._convert_to_indexer(key, axis=1)
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/pandas/core/indexing.py", line 1214, in _convert_to_indexer
raise KeyError('%s not in index' % objarr[mask])
KeyError: "['Rua'] not in index"

рдХреНрдпрд╛ рдХреЛрдИ рдорджрдж рдХрд░ рд╕рдХрддрд╛ рд╣реИ? рдореИрдВрдиреЗ рд╕реНрдЯреИрдХ рдУрд╡рд░рдлреНрд▓реЛ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рд▓реЗрдХрд┐рди рдХреЛрдИ рднреА рдорджрдж рдирд╣реАрдВ рдХрд░ рд╕рдХрд╛ред рдореБрдЭреЗ рд▓рдЧрдиреЗ рд▓рдЧрд╛ рд╣реИ рдХрд┐ рдореИрдВ рдкрд╛рдЧрд▓ рд╣реВрдБ рдФрд░ 'рд░реБрдЖ' рдореЗрд░реЗ рдЕрд╢рд╛рдВрдд рдорди рдХрд╛ рднреНрд░рдо рд╣реИред

рдЕрддрд┐рд░рд┐рдХреНрдд рдЬрд╛рдирдХрд╛рд░реА

рдореИрдВ рддреНрд░реБрдЯрд┐ рд░реЗрдЦрд╛ рд╕реЗ рдареАрдХ рдкрд╣рд▓реЗ рдЗрд╕ рдХреЛрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ:

delivery=pd.DataFrame()

for i in selection.index:
    sample=groups.get_group(selection['#CNAE'].loc[i]).sample(selection['samples'].loc[i])
    delivery=pd.concat((delivery,sample)).sort_values('Capital_Social',ascending=False)


print(delivery.columns)
print(delivery.Rua)
print(delivery.set_index('cnpj').columns)

delivery=delivery.set_index('cnpj')[['Raz├гo_social','Nome_Fantasia','Data_funda├з├гo','CEP','Estado','Cidade','Bairro','Rua','N├║mero','Complemento_endere├зo',
                                 'Telefone','email','Capital_Social', 'CNAE', '#CNAE', 'Natureza_Jur├нdica','Pessoas' ]]

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ

рдирдИ рдЕрдЬреАрдм рдЪреАрдЬреЗрдВ:
рдореИрдВрдиреЗ рдХреЛрдб рдХреЗ рдЙрд╕ рдЕрдВрддрд┐рдо рднрд╛рдЧ рд╕реЗ 'рд░реБрдЖ' рдХреЛ рдЫреЛрдбрд╝ рджрд┐рдпрд╛ рдФрд░ рд╣рдЯрд╛ рджрд┐рдпрд╛, рдХрд╛рд╢ рдХрд┐ рдпрд╣ рдХрд╛рдо рдХрд░реЗред рдореЗрд░реЗ рдЖрд╢реНрдЪрд░реНрдп рдХреЗ рд▓рд┐рдП, рдореБрдЭреЗ рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рдереА рд▓реЗрдХрд┐рди рдЕрдм 'рдиреНрдпреВрдореЗрд░реЛ' тАЛтАЛрдХреЙрд▓рдо рдХреЗ рд╕рд╛рдеред

delivery=delivery.set_index('cnpj')[['Raz├гo_social','Nome_Fantasia','Data_funda├з├гo','CEP','Estado','Cidade','Bairro','N├║mero','Complemento_endere├зo',
                                                 'Telefone','email','Capital_Social', 'CNAE', '#CNAE', 'Natureza_Jur├нdica' ]]

KeyError: "['N├║mero'] not in index"

рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ реи

рдФрд░ рдлрд┐рд░ рдореИрдВрдиреЗ 'рдиреНрдпреВрдореЗрд░реЛ' тАЛтАЛрдХреЛ рдЫреЛрдбрд╝ рджрд┐рдпрд╛ рдФрд░ рдЗрд╕реЗ рдирд┐рдХрд╛рд▓ рд▓рд┐рдпрд╛ред рдлрд┐рд░ рд╡рд╣реА рд╕рдорд╕реНрдпрд╛ 'Complemento_endere├зo' рдХреЗ рд╕рд╛рде рд╣реБрдИред рдлрд┐рд░ рдореИрдВрдиреЗ 'Complemento_endere├зo' рдХреЛ рд╣рдЯрд╛ рджрд┐рдпрд╛ред рдФрд░ рдпрд╣ 'рдЯреЗрд▓реАрдлреЛрди' рд╡рдЧреИрд░рд╣ рдХреЗ рд╕рд╛рде рд╣реБрдЖред

* рд╕рдВрдкрд╛рджрд┐рдд рдХрд░реЗрдВ 3 *

рдЕрдЧрд░ рдореИрдВ рдПрдХ pd.show_versions() рдХрд░рддрд╛ рд╣реВрдВ, рддреЛ рд╡рд╣ рдЖрдЙрдЯрдкреБрдЯ рд╣реИ:

рд╕реНрдерд╛рдкрд┐рдд рд╕рдВрд╕реНрдХрд░рдг

рдкреНрд░рддрд┐рдмрджреНрдз: рдХреЛрдИ рдирд╣реАрдВ
рдЕрдЬрдЧрд░: 3.5.0.рдЕрдВрддрд┐рдо.0
рдкрд╛рдпрдерди-рдмрд┐рдЯреНрд╕: 64
рдУрдПрд╕: рдбрд╛рд░реНрд╡рд┐рди
рдУрдПрд╕-рд░рд┐рд▓реАрдЬрд╝: 16.5.0
рдорд╢реАрди: x86_64
рдкреНрд░реЛрд╕реЗрд╕рд░: i386
рдмрд╛рдЗрдЯрдСрд░реНрдбрд░: рдереЛрдбрд╝рд╛
LC_ALL: рдХреЛрдИ рдирд╣реАрдВ
рд▓реИрдВрдЧ: рдХреЛрдИ рдирд╣реАрдВ

рдкрд╛рдВрдбрд╛: 0.18.1
рдирд╛рдХ: рдХреЛрдИ рдирд╣реАрдВ
рдкрд┐рдк: 8.1.2
рд╕реЗрдЯрдЕрдкрдЯреВрд▓: 18.2
рд╕рд╛рдЗрдерди: рдХреЛрдИ рдирд╣реАрдВ
рд╕реБрдиреНрди: 1.11.0
scipy: 0.17.1
statsmodels: реж.рем.рез
xarray: рдХреЛрдИ рдирд╣реАрдВ
рдЖрдИрдкреАрдерди: рдХреЛрдИ рдирд╣реАрдВ
рд╕реНрдлрд┐рдВрдХреНрд╕: рдХреЛрдИ рдирд╣реАрдВ
рдкрд╛рддреНрд╕реА: 0.4.1
рдбреЗрдЯреБрдЯрд┐рд▓: 2.5.3
рдкрд╛рдЗрдЯреНрдЬрд╝: реирежрезрем.рек
рдмреНрд▓реЙрд╕реНрдХ: рдХреЛрдИ рдирд╣реАрдВ
рдЕрдбрд╝рдЪрди: рдХреЛрдИ рдирд╣реАрдВ
рдЯреЗрдмрд▓: рдХреЛрдИ рдирд╣реАрдВ
numexpr: рдХреЛрдИ рдирд╣реАрдВ
рдореИрдЯрдкреНрд▓реЛрдЯрд▓рд┐рдм: 1.5.1
рдУрдкрдирдкреАрдПрдХреНрд╕рдПрд▓: рдХреЛрдИ рдирд╣реАрдВ
xlrd: 1.0.0
xlwt: рдХреЛрдИ рдирд╣реАрдВ
xlsxwriter: рдХреЛрдИ рдирд╣реАрдВ
рдПрд▓рдПрдХреНрд╕рдПрдордПрд▓: рдХреЛрдИ рдирд╣реАрдВ
рдмреАрдПрд╕4: 4.5.1
html5lib: рдХреЛрдИ рдирд╣реАрдВ
httplib2: рдХреЛрдИ рдирд╣реАрдВ
рдЖрд╡реЗрджрдХ: рдХреЛрдИ рдирд╣реАрдВ
sqlalchemy: 1.1.3
pymysql: 0.7.11.рдХреЛрдИ рдирд╣реАрдВ
psycopg2: рдХреЛрдИ рдирд╣реАрдВ
jinja2: рдХреЛрдИ рдирд╣реАрдВ
рдмреЛрдЯреЛ: рдХреЛрдИ рдирд╣реАрдВ
pandas_datareader: рдХреЛрдИ рдирд╣реАрдВ
рдХреЛрдИ рдирд╣реАрдВ

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

рдпрд╣ рдЙрди рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рд╣реИ рдЬреЛ Google рдкрд░ рдЦреЛрдЬ рдХрд░ рдпрд╣рд╛рдВ рдЖрдП рд╣реИрдВ, рдпрд╣ рджреЗрдЦрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐ рдХреНрдпрд╛ рдЧрд▓рдд рд╣реИред

рдпрджрд┐ рдЖрдк рдПрдХ CSV, рдпрд╛ XLSX рд╕реЗ рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╣реИрдВ, рддреЛ 100% рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдкрдХреЗ рдХрд┐рд╕реА рднреА рдХреЙрд▓рдо рдХреЗ рдирд╛рдо рдХреЗ рдЖрдЧреЗ рдпрд╛ рдЕрдВрдд рдореЗрдВ рдХреЛрдИ рд╕реНрдерд╛рди рдирд╣реАрдВ рд╣реИред

рдПрдХ рд╕реАрдПрд╕рд╡реА рдЖрдпрд╛рдд рдХрд░рддреЗ рд╕рдордп рдореИрдВрдиреЗ рджреЗрдЦрд╛ рдХрд┐ рдХреЙрд▓рдо рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рдереАред df рдХреЛ csv рдореЗрдВ рдирд┐рд░реНрдпрд╛рдд рдХрд░рддреЗ рд╕рдордп рдФрд░ рдЗрд╕реЗ рдПрдХреНрд╕реЗрд▓ рдореЗрдВ рдЦреЛрд▓рддреЗ рд╕рдордп, рдкрд┐рдЫрд▓реА рдпрд╛ рдЕрдЧреНрд░рдгреА рд╕рдлреЗрдж рд░рд┐рдХреНрдд рд╕реНрдерд╛рди рджреЗрдЦрдирд╛ рдЕрд╕рдВрднрд╡ рд╣реИред рдЖрдкрдХреЛ рдЗрд╕реЗ рдиреЛрдЯрдкреИрдб рдпрд╛ рдиреЛрдЯрдкреИрдб рд╕реЗ рдЦреЛрд▓рдирд╛ рд╣реЛрдЧрд╛++

рдлрд┐рд░ рд╕реЗ, рдпрд╣ рдЙрди рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рд╣реИ рдЬреЛ Google рдЦреЛрдЬ рд╕реЗ рдпрд╣рд╛рдВ рдкрд╣реБрдВрдЪреЗ рд╣реИрдВред рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдирд╛ рдХрд┐ рдЖрдкрдХреЗ csv, xlsx рдпрд╛ рдЖрдкрдХреЗ рджреНрд╡рд╛рд░рд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдП рдЬрд╛ рд░рд╣реЗ рдХрд┐рд╕реА рдЕрдиреНрдп рдбреЗрдЯрд╛рдлрд╝реНрд░реЗрдо рдлрд╝рд╛рдЗрд▓ рдЯреЗрдореНрдкреНрд▓реЗрдЯ рдореЗрдВ рдЖрдкрдХреЗ рдХреЙрд▓рдо рд╣реЗрдбрд░ рдирд╛рдореЛрдВ рд╕реЗ рд╕рднреА рдкреНрд░рдореБрдЦ рдФрд░ рдЕрдиреБрдЧрд╛рдореА рд╡реНрд╣рд╛рдЗрдЯрд╕реНрдкреЗрд╕ рд╣рдЯрд╛ рджрд┐рдП рдЧрдП рд╣реИрдВред

рд╕рднреА 24 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

@abutremutante : рдЗрд╕рдХреА рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж! рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЕрдЬреАрдм рд▓рдЧрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рд╣рдо рдЗрд╕ рд╕рдордп рдЗрд╕реЗ рджреЛрд╣рд░рд╛ рдирд╣реАрдВ рд╕рдХрддреЗ рдХреНрдпреЛрдВрдХрд┐ рд╣рдо рдЖрдкрдХрд╛ рдХреЛрдб рдирд╣реАрдВ рдЪрд▓рд╛ рд╕рдХрддреЗред рдХреНрдпрд╛ рдЖрдк рд╣рдорд╛рд░реЗ рд▓рд┐рдП рдПрдХ рдкреВрд░реНрдг рдХреЛрдб рдирдореВрдирд╛ рдкреНрд░рджрд╛рди рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

рд╕рд╛рде рд╣реА, рдпрджрд┐ рдЖрдк рдЕрдкрдиреЗ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЕрдВрдХ рдмреЙрдХреНрд╕ рдореЗрдВ pd.show_versons рдХрд╛ рдЖрдЙрдЯрдкреБрдЯ рдкреНрд░рджрд╛рди рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рддреЛ рдпрд╣ рдмрд╣реБрдд рдЕрдЪреНрдЫрд╛ рд╣реЛрдЧрд╛ред

рдирдорд╕реНрддреЗ! рдЬрд╡рд╛рдм рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред
рдореИрдВ рдЗрд╕реЗ рдЬреАрдердм рдкрд░ рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рдирд╣реАрдВ рдХрд░рдирд╛ рдЪрд╛рд╣реВрдВрдЧрд╛ред рдХреНрдпрд╛ рдореИрдВ рдЗрд╕реЗ рдЖрдк рд▓реЛрдЧреЛрдВ рдХреЛ рдИрдореЗрд▓ рд╕реЗ рднреЗрдЬ рд╕рдХрддрд╛ рд╣реВрдБ?

рдПрдо 17 рдкрд╣рд▓реЗ рдбреА рдбреА 2017, ├а (рд░реЛрдВ) 19:38, gfyoung [email protected] escreveu:

@abutremutante https://github.com/abutremutante : рдЗрд╕рдХреА рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж! рдпрд╣ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЕрдЬреАрдм рд▓рдЧрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рд╣рдо рдЗрд╕ рд╕рдордп рдЗрд╕реЗ рджреЛрд╣рд░рд╛ рдирд╣реАрдВ рд╕рдХрддреЗ рдХреНрдпреЛрдВрдХрд┐ рд╣рдо рдЖрдкрдХрд╛ рдХреЛрдб рдирд╣реАрдВ рдЪрд▓рд╛ рд╕рдХрддреЗред рдХреНрдпрд╛ рдЖрдк рд╣рдорд╛рд░реЗ рд▓рд┐рдП рдПрдХ рдкреВрд░реНрдг рдХреЛрдб рдирдореВрдирд╛ рдкреНрд░рджрд╛рди рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?

рд╕рд╛рде рд╣реА, рдпрджрд┐ рдЖрдк рдЕрдкрдиреЗ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЕрдВрдХ рдмреЙрдХреНрд╕ рдореЗрдВ pd.show_versons рдХрд╛ рдЖрдЙрдЯрдкреБрдЯ рдкреНрд░рджрд╛рди рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рддреЛ рдпрд╣ рдмрд╣реБрдд рдЕрдЪреНрдЫрд╛ рд╣реЛрдЧрд╛ред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub https://github.com/pandas-dev/pandas/issues/17275#issuecomment-323213193 рдкрд░ https://github.com/notifications/unsubscribe-auth/ ARNqx54xVjjuQyYofj1-AEjp9NRL5AFnks5sZMD7gaJpZM4O63lz ред

рдЕрдзрд┐рдорд╛рдирддрдГ рдирд╣реАрдВ, рдХреНрдпреЛрдВрдХрд┐ рдЬреЛ рдХреЛрдИ рднреА рдЗрд╕ рдореБрджреНрджреЗ рдХреЛ рдЙрдард╛рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдЙрд╕реЗ рдХреЛрдб рджреЗрдЦрдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрдЧреАред рдХреНрдпрд╛ рдЖрдк рдХрд┐рд╕реА рднрд┐рдиреНрди рддрд╛рд▓рд┐рдХрд╛ (рдпрд╛ DataFrame ) рдХреЗ рд╕рд╛рде рдкреНрд░рддрд┐рд▓рд┐рдкрд┐ рдмрдирд╛рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдЬрд┐рд╕рдореЗрдВ рд╕рдВрд╡реЗрджрдирд╢реАрд▓ рдЬрд╛рдирдХрд╛рд░реА рдирд╣реАрдВ рд╣реИ?

рдпрд╣рд╛рдВ рдХреЛрд╢рд┐рд╢ рдХреА:

рдкреАрдбреА . рдХреЗ рд░реВрдк рдореЗрдВ рдЖрдпрд╛рдд рдкрд╛рдВрдбрд╛
FindCos.FindCos_Functions рдХреЛ рдвреВрдВрдвреЗрдВ рдХреЗ рд░реВрдк рдореЗрдВ рдЖрдпрд╛рдд рдХрд░реЗрдВ #рдпрд╣ рдПрдХ рдлрд╝рд╛рдЗрд▓ рд╣реИ рдЬрд╣рд╛рдВ рдореИрдВ рдХреБрдЫ рдлрд╝рдВрдХреНрд╢рди рд▓рд┐рдЦрддрд╛ рд╣реВрдВ
рдЖрдпрд╛рдд рдбреЗрдЯрд╛рдЯрд╛рдЗрдо
рдкреАрдбреАрдмреА рдЖрдпрд╛рдд рдХрд░реЗрдВ

рд▓рдХреНрд╖реНрдп = find.get_full_basics (рд╡реНрдпрд╡рд╕рд╛рдп = 'рдПрд╕рдХреНрдпреВрдПрд▓рдЯреЗрдмрд▓ рд╕реЗ рдЪреБрдиреЗрдВ *', test_mode = рдЧрд▓рдд)

CNAEs=['23.30-3-01','26','27','49.30-2-03','37.02-9-00','46.45','47.73','46.44-3-01' ]
рд╣рд╛рдпрд░_рдХреЛрд╕=200

CNAEs рд╕реЗ рдЖрдЗрдЯрдо рдХрд╛ рдЪрдпрди

рдЪрдпрди = рдкреАрдбреАред рдбреЗрдЯрд╛рдлреНрд░реЗрдо ()
рд╕реАрдПрдирдПрдИ рдореЗрдВ рдореИрдВ рдХреЗ рд▓рд┐рдП:
x=target.loc[target['#CNAE'].str.startswith(i) == True]
рдЪрдпрди = pd.concat ((рдЪрдпрди, x))

рдЫрд╛рдирдиреЗ

рдЪрдпрди = рдЪрдпрдиред рд▓реЛрдХ [рдЪрдпрди ['рдХреИрдкрд┐рдЯрд▓_рд╕реЛрд╢рд▓'] <100000000]ред рд▓реЛрдХ [рдЪрдпрди ['situacao_cadastral'] == 'рдЕрддрд┐рд╡рд╛'] \
.loc[selection['situacao_especial'].isnull() == True].loc[selection['Natureza_Juridica'] != 'EMPRESA INDIVIDUAL DE RESP.LIMITADA (DE NATUREZA EMPRESARIA)']\
.loc[selection['Natureza_Juridica'] != 'EMPRESARIO (рд╡реНрдпрдХреНрддрд┐рдЧрдд)']\
.loc[selection['Estado'] != 'PA'].loc[selection['Estado'] != 'AM']\
.loc[selection['Estado'] != 'RR'].loc[selection['Estado'] != 'AC'].loc[selection['Estado'] != 'RO'].loc[selection[ 'рдПрд╕реНрдЯрд╛рдбреЛ'] != 'рдПрдкреА']\
.loc [рдЪрдпрди ['рдПрд╕реНрдЯрд╛рдбреЛ']! = 'рдЯреВ']

рджреЛрд╣рд░рд╛рд╡ рдирд┐рдпрдВрддреНрд░рдг

рд╕реВрдЪреА = ['file.csv']
рдЪрдпрди = рдЦреЛрдЬред рдмрд╣рд┐рд╖реНрдХреГрдд_рд╡реНрдпрд╡рд╕рд╛рдп (рдЪрдпрди, рд╕реВрдЪреА)

рдкреНрд░реЛрдлрд╛рдЗрд▓ рдХреА рдЬрд╛рдВрдЪ

рд╕рдореВрд╣ = рдЪрдпрдиред рд╕рдореВрд╣ рджреНрд╡рд╛рд░рд╛ ('# рд╕реАрдПрдирдПрдИ')
рдЪрдпрди ['рдкреНрд░рддрд┐рд╢рдд'] = рд╕рдореВрд╣ ['# рд╕реАрдПрдирдПрдИ']ред рдкрд░рд┐рд╡рд░реНрддрди ('рдЖрдХрд╛рд░')/рд▓реЗрди (рдЪрдпрди)
рдЪрдпрди = рдЪрдпрди [['# рд╕реАрдПрдирдПрдИ', 'рдкреНрд░рддрд┐рд╢рдд']] рдбреНрд░реЙрдк_рдбреБрдкреНрд▓рд┐рдХреЗрдЯ ()ред рд╕реЙрд░реНрдЯ_рд╡реИрд▓реНрдпреВ ('рдкреНрд░рддрд┐рд╢рдд', рдЖрд░реЛрд╣реА = рдЧрд▓рдд)
рдЪрдпрди ['рдирдореВрдиреЗ'] = рдЧреЛрд▓ (((рдХрд┐рд░рд╛рдпрд╛_рдХреЛрд╕ 1.05) рдЪрдпрди ['рдкреНрд░рддрд┐рд╢рдд']))

рд╡рд┐рддрд░рдг = pd.DataFrame ()
рдореИрдВ рдХреЗ рд▓рд┐рдП Selection.index рдореЗрдВ:
рдирдореВрдирд╛ = рд╕рдореВрд╣ред get_group (рдЪрдпрди ['# рд╕реАрдПрдирдПрдИ']ред рд▓реЛрдХ [i])ред рдирдореВрдирд╛ (рдЪрдпрди ['рдирдореВрдиреЗ']ред рд▓реЛрдХ [i])
рдбрд┐рд▓реАрд╡рд░реА = pd.concat ((рдбрд┐рд▓реАрд╡рд░реА, рдирдореВрдирд╛))редsort_values('Capital_Social',ascending=False)#.rename(columns={'Capital_Social':'Score_Tamanho'})

рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рд░реБрдЖ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдореМрдЬреВрдж рд╣реИ

рдкреНрд░рд┐рдВрдЯ (рдбрд┐рд▓реАрд╡рд░реАред рдХреЙрд▓рдо)
рдкреНрд░рд┐рдВрдЯ (рдбрд┐рд▓реАрд╡рд░реАред рд░реБрдЖ)
рдкреНрд░рд┐рдВрдЯ (рдбрд┐рд▓реАрд╡рд░реА.рд╕реЗрдЯ_рдЗрдВрдбреЗрдХреНрд╕ ('cnpj')ред рдХреЙрд▓рдо)
рдбрд┐рд▓реАрд╡рд░реА = рдбрд┐рд▓реАрд╡рд░реАред рдирд╛рдо рдмрджрд▓реЗрдВ (рдХреЙрд▓рдо = {'рд░реБрдЖ': 'рд░реБрдЖ'})
рдЕрдЧрд░ рдбрд┐рд▓реАрд╡рд░реА рдореЗрдВ 'рд░реБрдЖ' рд╣реИред рдХреЙрд▓рдо:
рдкреНрд░рд┐рдВрдЯ ('рдореИрдВ рдпрд╣рд╛рдБ рд╣реВрдБ')

рд╕рдорд╕реНрдпрд╛ рд░реЗрдЦрд╛

рдбрд┐рд▓реАрд╡рд░реА = рдбрд┐рд▓реАрд╡рд░реАред ','Complemento_endereco', 'Telefone', 'email', 'Capital_Social', 'CNAE','#CNAE','Natureza_Juridica']]

@abutremutante : рдзрдиреНрдпрд╡рд╛рдж, рд▓реЗрдХрд┐рди рджреБрд░реНрднрд╛рдЧреНрдп рд╕реЗ, рдпрд╣ рдХреЛрдб рд╣рдорд╛рд░реЗ рд▓рд┐рдП рдкреНрд░рддрд┐рдХреГрддрд┐ рдпреЛрдЧреНрдп рдирд╣реАрдВ рд╣реИред рд╣рдо import FindCos.FindCos_Functions рдирд╣реАрдВ рдЪрд▓рд╛ рд╕рдХрддреЗред рдЦрд░реЛрдВрдЪ рд╕реЗ рдХреЗрд╡рд▓ DataFrame рдмрдирд╛рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВ рдФрд░ рд╕рдорд╕реНрдпрд╛ рдХреЛ рджреЛрд╣рд░рд╛рдПрдВред

рд╕рд╛рде рд╣реА, рдпрджрд┐ рдЖрдк рдЕрдкрдиреЗ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЕрдВрдХ рдмреЙрдХреНрд╕ рдореЗрдВ pd.show_versons рдХрд╛ рдЖрдЙрдЯрдкреБрдЯ рдкреНрд░рджрд╛рди рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рддреЛ рдпрд╣ рдмрд╣реБрдд рдЕрдЪреНрдЫрд╛ рд╣реЛрдЧрд╛ред

@gfyoung : рдореИрдВрдиреЗ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЕрдВрдХ рдмреЙрдХреНрд╕ рдореЗрдВ pd.show_versions рдЬреЛрдбрд╝рд╛ред
рдбреЗрдЯрд╛рдлрд╝реНрд░реЗрдо рдХреЗ рд╕рдВрдмрдВрдз рдореЗрдВ, рдпрд╣ рдПрдХ рдмрд╣реБрдд рд▓рдВрдмрд╛ рдбреЗрдЯрд╛рдлрд╝реНрд░реЗрдо рд╣реИред рдореИрдВрдиреЗ рдЗрд╕рдХреА резреж рдкрд╣рд▓реА рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХрд╛ рдПрдХ csv рдмрдирд╛рдпрд╛, рдпрд╣реАрдВ:

рд▓рдХреНрд╖реНрдп = find.get_full_basics (рд╡реНрдпрд╡рд╕рд╛рдп = 'рдЪрдпрди рдХрд░реЗрдВ * sqltable рд╕реАрдорд╛ 10 рд╕реЗ;', test_mode = рдЧрд▓рдд)
target.to_csv('target10items.csv')

рдореИрдВ рдЗрд╕реЗ рдпрд╣рд╛рдБ рд╕рдВрд▓рдЧреНрди рдХрд░ рд░рд╣рд╛ рд╣реВрдБред
target10items.csv.zip

1) рдХреНрдпрд╛ рдЖрдк рдЗрд╕ рдЫреЛрдЯреЗ рд╕реЗ DataFrame рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЕрдкрдиреА рд╕рдорд╕реНрдпрд╛ рдХреЛ рджреЛрд╣рд░рд╛ рд╕рдХрддреЗ рд╣реИрдВ?
2) рдореИрдВрдиреЗ рджреЗрдЦрд╛ рд╣реИ рдХрд┐ рдЖрдк pandas рдмрд╣реБрдд рдкреБрд░рд╛рдиреЗ рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВ (рдЕрднреА рд╣рдо 0.20.3 рд╣реИрдВ)ред рдХреНрдпрд╛ рдЖрдк рдЕрдкрдЧреНрд░реЗрдб рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рдХреНрдпрд╛ рдЗрд╕рд╕реЗ рдЖрдкрдХреА рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рд╣реЛ рдЬрд╛рддреА рд╣реИ?

'рдмреИрд░реЛ' print(delivery.columns) рд▓рд┐рдП рдЖрдкрдХреЗ рдЖрдЙрдЯрдкреБрдЯ рдореЗрдВ рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдЙрд╕ рд╕реВрдЪреА рдореЗрдВ рд╣реИ рдЬрд┐рд╕реЗ рдЖрдк set_index рдмрд╛рдж рдкреНрд░рджрд╛рди рдХрд░рддреЗ рд╣реИрдВред рдпрд╣ рдереЛрдбрд╝рд╛ рд╕рдВрджреЗрд╣рд╛рд╕реНрдкрдж рд╣реИ рдХрд┐ рдЙрд╕ рд╕реВрдЪреА рдореЗрдВ 'рд░реБрдЖ' рдХреЗ рдареАрдХ рдкрд╣рд▓реЗ 'рдмреИрд░реЛ' рджрд┐рдЦрд╛рдИ рджреЗрддрд╛ рд╣реИред рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдЕрдиреБрдкрд▓рдмреНрдз рдХреЙрд▓рдо рдХрд╛ рдЪрдпрди рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдореЗрдВ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рд╣реЛ?

рдареАрдХ рд╣реИ, рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдореБрджреНрджрд╛ рдпрд╣ рд╣реИ рдХрд┐ 'рдмреИрд░реЛ' рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рд▓рд╛рдкрддрд╛ рдХреБрдВрдЬреА рд╣реИ, рд▓реЗрдХрд┐рди pandas 0.18.1 рдореЗрдВ рдПрдХ рдмрдЧ рдерд╛ рдЬрд╣рд╛рдВ рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢ рдЧрд▓рдд рдЖрдЗрдЯрдо рдХреЛ рд▓рд╛рдкрддрд╛ рдХреБрдВрдЬреА рдХреЗ рд░реВрдк рдореЗрдВ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИред

рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛

import pandas as pd
import numpy as np

cols = pd.Index(['Complemento_endere├зo', 'cnpj', 'Data_funda├з├гo', 'N├║mero',
   'Raz├гo_social', 'CEP', 'situacao_cadastral', 'situacao_especial', 'Rua',
   'Nome_Fantasia', 'last_revenue_normalized', 'last_revenue_year',
   'Telefone', 'email', 'Capital_Social', 'Cidade', 'Estado',
   'Raz├гo_social', 'name_bairro', 'Natureza_Jur├нdica', 'CNAE', '#CNAE',
   'CNAEs_secund├бrios', 'Pessoas', 'percent'],
  dtype='object')
delivery = pd.DataFrame(np.random.random(size=(5, len(cols))), columns=cols)

delivery = delivery.set_index('cnpj')[['Raz├гo_social','Nome_Fantasia','Data_funda├з├гo','CEP','Estado','Cidade','Bairro','Rua','N├║mero','Complemento_endere├зo','Telefone','email','Capital_Social', 'CNAE', '#CNAE', 'Natureza_Jur├нdica','Pessoas' ]]

pandas 0.18.1 , рдореБрдЭреЗ рдирд┐рдореНрди рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИ:

KeyError: "['Rua'] not in index"

рд╣рд╛рд▓рд╛рдВрдХрд┐, pandas 0.20.3 , рдореБрдЭреЗ рд╕рд╣реА рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИ:

KeyError: "['Bairro'] not in index"

рдЖрдк
рдХреАрд▓ рдареБрдХрд╛
рдпрд╣
@jschendel

рдмрд╣реБрдд рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж @gfyoung

рдмрд╣реБрдд - рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рджред

рдмрдВрдж, рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЖрдкрдХреА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░ рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдирдорд╕реНрддреЗ
рдореБрдЭреЗ рд╕рдорд╕реНрдпрд╛ рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреЛрдИ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╡рд┐рдЪрд╛рд░ рдирд╣реАрдВ рджрд┐рдЦ рд░рд╣рд╛ рд╣реИ, @gfyoung рдЖрдк

@ wangxuesong29 рдХреНрдпрд╛ рдЖрдкрдХреЗ рдкрд╛рд╕ рдиреНрдпреВрдирддрдо рдЙрджрд╛рд╣рд░рдг рд╣реИ? http://matthewrocklin.com/blog/work/2018/02/28/minimal-bug-reports

рдореБрдЭреЗ рдЖрдкрдХреЗ рдЬреИрд╕реА рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИред рдореИрдВрдиреЗ рджреЗрдЦрд╛ рд╣реИ рдХрд┐ рдЕрдЧрд░ рдореИрдВ рдУрдкрдирдСрдлрд┐рд╕ рдкреНрд░реЛрдЧреНрд░рд╛рдо рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ .csv рдлреЙрд░реНрдореЗрдЯ рдореЗрдВ рдмрджрд▓рддрд╛ рд╣реВрдВ рддреЛ рддреНрд░реБрдЯрд┐ рд╣реЛрддреА рд╣реИред рдЗрд╕рдХреЗ рдмрдЬрд╛рдп рдореИрдВрдиреЗ рдЗрдВрдЯрд░рдиреЗрдЯ рд╕реЗ рдбреЗрдЯрд╛ рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдпрд╛ рд╣реИ рдФрд░ рдореИрдВрдиреЗ рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рдзрд╛рд░рдг рдиреЛрдЯрдкреИрдб ++ рд╕рдВрдкрд╛рджрдХ рдореЗрдВ рд╕рдВрдкрд╛рджрд┐рдд рдХрд┐рдпрд╛ рд╣реИред рдлрд┐рд░ рдпрд╣ рд╕рд╛рдорд╛рдиреНрдп рд░реВрдк рд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдореБрдЭреЗ рдкрддрд╛ рд╣реИ рдХрд┐ рд╢рд╛рдпрдж рдпрд╣ рд╕рдорд╛рдзрд╛рди рдЖрдкрдХреЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдорджрдж рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдЖрдкрдХреЛ рдЯреЗрдХреНрд╕реНрдЯ рдПрдбрд┐рдЯрд░ рдпрд╛ рдкреНрд░реЛрдЧреНрд░рд╛рдо рдХреЛ рдмрджрд▓рдирд╛ рдЪрд╛рд╣рд┐рдП рдЬреЛ .csv рдлрд╛рдЗрд▓реЛрдВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИред

рддреНрд░реБрдЯрд┐ :
рдкрд╛рдВрдбрд╛ рд╕рдВрд╕реНрдХрд░рдг 0.23.4
рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ, рдКрдкрд░ рдХреЗ рд╕рдорд╛рди рдХреЛрдб рдЫреЛрдбрд╝рдХрд░,

рдХреЛрдб рдЪрд▓рд╛рдиреЗ рдХреЗ рдмрд╛рдж рдореБрдЭреЗ рдорд┐рд▓рддрд╛ рд╣реИ:

'рдкрдбрд╝реЛрд╕' рдЕрдиреБрдХреНрд░рдордгрд┐рдХрд╛ рдореЗрдВ рдирд╣реАрдВ рд╣реИ

рдХреЛрдб :
`рдЖрдпрд╛рдд рдкрд╛рдВрдбрд╛ рдкреАрдбреА рдХреЗ рд░реВрдк рдореЗрдВ
np . рдХреЗ рд░реВрдк рдореЗрдВ numpy рдЖрдпрд╛рдд рдХрд░реЗрдВ

cols = pd.Index(['Address_Complement', 'cnpj', 'Foundation_Date', 'рдирдВрдмрд░',
'Corporate_reason', 'CEP', 'situacao_cadastral', 'situacao_especial', 'Street',
'Fantasy_Name', 'last_revenue_normalized', 'last_revenue_year',
'рдлреЛрди', 'рдИрдореЗрд▓', 'рдХреИрдкрд┐рдЯрд▓_рд╕реЛрд╢рд▓', 'рд╕рд┐рдЯреА', 'рд╕реНрдЯреЗрдЯ',
'Corporate_reason', 'name_neighborhood', 'Nature_Legal', 'CNAE', '#CNAE',
'рдорд╛рдзреНрдпрдорд┐рдХ_рд╕реАрдПрдирдПрдИ', 'рд▓реЛрдЧ', 'рдкреНрд░рддрд┐рд╢рдд'],
рдбреАрдЯрд╛рдЗрдк = 'рдСрдмреНрдЬреЗрдХреНрдЯ')
рд╡рд┐рддрд░рдг = pd.DataFrame(np.random.random(size=(5, len(cols))), column=cols)

рд╡рд┐рддрд░рдг = рд╡рд┐рддрд░рдгред рдкрддрд╛_рдкреВрд░рдХ ',' рдлрд╝реЛрди ',' рдИрдореЗрд▓ ','Social_Capital', 'CNAE', '#CNAE', 'Legal_Nature', 'People']]
`

рдпрд╣ рдЙрди рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рд╣реИ рдЬреЛ Google рдкрд░ рдЦреЛрдЬ рдХрд░ рдпрд╣рд╛рдВ рдЖрдП рд╣реИрдВ, рдпрд╣ рджреЗрдЦрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐ рдХреНрдпрд╛ рдЧрд▓рдд рд╣реИред

рдпрджрд┐ рдЖрдк рдПрдХ CSV, рдпрд╛ XLSX рд╕реЗ рдХрд╛рдо рдХрд░ рд░рд╣реЗ рд╣реИрдВ, рддреЛ 100% рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдкрдХреЗ рдХрд┐рд╕реА рднреА рдХреЙрд▓рдо рдХреЗ рдирд╛рдо рдХреЗ рдЖрдЧреЗ рдпрд╛ рдЕрдВрдд рдореЗрдВ рдХреЛрдИ рд╕реНрдерд╛рди рдирд╣реАрдВ рд╣реИред

рдПрдХ рд╕реАрдПрд╕рд╡реА рдЖрдпрд╛рдд рдХрд░рддреЗ рд╕рдордп рдореИрдВрдиреЗ рджреЗрдЦрд╛ рдХрд┐ рдХреЙрд▓рдо рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдореЗрдВ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рдереАред df рдХреЛ csv рдореЗрдВ рдирд┐рд░реНрдпрд╛рдд рдХрд░рддреЗ рд╕рдордп рдФрд░ рдЗрд╕реЗ рдПрдХреНрд╕реЗрд▓ рдореЗрдВ рдЦреЛрд▓рддреЗ рд╕рдордп, рдкрд┐рдЫрд▓реА рдпрд╛ рдЕрдЧреНрд░рдгреА рд╕рдлреЗрдж рд░рд┐рдХреНрдд рд╕реНрдерд╛рди рджреЗрдЦрдирд╛ рдЕрд╕рдВрднрд╡ рд╣реИред рдЖрдкрдХреЛ рдЗрд╕реЗ рдиреЛрдЯрдкреИрдб рдпрд╛ рдиреЛрдЯрдкреИрдб рд╕реЗ рдЦреЛрд▓рдирд╛ рд╣реЛрдЧрд╛++

рдлрд┐рд░ рд╕реЗ, рдпрд╣ рдЙрди рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рд╣реИ рдЬреЛ Google рдЦреЛрдЬ рд╕реЗ рдпрд╣рд╛рдВ рдкрд╣реБрдВрдЪреЗ рд╣реИрдВред рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдирд╛ рдХрд┐ рдЖрдкрдХреЗ csv, xlsx рдпрд╛ рдЖрдкрдХреЗ рджреНрд╡рд╛рд░рд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдП рдЬрд╛ рд░рд╣реЗ рдХрд┐рд╕реА рдЕрдиреНрдп рдбреЗрдЯрд╛рдлрд╝реНрд░реЗрдо рдлрд╝рд╛рдЗрд▓ рдЯреЗрдореНрдкреНрд▓реЗрдЯ рдореЗрдВ рдЖрдкрдХреЗ рдХреЙрд▓рдо рд╣реЗрдбрд░ рдирд╛рдореЛрдВ рд╕реЗ рд╕рднреА рдкреНрд░рдореБрдЦ рдФрд░ рдЕрдиреБрдЧрд╛рдореА рд╡реНрд╣рд╛рдЗрдЯрд╕реНрдкреЗрд╕ рд╣рдЯрд╛ рджрд┐рдП рдЧрдП рд╣реИрдВред

рдореБрдЭреЗ рднреА рдпрд╣ рддреНрд░реБрдЯрд┐ рд╣реЛ рд░рд╣реА рд╣реИред
рдХреЙрд▓рдо рдХреЛ рд╕рд╣реА рдирд╛рдо рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЬрдм рдореИрдВ рдЕрдкрдиреА рд╕реАрдПрд╕рд╡реА рдлрд╝рд╛рдЗрд▓ рдХреЗ рд╕рд╛рде рд╕реАрдмреЙрд░реНрди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдореБрдЭреЗ рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИ (рдореЗрд░рд╛ рдХреЙрд▓рдо рдЗрдВрдбреЗрдХреНрд╕ рдХрд╛ рд╣реИ)

import seaborn as sns
import pandas as pd
Data = pd.read_csv('test.csv',delimiter=',') 
sns.lmplot(x='predLabel', y='trueLabel', data=Data)

рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢:
KeyError: "['predLabel' 'trueLabel'] рдЗрдВрдбреЗрдХреНрд╕ рдореЗрдВ рдирд╣реАрдВ"

рдореЗрд░рд╛ рднреА рдпрд╣реА рдореБрджреНрджрд╛ рд╣реИ
рдХреЙрд▓рдо рдХреЛ рд╕рд╣реА рдирд╛рдо рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЬрдм рдореИрдВ рдЕрдкрдиреА рд╕реАрдПрд╕рд╡реА рдлрд╝рд╛рдЗрд▓ рдХреЗ рд╕рд╛рде рд╕реАрдмреЛрд░реНрди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдореБрдЭреЗ рддреНрд░реБрдЯрд┐ рдорд┐рд▓рддреА рд╣реИ (рдореЗрд░рд╛ рдХреЙрд▓рдо рдЗрдВрдбреЗрдХреНрд╕ рд╕реЗ рдмрд╛рд╣рд░ рд╣реИ)

sns . рдХреЗ рд░реВрдк рдореЗрдВ рд╕реАрдмреЙрд░реНрди рдЖрдпрд╛рдд рдХрд░реЗрдВ
рдкреАрдбреА . рдХреЗ рд░реВрдк рдореЗрдВ рдЖрдпрд╛рдд рдкрд╛рдВрдбрд╛
рдбреАрдПрдл =
pd.read_csv('lawma1.csv', index_col =[0, 1], рд╕реАрдорд╛рдВрдХрдХ=',')
sns.lmplot(x='WEEK1', y='FLEET', data=df).savefig('law.png')

рддреНрд░реБрдЯрд┐ рд╕рдВрджреЗрд╢:
KeyError: "['FLEET'] рдЗрдВрдбреЗрдХреНрд╕ рдореЗрдВ рдирд╣реАрдВ рд╣реИ

рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рдереА рдФрд░ рдРрд╕рд╛ рдЗрд╕рд▓рд┐рдП рдерд╛ рдХреНрдпреЛрдВрдХрд┐ рдореЗрд░реЗ рдкрд╛рд╕ рдПрдХ рдмрд┐рдВрджреБ рдерд╛ "ред" рдХреЙрд▓рдо рдирд╛рдо рдХреЗ рдЕрдВрдд рдореЗрдВ, рдореИрдВрдиреЗ рдЗрд╕реЗ рд╣рдЯрд╛рдиреЗ рдХреЗ рдмрд╛рдж рдХрд╛рдо рдХрд┐рдпрд╛ред
podaci = pd.read_csv('data/fifa19a.csv', names=['id', 'ime', 'godine', 'ocjena', 'potencijal.', 'bodovi', 'stopalo', 'placa_tis_eur', 'cijena_mil_eur'])
"рдкреЛрдЯреЗрдВрд╕реАрдЬрд▓" рдХреЙрд▓рдо рдореЗрдВ рдРрд╕рд╛ рдерд╛
рдпрд╣ рдПрдХ рдмрдЧ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ

рдореБрдЭреЗ рднреА рдЗрд╕реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝ рд░рд╣рд╛ рд╣реИ, рдореИрдВрдиреЗ рдкреНрд░рд┐рдВрдЯ (X.columns) рдХрд╛ рднреА рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛ рдФрд░ рдЗрд╕рдиреЗ рдЗрдВрдбреЗрдХреНрд╕ 'рдПрдХреНрд╕рдкреЛрдЬрд╝рд░_рдПрдВрдб' рджрд┐рдЦрд╛рдпрд╛, рд▓реЗрдХрд┐рди рдЬрдм рдореИрдВрдиреЗ рдЗрд╕реЗ рд╕реЗрдВрдЯреНрд░реЛрдЗрдбреНрд╕_рдиреНрдпреВ = рдПрдХреНрд╕.рдЧреНрд░реБрдкрдмреА (["рдХреНрд▓рд╕реНрдЯрд░реНрд╕"]) рдореЗрдВ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛ред рдорд╛рдзреНрдп () [[" рдПрдХреНрд╕рдкреЛрдЬрд░_рдПрдВрдб", "рдбреНрдпреВрд░реЗрд╢рди"]] рдпрд╣ 'рдПрдХреНрд╕рдкреЛрдЬрд░_рдПрдВрдб' рдПрд░рд░ рджрд┐рдЦрд╛ рд░рд╣рд╛ рд╣реИ рдЬреЛ рдЗрдВрдбреЗрдХреНрд╕ рдореЗрдВ рдирд╣реАрдВ рд╣реИред рдХреГрдкрдпрд╛ рдорджрдж рдХрд░реЗрдВ рдореИрдВ рдкрд┐рдЫрд▓реЗ рджреЛ рдШрдВрдЯреЛрдВ рд╕реЗ рдпрд╣рд╛рдВ рдлрдВрд╕рд╛ рд╣реБрдЖ рд╣реВрдВред

рдореБрдЭреЗ рдореЗрд░реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╣рд▓ рдорд┐рд▓ рдЧрдпрд╛ред
рдореИрдВ рдЙрдкрд░реЛрдХреНрдд рдХрдерди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рдерд╛ рдХрд┐ centroids_new=X.groupby(["clusters"]).mean()[["exposure_end",,"Duration"]] рдореИрдВрдиреЗ рдЗрд╕ рдХрдерди рдХреЗ рдКрдкрд░ x.mean(axis=1) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдФрд░ рдлрд┐рд░ рдмрдпрд╛рди рдХрд╛ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛
centroids_new=X.groupby(["clusters"]).mean()[["exposure_end",,"Duration"]] рдмрд┐рдирд╛ рдорддрд▓рдм рдХреЗ рдФрд░ рдЗрд╕рдиреЗ рдареАрдХ рдХрд╛рдо рдХрд┐рдпрд╛ред рдкрд╣рд▓реЗ рдмрдпрд╛рди рдореЗрдВ рдЕрдХреНрд╖ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдирд╣реАрдВ рдерд╛ рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рд╕рдореВрд╣ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдирд╣реАрдВ рдХрд░ рд░рд╣рд╛ рдерд╛ рдЗрд╕рд▓рд┐рдП рдЗрд╕реЗ рджреЛ рдЪрд░рдгреЛрдВ рдореЗрдВ рдХрд░рдирд╛ рдкрдбрд╝рд╛ред
рдФрд░ рдореБрдЦреНрдп рд╕рдорд╕реНрдпрд╛ рдпрд╣ рдХреНрдпреЛрдВ рд╣реЛ рд░рд╣реА рдереА рдХрд┐ рдЕрдХреНрд╖ рдХреЛ 1 рдкрд░ рд╕реЗрдЯ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред

рдореБрдЭреЗ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╣рд▓ рдорд┐рд▓ рдЧрдпрд╛, рдореЗрд░реЗ рд▓рд┐рдП рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред

рдЬрд╛рдВрдЪреЗрдВ рдХрд┐ рдХреНрдпрд╛ рдЖрдкрдХреА рд╕реАрдПрд╕рд╡реА рдлрд╝рд╛рдЗрд▓ ' , ' рдпрд╛ ' рджреНрд╡рд╛рд░рд╛ рдЕрд▓рдЧ рдХреА рдЧрдИ рд╣реИ; 'ред рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореЗрд░рд╛ рдбреЗрдЯрд╛ ' , ' рджреНрд╡рд╛рд░рд╛ рдЕрд▓рдЧ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ рд▓реЗрдХрд┐рди рдореИрдВ ' рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рдерд╛; 'ред

рддреЛ рдмрд╕ рдЬреЛрдбрд╝рд╛

Df= pd.read_csv('C:\Users\user\Desktop\data.csv', sep=" , ")

"рдХреЙрд▓рдо" рдФрд░ "рдХреЙрд▓рдо"

рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдЪреАрдЬреЗрдВ рд╣реИрдВ, рдкрд╣рд▓реЗ рдХреЗ рд╕рд╛рдордиреЗ рдПрдХ рдЬрдЧрд╣ рд╣реИред рддреЛ рдмрд╕ рдЙрд╕ рдЬрдЧрд╣ рдХреЛ рдЬреЛрдбрд╝реЗрдВ рдЬрд╣рд╛рдВ рдЬрдЧрд╣ рд╣реИ

рдЬреИрд╕реЗ:
df ["рдХреЙрд▓рдо"] рдиреЗ рдореЗрд░реЗ рд▓рд┐рдП рдХрд╛рдо рдХрд┐рдпрд╛

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

idanivanov picture idanivanov  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

Abrosimov-a-a picture Abrosimov-a-a  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

nathanielatom picture nathanielatom  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

BDannowitz picture BDannowitz  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

venuktan picture venuktan  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ