Pandas: read_csv(filename_with_asian_locale) рд╡рд┐рдВрдбреЛрдЬрд╝ рдХреЗ рд▓рд┐рдП рдЕрдЬрдЧрд░ 3.6 рдореЗрдВ рд╡рд┐рдлрд▓ рд░рд╣рд╛

рдХреЛ рдирд┐рд░реНрдорд┐рдд 5 рдЬреВрди 2017  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: pandas-dev/pandas

рдХреЛрдб:

Python 3.6.0 |Anaconda 4.3.1 (64-bit)| (default, Dec 23 2016, 11:57:41) [MSC v.1900 64 bit (AMD64)] on win32
>>> pd.__version__
'0.20.1'
>>> import platform
>>> platform.platform()
'Windows-7-6.1.7601-SP1'
>>> import pandas as pd
>>> df = pd.read_csv(r'c:\tmp\ф╕нцЦЗ.csv')
Traceback (most recent call last):
  File "C:\ProgramData\Anaconda3\lib\site-packages\IPython\core\interactiveshell.py", line 2881, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "<ipython-input-6-0cd6317422e5>", line 1, in <module>
    df = pd.read_csv(r'c:\tmp\ф╕нцЦЗ.csv')
  File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 655, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 405, in _read
    parser = TextFileReader(filepath_or_buffer, **kwds)
  File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 762, in __init__
    self._make_engine(self.engine)
  File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 966, in _make_engine
    self._engine = CParserWrapper(self.f, **self.options)
  File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1582, in __init__
    self._reader = parsers.TextReader(src, **kwds)
  File "pandas\_libs\parsers.pyx", line 394, in pandas._libs.parsers.TextReader.__cinit__ (pandas\_libs\parsers.c:4209)
  File "pandas\_libs\parsers.pyx", line 712, in pandas._libs.parsers.TextReader._setup_parser_source (pandas\_libs\parsers.c:8895)
OSError: Initializing from file failed

рд╕рдорд╕реНрдпрд╛ рд╡рд┐рд╡рд░рдг

рдЕрдЬрдЧрд░ 3.6 рдиреЗ sys.getfilesystemencoding () рдХреЛ "mbcs" рдХреЗ рдмрдЬрд╛рдп "utf-8" рд╡рд╛рдкрд╕ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрджрд▓ рджрд┐рдпрд╛
рдкреАрдИрдкреА 529 рджреЗрдЦреЗрдВред

рдХреИрд╕реЗ рдареАрдХ рдХрд░рдирд╛ рд╣реИ

рдпрд╣рд╛рдБ рд╕рдорд╕реНрдпрд╛ рд╣реИ: parsers.pyx

if isinstance(source, basestring):
     if not isinstance(source, bytes):
         source = source.encode(sys.getfilesystemencoding() or 'utf-8')

рд╕реНрд░реЛрдд рдкреИрд░рд╛рдореАрдЯрд░ рд╣рдорд╛рд░рд╛ рдлрд╝рд╛рдЗрд▓ рдирд╛рдо рд╣реИ, рдФрд░ рдЗрд╕реЗ 'utf-8' рдореЗрдВ рдПрдиреНрдХреЛрдб рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛, рди рдХрд┐ рдЕрдЬрдЧрд░ 3.6 рдореЗрдВ рд╡рд┐рд░рд╛рд╕рдд 'mbcs' рдореЗрдВ
рдФрд░ рдЕрдВрдд рдореЗрдВ io.c:new_file_source . рдореЗрдВ open() рдореЗрдВ
рдЗрд╕ рдкреНрд░рдХрд╛рд░ рдПрдХ рдПрдордмреАрд╕реАрдПрд╕ рд╕реНрдЯреНрд░рд┐рдВрдЧ рдХреЗ рд░реВрдк рдореЗрдВ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХреА рдЧрдИ рд╣реИ, рдЗрд╕рд▓рд┐рдП, "рдлрд╝рд╛рдЗрд▓ рдирд╣реАрдВ рдорд┐рд▓реА" рдЕрдкрд╡рд╛рдж рдЖрд╢реНрдЪрд░реНрдпрдЪрдХрд┐рдд рдирд╣реАрдВ рд╣реИ
рд╢рд╛рдпрдж рдпрд╣ рд╡рд┐рдВрдбреЛрдЬрд╝ рдПрдкреАрдЖрдИ рдХреЗ рдпреВрдирд┐рдХреЛрдб рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЗрди рдЪреАрдЬреЛрдВ рдХреЛ рд╕рдВрднрд╛рд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрдЬрдЧрд░ 3.6 рдХреЗ рд▓рд┐рдП рд╕рд╛рдЗрдерди рдХреА рдЬрд┐рдореНрдореЗрджрд╛рд░реА рд╣реЛрдиреА рдЪрд╛рд╣рд┐рдП,
рд▓реЗрдХрд┐рди рдЕрднреА рдХреЗ рд▓рд┐рдП, рд╣рдо рд╕рд┐рд░реНрдл sys.getfilesystemencoding() рдХреЛ "mbcs" рдореЗрдВ рдмрджрд▓ рджреЗрддреЗ рд╣реИрдВ

Duplicate IO CSV Unicode

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

рд╕рдордЭреМрддрд╛ рдЧрддрд┐ рдХреЗ рд╕рд╛рде рдПрдХ рд╕рдорд╛рдзрд╛рди рд╣реИ:
рдЕрдЬрдЧрд░ df = pd.read_csv (r'c: tmpф╕нцЦЗ.csv', рдЗрдВрдЬрди = 'рдЕрдЬрдЧрд░' )

рд▓реЗрдХрд┐рди рдЖрдкрдХреА рд╕рднреА рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдореЗрдВ рдкреНрд░рддреНрдпреЗрдХ рдХреЙрд▓ рдХреЛ read_csv рдореЗрдВ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдирд╛ рдПрдХ рдЧрдВрджрд╛ рдХрд╛рдо рд╣реИ

рд╕рднреА 3 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

рд╕рдордЭреМрддрд╛ рдЧрддрд┐ рдХреЗ рд╕рд╛рде рдПрдХ рд╕рдорд╛рдзрд╛рди рд╣реИ:
рдЕрдЬрдЧрд░ df = pd.read_csv (r'c: tmpф╕нцЦЗ.csv', рдЗрдВрдЬрди = 'рдЕрдЬрдЧрд░' )

рд▓реЗрдХрд┐рди рдЖрдкрдХреА рд╕рднреА рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдореЗрдВ рдкреНрд░рддреНрдпреЗрдХ рдХреЙрд▓ рдХреЛ read_csv рдореЗрдВ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдирд╛ рдПрдХ рдЧрдВрджрд╛ рдХрд╛рдо рд╣реИ

рдпрд╣ рдЗрд╕рдХрд╛ рдПрдХ рдбреБрдкреНрд▓рд┐рдХреЗрдЯ рд╣реИ: https://github.com/pandas-dev/pandas/issues/15086

рдПрдХ рдкреАрдЖрд░ рдЬреБрдбрд╝рд╛ рд╣реБрдЖ рд╣реИ рд▓реЗрдХрд┐рди рджреБрд░реНрднрд╛рдЧреНрдп рд╕реЗ рдЗрд╕реЗ рдЙрдбрд╝рд╛ рджрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред

рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдЗрд╕рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдЙрдкрд╛рдп рдХрд░реЗрдВрдЧреЗред

рдлрд╝рд╛рдЗрд▓ рдирд╛рдо рдХреЗ рд▓рд┐рдП рдЪреАрдиреА рдирд╛рдореЛрдВ рдХрд╛ рдкреНрд░рдпреЛрдЧ рди рдХрд░реЗрдВ, рд▓реЗрдХрд┐рди рдЗрд╕реЗ рдЕрдВрдЧреНрд░реЗрдЬреА рдореЗрдВ рдмрджрд▓реЗрдВред
рдлрд╝рд╛рдЗрд▓ рдирд╛рдо рдореЗрдВ рдЪреАрдиреА рдХрд╛ рдкреНрд░рдпреЛрдЧ рди рдХрд░реЗрдВ, рдЗрд╕реЗ рдЕрдВрдЧреНрд░реЗрдЬреА рдореЗрдВ рдмрджрд▓реЗрдВред

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

hiiwave picture hiiwave  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

Ashutosh-Srivastav picture Ashutosh-Srivastav  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

ericdf picture ericdf  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

nathanielatom picture nathanielatom  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

tade0726 picture tade0726  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ