找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 217|回复: 1

[求助] pandas read_csv数据报错UnicodeDecodeError: 'gbk' codec can't decode byte ...

1

主题

1

帖子

1

积分

贫民

积分
1
siegfried 发表于 2021-4-15 09:44:03 | 显示全部楼层 |阅读模式
  1. #coding=gbk
  2. import requests
  3. import time
  4. from datetime import datetime
  5. import pandas as pd
  6. from io import StringIO
  7. from urllib import parse
  8. import json
  9. import random
  10. import re
  11. import sys,os

  12. import chardet



  13. print(int('0xe6',16))


  14. file_path='C:/Users/siegf/Desktop/finance/data/sh688663.csv'

  15. text_csv=pd.read_csv(file_path,parse_dates=['日期'],na_values=None,encoding='gb2312')

  16. print(text_csv)
复制代码
我在运行此脚本时报错如下
  1. runfile('C:/Users/siegf/Desktop/finance/stock_db/test5.py', wdir='C:/Users/siegf/Desktop/finance/stock_db')
  2. 230
  3. Traceback (most recent call last):

  4.   File "C:\Users\siegf\Desktop\finance\stock_db\test5.py", line 22, in <module>
  5.     text_csv=pd.read_csv(file_path,parse_dates=['日期'],na_values=None,encoding='gb2312')

  6.   File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 686, in read_csv
  7.     return _read(filepath_or_buffer, kwds)

  8.   File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 452, in _read
  9.     parser = TextFileReader(fp_or_buf, **kwds)

  10.   File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 946, in __init__
  11.     self._make_engine(self.engine)

  12.   File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1178, in _make_engine
  13.     self._engine = CParserWrapper(self.f, **self.opti**)

  14.   File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 2008, in __init__
  15.     self._reader = parsers.TextReader(src, **kwds)

  16.   File "pandas\_libs\parsers.pyx", line 537, in pandas._libs.parsers.TextReader.__cinit__

  17.   File "pandas\_libs\parsers.pyx", line 711, in pandas._libs.parsers.TextReader._get_header

  18.   File "pandas\_libs\parsers.pyx", line 905, in pandas._libs.parsers.TextReader._tokenize_rows

  19.   File "pandas\_libs\parsers.pyx", line 2034, in pandas._libs.parsers.raise_parser_error

  20. UnicodeDecodeError: 'gb2312' codec can't decode byte 0xe6 in position 252: illegal multibyte sequence
复制代码
请各位大佬帮忙调整,感谢感谢。如何能够正确读取csv文件内容。
csv文件是ANSI编码
我想使用gbk编码读取文件内容。

test5.py

429 Bytes, 下载次数: 2

脚本文件

sh688663.csv

361 Bytes, 下载次数: 4

csv文件

回复

使用道具 举报

0

主题

1

帖子

1

积分

贫民

积分
1
sdlll 发表于 2021-5-4 09:51:35 | 显示全部楼层
text_csv=pd.read_csv(file_path,parse_dates=['日期'],na_values=None,encoding='gb18030')
日期      股票代码    名称  ...         成交金额           总市值         流通市值
0  2021/4/13  sh688663  N新风光  ...  525121333.0  3.113888e+09  670778426.3
1  2021/4/14  sh688663  鏂伴?  ...          NaN           NaN          NaN
2     ?22.25      25.3    22  ...          NaN           NaN          NaN

[3 rows x 15 columns]
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表