pandas如何读取含有中文的excel

2024-03-04 0 385
目录
  • pandas读取含有中文的excel
  • pandas读取excel时遇到的编码问题 unknown_codepage_21010
  • 总结

pandas读取含有中文的excel

在读取含有中文的 Excel 文件时,需要使用 encoding 参数设置编码方式。

常用的编码方式有 'gbk' 和 'utf-8'。

示例代码:

import pandasas pd

# 读取含有中文的 Excel 文件
df = pd.read_excel(\’filename.xlsx\’, encoding=\’gbk\’)

如果读取过程中出现乱码,可以尝试更换编码方式。

pandas读取excel时遇到的编码问题 unknown_codepage_21010

最近在使用pandas读取不规则excel表时遇到了一种编码问题,自己找了好久资料也是终于综合了一下解决了这种编码异常的问题。

首先呢,报错会提示下面这种错误:

unknown encoding: unknown_codepage_21010

自己在找资料的时候看到一篇很早在git上发布的一篇文章,意思就是让直接明确将编码设置好,具体可以看一下git链接

https://github.com/okfn/messytables/issues/47

最后呢,自己改了一个源文件里的东西,其实也不知道是不是正确的,但是这个问题却解决了,所以分享出来,也算是为自己记录一下,以防以后再次遇到这个问题,又得找半天。

找到xlrd的__init__.py文件,在 open_workbook 模块中将encoding_override的值明确为"cp1252",其实具体这样做的原因就是将编码明确,使得可以识别这种异常编码。

def open_workbook(filename=None,
logfile=sys.stdout,
verbosity=0,
use_mmap=USE_MMAP,
file_contents=None,
encoding_override=\”cp1252\”,
formatting_info=False,
on_demand=False,
ragged_rows=False):

这样问题就成功解决了~

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持悠久资源网。

您可能感兴趣的文章:

  • Pandas读取Excel文件的六种方法
  • pandas读取文件夹下所有excel文件的实现
  • Pandas读取excel合并单元格的正确方式(openpyxl合并单元格拆分并填充内容)
  • Pandas实现Excel文件读取,增删,打开,保存操作
  • pandas读取Excel批量转换时间戳的实践
  • 使用python的pandas读取excel文件中的数据详情

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

悠久资源 Python pandas如何读取含有中文的excel https://www.u-9.cn/jiaoben/python/183087.html

常见问题

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务