pandas读取excel统计空值数量错误的解决方法

2024-04-18 0 660

问题:pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,代码如下

import pandas as pd

df = pd.read_excel(\’test.xlsx\’,dtype=str)
# 剔除空格
df = df.applymap(lambda x : str(x).strip())
print(\”b列为空的个数为\”+ str(pd.isnull(df[\’b\’]).sum())) # 打印出来b列中为空的是0个

excel数据长这样,B2是一个空格,希望得到空值为2的结果

pandas读取excel统计空值数量错误的解决方法

问题分析:

读取excel后的df是这样

pandas读取excel统计空值数量错误的解决方法

使用applymap剔除空格后的df是这样

pandas读取excel统计空值数量错误的解决方法

读取excel后的df的值(df.values)

pandas读取excel统计空值数量错误的解决方法

使用applymap剔除空格后的df的值(df.values)

pandas读取excel统计空值数量错误的解决方法

可以看到,在applymap方法处理后

值values的变化:一个空格变成了’’,之前的nan变成了’nan’(这里是字符串nan,当然不为空)

pd.isnull()只会统计NaN的数量,一个是字符串’‘,一个是字符串’nan’,因此都统计不到

解决:将’'和’nan’全部替换为np.nan,isnull就可以统计到

import numpy as np
import pandas as pd

df = pd.read_excel(\’test.xlsx\’,dtype=str)
# 剔除空格
df = df.applymap(lambda x : str(x).strip())
df[df == \’\’] = np.nan
df[df == \’nan\’] = np.nan
print(\”b列为空的个数为\”+ str(pd.isnull(df[\’b\’]).sum())) # 打印出来b列中为空的是2个

到此这篇关于pandas读取excel统计空值数量错误的解决方法的文章就介绍到这了,更多相关pandas读取excel空值内容请搜索悠久资源网以前的文章或继续浏览下面的相关文章希望大家以后多多支持悠久资源网!

您可能感兴趣的文章:

  • pandas读取excel时获取读取进度的实现
  • pandas 读取excel文件的操作代码
  • Python Pandas读取Excel日期数据的异常处理方法
  • python pandas库读取excel/csv中指定行或列数据
  • Python调用Pandas实现Excel读取
  • 使用python的pandas读取excel文件中的数据详情
  • Pandas读取Excel文件的六种方法
  • pandas如何读取含有中文的excel

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

悠久资源 Python pandas读取excel统计空值数量错误的解决方法 https://www.u-9.cn/jiaoben/python/187081.html

常见问题

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务