如何去除xlsx中读取的字符串末尾字符“_x0000_”

问题描述

从excel文件(xlsx)中使用pandas读取,最终导出一个字符串列表,元素包含一系列的_x0000_,如何去除?
代码如下:

import pandas as pd

df = pd.read_excel('地名.xlsx')
a = df.iloc[:,0].values.tolist()
c = [x.strip() for x in a]
print(c)

使用strip()也没用,
输出结果类似为:
['皋兰路_x0000__x0000__x0000_', '天庆家园_x0000__x0000__x0000__x0000_', '煤炭厂_x0000_']

解决方法

c = [x.strip('_x0000_') for x in a]

输出正常:
['皋兰路', '天庆家园', '煤炭厂']

存疑

这个“x0000”在xlsx中显示类似于空格,但是读取成字符串就会变成这一串,不应该是空格吗,为什么直接使用strip()也不能去除(需要视为一般的字符串)?

上一篇:流程控制


下一篇:Python爬取爬取明星关系并写入csv文件