问题描述
从excel文件(xlsx)中使用pandas读取,最终导出一个字符串列表,元素包含一系列的_x0000_
,如何去除?
代码如下:
import pandas as pd
df = pd.read_excel('地名.xlsx')
a = df.iloc[:,0].values.tolist()
c = [x.strip() for x in a]
print(c)
使用strip()
也没用,
输出结果类似为:['皋兰路_x0000__x0000__x0000_', '天庆家园_x0000__x0000__x0000__x0000_', '煤炭厂_x0000_']
解决方法
c = [x.strip('_x0000_') for x in a]
输出正常:['皋兰路', '天庆家园', '煤炭厂']
存疑
这个“x0000”在xlsx中显示类似于空格,但是读取成字符串就会变成这一串,不应该是空格吗,为什么直接使用strip()
也不能去除(需要视为一般的字符串)?