某通讯录同步助手pandas数据清洗

'''
因为换手机需要导入通讯录产生的数据清洗需求
使用某通讯录同步助手,产生联系人姓和名的索引问题
导出联系人到本地,选择.csv格式
观察数据,发现'姓'列有一部分是',','名'列也差不多

print(df[['姓','名']]) ==>',' 是NaN
df.fillna({'姓':'','名':''},inplace=True)指定列替换成空
df['姓'] = df['姓'] + df['名'] ==> 将联系人全称合并到'姓'列
df['名'] = '' ==> '名'列为空

注:读取和保存都有使用汉字编码encoding='gbk'
'''

import pandas as pd


df = pd.read_csv('/Users/qyk/Desktop/from_qq.csv',encoding='gbk')

# print(df[['姓','名']])

df.fillna({'姓':'','名':''},inplace=True)
df['姓'] = df['姓'] + df['名']
# print(df['姓'])

df['名'] = '' #此处不可以使用','
print(df[['姓','名']])
# print(df)
df.to_csv('/Users/qyk/Desktop/to_qq.csv',encoding='gbk',index=False) # index=False 否则联系人名后面会跟上索引号的
上一篇:Oracle ASM实例同filesystem间的文件传输


下一篇:pandas计算最大回撤