我有一个数据框,如下所示:
Company LT MT ST
0 XYZ A - -
1 XYZ A - B
2 XYZ - C B
3 ABC R - -
4 ABC R - B
5 DEF A B -
6 DEF A B B
我要做的是制作一个数据框,该框可以检查公司是否重复,并且基于对多列LT,MT和M的重复检查. ST.如果这些列中的值是重复的,则将其合并到相同公司名称的单行条目中.
输出如下:
Company LT MT ST
0 XYZ A C B
1 ABC R - B
2 DEF A B B
我已经尝试过df.drop_duplicates(),但是不能解决我的问题.
解决方法:
首先使用groupby和fillna
In [559]: (df.replace('-', np.nan)
.groupby('Company', sort=False, as_index=False)
.first()
.fillna('-'))
Out[559]:
Company LT MT ST
0 XYZ A C B
1 ABC R - B
2 DEF A B B