文章目录
duplicated()和drop_duplicates()
导库
import pandas as pd
import numpy as np
创建数据集
x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])
x=pd.DataFrame(x)
x
duplicated()
返回每行数据是否重复
x.duplicated()
计算重复数据数目
x.duplicated().sum()
drop_duplicates()
删除重复值
x=x.drop_duplicates()
x