Pandas 数据重复处理 duplicated()和drop_duplicates()

文章目录


duplicated()和drop_duplicates()

导库

import pandas as pd
import numpy as np

创建数据集

x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])
x=pd.DataFrame(x)
x

Pandas 数据重复处理 duplicated()和drop_duplicates()

duplicated()

返回每行数据是否重复

x.duplicated()

Pandas 数据重复处理 duplicated()和drop_duplicates()

计算重复数据数目

x.duplicated().sum()

Pandas 数据重复处理 duplicated()和drop_duplicates()

drop_duplicates()

删除重复值

x=x.drop_duplicates()
x

Pandas 数据重复处理 duplicated()和drop_duplicates()

上一篇:TABLE 语句用来删除表定义及其所有


下一篇:pandas删除某一列的方法(drop函数)