数据处理 简单的统计

1.判断每一行的元素是否包含某字符串

(1)先将dataframe中的一列取出来series

a = df.column0

例: 

数据处理 简单的统计

 (2)是否包含某字符串

给每一行是否含有某字符串赋布尔值

series.str.contains("str1")

例:数据处理 简单的统计

2.统计某列中各元素出现的次数

(1)dataframe中插入一个series列

    df.insert(列数,’列名‘,b.数据)

df.insert(1,'name',b.values)

例:数据处理 简单的统计

 (2)将要统计列转换成list

list1 = df["name"].values.tolist()

例:数据处理 简单的统计

(3)用numpy统计

dict(zip(*np.unique(list1, return_counts=True)))

例:数据处理 简单的统计 

3.统计行数列数

 行数:df.shape[0]

 列数:df.shape[1]

上一篇:第三天,环境搭建


下一篇:ubuntu18.04设置开机自启动-可以用于图像界面的程序