一、简介
pd.concat()函数可以沿着指定的轴将多个dataframe或者series拼接到一起。
基本语法:
pd.concat( objs, axis=0, join=‘outer’, join_axes=None,ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=None, copy=True,)
objs 表示需要连接的对象,比如:[df1, df2],需要将合并的数据用综括号包围;
axis=0 表拼接方式是上下堆叠,当axis=1表示左右拼接;
join 参数控制的是外连接还是内连接,join='outer’表示外连接,保留两个表中的所有信息;join="inner"表示内连接,拼接结果只保留两个表共有的信息;
join_axes参数是在内连接时选择要完整保留哪个表的索引,但是这个参数在官方文档中提醒即将被弃用,所以不做详细讲解,只看一下join参数的表现吧;
二 、代码
import pandas as pd
d1 = [["xiaolei",20,10081],["xiaowu",30,10082]]
t1 = pd.DataFrame(d1)
print(t1)
print('*'*50)
d2 = [["xiaowang",22,10083],["xiaoming",25,10084]]
t2 = pd.DataFrame(d2)
print(t2)
print('*'*25+'合并结果如下(默认是上下堆叠)'+'*'*25)
t = pd.concat([t1,t2])
print(t)
运行结果:
0 1 2
0 xiaolei 20 10081
1 xiaowu 30 10082
**************************************************
0 1 2
0 xiaowang 22 10083
1 xiaoming 25 10084
********************合并结果如下(默认是上下堆叠)********************
0 1 2
0 xiaolei 20 10081
1 xiaowu 30 10082
0 xiaowang 22 10083
1 xiaoming 25 10084