我有一个数据帧df,如下所示:
Col1 Col2
0 1 T
1 1 B
2 3 S
3 2 A
4 1 C
5 2 A
etc...
我想创建两个数据帧:df1是10行的随机样本,这样Col2 ==’T’. df2是df减去df1中的行.
解决方法:
假设你有一个唯一索引的数据框(如果你没有,你可以简单地做.reset_index(),应用这个,然后在事后设置set_index),你可以使用DataFrame.sample
. [实际上,你应该可以使用样本即使框架没有唯一索引,但您无法使用以下方法获取df2.]
请注意,在此示例中我使用的是A而不是T,因为A是您给出的示例中Col2的唯一重复值,我只会随机选择1而不是10.
>>> df1 = df[df.Col2 == "A"].sample(1)
>>> df2 = df[~df.index.isin(df1.index)]
>>> df1
Col1 Col2
3 2 A
>>> df2
Col1 Col2
0 1 T
1 1 B
2 3 S
4 1 C
5 2 A