Pandas一个需求:存在一个列表,需要在一个DataFrame中取到以该列表为索引的数据

 需求:Pandas一个需求:存在一个列表,需要在一个DataFrame中取到以该列表为索引的数据

这里有一个坑,

In [103]: s = pd.Series([1, 2, 3])

In [104]: s
Out[104]: 
0    1
1    2
2    3
dtype: int64

当loc[]中的列表包含于S的索引中的话,没有问题

In [105]: s.loc[[1, 2]]
Out[105]: 
1    2
2    3
dtype: int64


In [4]: s.loc[[1, 2, 3]]

Passing list-likes to .loc with any non-matching elements will raise
KeyError in the future, you can use .reindex() as an alternative.

See the documentation here:
https://pandas.pydata.org/pandas-docs/stable/indexing.html#deprecate-loc-reindex-listlike

 由于 3不在s的索引中,所以引发了一个错误。

 

解决办法:

将s先用reindex() 接收需索引的列表, 这样就会将s索引中没有的值,填充为Nan

In [106]: s.reindex([1, 2, 3])
Out[106]: 
1    2.0
2    3.0
3    NaN
dtype: float64

另外:如果你只想取到给定list和DataFrame索引中交集的值,那么就可以用一下方式:
In [107]: labels = [1, 2, 3]

In [108]: s.loc[s.index.intersection(labels)]
Out[108]: 
1    2
2    3
dtype: int64


同时需要注意:
Pandas一个需求:存在一个列表,需要在一个DataFrame中取到以该列表为索引的数据

 

 

 
 
上一篇:二维数组 A[m][n] 按行优先和按列优先的 下标地址转换公式


下一篇:randint() , numpy.sum() , Pandas DataFrame.loc[], numpy.argpartition()