使用Pandas添加列的时候,出现空值(原因是列的格式是Series)
今天我使用如下方式,对dataFrame进行赋值添加新的列操作的时候出现如下问题
# 计算收益率函数
def calculate_return(data_df):
all_rate = pd.DataFrame()
code = data_df['tic'].unique()
for i in code:
rate = data_df[data_df['tic'] == i].close.pct_change(1)[1:]
# 必须转换成数组或者列表,才能对dataFrame进行赋值,series不行
all_rate[i] = rate
print(all_rate)
# 求等权重增长
equal_rate = np.sum(total_rate, axis = 0)
return equal_rate
# 回测数据是从2017-
from datetime import datetime
time = list(data['predict_date'].unique())
time.insert(0, 20171231)
Return = np.array([])
for i in range(1, len(time)):
time_data = data[data['predict_date'] == time[i]].copy()
time_data.sort_values("eps",inplace=True)
code = time_data.iloc[-20:, :]['code'].values
# print(code)
data_df = get_data(code, str(time[i-1]), str(time[i]))
data_df = full_table(data_df)
return_rate = calculate_return(data_df)
Return = np.hstack((Return, equal_weight))
是因为rate是Series格式,所以不能直接使用
all_rate = pd.DataFrame()
all_rate[i] = rate
必须转换成rate.values
all_rate = pd.DataFrame()
all_rate[i] = rate.values