使用Pandas添加列的时候,出现空值(原因是列的格式是Series)

使用Pandas添加列的时候,出现空值(原因是列的格式是Series)

今天我使用如下方式,对dataFrame进行赋值添加新的列操作的时候出现如下问题

# 计算收益率函数
def calculate_return(data_df):
    all_rate = pd.DataFrame()
    code = data_df['tic'].unique()

    for i in code:  
        rate = data_df[data_df['tic'] == i].close.pct_change(1)[1:]
        # 必须转换成数组或者列表,才能对dataFrame进行赋值,series不行
        all_rate[i] = rate

    print(all_rate)
    # 求等权重增长
    equal_rate = np.sum(total_rate, axis = 0)
    
    return equal_rate


# 回测数据是从2017-
from datetime import datetime
time = list(data['predict_date'].unique())
time.insert(0, 20171231)

Return = np.array([])
for i in range(1, len(time)):
    time_data = data[data['predict_date'] == time[i]].copy()
    time_data.sort_values("eps",inplace=True)
    code = time_data.iloc[-20:, :]['code'].values
#     print(code)
    data_df = get_data(code, str(time[i-1]), str(time[i]))
    data_df = full_table(data_df)
    
    return_rate = calculate_return(data_df)
    Return = np.hstack((Return, equal_weight))

使用Pandas添加列的时候,出现空值(原因是列的格式是Series)

是因为rate是Series格式,所以不能直接使用

all_rate = pd.DataFrame()
all_rate[i] = rate

必须转换成rate.values

all_rate = pd.DataFrame()
all_rate[i] = rate.values

使用Pandas添加列的时候,出现空值(原因是列的格式是Series)

上一篇:循环控制


下一篇:Regression