我正在努力理解此错误,因为我将给您一个有效的示例,而我对此感兴趣的示例却没有.
我必须分析一组数据,其中包含全年的每小时价格,称为sys_prices,在进行各种转换后,它是一个具有8785行(1列)的numpy.ndarray对象,每一行都是一个numpy.ndarray项仅包含一个元素,即numpy.float64数字.
下面的代码不起作用:
stop_day = 95
start_day = stop_day - 10 # 10 days before
stop_day = (stop_day-1)*24
start_day = (start_day-1)*24
pcs=[] # list of prices to analyse
for ii in range(start_day, stop_day):
pcs.append(sys_prices[ii][0])
p, x = np.histogram(pcs, bins='fd')
* 24部分是调整数据集中的索引,以便遵守小时分辨率.
我期望的是将列表pc提供给直方图方法,以便将我的直方图和bin边缘的值分别获取为p和x.
我说这是我期望的,因为以下代码有效:
start_day = 1
start_month = 1
start_year = 2016
stop_day = 1
stop_month = 2
stop_year = 2016
num_prices = (date(stop_year, stop_month, stop_day) - date(start_year, start_month, start_day)).days*24
jan_prices = []
for ii in range(num_prices):
jan_prices.append(sys_prices[ii][0])
p, x = np.histogram(jan_prices, bins='fd') # bin the data`
代码上的差异在于,工作示例仅在从一年中的选定日期开始向后的任意时段内分析10天,而工作示例使用了一月份的所有价格(例如,一月的前744个值)数据集).
奇怪的事情:我为stop_day使用了不同的值,似乎95会引发错误,而99或100或200不会.
你可以帮帮我吗?
解决方法:
我解决了这个问题,在数据集中只有一个NaN我找不到.
对于那些想知道如何发现它的人,我只是使用以下代码来查找项目的索引:
nanlist=[]
for ii in range(len(array)):
if numpy.isnan(array[ii]):
nanlist.append(ii)
数组是您的容器.