c-如何避免在计算平均时间时发生溢出的可能性?

我正在编写一个函数,用于获取调用特定void(*)(void)又称为void->所需的平均时钟. void函数特定的次数.

我担心如果样本量太大,观测值的总和将会溢出并使平均值无效.

有没有一种标准的方法来消除此类问题中总和溢出的可能性?

注意:我知道这个例子太幼稚,不能得出任何有关性能的结论.我有兴趣消除总和溢出的可能性,而不是在性能方面做出任何结论.

注意2:我也理解,除非程序运行了数百年,否则64位无符号数字实际上不会溢出,但是我很好奇是否也可以消除这种假设.

这是我自包含的代码:

#include <Windows.h>
#include <stdio.h>

/**
 * i want to parametrize the type which is used to store sample size
 * to see whether it impacts performance 
 */
template <typename sampleunit_t>
static inline ULONGLONG AveragePerformanceClocks (void (*f)(),  sampleunit_t nSamples)
{
    ULONGLONG sum;
    sampleunit_t i;    

    sum = 0;

    for (i = 0; i < nSamples; ++i) {
        LARGE_INTEGER t1; 
        LARGE_INTEGER t2;
        ULONGLONG dt;

        QueryPerformanceCounter(&t1);
        f();        
        QueryPerformanceCounter(&t2);

        dt = t2.QuadPart - t1.QuadPart;

        // sum may possibly overflow if program runs long enough with
        // a large enough nSamples
        sum += dt;
    }


    return (ULONGLONG)(sum / nSamples);
}

/* a cdecl callback that consumes time */
static void test1() 
{
    // don't optimize
    volatile int i;

    for (i = 0; i < 10000; ++i) {

    }
}

int main(int argc, char **argv)
{
    ULONGLONG avg;

    avg = AveragePerformanceClocks<BYTE>(test1, 255);    
    printf("average clocks(truncated): %llu.\n", avg);   

    avg = AveragePerformanceClocks<WORD>(test1, 255);    
    printf("average clocks(truncated): %llu.\n", avg);   

    avg = AveragePerformanceClocks<DWORD>(test1, 255);    
    printf("average clocks(truncated): %llu.\n", avg);   

    avg = AveragePerformanceClocks<ULONGLONG>(test1, 255);    
    printf("average clocks(truncated): %llu.\n", avg);   

    system("pause");

    return 0;
}

解决方法:

前n个元素的平均值为

          SUM
Average = ---
           n

下一个元素Mi是

           (SUM + Mi)
Average2 = ----------
              n + 1

因此,给定当前平均值,可以使用新读数找到下一个平均值.

           (Average * n + Mi )
Average2 = -------------------
                  n + 1

然后可以将其更改为不增加的方程式

                       n      Mi
Average2 = Average * ----- + -----
                     n + 1   n + 1

在实践中,时间的大小将适合计算机的数据类型.

如所指出的,这需要使用浮点表示,并且虽然不会由于溢出而失败,但是当n /(n 1)小于浮点分数部分的精度时仍然可能失败.

更新

incremental average

有更好的重组.

                       Mi - Average
Average2 = Average  +  -------------
                           n + 1

更好,因为它只有一个分区.

上一篇:求自定类型元素的平均


下一篇:(转)Skyline timeseries异常判定算法