UVa 10900 (连续概率、递推) So you want to be a 2n-aire?

题意:

初始奖金为1块钱,有n个问题,连续回答对i个问题后,奖金变为2i元。

回答对每道题的概率在t~1之间均匀分布。

听到问题后有两个选择:

  • 放弃回答,拿走已得到的奖金
  • 回答问题:
    • 如果回答正确,奖金加倍
    • 如果回答错误,游戏结束,得不到奖金

分析:

d[i]表示答对i题后最大期望奖金,设回答对第i题的概率为p,

则回答第i题的期望奖金 = p × d[i]

考虑上不回答的情况,期望奖金最大值为max{2i-1, p*d[i]}

因为p在t~1均匀分布,所以d[i]等于分段函数max{2i-1, p*d[i]}在这个区间上的积分。

因为一段是常函数,一段是直线,所以积分很好求。

令p0 = max{t, 2i/d[i+1]}

  • p < p0,选择不回答,奖金期望为2i
  • p ≥ p0,选择回答,奖金期望为(1+p0)/2 * d[i+1]

根据全概率公式,第一种情况的概率为p1 = (p0 - t) / (1 - t)

d[i] = p1*2i + (1-p1)*(1+p0)/2 * d[i+1]

边界d[n] = 2n,答案为d[0]

 #include <cstdio>
#include <algorithm>
using namespace std; const int maxn = ;
double d[maxn]; int main()
{
//freopen("in.txt", "r", stdin);
int n;
double t;
while(scanf("%d%lf", &n, &t) == && n)
{
d[n] = ( << n);
for(int i = n-; i >= ; --i)
{
double p0 = max(t, (double)(<<i)/d[i+]);
double p1 = (p0-t)/(-t);
d[i] = (double)(<<i)*p1 + (+p0)/ * d[i+] * (-p1);
}
printf("%.3f\n", d[]);
} return ;
}

代码君

上一篇:【Rust日报】 2019-06-01:用 Rust 实现 WebGPU 协议


下一篇:APP的宣传方式有哪些