[Codeforces 865C]Gotta Go Fast(期望dp+二分答案)
题面
一个游戏一共有n个关卡,对于第i关,用a[i]时间通过的概率为p[i],用b[i]通过的时间为1-p[i],每通过一关后可以选择继续下一关或者时间清0并从第一关开始,先要求通过所有关卡的时间和不能超过R才算彻底通关,问直到彻底通关位置的游戏时间的期望值为多少
分析
二分从头开始通关的用时期望mid
设\(dp[i][j]\)表示通前i关,当前时间为j的期望,倒推期望.
若超时重新开始,则\(dp[i][j]=mid\)
若用方法a通过这一关,则更新j,\((dp[i+1][j+a[i]]+a[i])*p[i]\)
用方法b同理
总而言之,有$$dp[i][j]=min(mid,(dp[i+1][j+a[i]]+a[i])p[i],(dp[i+1][j+b[i]]+b[i])(1-p[i]))$$
如果最终答案\(dp[1][0]<mid\),就缩小二分范围,否则增大二分范围
代码
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define maxn 50
#define maxv 5000
#define maxrb 1e10
#define maxt 150 //二分答案迭代次数,处理精度
using namespace std;
int n,r;
int a[maxn+5],b[maxn+5];
double p[maxn+5];
double dp[maxn+5][maxv+5];
//dp[i][j]第i关,用时j通关的期望
//二分从1关开始通完的期望mid
bool check(double mid){
for(int i=n;i>=1;i--){
for(int j=r+1;j<=maxv;j++){
dp[i+1][j]=mid;
//通关超过时间限制,回到起点重新开始
}
for(int j=0;j<=r;j++){
double t1=(dp[i+1][j+a[i]]+a[i])*p[i];
double t2=(dp[i+1][j+b[i]]+b[i])*(1-p[i]);
dp[i][j]=min(mid,t1+t2);
}
}
if(dp[1][0]<mid) return 1;//如果实际dp值比二分值更小,可以继续缩小二分范围
else return 0;
}
int main(){
scanf("%d %d",&n,&r);
for(int i=1;i<=n;i++){
scanf("%d %d",&a[i],&b[i]);
scanf("%lf",&p[i]);
p[i]/=100;
}
double lb=0,rb=1e10,mid,ans=0;
for(int i=1;i<=maxt;i++){
mid=(lb+rb)/2;
if(check(mid)){
ans=mid;
rb=mid;
}else lb=mid;
}
printf("%.9lf",ans);
}