ACM - 概率、期望题目 小结(临时)

概率DP求期望大多数都是全期望公式的运用。主要思考状态空间的划分以及状态事件发生的概率。问题可以分为无环和有环两类。无环一类多数比较简单,可以通过迭代或者记忆化搜索完成。有环一类略复杂,可以通过假设方程化简公式解决或者高斯消元求解。

POJ 2096 Collecting Bugs

http://poj.org/problem?id=2096

概率DP入门题,注意理解和状态的转移过程才能建立方程。

dp[i][j]表示已经找到i种系统的j种bug时达到目标状态时的期望,此时找到一个bug,可能仍属于原来i种系统j种bug,也可能是第i+1种系统j种bug,也可能是i种系统第j+1种bug,也可能是第i+1种系统第j+1种bug,不同情况有不同的概率。这是所谓的马尔柯夫过程。

#include <iostream>
#include <cstdlib>
#include <cstdio>
#include <algorithm>
#include <cstring>
using namespace std;
][];
][];
double r;
int n,s;
double dp(int i,int j)
{
    if(vis[i][j]||i>n||j>s) return f[i][j];
    vis[i][j]=true;
    f[i][j]=+(n-i)*j/r*dp(i+,j)+i*(s-j)/r*dp(i,j+)+(n-i)*(s-j)/r*dp(i+,j+);
    f[i][j]/=(-i*j/r);
    return f[i][j];
}
int main()
{
    scanf("%d%d",&n,&s);
    r=n*s;
    vis[n][s]=;
    f[n][s]=;
    printf(,));
    ;
}

UVa 11762  Race to 1

概率DP,马尔柯夫过程。

dp[i]表示i经过题目变换得到1的期望,这样dp[i]=(s[i]-p[i])/s[i]*dp[i]+sum{1/s[i]*dp[i/prime[i][j]]}其中s[i]表示1到i之间的素数个数,p[i]表示数字i

的质因子个数,prime[i][j]表示数字i的第j个质因子。

终止条件是dp[1]=0。因为1不需要变化就能得到1,所以期望的步骤数是0。

#include <iostream>
#include <cstdlib>
#include <cstdio>
#include <algorithm>
#include <cstring>
#include <vector>
#define maxn 1000000
using namespace std;
];
];
vector<];
void init()
{
    memset(is_prime,,sizeof(is_prime));
    is_prime[]=;
    ; i<=maxn; ++i)
        if(is_prime[i])
        {
            numb[i].push_back(i);
            for(int j=i+i; j<=maxn; j+=i)
            {
                is_prime[j]=false;
                numb[j].push_back(i);
            }
        }
    ; i<=maxn; ++i)
        ]+;
        ];
}
];
];
int n;
double dp(int x)
{
    if(vis[x]) return f[x];
    vis[x]=true;
    f[x]=;
    ; i<numb[x].size(); ++i)
        f[x]+=1.0/sum[x]*dp(x/numb[x][i]);
    f[x]/=(-((sum[x]-numb[x].size())/1.0/sum[x]));
    return f[x];
}
int main()
{
    ;
    scanf("%d",&T);
    f[]=;
    vis[]=;
    init();
    while(T--)
    {
        scanf("%d",&n);
        printf("Case %d: %.10lf\n",++kase,dp(n));
    }
    ;
}

HDU  4405 Aeroplane chess

简单的概率DP,注意用记忆化搜索会爆栈。

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cstdlib>
using namespace std;
int n,m;
];
],p;
int main()
{
    p=/6.0;
    while(scanf("%d%d",&n,&m)!=EOF)
    {
        if(!n&&!m) break;
        memset(move,,sizeof(move));
        ; i<m; ++i)
        {
            int x,y;
            scanf("%d%d",&x,&y);
            move[x]=y;
        }
        memset(f,,sizeof(f));
        ; i>=; --i)
        {
            if(move[i]) f[i]=f[move[i]];
            else
            {
                f[i]=;
                ; j<=; ++j)
                    f[i]+=p*f[i+j];
            }
        }
        printf(]);
    }
    ;
}

HDU 3853 LOOPS

经典的简单概率DP,注意可能有到达自身概率是1的情况,这种地方不可能再达到别的地方,所以应该被忽略掉。

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cstdlib>
using namespace std;
][][];
][];
int n,m;
int main()
{
    while(scanf("%d%d",&n,&m)!=EOF)
    {
        memset(pro,,sizeof(pro));
        memset(dp,,sizeof(dp));
        ; i<=n; ++i)
            ; j<=m; ++j)
                scanf(],&pro[i][j][],&pro[i][j][]);
        ; --i)
            ; --j)
            {
                if(i==n&&j==m) continue;
                dp[i][j]=;
                ]==) dp[i][j]=;
                else
                {
                    dp[i][j]+=pro[i][j][]*dp[i][j+]+pro[i][j][]*dp[i+][j];
                    dp[i][j]/=(-pro[i][j][]);
                }
            }
        printf(][]);
    }
    ;
}

ZOJ 3329  One Person Game

带环的概率DP。设dp[i]表示当前为i分时到结束游戏时的期望,这样dp[i]=r*dp[0]+∑pk*dp[i+x]。其中r表示第一二三个骰子分别取a,b,c时的概率即1/(k1*k2*k3)。pk表示三个骰子和为x时的概率。终止条件时i>=n时,dp[i]=0。我们的最终答案是dp[0],但是这里每次递推都需要用到dp[0],显然不符合动规的特点,是所谓有环。因此需要别的方法。

#include <iostream>
#include <cstdio>
#include <cstring>
#include <vector>
#include <queue>
#include <algorithm>
#define ll long long
#define MAXN 30005
using namespace std;
],B[];
];
int main()
{
    int T;
    scanf("%d",&T);
    while(T--)
    {
        int n,k1,k2,k3,a,b,c;
        scanf("%d%d%d%d%d%d%d",&n,&k1,&k2,&k3,&a,&b,&c);
        double r=1.0/(k1*k2*k3);
        memset(A,,sizeof(A));
        memset(B,,sizeof(B));
        memset(pro,,sizeof(pro));
        ; i<=k1; ++i)
            ; j<=k2; ++j)
                ; k<=k3; ++k)
                    if(!(i==a&&j==b&&k==c))
                        pro[i+j+k]+=r;
        int s=k1+k2+k3;
        ; --i)
        {
            ; j<=s; ++j)
            {
                A[i]+=pro[j]*A[i+j];
                B[i]+=pro[j]*B[i+j];
            }
            A[i]+=r;
            B[i]++;
        }
        printf(]/(-A[]));
    }
    ;
}

ZOJ 3582 Back to the Past

http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=4624

概率DP求期望。dp[i][j]表示两侧分别亮了i和j个灯,然后枚举当天左右两侧分别亮的灯数,这里要注意求概率,比如左右两侧分别亮了k1、k2个灯,那么该事件发生的概率是

C[n-i][k1]*pow(p,k1)*pow(1-p,n-i-k1)*C[n-j][k2]*pow(p,k2)*pow(1-p,n-j-k2),注意这里选择亮的灯的部分。记忆化搜索或者递推都可以解决。

#include <iostream>
#include <cstdlib>
#include <cstdio>
#include <algorithm>
#include <cstring>
#include <string>
#include <vector>
#include <cmath>
#define maxn 1000000
using namespace std;
int n,m;
double p;
][];
][],pro[][];
][];
void init()
{
    pro[][]=pro[][]=;
    ; i<=*n; ++i)
    {
        pro[][i]=pro[][i-]*p;
        pro[][i]=pro[][i-]*(-p);
    }
}
double dp(int a,int b)
{
    ;
    if(vis[a][b]) return f[a][b];
    vis[a][b]=true;
    f[a][b]=;
    ; i<=n-a; ++i)
        ; j<=n-b; ++j)
        {
            &&j==))
                f[a][b]+=C[n-a][i]*pro[][i+j]*C[n-b][j]*pro[][n*-a-b-i-j]*dp(a+i,b+j);
        }
    f[a][b]/=(-pro[][n*-a-b]);
    return f[a][b];
}
int main()
{
    C[][]=;
    ; i<=; ++i)
    {
        C[i][]=C[i][i]=;
        ; j<i; ++j)
            C[i][j]=C[i-][j]+C[i-][j-];
    }
    while(scanf("%d%d%lf",&n,&m,&p))
    {
        if(!n&&!m&&!p) break;
        init();
        memset(vis,,sizeof(vis));
        memset(f,,sizeof(f));
        printf(,));
    }
    ;
}
上一篇:7.25实习培训日志-Oracle SQL(一)


下一篇:TCPReplay使用---张子芳