联赛模拟测试5 涂色游戏矩阵优化DP

2023-01-05 15:01:28

题目描述

分析

定义出\(dp[i][j]\)为第\(i\)列涂\(j\)种颜色的方案数

然后我们要解决几个问题

首先是求出某一列涂恰好\(i\)种颜色的方案数\(d[i]\)

如果没有限制必须涂\(i\)种，而是有的颜色可以不涂，那么方案数为\(i^n\)

为了避免少涂的情况，我们减去只涂\(1 \sim i-1\)种颜色的方案数

即\(d[i]=i^n-\sum_{j=1}^{i-1}C_i^j \times d[j]\)

初始化为\(d[1]=1\)

接下来考虑转移

\(f[i][j]=f[i-1][k] \times d[j] \times C_k^{cf} \times C_{p-k}^{j-cf}\)

其中\(i\)为当前列的编号，\(j\)为当前列选了几种颜色，\(k\)为上一列选了几种颜色，\(cf\)为这些颜色有几种相同的

注意两个组合数不能写成\(C_j^{cf} \times C_{p-j}^{k-cf}\)

因为我们要选出\(j\)个，而不是\(k\)个

时间复杂度\(m \times n^3\)

期望得分：\(40\)，实际得分:\(50\)

下一步我们考虑怎么优化

我们会发现，如果\(j\)和\(k\)确定了，那么\(f[i-1][k]\)乘的系数就确定了

根据乘法分配率，我们可以把系数预处理出来，优化掉一维

时间复杂度\(m \times n^2\)

期望得分：\(70\)，实际得分:\(70\)

我们继续观察会发现，每一列的转移乘的系数都是固定的

结合\(m\)的大小，我们可以使用矩阵快速幂优化

时间复杂度\(logm \times n^3\)

期望得分：\(100\)，实际得分:\(70\)

因为出题人卡常卡到丧心病狂，最后几个点仍然会跑到\(2s\)多

所以我们要优化代码的常数

能不用\(longlong\)就不用\(longlong\)

减少取模的次数

加几个玄学的\(register\)和\(inline\)

再手动吸一下氧就可以了

时间复杂度\(logm \times n^3\)

期望得分：\(100\)，实际得分:\(100\)

代码

#include<cstdio>

#include<algorithm>

#include<cmath>

#include<cstring>

#define fastcall __attribute__((optimize("-O3")))

%:pragma GCC optimize(2)

%:pragma GCC optimize(3)

%:pragma GCC optimize("Ofast")

%:pragma GCC optimize("inline")

%:pragma GCC optimize("-fgcse")

%:pragma GCC optimize("-fgcse-lm")

%:pragma GCC optimize("-fipa-sra")

%:pragma GCC optimize("-ftree-pre")

%:pragma GCC optimize("-ftree-vrp")

%:pragma GCC optimize("-fpeephole2")

%:pragma GCC optimize("-ffast-math")

%:pragma GCC optimize("-fsched-spec")

%:pragma GCC optimize("unroll-loops")

%:pragma GCC optimize("-falign-jumps")

%:pragma GCC optimize("-falign-loops")

%:pragma GCC optimize("-falign-labels")

%:pragma GCC optimize("-fdevirtualize")

%:pragma GCC optimize("-fcaller-saves")

%:pragma GCC optimize("-fcrossjumping")

%:pragma GCC optimize("-fthread-jumps")

%:pragma GCC optimize("-funroll-loops")

%:pragma GCC optimize("-freorder-blocks")

%:pragma GCC optimize("-fschedule-insns")

%:pragma GCC optimize("inline-functions")

%:pragma GCC optimize("-ftree-tail-merge")

%:pragma GCC optimize("-fschedule-insns2")

%:pragma GCC optimize("-fstrict-aliasing")

%:pragma GCC optimize("-falign-functions")

%:pragma GCC optimize("-fcse-follow-jumps")

%:pragma GCC optimize("-fsched-interblock")

%:pragma GCC optimize("-fpartial-inlining")

%:pragma GCC optimize("no-stack-protector")

%:pragma GCC optimize("-freorder-functions")

%:pragma GCC optimize("-findirect-inlining")

%:pragma GCC optimize("-fhoist-adjacent-loads")

%:pragma GCC optimize("-frerun-cse-after-loop")

%:pragma GCC optimize("inline-small-functions")

%:pragma GCC optimize("-finline-small-functions")

%:pragma GCC optimize("-ftree-switch-conversion")

%:pragma GCC optimize("-foptimize-sibling-calls")

%:pragma GCC optimize("-fexpensive-optimizations")

%:pragma GCC optimize("inline-functions-called-once")

%:pragma GCC optimize("-fdelete-null-pointer-checks")

const int maxn=1e4+5;

const int maxm=105;

const int maxp=1e4+5;

const int mod=998244353;

int ny[maxn],jc[maxn],jcc[maxn],f[maxp][maxm],n,m,p,q,d[maxm],xs[maxm][maxm];

int a[maxm][maxm];

int ans;

int getC(int nn,int mm){

	return 1LL*jc[nn]*jcc[mm]%mod*jcc[nn-mm]%mod;

}

int ksm(int ds,int zs){

	int ans=1;

	while(zs){

		if(zs&1) ans=1LL*ans*ds%mod;

		ds=1LL*ds*ds%mod;

		zs>>=1;

	}

	return ans;

}

struct asd{

	int sz[maxm][maxm];

	asd(){

		memset(sz,0,sizeof(sz));

	}

}da,xss;

#define reg register

asd cf(asd aa,asd bb){

	asd cc;

	for(reg int i=1;i<maxm;i++){

		for(reg int j=1;j<maxm;j++){

			for(reg int k=1;k<maxm;k++){

				cc.sz[i][j]=(cc.sz[i][j]+1LL*aa.sz[i][k]*bb.sz[k][j]%mod);

				if(cc.sz[i][j]>=mod) cc.sz[i][j]-=mod;

			}

		}

	}

	return cc;

}

int main(){

	freopen("color.in","r",stdin);

	freopen("color.out","w",stdout);

	scanf("%d%d%d%d",&n,&m,&p,&q);

	ny[1]=1;

	for(int i=2;i<maxm;i++){

		ny[i]=1LL*(mod-mod/i)*ny[mod%i]%mod;

	}

	jc[0]=jcc[0]=1;

	for(int i=1;i<maxm;i++){

		jc[i]=1LL*jc[i-1]*i%mod;

		jcc[i]=1LL*jcc[i-1]*ny[i]%mod;

	}

	int mmax=std::min(n,p);

	d[1]=1;

	for(reg int i=2;i<=mmax;i++){

		d[i]=ksm(i,n);

		for(reg int j=1;j<i;j++){

			d[i]=(d[i]-1LL*d[j]*getC(i,j)%mod+mod);

			if(d[i]>=mod) d[i]-=mod;

		}

	}

	for(reg int i=1;i<=mmax;i++){

		f[1][i]=1LL*getC(p,i)*d[i]%mod;

		da.sz[i][1]=f[1][i];

	}

	for(reg int j=1;j<=mmax;j++){

		for(reg int k=1;k<=mmax;k++){

			int noww=std::min(j,k);

			for(reg int cf=0;cf<=noww;cf++){

				if(j+k-cf<q || j+k-cf>p) continue;

				xs[j][k]=(xs[j][k]+1LL*d[j]*getC(k,cf)%mod*getC(p-k,j-cf)%mod);

				if(xs[j][k]>=mod) xs[j][k]-=mod;

				xss.sz[j][k]=xs[j][k];

			}

		}

	}

	m--;

	while(m){

		if(m&1) da=cf(xss,da);

		m>>=1;

		xss=cf(xss,xss);

	}

	for(int i=1;i<=mmax;i++){

		ans+=da.sz[i][1];

		if(ans>=mod) ans-=mod;

	}

	printf("%d\n",ans);

	return 0;

}

码农公寓

题目描述

分析

代码

相关文章