首页 > 题解 > bzoj 1030 [JSOI2007]文本生成器

bzoj 1030 [JSOI2007]文本生成器


打算写一晚上题解。。

Description

  JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,他们现在使用的是GW文本生成器v6版。该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文章—— 也就是说,生成的文章中每个字节都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的标准,使用者现在使用的GW文本生成器v6版所生成的文章也是几乎完全不可读的?。ZYX需要指出GW文本生成器 v6生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?

Input

  输入文件的第一行包含两个正整数,分别是使用者了解的单词总数N (<= 60),GW文本生成器 v6生成的文本固定长度M;以下N行,每一行包含一个使用者了解的单词。这里所有单词及文本的长度不会超过100,并且只可能包含英文大写字母A..Z

Output

  一个整数,表示可能的文章总数。只需要知道结果模10007的值。

Sample Input

2 2

A

B

Sample Output

100

题解

首先简单容斥一下,先找到所有的不可读串再拿总的减一下。

不可读的串的数量就是在AC自动机上走m步而不经过is_end(包括fail过继的节点)的路径条数。

f[i][j]表示长度为i的串在AC自动机的j号节点不合法的方案数。这样所有点向它的不是is_end的儿子转移就可以了。

答案是f[m][1..sz]的累和。

#include <cstdio>
#include <cstring>
#include <queue>
#define N 6000
#define mod 10007
using namespace std;
int n,m,sz,root,ans,ch[N][26],is_end[N],fail[N],f[N][N],ti[101];
char s[N];
void up(int &x,int y){x+=y;if (x>mod) x-=mod;}
void insert(char s[],int t)
{
    int len=strlen(s+1),now=root;
    for (int i=1;i<=len;now=ch[now][s[i]-'A'],i++)
        if (!ch[now][s[i]-'A']) ch[now][s[i]-'A']=++sz;
    is_end[now]|=1;
}
void make_fail()
{
    queue<int>que;
    for (int i=0;i<26;i++)
        if (ch[root][i]) que.push(ch[root][i]);
    while(!que.empty())
    {
        int now=que.front();que.pop();
        for (int i=0;i<26;i++)
            if (ch[now][i])
                is_end[ch[now][i]]|=is_end[ch[fail[now]][i]],
                fail[ch[now][i]]=ch[fail[now]][i],que.push(ch[now][i]);
            else
                ch[now][i]=ch[fail[now]][i];
    }
}
main()
{
    ti[0]=1;
    for (int i=1;i<=100;i++) ti[i]=(ti[i-1]*26)%mod;
    scanf("%d%d",&m,&n);
    for (int i=1;i<=m;i++)
        scanf("%s",s+1),insert(s,i);
    make_fail();
    f[0][root]=1;
    for (int i=0;i<n;i++)
        for (int j=0;j<=sz;j++)
            if (f[i][j] && !is_end[j])
                for (int l=0;l<26;l++)
                    if (!is_end[ch[j][l]])
                        (f[i+1][ch[j][l]]+=f[i][j])%=mod;
    for (int i=0;i<=sz;i++)
        if (!is_end[i])
            (ans+=f[n][i])%=mod;
    printf("%d\n",((ti[n]-(ans%mod))+mod)%mod);
}