bing统计【转自CSDN博客】

2023-11-13 21:57:15

文章来源：http://blog.csdn.net/aa512690069/article/details/17918799

其原文是微软一个小题目：http://hero.csdn.net/Question/Details?ID=215&ExamID=210

本届大赛由微软必应词典冠名，必应词典(http://cn.bing.com/dict/?form=BDVSP4&mkt=zh-CN&setlang=ZH)是微软推出的新一代英语学习引擎，里面收录了很多我们常见的单词。但现实生活中，我们也经常能看到一些毫无规则的字符串，导致词典无法正常收录，不过，我们是否可以从无规则的字符串中提取出正规的单词呢？

例如有一个字符串"iinbinbing"，截取不同位置的字符‘b’、‘i’、‘n’、‘g’组合成单词"bing"。若从1开始计数的话，则‘b’ ‘i’ ‘n’ ‘g’这4个字母出现的位置分别为(4,5,6,10) (4,5,9,10),(4,8,9,10)和(7,8,9,10)，故总共可以组合成4个单词”bing“。

咱们的问题是：现给定任意字符串，只包含小写‘b’ ‘i’ ‘n’ ‘g’这4种字母，请问一共能组合成多少个单词bing?

字符串长度不超过10000，由于结果可能比较大，请输出对10^9 + 7取余数之后的结果。

******************************************************************************

我的思路（这个思路只是针对任何单词，前提是单词中没有重复的字母，比如说：good，o重复了则不适用，原因是加上重复字母的话得复杂不少而没有做）：按照例子 “iinbinbing“ 来说，可以画出如下4张图，来对应bing的4种情况，其纵轴是该字符出现在字符串中的索引（1开始）:

那么这个统计问题就转换成了线段从b开始连接到尾部g的线路数，且连接的点位置必须满足前一个字母位置小于后一个字母位置（顺序）。

如下图，bing的组成个数 n = b1 + b2。 n = 1 + 3 = 4;

有了这个想法，然后开始想办法统计连接到尾部的线路数加总即可.既然是统计到尾部的线路数，当然从尾部开始找。于是乎，得到如下统计图表：

bing统计【转自CSDN博客】

有了这个想法，然后开始想办法统计连接到尾部的线路数加总即可.既然是统计到尾部的线路数，当然从尾部开始找。于是乎，得到如下统计图表：

那么，其实我们就是为了求总数，而不必要得到每一点的所有线路，所以。我们每一步执行都加总一次，即得到如下图:

那么，这个图的字母b的第一个计数器(b, 4)即为bing的组合个数。也就是连接到尾部的总个数。

结语：

这个实现的步骤复杂度为O(2N)，计算长度 + 统计，2次循环。

可以看得出这里为什么不允许重复字母，如果是重复的字母则需要建立复合计数器（即一个字母有多个计数器，分别对不同位置进行计数），但是鉴于题目没有这些要求而没有做多余的事情。

后来发现，其实这里正着循环也行，复杂度O(N)，长度不需要计算。

实现代码如下（这个是我提交给微软考试用的题目，也就不改了）：

 1 #include<stdio.h>
 2 #include<malloc.h>
 3 int howmany (const char* s)
 4 {    
 5     unsigned int len = 0;
 6     const char* e = s;
 7     const char* key = "bing";
 8     const char* ke = key;
 9     unsigned int keyLen = 0;
10     long long num = 0;
11     long long* bing = 0;
12     int idx[256] = {0};
13     unsigned int i = 0;
14 
15     if(s == 0 || *s == 0) return 0;
16     
17     while(*ke++ != 0);
18     while(*++e != 0);
19     keyLen = ke - key - 1;
20 
21     bing = (long long*)malloc(sizeof(long long) * keyLen);
22     for(i = 0; i < keyLen; ++i)
23     {
24         idx[key[i]] = i + 1;
25         bing[i] = 0;
26     }
27 
28     for (--e; e >= s; --e)
29     {
30         int n = idx[*(unsigned char*)e];
31 
32         if(!n)
33             continue;
34         
35         if(n == keyLen)
36         {
37             bing[n - 1]++;
38         }
39         else
40         {
41             if(bing[n] > 0)
42                 bing[n - 1] += bing[n];
43         }
44     }
45 
46     num = bing[0];
47     free(bing);
48     return num % 1000000007;
49 }

复杂度O(N)

 1 int howmany(const char* str)
 2 {
 3     long long counter[4] = {0};
 4     if(str == 0) return 0;
 5 
 6     for(; *str != 0; str++)
 7     {
 8         switch(*str)
 9         {
10         case ‘b‘:    counter[0]++; break;
11         case ‘i‘:    counter[1]+=counter[0]; break;
12         case ‘n‘:    counter[2]+=counter[1]; break;
13         case ‘g‘:    counter[3]+=counter[2]; break;
14         }
15     }
16     return counter[3] % 1000000007;
17 }

*************************************************

以上都是原作者的分析和代码。个人感觉前面的分析没讲清楚，不过最后一段代码倒是很好。我自己写，原先想的简单，直接没考虑b、i、n、g几个字母的顺序问题，直接统计个数然后相乘（我想的太简单了⊙﹏⊙b汗）。

看了作者分析，知道要考虑顺序问题，然后再看最后一段代码，想想理解了。谢谢作者。

bing统计【转自CSDN博客】

码农公寓

相关文章