要心中有“数”——C语言初学者代码中的常见错误与瑕疵(8)

  在 C语言初学者代码中的常见错误与瑕疵(7) 中,我给出的重构代码中存在BUG。这个BUG是在飞鸟_Asuka网友指出“是不是时间复杂度比较大”,并说他“第一眼看到我就想把它当成一个数学问题来做”之后,我又重新对问题进行了数学式的思考后发现的。
  这个BUG源于在(1<=A,B<=1000)条件下对矩形个数的数量级心里没数。当时觉得这个题目的目的是考察穷举,由于题目限定了A、B的范围,所以结果应该不是很大。事实证明这种想法是一厢情愿。
  通常情况下,我不喜欢用数学方法解决C语言编程问题。因为很多问题,一旦在数学上能够轻易解决,编写代码往往是索然无趣的,对学习和练习C语言几乎没有什么益处。譬如,求1+2+3+……+100,如果不知道或假装不知道数学解法,代码可能是这样的

#include <stdio.h>

int main( void )
{
int i , sum = ; for ( i = ; i <= ; i ++ )
{
sum += i ;
}
printf("%d\n",sum); return ;
}

  而若使用数学方法,代码则是

#include <stdio.h>

int main( void )
{
printf("%d\n", ( + ) * / ); return ;
}

  前者,C语言和编程成分的含量很高,数学含量却很低;而后者数学含量很高,可C语言和编程成分的含量几乎为0。
  从解决实际问题的角度来说,显然应该用后一种方法;而从学习C语言和练习编程的角度来说,则应该使用前一种方法。所以一个好的编程问题,应该是没有数学解的,至少应该没有显而易见、容易得到的数学解。否则,只是用C语言对公式做一个简单的翻译(这大概是FORTRAN语言的哲学),编程的味道就全没有了,谭浩强的很多题目就是如此(参见:滥用变量综合症)。“矩形的个数”问题应该说还不是那么容易得到数学解的。
  所以,在飞鸟_Asuka 网友说他“第一眼看到我就想把它当成一个数学问题来做”之后,我也尝试着用数学的方式思考了一下。我发现,在同一条直线上的n个不同的点一共可以构成(n-1)n/2条不同的线段,A*B的矩形相邻两边各有A+1和B+1个不同的点,因而可以分别构成(A+1)A/2和(B+1)B/2条不同的线段,这样构成的矩形的个数一共就是(A+1)A/2×(B+1)B/2个。当A和B取最大值1000时,结果显然不小于25×1010,而这个值显然大于231-1,甚至也大于232-1(多数编译器中 unsigned 类型所能表示的最大整数)。这样,原来的重构代码中用int类型作为结果的类型,显然错了。
  我一向认为C语言程序员应该心中有“数”,即对表达式中的数据和结果有最起码的范围估计。没想到,这次由于刻意回避数学解法,却立刻遭到了违背信条的报应。正应验了Muphry's law所言:Anything that can go wrong, will go wrong。
  冯诺依曼也认为程序员至少应该清楚计算过程中数据的数量级,为此他反对浮点数。与之相反,约翰.巴科斯则盲目乐观地发明了浮点数,很多程序员尽情地享受浮点数的方便,却由于盲目乐观屡屡被浮点数这种“有缺陷的抽象”所伤。更有甚至,很多程序员连浮点数最基本的原理都不懂,竟然能写出k=sqrt(n) 这样狗屁不通的句子。(参见:似是而非的k=sqrt(n)
  回过头来再谈我代码的BUG。这个BUG的另一个教训是没有进行比较充分的测试,如果测试一下边界情况可能不难发现这个BUG。后来我又重新测试了一下,发现程序运行时间比较长,这说明飞鸟_Asuka 网友指出“是不是时间复杂度比较大”的问题也是存在的。但当时为了算法叙述的方便,就没有按照下面的方法写count()函数:

int count( int A , int B )
{
int x1 , y1 ;//第一个点的坐标
int x2 , y2 ;//第二个点的坐标
int num = ; for ( x1 = ; x1 < B ; x1 ++ )// for ( x1 = 0 ; x1 <= B ; x1 ++ )
for ( y1 = ; y1 < A ; y1 ++ )// for ( y1 = 0 ; y1 <= A ; y1 ++ )//穷举第一个点的各种可能
for ( x2 = x1 + ; x2 <= B ; x2 ++ )// for ( x2 = 0 ; x2 <= B ; x2 ++ )
for ( y2 = y1 + ; y2 <= A ; y2 ++ )// for ( y2 = 0 ; y2 <= A ; y2 ++ )//穷举第二个点的各种可能
num ++ ; // {
// if ( x1 < x2 && y1 < y2 )
// num ++ ;
// }
return num ;
}

  如果写成这种形式,不难发现第二层循环与第三层是可以对调的,对调后为:

   for ( x1 =  ; x1 < B ; x1 ++ )
for ( x2 = x1 + ; x2 <= B ; x2 ++ )
for ( y1 = ; y1 < A ; y1 ++ )
for ( y2 = y1 + ; y2 <= A ; y2 ++ )
num ++ ;

  这时应该能够看出,最内两层循环次数为 A + A-1 + A-2 +……+1,最外两层循环的循环次数为B + B-1 + B-2 +……+1,因而结果可以直接得到,即(A+1)A/2*(B+1)B/2。

  算法问题解决了,又产生了新的问题,那就是如何表示这么大的整数,这是一个数据结构的问题。(或许,这才是题目的本意?)
  办法之一就是使用表示范围更大的整数类型,例如C99中的long long int类型。
  如果编译器不支持C99也没有表示范围更大的整数类型,那就只有自己着手构造新的数据结构了。
  矩形个数的最大值大约为25×1010,这并不是一个很大的数,一个int不够,那就用两个好了。这里把存储大数的数据结构设计为一数组,

typedef int BIG_NUM[] ;

  数组的第0个元素存储低6位,第1个元素存储高位。存储低6位的原因是避免乘法运算时溢出(乘数不超过1001,与一个6十进制整数相乘不超过109,在int类型的表示范围之内)。

  通过调用

BIG_NUM num ;
count( num , A , B );

将结果写到num中。

count()函数的实现:

void count( BIG_NUM m , int A , int B )
{
m[] = ;
m[] = ;
mul_sum( m , A );//将1+2+……+A的结果乘入m
mul_sum( m , B );//将1+2+……+B的结果乘入m
}

  由于结果是累乘得到的,所以初始化为1。为防止溢出,只能

void mul_sum( BIG_NUM m , int n )
{
int t1 = n % == ? n / : n ,
t2 = n % != ? (n + ) / : n + ;
mul( m , t1 );
mul( m , t2 );
}

  小心翼翼地一个个地乘(每个乘数都不得超过1001)。t1,t2这两个变量是为了回避BIG_NUM类型的除法运算。

void mul( BIG_NUM m , int n )
{
m[] *= n ;
m[] *= n ;
m[] += m[]/;//进位
m[] %= ;
}

  每乘以一个数,立刻就处理进位问题。
  最后还要考虑如何输出:

void output( BIG_NUM m )
{
if ( m[] == )
{
printf( "%d\n" , m[] );
return ;
} printf( "%d" , m[] );
printf( "%06d\n" , m[] ); }

  这里的"%06"是为了保证低位不够6位时仍能正确输出。

  完整的代码如下:

/*
矩形的个数
在一个3*2的矩形中,可以找到6个1*1的矩形,4个2*1的矩形3个1*2的矩形,
2个2*2的矩形,2个3*1的矩形和1个3*2的矩形,总共18个矩形。
给出A,B,计算可以从中找到多少个矩形。 输入:
本题有多组输入数据(<10000),你必须处理到EOF为止
输入2个整数A,B(1<=A,B<=1000) 输出:
输出找到的矩形数。 样例: 输入:
1 2
3 2 输出:
3
18 作者:薛非
出处:http://www.cnblogs.com/pmer/ “C语言初学者代码中的常见错误与瑕疵”系列博文 */ #include <stdio.h>
typedef int BIG_NUM[] ; void count( BIG_NUM , int , int );
void mul_sum( BIG_NUM , int );
void mul( BIG_NUM , int );
void output( BIG_NUM ); #define POW 1000000
#define WID 6 int main( void )
{
int A , B ; while ( printf( "输入2个整数A,B(1<=A,B<=1000)\n" ),
scanf( "%d%d" , &A , &B )!= EOF
)
{
BIG_NUM num ;
count( num , A , B );
output( num );
}   return ;
} void output( BIG_NUM m )
{
if ( m[] == )
{
printf( "%d\n" , m[] );
return ;
} printf( "%d" , m[] );
printf( "%0*d\n" , WID , m[] ); } void mul( BIG_NUM m , int n )
{
m[] *= n ;
m[] *= n ;
m[] += m[]/POW;//进位
m[] %= POW;
} void count( BIG_NUM m , int A , int B )
{
m[] = ;
m[] = ;
mul_sum( m , A );//将1+2+……+A的结果乘入m
mul_sum( m , B );//将1+2+……+B的结果乘入m
} void mul_sum( BIG_NUM m , int n )
{
int t1 = n % == ? n / : n ,
t2 = n % != ? (n + ) / : n + ;
mul( m , t1 );
mul( m , t2 );
}

  写的有点丑。

上一篇:Request中的方法调用


下一篇:C语言初学者代码中的常见错误与瑕疵(7)