通过词法分析实现的指出C程序中包含的头文件

  在阅读有些程序的源码时,很希望能够马上弄清楚源码中到底包含了哪些头文件,以确定是否需要为了特殊的函数而手动加入#include。借助flex的词法分析实现了这一功能,本质上就是对正则表达式的匹配。注意这个程序不能够处理包含嵌套的情形(也就是说不能指出包含文件包含了哪些文件),感兴趣的可以通过栈来实现。源码如下:

 /*源代码:ic.l*/

 /*定义文件预处理指令文件名起始状态*/
%x IFILE %%
^"#"[ \t]*include[ \t]*[\"<] {BEGIN IFILE;} /*#include的多种表达方式的正则表达式*/
<IFILE>[^\t\n\">]+ {/*进入文件名状态*/
printf("%d:%s\n",yylineno++,yytext);/*输出行号和文件名,yylineno是flex定义的全局变量,yytext是当前
输入流*/
{
char c;
/*去处行尾可能的换行符*/
while((c=input()) && c!='\n');
}
/*回复至初始状态*/
BEGIN INITIAL;
}/*下面的RE用于处理行首换行(空行)和换行的情况,增加yylineno的值*/
^\n {++yylineno;}
\n {++yylineno;}
. {/*直接忽略*/}
%% int main(int argc,char *argv[])
{
/*命令行读取文件名参数*/
if (argc<)
{
fprintf(stderr,"Usage:%s filename\n",argv[]);
}
FILE *f;
int i;
/*循环打开文件*/
for (i=;i<argc;++i)
{
f=fopen(argv[i],"r");
if (!f)
{
perror(argv[i]);
exit(EXIT_FAILURE);
}
/*重新开始输入*/
yyrestart(f);
yylineno=;
/*开始新的文件,函数初始化为1*/
printf("\t%s:\n",argv[i]);
yylex();/*开始词法分析*/
printf("\n");
fclose(f);
}
return ;
}

编译指令:

 $flex -o ic.lex.c ic.l
$gcc -o ic ic.lex.c -lfl

示范运行结果:

 $ ./ic test_inc.c inc_count.lex.c
test_inc.c:
:stdio.h inc_count.lex.c:
:stdio.h
:string.h
:errno.h
:stdlib.h
:inttypes.h
:unistd.h

可见已经达到了目的。

上一篇:Python 正则 —— 捕获与分组


下一篇:Linux内核的整体架构