我需要计算正确的C#源文件中的类数.
我写了以下语法:
grammar CSharpClassGrammar;
options
{
language=CSharp2;
}
@parser::namespace { CSharpClassGrammar.Generated }
@lexer::namespace { CSharpClassGrammar.Generated }
@header
{
using System;
using System.Collections.Generic;
}
@members
{
private List<string> _classCollector = new List<string>();
public List<string> ClassCollector { get { return
_classCollector; } }
}
/*------------------------------------------------------------------
* PARSER RULES
*------------------------------------------------------------------*/
csfile : class_declaration* EOF
;
class_declaration
: (ACCESSLEVEL | MODIFIERS)* PARTIAL? 'class' CLASSNAME
class_body
';'?
{ _classCollector.Add($CLASSNAME.text); }
;
class_body
: '{' class_declaration* '}'
;
/*------------------------------------------------------------------
* LEXER RULES
*------------------------------------------------------------------*/
ACCESSLEVEL
: 'public' | 'internal' | 'protected' | 'private' | 'protected
internal'
;
MODIFIERS
: 'static' | 'sealed' | 'abstract'
;
PARTIAL
: 'partial'
;
CLASSNAME
: ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'A'..'Z'|'0'..'9'|'_')*
;
COMMENT
: '//' ~('\n'|'\r')* {$channel=HIDDEN;}
| '/*' ( options {greedy=false;} : . )* '*/' {$channel=HIDDEN;}
;
WHITESPACE
: ( '\t' | ' ' | '\r' | '\n'| '\u000C' )+ { $channel = HIDDEN; }
;
此解析器正确地计算带有空类主体的空类(以及嵌套类):
internal class DeclarationClass1
{
class DeclarationClass2
{
public class DeclarationClass3
{
abstract class DeclarationClass4
{
}
}
}
}
我需要计数不为空的类,例如:
class TestClass
{
int a = 42;
class Nested { }
}
我需要以某种方式忽略“不是类声明”的所有代码.
在上面的示例中,忽略
int a = 42;
我怎样才能做到这一点?可能是其他语言的例子吗?
请帮忙!
解决方法:
当您仅对源文件的某些部分感兴趣时,可以在选项{…}部分中设置filter = true.这将使您能够仅定义您感兴趣的标记,而未定义的标记将被词法分析器忽略.
请注意,这仅适用于词法分析器语法,不适用于组合(或解析器)语法.
一些演示:
lexer grammar CSharpClassLexer;
options {
language=CSharp2;
filter=true;
}
@namespace { Demo }
Comment
: '//' ~('\r' | '\n')*
| '/*' .* '*/'
;
String
: '"' ('\\' . | ~('"' | '\\' | '\r' | '\n'))* '"'
| '@' '"' ('"' '"' | ~'"')* '"'
;
Class
: 'class' Space+ Identifier
{Console.WriteLine("Found class: " + $Identifier.text);}
;
Space
: ' ' | '\t' | '\r' | '\n'
;
Identifier
: ('a'..'z' | 'A'..'Z' | '_') ('a'..'z' | 'A'..'Z' | '_' | '0'..'9')*
;
重要的是,将标识符留在那里,因为您不希望Xclass Foo被标记为:[‘X’,’class’,’Foo’].有了标识符,Xclass将成为整个标识符.
可以使用以下课程测试语法:
using System;
using Antlr.Runtime;
namespace Demo
{
class MainClass
{
public static void Main (string[] args)
{
string source =
@"class TestClass
{
int a = 42;
string _class = ""inside a string literal: class FooBar {}..."";
class Nested {
/* class NotAClass {} */
// class X { }
class DoubleNested {
string str = @""
multi line string
class Bar {}
"";
}
}
}";
Console.WriteLine("source=\n" + source + "\n-------------------------");
ANTLRStringStream Input = new ANTLRStringStream(source);
CSharpClassLexer Lexer = new CSharpClassLexer(Input);
CommonTokenStream Tokens = new CommonTokenStream(Lexer);
Tokens.GetTokens();
}
}
}
产生以下输出:
source=
class TestClass
{
int a = 42;
string _class = "inside a string literal: class FooBar {}...";
class Nested {
/* class NotAClass {} */
// class X { }
class DoubleNested {
string str = @"
multi line string
class Bar {}
";
}
}
}
-------------------------
Found class: TestClass
Found class: Nested
Found class: DoubleNested
请注意,这只是一个快速演示,我不确定我是否在语法中处理了正确的字符串文字(我不熟悉C#),但是此演示应该为您提供一个起点.
祝好运!