使用antlr4及java实现snl语言的解释器

2022-07-14 17:15:17

对于antlr4的基础使用，请参考我的前一篇文章《用antlr4来实现<按编译原理的思路设计的一个计算器>中的计算器》。

其实我对于antlr4的理解也仅限于那篇文章的范围，但那些内容对于我们实现一个SNL语言已是足够了。

SNL语言的简介可以百度百科（http://baike.baidu.com/subview/2298006/5909410.htm）中看到。

简单说来，这是一个非常简单的结构化编程语言，它包含了一个编程语言应该有的最基本的东西，同时基本上不包含其它的所谓先进的元素。

首先贴一下文法（我对原始的文法做了一些调整，如：原始的文法中if语句的else部分不是可选的，原始文法中record类型内部只能有基础类型或array类型，等等。但我所做的这些调整都是比较边缘的，以下文法基本上保持了SNL语言的原貌）：

grammar Snlc;

@header{package net.yeah.zhouyou.mickey.snl.antlr4;}

program: programHead declarePart programBody? ;

programHead: PROGRAM programName=ID ;
declarePart: typeDecpart? varDecpart? procDecpart? ;

typeDecpart: TYPE typeDecList ;
typeDecList: typeId=ID ‘:=‘ typeDef ‘;‘ typeDecList? ;

typeDef: basicType
       | structureType
       | ID
       ;
basicType: INTEGER | CHAR ;
structureType: arrayType
             | recordType
             ;
arrayType: ARRAY ‘[‘ low=INTC ‘..‘ top=INTC ‘]‘ OF basicType ;
recordType: RECORD fieldDecList END ;
fieldDecList: typeDef idList ‘;‘ fieldDecList? ;
idList: ID (‘,‘ idList)? ;

varDecpart: VAR varDecList ;
varDecList: typeDef idList ‘;‘ varDecList? ;

procDecpart: procDeclare procDecpart? ;
procDeclare: PROCEDURE procName=ID ‘(‘ paramList? ‘)‘ ‘;‘
declarePart programBody ;
paramList: param (‘;‘ paramList)? ;
param: VAR? typeDef idList ;

programBody: BEGIN stmList END ;
stmList: stm (‘;‘ stmList)? ;
stm: conditionalStm
   | loopStm
   | inputStm
   | outputStm
   | assignment
   | callStm
   | RETURN
   ;
assignment: variable ‘:=‘ exp ;
callStm: ID ‘(‘ actParamList? ‘)‘ ;
conditionalStm: IF condExp THEN stmList (ELSE stmList)? FI ;
loopStm: WHILE condExp DO stmList ENDWH ;
inputStm: READ ‘(‘ invar=ID ‘)‘ ;
outputStm: WRITE ‘(‘ exp ‘)‘ ;
actParamList: exp (‘,‘ actParamList)? ;
condExp: exp (cmpOp=(EQ | LT) exp)? ;
exp: exp op=(MUL | DIV) exp
   | exp op=(ADD | SUB) exp
   | factor
   ;
factor: ‘(‘ exp ‘)‘
      | intVal=INTC
      | variable
      ;
variable: ID variMore? ;
variMore: ‘[‘ exp ‘]‘
        | DOT ID variMore?
        ;

//
PROGRAM: ‘program‘ ;
TYPE: ‘type‘;
INTEGER: ‘integer‘ ;
CHAR: ‘char‘ ;
ARRAY: ‘array‘ ;
OF: ‘of‘ ;
RECORD: ‘record‘ ;
BEGIN: ‘begin‘ ;
END: ‘end‘ ;
PROCEDURE: ‘procedure‘ ;
VAR: ‘var‘ ;
IF: ‘if‘ ;
THEN: ‘then‘ ;
ELSE: ‘else‘ ;
WHILE: ‘while‘ ;
DO: ‘do‘;
ENDWH: ‘endwh‘ ;
READ: ‘read‘ ;
WRITE: ‘write‘ ;
RETURN: ‘return‘ ;
FI: ‘fi‘ ;
ID: [a-zA-Z][a-zA-Z0-9]* ;
INTC: [0-9]+ ;
ADD: ‘+‘ ;
SUB: ‘-‘ ;
MUL: ‘*‘ ;
DIV: ‘/‘ ;
EQ: ‘=‘ ;
LT: ‘<‘ ;
DOT: ‘.‘ ;
DDOT: ‘..‘ ;
AMGT: ‘:=‘ ;
SEM: ‘;‘ ;
COMMA: ‘,‘ ;
LBT: ‘(‘ ;
RBT: ‘)‘ ;
LSBT: ‘[‘ ;
RSBT: ‘]‘ ;
WS: [ \t\n\r]+ -> skip;

读懂这个文法就完全清楚了这门语言的语法结构了，大家可以直接用它来开始开发了，对于语义的部分，大家猜都能猜得出个大概。

但是文法对于学习一个语言来说是比较抽象的，虽然大家都能看懂，但过于理论化，所以我写几个例子贴在下面。

例一，以下程序演示了参数传递，调用proc时传入三个参数1,2,3，在proc内部打印这三个参数的值到控制台——如果我们实现的没有问题，则它应该可以正确打印出这三个数字：

program test
    procedure proc(integer a, b; integer c);
    begin
        write(a);
        write(b);
        write(c)
    end
begin
    proc(1, 2, 3)
end

例二，以下程序中创建了一个整数数组，这个数组的下标是从6到8，共三个值（或三个引用），然后分写或读数组的每个元素。

program test
    var array[6..8] of integer a;
begin
    a[6] := 1;
    a[7] := 2;
    a[8] := 3;

    write(a[6]);
    write(a[7]);
    write(a[8])
end

例三，以下程序定义了一个过程f，当调用这个过程中，会打印当前的参数，并把参数+1传入下一次的递归调用中。如果没有实现“尾递归优化”，则这个程序的调用可预期的情况是“堆栈溢出”。

program recursion
    procedure f(integer d);
    begin
        write(d);
        f(d + 1)
    end
begin
    f(1)
end

例四，以下程序用来表示引用传参。我们把t做为参数传到ref过程中，过程中对参数n做了一些动作，结束这个过程后打印t——如果我们的实现中，把实参t传给形参n是值传递的，则最终会打印出5（因为过程内部无论做了什么都改变不了实参）；如果我们的实现中，把实参t传给形参n是引用传递的，则n和t在语义上就是同一个对象，则作用于n的都会在t上有所体现。

在我的实现中，它会打印出3，因为我把参数传递实现为引用传递，但把 := 实现为值传递。

program test
    var integer t;
    procedure ref(integer n);
        var integer i;
    begin
        i := n;
        n := 3;
        i := 1
    end
begin
    t := 5;
    ref(t);
    write(t)
end

例五，以下程序中的factorial过程用于计算n的阶乘，因为我实现的是引用传参，所以我们可以用参数从过程中返回结果。如果我们不设计成引用传参，则需要使用全局变量来传递数据了。

program test
    var integer res;
    procedure factorial(integer n, r);
    begin
        r := 1;
        factorial_recursion(n, r)
    end
    procedure factorial_recursion(integer n, r);
    begin
        if 1 < n then
            r := r * n;
            factorial_recursion(n - 1, r)
        fi
    end
begin
    factorial(10, res);
    write(res)
end

例六，以下程序用来测试类型定义的功能（其实是一个挺无聊的测试用例）

program test
    type
        int := integer;
        array1to20 := array[1..20] of char;
        recordtype1 := record
            int a, b;
            array1to20 c;
        end;
        recordtype2 := record
            recordtype1 v;
            char c;
        end;
    var recordtype2 v;
        array1to20 v2;
begin
    v.v.a := 1;
    write(v.v.a);

    v2[1] := 65;
    write(v2[1]);

    v.v.c[1] := 68;
    write(v.v.c[1]);

v.c := 66;
write(v.c)
end

例七，以下程序实现了一个冒泡排序（这是教材上给出的例子）：

program bubble
var integer i, j, num;
array [1..20] of integer a;

    procedure q(integer num);
        var integer i, j, k;
            integer t;
    begin
        i := 1;
        while i < num do
            j := num - i + 1;
            k := 1;
            while k < j do
                if a[k + 1] < a[k] then
                    t := a[k];
                    a[k] := a[k + 1];
                    a[k + 1] := t
                else
                    t := 0
                fi;
                k := k + 1
            endwh;
            i:= i + 1
        endwh
    end
begin
    read(num);
    i := 1;
    while i < (num + 1) do
        read(j);
        a[i] := j;
        i := i + 1
    endwh;
    q(num);
    i := 1;
    while i < (num + 1) do
        write(a[i]);
        i := i + 1
    endwh
end.

经过以上的介绍，大家应该对SNL这个语言比较理解了，下面我选择这个解释器最重要的部分介绍一下开发思路。

一、堆栈

………………

二、上下文（符号表）

………………

三、引用

………………

四、类型

………………

使用antlr4及java实现snl语言的解释器,布布扣,bubuko.com

使用antlr4及java实现snl语言的解释器

码农公寓

相关文章