编译器开发系列--Ocelot语言3.类型名称的消解

2023-12-05 12:32:16

“类型名称的消解”即类型的消解。类型名称由TypeRef 对象表示，类型由Type 对象表示。类型名称的消解就是将TypeRef 对象转换为Type 对象。

TypeResolver 类的处理仅仅是遍历抽象语法树，发现TypeRef 的话就从叶子节点开始将其转换为Type 类型。类型和变量的不同之处在于没有作用域的嵌套（作用域唯一），因此没
有必要使用栈。
【TypeRef 对象和Type 对象的对应关系保存在TypeTable 对象中。】

其中Type为类型的定义。struct point { int x; int y; }; 是类型的定义。

TypeRef为类型的名称。struct point 是类型的名称，之所以特意将Type 类和TypeRef 类分开，是因为在类型定义之前就可以编写用到了该类型的代码。也就是说，可以编写如下所示的代码，C 语言中是不可以编写这样的代码的：

	struct s var;

	struct s {

		int memb;

	};

类型名称的消解入口：

    /*入口

     *

     */

    // #@@range/resolveProgram{

    public void resolve(AST ast) {

    	/*

    	 * 首先调用defineTypes 方法，根据代码中定义的类型生成Type 对象，并保存到

			TypeTable 对象中。通过import 导入的类型定义也在这里处理。

    	 */

        defineTypes(ast.types());

        /*类型和抽象语法树的遍历.

         * 但defineTypes 方法不处理结构体成员的类型等TypeRef 对象。将抽象语法树中已有

			的TypeRef 转换成Type 的处理将在下面的foreach 语句中执行。如果这两部分处理不分开进

			行的话，在处理递归的类型定义时程序会陷入死循环。

			ast.types()--源文件内外的类型定义

         */

        // #@@range/resolveProgram_core{

        for (TypeDefinition t : ast.types()) {

            t.accept(this);

        }

        /*

         * 第2 个foreach 语句将使用import 从文件外部读入的定义、全局变量以及函数等所有剩余

			的TypeRef 转换为Type。

			ast.entities()--用import 导入的变量和函数的声明，以及源文件内的变量和函数的定义

         */

        for (Entity e : ast.entities()) {

            e.accept(this);

        }

        /*

         * 上面两个for循环遍历在源文件内外定义的所有类型、变量、函数，将其中所包含的TypeRef 对象

			全部转换为Type 对象。

         */

        // #@@}

    }

首先对ast.types()，即StructNode（结构体定义）、UnionNode（联合体定义）、TypedefNode（用户类型定义）执行defineTypes：

    /*类型的声明.

     * defineTypes 是将类型定义添加到TypeTable 对象的方法

     */

    // #@@range/defineTypes{

    private void defineTypes(List<TypeDefinition> deftypes) {

    	/*

    	 * 使用foreach 语句将deftypes 中的TypeDefinition 对象逐个取出， 将def.

			typeRef() 和def.definingType() 关联成对， 用typeTable.put 方法添加到

			typeTable 中。def.typeRef() 返回的是该TypeDefinition 对象要定义的类型的

			TypeRef（类型名称）。def.definingType() 返回的是该TypeDefinition 对象要定义的

			Type（类型）。

    	 */

        for (TypeDefinition def : deftypes) {

        	/*

        	 * 但如果typeTable.isDefined() 为true 的话，说明这个TypeRef 已经存在，这种情

				况下取消添加处理并输出错误消息。

        	 */

            if (typeTable.isDefined(def.typeRef())) {

                error(def, "duplicated type definition: " + def.typeRef());

            }

            else {

            	/*

            	 * TypeDefinition 类是抽象类， 实际生成的实例是TypeDefinition 的子类

					StructNode、UnionNode、TypedefNode。StructNode 表示结构体的定义，UnionNode

					表示联合体的定义，TypedefNode 表示typedef 语句。

					StructNode#definingType:

					public Type definingType() {

						return new StructType(name(), members(), location());

					}

					调用TypeTable#put 方法将生成的StrcutType 对

					象添加到TypeTable 对象中。TypeTable 对象的内部保存有HashMap 对象， 因此

					TypeTable#put 方法只需简单地调用HashMap#put 即可。

            	 */

                typeTable.put(def.typeRef(), def.definingType());

            }

        }

    }

把上面三种类型的名称和类型都保存在typeTable中，注意typeTable初始化的时候已经自动把所有基本类型都put进去了。然后第一个for循环的三个visit方法：

    // #@@range/StructNode{

    public Void visit(StructNode struct) {

        resolveCompositeType(struct);

        return null;

    }

    // #@@}

    // #@@range/UnionNode{

    public Void visit(UnionNode union) {

        resolveCompositeType(union);

        return null;

    }

    // #@@}

    // #@@range/TypedefNode{

    public Void visit(TypedefNode typedef) {

        bindType(typedef.typeNode());

        bindType(typedef.realTypeNode());

        return null;

    }

    // #@@}

接着：

    public void resolveCompositeType(CompositeTypeDefinition def) {

        CompositeType ct = (CompositeType)typeTable.get(def.typeNode().typeRef());

        if (ct == null) {

            throw new Error("cannot intern struct/union: " + def.name());

        }

        for (Slot s : ct.members()) {

            bindType(s.typeNode());

        }

    }

    /*

     * 首先，用TypeNode#isResolved 方法检查是否已经完成了转换，如果已经完成，则即

		刻使用return 结束处理。如果还未转换，用n.typeRef() 从TypeNode 中取出TypeRef，

		再用typeTable.get 转换为Type 对象， 然后将此Type 对象用n.setType 设置到

		TypeNode 中。

     */

    // #@@range/bindType{

    private void bindType(TypeNode n) {

        if (n.isResolved()) return;

        n.setType(typeTable.get(n.typeRef()));

    }

也很简单，resolveCompositeType是针对每种类型的成员的类型检查，关键的类是TypeNode，从它里面获取TypeRef（类型的名称），再通过类型的名称从typeTable获取已有的类型的定义。然后获取到当前类型的所有的成员变量，再将这个成员变量的类型的名称和定义通过bindType方法绑定起来。typeTable实际上是起到一个中转站的作用。

第二个for循环是将除了上面三种类型的所有剩余的TypeRef 转换为Type。比如：

    /*

     * 变量定义的类型消解.

     */

    // #@@range/DefinedVariable{

    public Void visit(DefinedVariable var) {

    	/*

    	 * TypeRef 对象基本上都存放在TypeNode 对象中。TypeNode 是成对地保存TypeRef 和

			Type 的对象，其目的在于简化TypeResolver 类的代码。

    	 */

        bindType(var.typeNode());

        if (var.hasInitializer()) {

            visitExpr(var.initializer());

        }

        return null;

    }

还有重要的函数类型：

    /*

     * 函数定义的类型消解.

     */

    // #@@range/DefinedFunction{

    public Void visit(DefinedFunction func) {

    	/*

    	 * 在函数定义中，如下这些地方存在TypeRef。

			1. 返回值的类型

			2. 形参的类型

			3. 函数体的代码中

    	 */

        resolveFunctionHeader(func);

        visitStmt(func.body());

        return null;

    }

    private void resolveFunctionHeader(Function func) {

    	/*

    	 * resolveFunctionHeader 方法的第1 行用于处理返回值的类型。func.typeNode()

			返回保存有返回值类型的TypeNode 对象，再调用bindType 方法将返回值的类型从

			TypeRef 转换为Type。

    	 */

        bindType(func.typeNode());

        /*

         * resolveFunctionHeader 方法从第2 行开始都是对形参进行的处理。用foreach 语句

         * 对func.parameters() 进行遍历，取出表示形参的Parameter 对象。然后用param.

			typeNode() 取出Parameter 对象中的TypeNode 对象，将TypeRef 转换为Type。

         */

        for (Parameter param : func.parameters()) {

            // arrays must be converted to pointers in a function parameter.

        	/*

        	 * 只有在将形参的TypeRef 转换为Type 时使用了TypeTable 类的getParamType 方法。

				它和通常的get 方法的区别在于数组的TypeRef 会被转换为指针的Type。C 语言（C♭）中形

				参类型是数组的情况下完全等同于指针类型，因此在此处统一成为指针类型。

        	 */

            Type t = typeTable.getParamType(param.typeNode().typeRef());

            param.typeNode().setType(t);

        }

    }

首先调用resolveFunctionHeader方法，里面第一行是绑定函数的返回类型，然后一个for循环绑定函数的所有形参类型。然后再调用visitStmt(func.body());绑定函数体的所有类型：

    public Void visit(BlockNode node) {

        for (DefinedVariable var : node.variables()) {

            var.accept(this);

        }

        visitStmts(node.stmts());

        return null;

    }

码农公寓

相关文章