一、为什么要写这个工具?
公司内容有多个项目需要同一个功能,而这些项目中,有的是用Java的,有的是用C++的,同时由于某些现实条件限制,无法所有项目都调用统一的服务接口(如:可能运行在无网络的情况下),所以可选方案有两种:
a.分别用Java和C++实现两套一样的功能。
b.实现一个生成工具,用来生成同一种逻辑的Java和C++代码。
现在项目还刚刚开始,还不确定未来会使用以上两种方案之中的哪一种,不过我还是需要事先做准备。
二、本文不会有的内容
我不希望在一篇技术文章中涉及到任何业务,以及为避免任何形式的公司敏感信息的泄露,所以本文中不会出现这个工具中的关键代码,即:
a.这篇文章中的代码都是用于描述方便而写的测试代码,而不会包含真实的项目代码。
b.这篇文章只讲技术,而不涉及业务处理。
三、为什么用Scheme来做为源语言?
首先要说一下,这个源语言是一个Scheme-like的语言,而不是Scheme本身,但语法非常相似。
那么为什么用Scheme的形式来做为源语言呢?直接用Java不就只需要把Java翻译成C++了么?
我选择用Scheme的原因是:
a.这个语言是一个动态类型语言,所以在语法上不会在声明中出现对象的类型。
b.Scheme-like实际上就是lisp-like(S表达式),这种语法形式非常简单,而且各种语言元素上高度统一,非常容易实现。
基于以上两点,以后如果我们再写一个图形工具(给业务方用户直接使用来编辑算法)来生成这个语言也会比较容易——如果要写一个GUI工具编辑好算法之后,生成的直接是Java代码,则有点过于困难了,虽然还是可以做到,但工作量上可能会是10倍,甚至数十倍的差距。所以,为了未来可能的处理方便,以及现在对语言本身的实现方便,这里选用一个在语言上“看似”无类型的,且语法简单的语法来做是比较好的。同时,因这个语言整个就是我在做,所以以后在现在语法的基础之上增加更具表达力的语法也并不会再困难。
四、关于类型
Scheme语言是一个动态类型的语言,而我的目标语言是Java和C++两个静态类型语言,所以这个Scheme-like语言只是在形式上是动态语言的,而本制上必须还是一个静态类型语言才行。那么即然在语言的文本上并不存在关于类型的声明,那么我们怎么知道翻译到Java和C++之后是什么类型呢?
关于类型识别分为如下几种情况:
a.业务代码直接掉用的接口是最简单的……后续补充。
b.函数内部的变量定义……后续补充。
c.对于内部的一个函数,情况最是复杂,比如:(define (fun m a) (m a))这样一个函数可以看出m是一个函数(或一个lambda),它接受一个参数a,但我们从这个函数中无法确定a是什么类型的,m的返回值是什么。而这此类型在Scheme中也是只有当运行时才可以确定的,但我们需要直接翻译到静态的代码中,这样我们实际上不得不通过一些手段以确定期类型……后续补充。
d.……
五、表达式与函数
在Scheme中,表达式都是有值的,所以我们可以写出这样的代码:(let ((a (if (< 1 2) 1 2))) a),而在C++和Java中表达式都是没有值的,所以我们不可以这样写:double x = {if (true) 1; else 2;},这样在本身的语法映射上就差别太大了。为了简化开发,还是把Scheme中的函数,都对应的在Java和C++代码中实现一个函数,这样就会比罗容易做这个翻译。
比如:在Scheme中if是一个函数,则在Java中实现一个这样的接口<T> T _if(Supplier<Boolean> cond, Supplier<T> exeBody1, Supplier<T> exeBody2);在C++中实现这样一个函数template<class T> T _if(std::function<bool()> cond, std::function<T()> exeBody1, std::function<T()> exeBody2);——这里使用lambda式参数的原因会在后面讲到。
再比如:在Scheme中+是一个函数,则在Java中实现一个这样的接口double add(double d1, double d2),在C++中也实现同样一个函数。
等等。
这些函数的实现都是只有一行的,C++编译器都是可以用inline的方式优化掉的,所以不会有什么性能问题,而Java语言并不会做inline这样的动作,但我就不清楚JVM是否会在运行时进行inline处理了。
六、关于延时计算
延时计算主要应用在两个方面:
……
七、关于短路
……
今天有点累了,改天再补完吧。