Go语言与数据库开发:01-09

包和工具

Go语言有超过100个的标准包(译注:可以用 go list std | wc -l 命令查看标准包的具体数
目),标准库为大多数的程序提供了必要的基础构件。在Go的社区,有很多成熟的包被设
计、共享、重用和改进,目前互联网上已经发布了非常多的Go语音开源包,它们可以通过
http://godoc.org 检索。

Go还自带了工具箱,里面有很多用来简化工作区和包管理的小工具。

包简介

任何包系统设计的目的都是为了简化大型程序的设计和维护工作,通过将一组相关的特性放
进一个独立的单元以便于理解和更新,在每个单元更新的同时保持和程序中其它单元的相对
独立性。这种模块化的特性允许每个包可以被其它的不同项目共享和重用,在项目范围内、
甚至全球范围统一的分发和复用。

每个包一般都定义了一个不同的名字空间用于它内部的每个标识符的访问。每个名字空间关
联到一个特定的包,让我们给类型、函数等选择简短明了的名字,这样可以避免在我们使用
它们的时候减少和其它部分名字的冲突。

每个包还通过控制包内名字的可见性和是否导出来实现封装特性。通过限制包成员的可见性
并隐藏包API的具体实现,将允许包的维护者在不影响外部包用户的前提下调整包的内部实
现。通过限制包内变量的可见性,还可以强制用户通过某些特定函数来访问和更新内部变
量,这样可以保证内部变量的一致性和并发时的互斥约束。

当我们修改了一个源文件,我们必须重新编译该源文件对应的包和所有依赖该包的其他包。
即使是从头构建,Go语言编译器的编译速度也明显快于其它编译语言。Go语言的闪电般的编
译速度主要得益于三个语言特性。第一点,所有导入的包必须在每个文件的开头显式声明,
这样的话编译器就没有必要读取和分析整个源文件来判断包的依赖关系。第二点,禁止包的
环状依赖,因为没有循环依赖,包的依赖关系形成一个有向无环图,每个包可以被独立编
译,而且很可能是被并发编译。第三点,编译后包的目标文件不仅仅记录包本身的导出信
息,目标文件同时还记录了包的依赖关系。因此,在编译一个包的时候,编译器只需要读取
每个直接导入包的目标文件,而不需要遍历所有依赖的的文件

导入路径

每个包是由一个全局唯一的字符串所标识的导入路径定位。出现在import语句中的导入路径也
是字符串。
import (
"fmt"
"math/rand"
"encoding/json"
"golang.org/x/net/html"
"github.com/go-sql-driver/mysql"
)

Go语言的规范并没有指明包的导入路径字符串的具体含义,导
入路径的具体含义是由构建工具来解释的。

也有第三方扩展的工具箱存在。例如,Google
公司内部的Go语言码农,他们就使用内部的多语言构建系统。用不同的规则来处理包名字和定位包,
用不同的规则来处理单元测试等等,因为这样可以更紧密适配他们内部环境。

如果你计划分享或发布包,那么导入路径最好是全球唯一的。为了避免冲突,所有非标准库
包的导入路径建议以所在组织的互联网域名为前缀;而且这样也有利于包的检索。例如,上
面的import语句导入了Go团队维护的HTML解析器和一个流行的第三方维护的MySQL驱动。

包声明

在每个Go语音源文件的开头都必须有包声明语句。包声明语句的主要目的是确定当前包被其
它包导入时默认的标识符。

例如,math/rand包的每个源文件的开头都包含 package rand 包声明语句,所以当你导入这个
包,你就可以用rand.Int、rand.Float64类似的方式访问包的成员。
package main
import (
"fmt"
"math/rand"
)
func main() {
fmt.Println(rand.Int())
}

通常来说,默认的包名就是包导入路径名的最后一段,因此即使两个包的导入路径不同,它
们依然可能有一个相同的包名。例如,math/rand包和crypto/rand包的包名都是rand。

关于默认包名一般采用导入路径名的最后一段的约定也有三种例外情况。第一个例外,包对
应一个可执行程序,也就是main包,这时候main包本身的导入路径是无关紧要的。

名字为main的包是给go build构建命令一个信息,这个包编译完之后必须调用连接器生
成一个可执行程序。

第二个例外,包所在的目录中可能有一些文件名是以test.go为后缀的Go源文件,并且这些源文件声明的包名也是以
_test为后缀名的。这种目录可以包含两种包:一种普通包,加一种则是测试的外部扩展包。
所有以_test为后缀包名的测试外部扩展包都由go test命令独立编译,普通包和测试的外部扩
展包是相互独立的。

第三个例外,一些依赖版本号的管理工具会在导入路径后追加版本号信息

导入声明

可以在一个Go语言源文件包声明语句之后,其它非导入声明语句之前,包含零到多个导入包
声明语句。每个导入声明可以单独指定一个导入路径,也可以通过圆括号同时导入多个导入
路径。

下面两个导入形式是等价的,但是第二种形式更为常见。
import "fmt"
import "os"
import (
"fmt"
"os"
)

导入的包之间可以通过添加空行来分组;通常将来自不同组织的包独自分组。包的导入顺序
无关紧要,但是在每个分组中一般会根据字符串顺序排列。

import (
"fmt"
"html/template"
"os"
"golang.org/x/net/html"
"golang.org/x/net/ipv4"
)

如果我们想同时导入两个有着名字相同的包,例如math/rand包和crypto/rand包,那么导入声
明必须至少为一个同名包指定一个新的包名以避免冲突。这叫做导入包的重命名。
import (
"crypto/rand"
mrand "math/rand" // alternative name mrand avoids conflict
)

导入包的重命名只影响当前的源文件。其它的源文件如果导入了相同的包,可以用导入包原
本默认的名字或重命名为另一个完全不同的名字。
导入包重命名是一个有用的特性,它不仅仅只是为了解决名字冲突。如果导入的一个包名很
笨重,特别是在一些自动生成的代码中,这时候用一个简短名称会更方便。选择用简短名称
重命名导入包时候最好统一,以避免包名混乱。选择另一个包名称还可以帮助避免和本地普
通变量名产生冲突。例如,如果文件中已经有了一个名为path的变量,那么我们可以
将"path"标准包重命名为pathpkg。
每个导入声明语句都明确指定了当前包和被导入包之间的依赖关系。如果遇到包循环导入的
情况,Go语言的构建工具将报告错误。

上一篇:GoLang设计模式01 - 建造者模式


下一篇:Go语言与数据库开发:01-08