轻量函数式 JavaScript:二、函数式函数的基础

函数式编程 不是使用 function 关键字编程。 如果它真有那么简单,我在这里就可以结束这本书了!但重要的是,函数确实是 FP 的中心。使我们的代码成为 函数式 的,是我们如何使用函数。

但是,你确信你知道 函数 是什么意思吗?

在这一章中,我们将要通过讲解函数的所有基本方面来为本书的剩余部分打下基础。在某种意义上,这里的内容即便是对非 FP 程序员来说也是应当知道的关于函数的一切。但是如果我们想要从 FP 的概念中学到竟可能多的东西,我们必须 知道 函数的里里外外。

振作起来,关于函数东西可能比你已经知道的东西多得多。

什么是函数?

要解释函数式编程,我所能想到的最自然的起点就是 函数。这看起来再明显不过了,但我想我们的旅程需要坚实的第一步。

那么……什么是函数?

数学简忆

我知道我承诺过尽可能远离数学,但稍稍忍耐我片刻,在继续之前我们快速地检视一些东西:代数中有关函数和图像的基础。

你还记得在学校里学过的关于 f(x) 的一些东西吗?等式 y = f(x) 呢?

比如说一个等式这样定义的:f(x) = 2x2 + 3。这是什么意思?给这个函数画出图像是什么意思?这就是图像:

轻量函数式 JavaScript:二、函数式函数的基础

你能注意到,对于任何 x 的值,比如 2,如果你将它插入这个等式,你会得到 11。那么 11 是什么?它是函数 f(x)返回值,代表我们刚才说到的 y 值。

换句话说,在图像的曲线上有一个点 (2,11)。而且对于我们插入的任意的 x 的值,我们都能得到另一个与之相对应的 y 值作为一个点的坐标。比如另外一个点 (0,3),以及另一个点 (-1,5)。将这些点放在一起,你就得到了上面的抛物线图像。

那么这到底与 FP 有什么关系?

在数学中,一个函数总是接受输入,并且总是给出输出。一个你将经常听到的 FP 术语是“态射(morphism)”;这个很炫的词用来描述一个值的集合映射到另一个值的集合,就像一个函数的输入与这个函数的输入的关系一样。

在代数中,这些输入与输出经常被翻译为被绘制的图像的坐标的一部分。然而,我们我可以使用各种各样的输入与输出定义函数,而且它们不必与视觉上图像的曲线有任何关系。

函数 vs 过程

那么为什么说了半天数学和图像?因为在某种意义上,函数式编程就是以这种数学意义上的 函数 来使用函数。

你可能更习惯于将函数考虑为过程(procedures)。它有什么区别?一个任意功能的集合。它可能有输入,也可能没有。它可能有一个输出(return 值),也可能没有。

而一个函数接收输入并且绝对总是有一个 return 值。

如果你打算进行函数式编程,你就应当尽可能多地使用函数,而不是过程。你所有的 function 都应当接收输入并返回输出。为什么?这个问题的答案有许多层次的含义,我们将在这本书中逐一揭示它们。

函数输入

根据这个定义,所有函数都需要输入。

你有时会听到人们称它们为“实际参数(arguments)”,而有时称为“形式参数(parameters)”。那么这都是什么意思?

实际参数 是你传入的值,而 形式参数 是在函数内部被命名的变量,它们接收那些被传入的值。例如:

function foo(x,y) {
    // ..
}

var a = 3;

foo( a, a * 2 );

aa * 2(实际上,是这个表达式的值,6) 是 foo(..) 调用的 实际参数xy 是接收实际参数值(分别是 36)的 形式参数

注意: 在 JavaScript 中,不要求 实际参数 的数量与 形式参数 的数量相吻合。如果你传入的 实际参数 多于被声明来接受它们的 形式参数 ,那么这些值会原封不动地被传入。这些值可以用几种不同的方式访问,包括老旧的 arguments 对象。如果你传入的 实际参数 少于被声明的 形式参数,那么每一个无人认领的形式参数都是一个 “undefined” 值,这意味着它在这个函数的作用域中存在而且可用,只是初始值是空的 undefined

输入计数

被“期待”的实际参数的数量 —— 你可能想向它传递多少实际参数 —— 是由被声明的形式参数的数量决定的。

function foo(x,y,z) {
    // ..
}

foo(..) 期待 三个实际参数,因为它拥有三个被声明的形式参数。这个数量有一个特殊的术语:元(arity)。元是函数声明中形式参数的数量。foo(..) 的元是 3

你可能会想在运行时期间检查一个函数引用来判定它的元。这可以通过这个函数引用的 length 属性来完成:

function foo(x,y,z) {
    // ..
}

foo.length;                // 3

一个在执行期间判定元的原因可能是,一段代码从多个源头接受一个函数引用,并且根据每个函数引用的元来发送不同的值。

例如,想象这样一种情况,一个函数引用 fn 可能期待一个,两个,或三个实际参数,但你总是想要在最后一个位置上传递变量 x

// `fn` 被设置为某个函数的引用
// `x` 存在并拥有一些值

if (fn.length == 1) {
    fn( x );
}
else if (fn.length == 2) {
    fn( undefined, x );
}
else if (fn.length == 3) {
    fn( undefined, undefined, x );
}

提示: 一个函数的 length 属性是只读的,而且它在你声明这个函数时就已经被决定了。它应当被认为实质上是一种元数据,用来描述这个函数意料之中的用法。

一个要小心的坑是,特定种类的形式参数列表可以使函数的 length 属性报告的东西与你期待的不同。不要担心,我们会在本章稍后讲解每一种(ES6 引入的)特性:

function foo(x,y = 2) {
    // ..
}

function bar(x,...args) {
    // ..
}

function baz( {a,b} ) {
    // ..
}

foo.length;                // 1
bar.length;                // 1
baz.length;                // 1

如果你使用这些形式参数中的任意一种,那么要小心你函数的 length 值可能会使你惊讶。

那么如何计数当前函数调用收到的实际参数数量呢?这曾经是小菜一碟,但现在情况变得稍微复杂一些。每个函数都有一个可以使用的 arguments (类数组)对象,它持有每个被传入的实际参数的引用。你可检查 argumentslength 属性来搞清楚有多少参数被实际传递了:

function foo(x,y,z) {
    console.log( arguments.length );    // 2
}

foo( 3, 4 );

在 ES5(具体地说,strict 模式)中,arguments 被认为是有些软废弃了;许多人都尽量避免使用它。它永远都不会被移除 —— 在 JS 中,不论那将会变得多么方便,我们“永远”都不会破坏向下的兼容性 —— 但是由于种种原因依然强烈建议你尽可能避免使用它。

然而,我建议 arguments.length,而且仅有它,在你需要关心被传入的实际参数的数量时是可以继续使用的。某个未来版本的 JS 中有可能会加入一个特性,在没有 arguments.length 的情况下恢复判定被传递的实际参数数量的能力;如果这真的发生了,那么我们就可以完全放弃 arguments 的使用了。

小心:绝不要 按位置访问实际参数,比如 arguments[1]。如果你必须这么做的话,坚持只使用 arguments.length

除非……你如何访问一个在超出被声明的形式参数位置上传入的实际参数?我一会就会回答这个问题;但首先,退一步问你自己,“为什么我想要这么做?”。把这个问题认真地考虑几分钟。

这种情况的发生应该非常少见;它不应当是你通常所期望的,或者在你编写函数时所依靠的东西。如果你发现自己身陷于此,那么就再多花20分钟,试着用一种不同的方式来设计这个函数的交互。即使这个参数是特殊的,也给它起个名字。

一个接收不确定数量的实际参数的函数签名称为可变参函数(variadic function)。有些人喜欢这种风格的函数设计,但我想你将会发现 FP 程序员经常想要尽量避免这些。

好了,在这一点上唠叨得够多了。

假定你需要以一种类似数组下标定位的方式来访问实际参数,这可能是因为你正在访问一个没有正式形式参数位置的实际参数。我们该如何做?

ES6 前来拯救!让我们使用 ... 操作符来声明我们的函数 —— 它有多个名称:“扩散”、“剩余”、或者(我最喜欢的)“聚集”。

function foo(x,y,z,...args) {
    // ..
}

看到形式参数列表中的 ...args 了吗?这是一种新的 ES6 声明形式,它告诉引擎去收集(嗯哼,聚集)所有剩余的(如果有的话)没被赋值给命名形式参数的实际参数,并将它们放到名为 args 的真正的数组中。args 将总是一个数组,即便是空的。但它 不会 包含那些已经赋值给形式参数 xy、和 z 的值,只有超过前三个值被传入的所有东西。

function foo(x,y,z,...args) {
    console.log( x, y, z, args );
}

foo();                    // undefined undefined undefined []
foo( 1, 2, 3 );            // 1 2 3 []
foo( 1, 2, 3, 4 );        // 1 2 3 [ 4 ]
foo( 1, 2, 3, 4, 5 );    // 1 2 3 [ 4, 5 ]

所以,如果你 真的 想要设计一个解析任意多实际参数的函数,就在末尾使用 ...args(或你喜欢的其他任何名字)。现在,你将得到一个真正的,没有被废弃的,不讨人嫌的数组来访问那些实际参数。

只不过要注意,值 4 在这个 args 的位置 0 上,而不是位置 3。而且它的 length 值将不会包括 12、和 3 这三个值。...args 聚集所有其余的东西,不包含 xy、和 z

你甚至 可以 在没有声明任何正式形式参数的参数列表中使用 ... 操作符:

function foo(...args) {
    // ..
}

无论实际参数是什么,args 现在都是一个完全的实际参数的数组,而且你可以使用 args.length 来知道究竟有多少个实际参数被传入了。而且如果你选择这样做的话,你可以安全地使用 args[1]args[317]。但是,拜托不要传入318个实际参数。

说到 ES6 的好处,关于你函数的实际参数与形式参数,还有几种你可能想知道的其他的技巧。这个简要概览之外的更多信息,参见我的 “你不懂 JS —— ES6 与未来” 的第二章。

实际参数技巧

要是你想要传递一个值的数组作为你函数调用的实际参数呢?

function foo(...args) {
    console.log( args[3] );
}

var arr = [ 1, 2, 3, 4, 5 ];

foo( ...arr );                        // 4

我们使用了我们的新朋友 ...,它不只是在形式参数列表中可以使用;而且还可以在调用点的实际参数列表中使用。在这样的上下文环境中它将拥有相反的行为。在形式参数列表中,我们说它将实际参数 聚集 在一起。在实际参数列表中,它将它们 扩散 开来。所以 arr 的内容实际上被扩散为 foo(..) 调用的各个独立的实际参数。你能看出这与仅仅传入 arr 数组的整个引用有什么不同吗?

顺带一提,多个值与 ... 扩散是可以穿插的,只要你认为合适:

var arr = [ 2 ];

foo( 1, ...arr, 3, ...[4,5] );        // 4

以这种对称的感觉考虑 ...:在一个值的列表的位置,它 扩散。在一个赋值的位置 —— 比如形式参数列表,因为实际参数被 赋值给 了形式参数 —— 它 聚集

不管你调用哪一种行为,... 都令使用实际参数列表变得非常简单。用slice(..)concat(..)apply(..) 来倒腾我们实际参数值数组的日子一去不复返了。

形式参数技巧

在 ES6 中, 形式参数可以被声明 默认值。在这个形式参数的实际参数没有被传递,或者被传递了一个 undefined 值的情况下,默认的赋值表达式将会取而代之。

考虑如下代码:

function foo(x = 3) {
    console.log( x );
}

foo();                    // 3
foo( undefined );        // 3
foo( null );            // null
foo( 0 );                // 0

注意: 我们不会在此涵盖更多的细节,但是默认值表达式是懒惰的,这意味着除非需要它不会被求值。另外,它可以使用任意合法的 JS 表达式,甚至是一个函数调用。这种能力使得许多很酷的技巧成为可能。例如,你可以在形式参数列表中声明 x = required(),而在 required() 函数中简单地 throw "This argument is required.",来确保其他人总是带着指定的实际/形式参数来调用你的函数。

另一个我们可以在形式参数列表中使用的技巧称为 “解构”。我们将简要地扫它一眼,因为这个话题要比我们在这里讨论的复杂太多了。同样,更多信息参考我的 “ES6 与未来”。

还记得刚才可以接收318个实际参数的 foo(..) 吗!?

function foo(...args) {
    // ..
}

foo( ...[1,2,3] );

要是我们想改变这种互动方式,让我们函数的调用方传入一个值的数组而非各个独立的实际参数值呢?只要去掉这两个 ... 就好:

function foo(args) {
    // ..
}

foo( [1,2,3] );

这很简单。但如果我们想给被传入的数组的前两个值赋予形式参数名呢?我们不再声明独立的形式参数了,看起来我们失去了这种能力。但解构就是答案:

function foo( [x,y,...args] = [] ) {
    // ..
}

foo( [1,2,3] );

你发现现在形式参数列表周围的方括号 [ .. ] 了吗?这就是数组解构。解构为你想看到的某种结构(对象,数组等)声明了一个 范例,描述应当如何将它分解(分配)为各个独立的部分。

在这个例子中,解构告诉引擎在这个赋值的位置(也就是形式参数)上期待一个数组。范例中说将这个数组的第一个值赋值给称为 x 的本地形式参数变量,第二个赋值给 y,而剩下的所有东西都 聚集args 中。

你本可以像下面这样手动地做同样的事情:

function foo(params) {
    var x = params[0];
    var y = params[1];
    var args = params.slice( 2 );

    // ..
}

但是现在我们要揭示一个原则 —— 我们将在本文中回顾它许多许多次 —— 的第一点:声明式代码经常要比指令式代码表意更清晰。

声明式代码,就像前面代码段中的解构,关注于一段代码的结果应当是什么样子。指令式代码,就像刚刚展示的手动赋值,关注于如何得到结果。如果稍后再读这段代码,你就不得不在大脑中执行它来得到期望的结果。它的结果被 编码 在这里,但不清晰。

不论什么地方,也不论我们的语言或库/框架允许我们这样做到多深的程度,我们都应当努力使用声明式的、自解释的代码。

正如我们可以解构数组,我们还可以解构对象形式参数:

function foo( {x,y} = {} ) {
    console.log( x, y );
}

foo( {
    y: 3
} );                    // undefined 3

我们将一个对象作为实际参数传入,它被解构为两个分离的形式参数变量 xy,被传入的对象中具有相应属性名称的值将会被赋予这两个变量。对象中不存在 x 属性并不要紧;它会如你所想地那样得到一个 undefined 变量。

但是在这个形式参数对象解构中我想让你关注的是被传入 foo(..) 的对象。

foo(undefined,3) 这样普通的调用点,位置用于将实际参数映射到形式参数上;我们将 3 放在第二个位置上使它被赋值给形式参数 y。但是在这种引入了形式参数解构的新型调用点中,一个简单的对象-属性指示了哪个形式参数应该被赋予实际参数值 3

我们不必在这个调用点中说明 x,因为我们实际上不关心 x。我们只是忽略它,而不是必须去做传入 undefined 作为占位符这样令人分心的事情。

有些语言直接拥有这种行为特性:命名实际参数。换句话说,在调用点中,给一个输入值打上一个标签来指示它映射到哪个形式参数上。JavaScript 不具备命名实际参数,但是形式参数对象解构是最佳后备选项。

使用对象解构传入潜在的多个实际参数 —— 这样做的一个与 FP 关联的好处是,只接收单一形式参数(那个对象)的函数与另一个函数的单一输出组合起来要容易得多。稍后会详细讲解这一点。

回想一下,“元”这个术语指一个函数期待接收多少形式参数。一个元为 1 的函数也被称为一元函数。在 FP 中,我们将尽可能使我们的函数是一元的,而且有时我们甚至会使用各种函数式技巧将一个高元函数转换为一个一元的形式。

注意: 在第三章中,我们将重温这种命名实际参数解构技巧,来对付恼人的形式参数顺序问题。

根据输入变化的函数

考虑这个函数:

function foo(x,y) {
    if (typeof x == "number" && typeof y == "number") {
        return x * y;
    }
    else {
        return x + y;
    }
}

显然,这个造作的例子会根据你传入的输入不同而表现出不同的行为。

例如:

foo( 3, 4 );            // 12

foo( "3", 4 );            // "34"

程序员们像这样定义函数的原因之一,是可以更方便地将不同的行为 重载(overload) 入一个函数中。最广为人知的例子就是由许多像 JQuery 这样的主流库提供的 $(..) 函数。根据你向它传递什么实际参数,这个“钱号”函数大概拥有十几种非常不同的行为 —— 从 DOM 元素查询到 DOM 元素创建,以及将一个函数拖延到 DOMContentLoaded 事件之后。

感觉这种方式有一种优势,就是需要学习的 API 少一些(只有一个 $(..) 函数),但是在代码可读性上具有明显的缺陷,而且不得不小心地检查到底什么东西被传入了,才能解读一个调用要做什么。

这种基于一个函数的输入来重载许多不同行为的技术称为特设多态(ad hoc polymorphism)。

这种设计模式的另一种表现形式是,使一个函数在不同场景下拥有不同的输出(更多细节参加下一节)。

警告: 要对这里的 方便 的冲动特别小心。仅仅因为你可以这样设计一个函数,而且即便可能立即感知到一些好处,这种设计决定所带来的长期成本也可能不令人愉快。

函数输出

在 JavaScript 中,函数总是返回一个值。这三个函数都拥有完全相同的 return 行为:

function foo() {}

function bar() {
    return;
}

function baz() {
    return undefined;
}

如果你没有 return 或者你仅仅有一个空的 return;,那么 undefined 值就会被隐含地 return

但是要尽可能地保持 FP 中函数定义的精神 —— 使用函数而不是过程 —— 我们的函数应当总是拥有输出,这意味着它们应当明确地 return 一个值,而且通常不是 undefined

一个 return 语句只能返回一个单一的值。所以如果你的函数需要返回多个值,你唯一可行的选项是将它们收集到一个像数组或对象这样的复合值中:

function foo() {
    var retValue1 = 11;
    var retValue2 = 31;
    return [ retValue1, retValue2 ];
}

就像解构允许我们在形式参数中拆分数组/对象一样,我们也可以在普通的赋值中这么做:

function foo() {
    var retValue1 = 11;
    var retValue2 = 31;
    return [ retValue1, retValue2 ];
}

var [ x, y ] = foo();
console.log( x + y );            // 42

将多个值收集到一个数组(或对象)中返回,继而将这些值解构回独立的赋值,对于函数来说是一种透明地表达多个输出的方法。

提示: 如果我没有这么提醒你,那将是我的疏忽:花点时间考虑一下,一个需要多个输出的函数是否能够被重构来避免这种情况,也许分成两个或更多更小的意图单一的函数?有时候这是可能的,有时候不;但你至少应该考虑一下。

提前返回

return 语句不仅是从一个函数中返回一个值。它还是一种流程控制结构;它会在那一点终止函数的运行。因此一个带有多个 return 语句的函数就拥有多个可能的出口,如果有许多路径可以产生输出,那么这就意味着阅读一个函数来理解它的输出行为可能更加困难。

考虑如下代码:

function foo(x) {
    if (x > 10) return x + 1;

    var y = x / 2;

    if (y > 3) {
        if (x % 2 == 0) return x;
    }

    if (y > 1) return y;

    return x;
}

突击测验:不使用浏览器运行这段代码,foo(2) 返回什么?foo(4) 呢?foo(8) 呢?foo(12) 呢?

你对自己的答案有多自信?你为这些答案交了多少智商税?我考虑它时,前两次都错了,而且我是用写的!

我认为这里的一部分可读性问题是,我们不仅将 return 用于返回不同的值,而且还将它作为一种流程控制结构,在特定的情况下提前退出函数的执行。当然有更好的方式编写这种流程控制(例如 if 逻辑),但我也认为有办法使输出的路径更加明显。

注意: 突击测验的答案是 228、和 13.

考虑一下这个版本的代码:

function foo(x) {
    var retValue;

    if (retValue == undefined && x > 10) {
        retValue = x + 1;
    }

    var y = x / 2;

    if (y > 3) {
        if (retValue == undefined && x % 2 == 0) {
            retValue = x;
        }
    }

    if (retValue == undefined && y > 1) {
        retValue = y;
    }

    if (retValue == undefined) {
        retValue = x;
    }

    return retValue;
}

这个版本无疑更加繁冗。但我要争辩的是它的逻辑追溯起来更简单,因为每一个 retValue 可能被设置的分支都被一个检查它是否已经被设置过的条件 守护 着。

我们没有提前从函数中 return 出来,而是使用了普通的流程控制来决定 retValue 的赋值。最后,我们单纯地 return retValue

我并不是在无条件地宣称你应当总是拥有一个单独的 return,或者你绝不应该提早 return,但我确实认为你应该对 return 在你的函数定义中制造隐晦流程控制的部分多加小心。试着找出表达逻辑的最明确的方式;那通常是最好的方式。

没有被 return 的输出

你可能在你写过的大部分代码中用过,但可能没有太多考虑过的技术之一,就是通过简单地改变函数外部的变量来使它输出一些或全部的值。

记得我们在本章早先的 f(x) = 2x2 + 3 函数吗?我们可以用 JS 这样定义它:

var y;

function foo(x) {
    y = (2 * Math.pow( x, 2 )) + 3;
}

foo( 2 );

y;                        // 11

我知道这是一个愚蠢的例子;我们本可以简单地 return 值,而非在函数内部将它设置在 y 中:

function foo(x) {
    return (2 * Math.pow( x, 2 )) + 3;
}

var y = foo( 2 );

y;                        // 11

两个函数都完成相同的任务。我们有任何理由择优选用其中之一吗?有,绝对有。

一个解释它们的不同之处的方式是,第二个版本中的 return 标明了一个明确的输出,而前者中的 y 赋值是一种隐含的输出。此时你能已经有了某种指引你的直觉;通常,开发者们优先使用明确的模式,而非隐含的。

但是改变外部作用域中的变量,就像我们在 foo(..) 内部中对 y 赋值所做的,只是得到隐含输出的方式之一。一个更微妙的例子是通过引用来改变非本地值。

考虑如下代码:

function sum(list) {
    var total = 0;
    for (let i = 0; i < list.length; i++) {
        if (!list[i]) list[i] = 0;

        total = total + list[i];
    }

    return total;
}

var nums = [ 1, 3, 9, 27, , 84 ];

sum( nums );            // 124

这个函数最明显的输出是我们明确地 return 的和 124。但你发现其他的输出了吗?试着运行这代码然后检查 nums 数组。现在你发现不同了吗?

现在在位置 4 上取代 undefined 空槽值的是一个 0。看起来无害的 list[i] = 0 操作影响了外部的数组值,即便我们操作的是本地形式参数变量 list

为什么?因为 list 持有一个 nums 引用的引用拷贝,而不是数组值 [1,3,9,..] 的值拷贝。因为 JS 对数组,对象,以及函数使用引用和引用拷贝,所以我们可以很容易地从我们的函数中制造输出,这甚至是偶然的。

这种隐含的函数输出在 FP 世界中有一个特殊名称:副作用(side effects)。而一个 没有副作用 的函数也有一个特殊名称:纯函数(pure function)。在后面的章节中我们将更多地讨论这些内容,但要点是,我们将尽一切可能优先使用纯函数并避免副作用。

函数的函数

函数可以接收并返回任意类型的值。一个接收或返回一个或多个其他函数的函数有一个特殊的名称:高阶函数(higher-order function)。

考虑如下代码:

function forEach(list,fn) {
    for (let i = 0; i < list.length; i++) {
        fn( list[i] );
    }
}

forEach( [1,2,3,4,5], function each(val){
    console.log( val );
} );
// 1 2 3 4 5

forEach(..) 是一个高阶函数,因为它接收一个函数作为实际参数。

一个高阶函数还可以输出另一个函数,比如:

function foo() {
    var fn = function inner(msg){
        console.log( msg );
    };

    return fn;
}

var f = foo();

f( "Hello!" );            // Hello!

return 不是“输出”另一个函数的唯一方法:

function foo() {
    var fn = function inner(msg){
        console.log( msg );
    };

    bar( fn );
}

function bar(func) {
    func( "Hello!" );
}

foo();                    // Hello!

高阶函数的定义就是将其他函数看做值的函数。FP 程序员一天到晚都在写这些东西!

保持作用域

在一切编程方式 —— 特别是 FP —— 中最强大的东西之一,就是当一个函数位于另一个函数的作用域中时如何动作。当内部函数引用外部函数的一个变量时,这称为闭包(closure)。

实用的定义是,闭包是在一个函数即使在不同的作用域中被执行时,也能记住并访问它自己作用域之外的变量。

考虑如下代码:

function foo(msg) {
    var fn = function inner(){
        console.log( msg );
    };

    return fn;
}

var helloFn = foo( "Hello!" );

helloFn();                // Hello!

foo(..) 的作用域中的形式参数变量 msg 在内部函数中被引用了。当 foo(..) 被执行,内部函数被创建时,它就会捕获对 msg 变量的访问权,并且即使在被 return 之后依然保持这个访问权。

一旦我们有了 helloFn,一个内部函数的引用,foo(..) 已经完成运行而且它的作用域看起来应当已经消失了,这意味着变量 msg 将不复存在。但是这没有发生,因为内部函数拥有一个对 msg 的闭包使它保持存在。只要这个内部函数(现在在一个不同的作用域中通过 helloFn 引用)存在,被闭包的变量 msg 就会保持下来。

再让我们看几个闭包在实际中的例子:

function person(id) {
    var randNumber = Math.random();

    return function identify(){
        console.log( "I am " + id + ": " + randNumber );
    };
}

var fred = person( "Fred" );
var susan = person( "Susan" );

fred();                    // I am Fred: 0.8331252801601532
susan();                // I am Susan: 0.3940753308893741

内部函数 identify() 闭包着两个变量,形式参数 id 和内部变量 randNumber

闭包允许的访问权不仅仅限于读取变量的原始值 —— 它不是一个快照而是一个实时链接。你可以更新这个值,而且在下一次访问之前这个新的当前状态会被一直记住。

function runningCounter(start) {
    var val = start;

    return function current(increment = 1){
        val = val + increment;
        return val;
    };
}

var score = runningCounter( 0 );

score();                // 1
score();                // 2
score( 13 );            // 15

警告: 由于我们将在本文稍后讲解的一些理由,这种使用闭包来记住改变的状态(val)的例子可能是你想要尽量避免的。

如果你有一个操作需要两个输入,你现在知道其中之一但另一个将会在稍后指定,你就可以使用闭包来记住第一个输入:

function makeAdder(x) {
    return function sum(y){
        return x + y;
    };
}

// 我们已经知道 `10` 和 `37` 都是第一个输入了
var addTo10 = makeAdder( 10 );
var addTo37 = makeAdder( 37 );

// 稍后,我们指定第二个输入
addTo10( 3 );            // 13
addTo10( 90 );            // 100

addTo37( 13 );            // 50

一般说来,一个 sum(..) 函数将会拿着 xy 两个输入并把它们加在一起。但是在这个例子中我们首先收到并(通过闭包)记住值 x,而值 y 是在稍后被分离地指定的。

注意: 这种在连续的函数调用中指定输入的技术在 FP 中非常常见,而且拥有两种形式:局部应用(partial application)与柯里化(currying)。我们将在本书稍后更彻底地深入它们。

当然,因为在 JS 中函数只是一种值,所以我们可以通过闭包来记住函数值。

function formatter(formatFn) {
    return function inner(str){
        return formatFn( str );
    };
}

var lower = formatter( function formatting(v){
    return v.toLowerCase();
} );

var upperFirst = formatter( function formatting(v){
    return v[0].toUpperCase() + v.substr( 1 ).toLowerCase();
} );

lower( "WOW" );                // wow
upperFirst( "hello" );        // Hello

与其将 toUpperCase()toLowerCase() 的逻辑在我们的代码中散布/重复得到处都是,FP 鼓励我们创建封装(encapsulate) —— “包起来”的炫酷说法 —— 这种行为的简单函数。

具体地说,我们创建了两个简单的一元函数 lower(..)upperFirst(..),在我们程序的其余部分中,这些函数将会更容易地与其他函数组合起来工作。

提示: 你是否发现了 upperFirst(..) 本可以使用 lower(..)?

我们将在本书的剩余部分重度依赖闭包。如果不谈整个编程世界,它可能是一切 FP 中最重要的基础实践。要非常熟悉它!

语法

在我们从这个函数的入门教程启程之前,让我们花点儿时间讨论一下它们的语法。

与本书的其他许多部分不同,这一节中的讨论带有最多的个人意见与偏好,不论你是否同意或者反对这里出现的看法。这些想法非常主观,虽然看起来许多人感觉它们更绝对。不过说到头来,由你决定。

名称有何含义?

从语法上讲,函数声明要求包含一个名称:

function helloMyNameIs() {
    // ..
}

但是函数表达式可以以命名和匿名两种形式出现:

foo( function namedFunctionExpr(){
    // ..
} );

bar( function(){    // <-- 看,没有名称!
    // ..
} );

顺便问一下,我们说匿名究竟是什么意思?具体地讲,函数有一个 name 属性,它持有这个函数在语法上被赋予的名称的字符串值,比如 "helloMyNameIs" 或者 "namedFunctionExpr"。这个 name 属性最常被用于你的 JS 环境的控制台/开发者工具中,当这个函数存在于调用栈中时将它显示出来。

匿名函数通常被显示为 (anonymous function)

如果你曾经在除了一个异常的调用栈轨迹以外没有任何可用信息的情况下调试 JS 程序,你就可能感受过看到一行接一行的 (anonymous function) 的痛苦。对于该异常从何而来,这种列表不会给开发者任何线索。它帮不到开发者。

如果你给你的函数表达式命名,那么这个名称将总是被使用。所以如果你使用了一个像 handleProfileClicks 这样的好名字取代 foo,那么你将得到有用得多的调用栈轨迹。

在 ES6 中,匿名函数表达式可以被 名称推断(name inferencing) 所辅助。考虑如下代码:

var x = function(){};

x.name;            // x

如果引擎能够猜测你 可能 想让这个函数叫什么名字,它就会立即这么做。

但要小心,不是所有的语法形式都能从名称推断中受益。函数表达式可能最常出现的地方就是作为一个函数调用的实际参数:

function foo(fn) {
    console.log( fn.name );
}

var x = function(){};

foo( x );                // x
foo( function(){} );    //

当从最近的外围语法中无法推断名称时,它会保留一个空字符串。这样的函数将会在调用栈轨迹中报告为 (anonymous function)

除了调试的问题之外,被命名的函数还有其他的好处。首先,语法名称(也叫词法名称)对于内部自引用十分有用。自引用对于递归来说是必要的,在事件处理器中也十分有帮助。

考虑这些不同的场景:

// 同步递归:
function findPropIn(propName,obj) {
    if (obj == undefined || typeof obj != "object") return;

    if (propName in obj) {
        return obj[propName];
    }
    else {
        let props = Object.keys( obj );
        for (let i = 0; i < props.length; i++) {
            let ret = findPropIn( propName, obj[props[i]] );
            if (ret !== undefined) {
                return ret;
            }
        }
    }
}
// 异步递归
setTimeout( function waitForIt(){
    // `it` 还存在吗?
    if (!o.it) {
        // 稍后重试
        setTimeout( waitForIt, 100 );
    }
}, 100 );
// 解除事件处理器绑定
document.getElementById( "onceBtn" )
    .addEventListener( "click", function handleClick(evt){
        // 解除事件绑定
        evt.target.removeEventListener( "click", handleClick, false );

        // ..
    }, false );

在所有这些情况下,命名函数的名称都是它内部的一个有用且可靠的自引用。

另外,即使是在一个一行函数的简单情况下,将它们命名也会使代码更具自解释性,因此使代码对于那些以前没有读过它的人来说变得更易读:

people.map( function getPreferredName(person){
    return person.nicknames[0] || person.firstName;
} )
// ..

函数名 getPreferredName(..) 告诉读者映射操作的意图是什么,而这仅从代码来看的话没那么明显。这个名称标签使得代码更具可读性。

另一个匿名函数表达式常见的地方是 IIFE(即时调用的函数表达式):

(function(){

    // 看,我是一个 IIFE!

})();

你几乎永远看不到 IIFE 为它们的函数表达式使用名称,但它们应该这么做。为什么?为了我们刚刚讲过的所有理由:调用栈轨迹调试、可靠的自引用、与可读性。如果你实在想不出任何其他名称,至少要使用 IIFE 这个词:

(function IIFE(){

    // 你已经知道我是一个 IIFE 了!

})();

我的意思是有多种理由可以解释为什么 命名函数总是优于匿名函数。 事实上,我甚至可以说基本上不存在匿名函数更优越的情况。对于命名的另一半来说它们根本没有任何优势。

编写匿名函数不可思议地容易,因为那样会让我们投入精力找出的名称减少一个。

我承认;我和所有人一样有罪。我不喜欢在命名上挣扎。我想到的头三个或四个名称通常都很差劲。我不得不一次又一次地重新考虑命名。我宁愿撒手不管而使用匿名函数表达式。

但我们是在用好写与难读做交易。这不是一桩好买卖。由于懒惰或没有创意而不想为你的函数找出名称,是一个使用匿名函数的太常见,但很烂的借口。

为每个函数命名。 如果你坐在那里很为难,不能为你写的某个函数想出一个好名字,那么我会强烈地感觉到你还没有完全理解这个函数的目的 —— 或者它的目的太泛泛或太抽象了。你需要回过头去重新设计这个函数,直到它变得更清晰。而到了那个时候,一个名称将显而易见。

我可以用我的经验作证,在给某个东西良好命名的挣扎中,我通常对它有了更好的理解,甚至经常为了改进可读性和可维护性而重构它的设计。这种时间上的投资是值得的。

没有 function 的函数

至此我们一直在使用完全规范的函数语法。但毫无疑问你也听说过关于新的 ES6 => 箭头函数语法的讨论。

比较一下:

people.map( function getPreferredName(person){
    return person.nicknames[0] || person.firstName;
} )
// ..

people.map( person => person.nicknames[0] || person.firstName );

哇哦。

关键词 function 不见了,return、括号 ( )、花括号 { }、和引号 ; 也不见了。所有这些,换来了所谓的大箭头符号 =>

但这里我们忽略了另一个东西。你发现了吗?函数名 getPreferredName

没错;=> 箭头函数是词法上匿名的;没有办法在语法上给它提供一个名称。它们的名称可以像普通函数那样被推断,但同样地,在最常见的函数表达式作为实际参数的情况下它帮不上什么忙。

如果由于某些原因 person.nicknames 没有被定义,一个异常被抛出,这意味着 (anonymous function) 将会位于调用栈轨迹的顶端。呃。

老实说,对我而言,=> 箭头函数的匿名性是一把指向心脏的 => 匕首。我无法忍受命名的缺失。它更难读、更难调试、而且不可能进行自引用。

如果说这还不够坏,那另一个打脸的地方是,如果你的函数定义有不同的场景,你就必须趟过一大堆有微妙不同的语法。我不会在这里涵盖它们的所有细节,但简单地说:

people.map( person => person.nicknames[0] || person.firstName );

// 多个形式参数?需要 ( )
people.map( (person,idx) => person.nicknames[0] || person.firstName );

// 形式参数解构?需要 ( )
people.map( ({ person }) => person.nicknames[0] || person.firstName );

// 形式参数默认值?需要 ( )
people.map( (person = {}) => person.nicknames[0] || person.firstName );

// 返回一个对象?需要 ( )
people.map( person =>
    ({ preferredName: person.nicknames[0] || person.firstName })
);

在 FP 世界中 => 激动人心的地方主要在于它几乎完全符合数学上函数的符号,特别是在像 Haskell 这样的 FP 语言中。箭头函数语法 => 的形状可以进行数学上的交流。

再挖深一些,我觉得支持 => 的争辩是,通过使用轻量得多的语法,我们减少了函数之间的视觉边界,这允许我们像曾经使用懒惰表达式那样使用简单的函数表达式 —— 这是另一件 FP 程序员们最喜欢的事。

我想大多数 FP 程序员将会对这些问题不屑一顾。他们深爱着匿名函数,也爱简洁的语法。但正如我之前说的:这由你来决定。

注意: 虽然在实际中我不喜欢在我的应用程序中使用 =>,但我们将会在本书剩余部分的许多地方使用它 —— 特别是当我们展示常用的 FP 工具时 —— 当简洁性在代码段有限的物理空间中成为不错的优化方式时。这种方式是否会使你的代码可读性提高或降低,你要做出自己的决断。

This 是什么?

如果你对 JavaScript 中的 this 绑定规则不熟悉,我推荐你看看我的“你不懂 JS:this 与对象原型”一书。对于这一节的目的来说,我假定你知道在一个函数调用中 this 是如何被决定的(四种规则之一)。但就算你对 this 还不甚了解,好消息是我们会得出这样的结论:如果你想使用 FP,那么你就不应当使用 this

JavaScript 的 function 拥有一个在每次函数调用时自动绑定的 this 关键字。这个 this 关键字可以用许多不同的方式描述,但我喜欢称它为函数运行的对象上下文环境。

对于你的函数来说,this 是一个隐含形式参数输入。

考虑如下代码:

function sum() {
    return this.x + this.y;
}

var context = {
    x: 1,
    y: 2
};

sum.call( context );        // 3

context.sum = sum;
context.sum();                // 3

var s = sum.bind( context );
s();                        // 3

当然,如果 this 可以是一个函数的隐含输入,那么相同的对象环境就可以作为明确的实际参数发送:

function sum(ctx) {
    return ctx.x + ctx.y;
}

var context = {
    x: 1,
    y: 2
};

sum( context );

更简单。而且这种代码在 FP 中处理起来容易得多。当输入总是明确的时候,将多个函数组合在一起,或者使用我们将在下一章中学到的其他搬弄输入的技术都将简单得多。要使这些技术与 this 这样的隐含输入一起工作,在不同场景下要么很尴尬要么就是几乎不可能。

我们可以在一个基于 this 的系统中利用其他技巧,例如原型委托(也在“this 与对象原型”一书中有详细讲解):

var Auth = {
    authorize() {
        var credentials = this.username + ":" + this.password;
        this.send( credentials, resp => {
            if (resp.error) this.displayError( resp.error );
            else this.displaySuccess();
        } );
    },
    send(/* .. */) {
        // ..
    }
};

var Login = Object.assign( Object.create( Auth ), {
    doLogin(user,pw) {
        this.username = user;
        this.password = pw;
        this.authorize();
    },
    displayError(err) {
        // ..
    },
    displaySuccess() {
        // ..
    }
} );

Login.doLogin( "fred", "123456" );

注意: Object.assign(..) 是一个 ES6+ 工具,用于从一个或多个源对象向一个目标对象进行属性的浅赋值拷贝:Object.assign( target, source1, ... )

如果你解读这段代码有困难:我们有两个分离的对象 LoginAuthLogin 实施了向 Auth 的原型委托。通过委托与隐含的 this 上下文环境共享,这两个对象在 this.authorize() 函数调用中被虚拟地组合在一起,这样在 Auth.authorize(..) 函数中 this 上的属性/方法被动态地共享。

由于各种原因这段代码不符合 FP 的种种原则,但是最明显的问题就是隐含的 this 共享。我们可以使它更明确一些,保持代码可以更容易地向 FP 的方向靠拢:

// ..

authorize(ctx) {
    var credentials = ctx.username + ":" + ctx.password;
    Auth.send( credentials, function onResp(resp){
        if (resp.error) ctx.displayError( resp.error );
        else ctx.displaySuccess();
    } );
}

// ..

doLogin(user,pw) {
    Auth.authorize( {
        username: user,
        password: pw
    } );
}

// ..

从我的观点看,这其中的问题并不是使用了对象来组织行为。而是我们试图使用隐含输入取代明确输入。当我带上我的 FP 帽子时,我会想将 this 这东西留在衣架上。

总结

函数十分强大。

但我们要清楚什么是函数。它不只是一个语句/操作的集合。特别地,一个函数需要一个或多个输入(理想情况,只有一个!)以及一个输出。

函数内部的函数可以拥有外部变量的闭包,为稍后的访问记住它们。这是所有种类的编程中最重要的概念之一,而且是 FP 基础的基础。

要小心匿名函数,特别是箭头函数 =>。它们写起来方便,但是将作者的成本转嫁到了读者身上。我们学习 FP 的所有原因就是写出可读性更强的代码,所以先不要那么快就赶这个潮流。

不要使用 this 敏感的函数。别这么干。

上一篇:轻量函数式 JavaScript:一、为什么要进行函数式编程?


下一篇:网站常见问题1分钟定位(二)- 如何使用阿里云ARMS诊断Java服务端报错问题