JS:数组去重的多种方法总结与一步步优化

两层for循环

这种函数的优点是兼容性好比较通用,缺点是时空复杂度都很直观的为O(n2),不利于维护和性能。

var array = [1,1,'1','1']
function unique(array) {
    var res = []
    for (var i=0,arrlen=array.length;i<arrlen;i++) {
        for (var j = 0,reslen=res.length;j<reslen;j++) {
            if (array[i] === res[j]) {
                break
            }
        }
        if (j === reslen) {
            res.push(array[i])
        }
    }
    return res
}
console.log(unique(array)) //[1,'1']

indexOf()

通过 indexOf 简化内层代码,优化上一 两层for循环 方法。

var array = [1,1,'1','1']
function unique(array) {
    var res = []
    for (var i=0,len=array.length;i<len;i++) {
        var current = array[i]
        if (res.indexOf(current) === -1) {
            res.push(current)
        }
    }
    return res
}
console.log(unique(array)) // [1,'1']

filter()

通过 filter 简化外层循环,优化上一 indexof 方法。

var array = [1,2,1,1,'1']
function unique(array) {
    var res = array.filter(function(item,index,array) {
        return array.indexOf(item) === index
    })
    return res
}
console.log(unique(array)) // [1,2,'1']

Object键值对

  1. 通过 filter 为数组的每一个元素做条件过滤。
  2. 再通过 三元运算 将数组的元素作为key登录在obj中,将它对应的值设为true。
  3. 通过 hasOwnProperty 判断对象是否包含某一属性(键),如果包含即返回false, filter 接收到false将会过滤掉该 item (array[index]) 的return事件。
var array1 = [1,2,1,2,1]
var array2 = [1, 2, 1, 1, '1'];
function unique(array) {
    var obj = {}
    return array.filter(function(item, index, array){
        return obj.hasOwnProperty(item) ? false : (obj[item] = true)
    })
}
console.log(unique(array1)) //[1,2]
console.log(unique(array2)) // [1, 2]
  • 缺点:由于Object的键只能是String类型,因此 obj[1] 与 obj['1'] 是等价的,它们引用同一个堆栈,最终在第二数组实参中 1 和 '1' 被去重为同一个元素。

typeof()

上一个方法说到Object的键只能是String类型,所以我们可以通过 typeof item + item 的方式拼成一个字符串,来作为 hasOwnProperty 的判断依据:

var array = [1,2,1,1,'1']
function unique(array) {
    var obj = {}
    return array.filter(function(item,index,array) {
        return obj.hasOwnProperty(typeof item+item)?false:(obj[typeof item+item] = true)
    })
}
console.log(unique(array)) //[1,2,'1']

array[0]和array[4]分别被 typeof 拼接成 "number1" 和 "string1",很好的区分了不同类型转字符串后的区别。

但是如果数组中存在对象,比如[ { name: 97 }, { descript: 'z' } ],由于 typeof item + item 的结果都会是 object[object Object] (String类型),所以除了数组中的第一个对象,所有的对象都会被过滤。

JSON.stringify()

上一方法说到 typeof item + item 两个拥有不同键值对的对象都会返回object[object Object],所以我们可以使用 JSON.stringify() 将对象序列化来避免相同的键值对。

var array = [1,1,2,2,'1',{value: 1}, {value: 1}, {value: 2}]
function unique(array) {
    var obj = {}
    return array.filter(function(item, index, array){
        console.log(typeof item + JSON.stringify(item))
        return obj.hasOwnProperty(typeof item + JSON.stringify(item)) ? false : (obj[typeof item + JSON.stringify(item)] = true)
    })
}
console.log(unique(array)) // [1,2,'1',{value: 1}, {value: 2}]

obj[typeof item + JSON.stringify(item)] 中假设item是object类型,就会被格式化成JSON字符串,即可区分两个不同的object。

Array.from()

根据MDN描述:

 Array.from() 方法从一个类似数组或可迭代对象创建一个新的,浅拷贝的数组实例。(赋值、浅拷贝、深拷贝的方法会在后面的文章详解)

ES6 - Set()

 Set 对象是ES6中的新数据结构,根据MDN描述:

Set对象是值的集合,你可以按照插入的顺序迭代它的元素。 Set中的元素只会出现一次,即 Set 中的元素是唯一的。

也就是说,Set对象类似于数组,但是成员的值都是唯一的,没有重复的值。那么借助于Set,数组去重将变得异常简单:

var array = [1, 2, 1, '1']
function unique(array) {
   return Array.from(new Set(array))
}
console.log(unique(array)) // [1, 2, "1"]

ES6 - Array.prototype.Map()

 Map() 在参数上和 filter() 类似,可以通过它来改写 unique().

var array = [1, 2, 1, '1'];
function unique(array) {
    const seen = new Map()
    return array.filter(function(item,index,array) {
        return !seen.has(item) && seen.set(item,1)
    })
}
console.log(unique(array)) //[1,2,'1']

总结

如果有这样一个数组

var array = [1, 1, '1', '1', null, null, undefined, undefined, new String('1'), new String('1'), /a/, /a/, NaN, NaN];

用不同的方法对其去重,来查看方法的兼容性:

方法 结果 说明
for循环 [1, "1", null, undefined, String, String, /a/, /a/, NaN, NaN] 对象和 NaN 不去重
indexOf [1, "1", null, undefined, String, String, /a/, /a/, NaN, NaN] 对象和 NaN 不去重
filter+indexOf [1, "1", null, undefined, String, String, /a/, /a/] 对象不去重 NaN 会被忽略掉
对象键值对去重 [1, "1", null, undefined, String, /a/, NaN] 全部去重
Set对象去重 [1, "1", null, undefined, String, String, /a/, /a/, NaN] 对象不去重 NaN 去重

相关资源:JS数组去重方法总结.

- END -

上一篇:Redis新数据类型


下一篇:数组去重