Golang数据类型之切片

Golang数据类型之切片

1、切片介绍

Go中的切片slice依赖于数组,它的底层就是数组,所以数组具有的优点,slice都有。 且slice支持可以通过appendslice中追加元素,长度不够时会动态扩展,通过再次slice切片,可以得到得到更小的slice结构,可以迭代、遍历等

// runtime/slice.go
type slice struct {
    array unsafe.Pointer // 数组指针
    len   int // 长度 
    cap   int // 容量
}

每一个slice结构都由3部分组成:

  • 容量(capacity):即底层数组的长度,表示这个slice目前最多能扩展到的长度
  • 长度(length):表示slice当前的长度,即当前容纳的元素个数
  • 数组指针(array):指向底层数组的指针

比如创建一个长度为3,容量为5int类型的切片

s := make([]int, 3, 4)
fmt.Println(a, len(s), cap(s)) // [0 0 0] 3 5

2、声明和初始化

Go中可以通过多种方式创建和初始化切片

是否提前知道切片所需的容量通常会决定如何创建切片

2.1 make创建

// 创建一个整型切片, 其长度为 3 个元素,容量为 5 个元素
slice := make([]int, 3, 5)

// 我们也可以省略容量, 默认长度==容量
// 创建一个整型切片 其长度和容量都是 5 个元素
slice := make([]int, 5)

// 但是长度不能小于容量, 否则编译器过不了
// a := make([]int, 5, 3)

2.2 字面量创建

// 这种方法和创建数组类似,只是不需要指定[]运算符里的值。初始的长度和容量会基于初始化时提供的元素的个数确定
slice := []int{1,2,3}

// 和数组一样也可以通过指定索引初始化, 比如index 4 值为100
slice := []int{3: 100}

2.3 创建数组和切片的区别

如果在[]运算符里指定了一个值,那么创建的就是数组而不是切片,比如

a := [3]int{1,2,3}
b := []int{1,2,3}

虽然他们声明时只要这一点点区别,但是他们的数据结构区差别却很大,一个是引用类型一个是值类型

2.4 创建切片的本质

切片相关源码放置位置: src/runtime/slice.go, 我们使用make时, 实际上是调用的makeslice函数

// 这里一波操作过后返回的是slice的pointer
func makeslice(et *_type, len, cap int) unsafe.Pointer {}

3、切片访问

对切片里某个索引指向的元素赋值和对数组里某个索引指向的元素赋值的方法完全一样。使
[]操作符就可以改变某个元素的值,下面是使用切片字面量来声明切片

s := []int{1,2,3}
s[0]

// 但是不能越界访问, 比如
s[3] // panic: runtime error: index out of range [3] with length 3

查看切片长度: len

查看切片容量: cap

4、nil和空切片

声明未初始化的切片为nil

var s []int
var s1 []int
fmt.Printf("%p\n", s1)  // 0x0

make初始化的是一个空切片

s := make([]int,0)
// unsafe.Pointer ——> *slice
s2 := make([]int, 0)
fmt.Printf("%p\n", s2)  // 0x126c9

所以nil切片直接赋值是要报错的

var s []int
s[0] = 1 // panic: runtime error: index out of range [0] with length 0

5、切片中添加元素

通过append函数往切片中追加元素, 比如

s := make([]int, 0, 4)
s = append(s, 10, 20, 30, 40)

现在底层数组已经满了,再往里面追加元素会如何?

s = append(s,50)

函数append()会智能地处理底层数组的容量增长。在切片的容量小于1024个元素时,总是会成倍地增加容量。一旦元素个数超过1024,容量的增长因子会设为1.25,也就是会每次增加25%的容量(随着语言的演化,这种增长算法可能会有所改变)

因此扩容对于切片来说是一个比较消耗成本的事情,会开辟新的内存空间

扩容时是新创建一个切片数组,若原数据没有继续使用,会被gc

s1 := make([]int, 0, 4)
s1 = append(s1, 10, 20, 30, 40) // 10, 20, 30, 40
fmt.Println(s1, len(s1), cap(s1))  // [10 20 30 40] 4 4
s1 = append(s1, 50)
fmt.Println(s1, len(s1), cap(s1))  // [10 20 30 40 50] 5 8

6、通过切片创建切片

切片之所以被称为切片,是因为创建一个新的切片,也就是把底层数组切出一部分。通过切片创建新切片的语法如下, 详情请参考: 切片的语法

slice[low : high]
slice[low : high : max]
  • low : 表示从slic的第几个元素开始切
  • high : 控制切片的长度high-low
  • max : 控制切片的容量max-low

比如

s1 := []int{1, 2, 3, 4}
s2 := s1[2:4:4]  // [index2, index4) 左闭右开区间, 容量 4-2
fmt.Println(s2, len(s2), cap(s2)) // [3 4] 2 2

如果high == max也可以省略max,比如:

s3 := s1[2:4]

再次基础上还要几种省略写法:

  • 省略low:表示从 index 0开始
  • 省略high:表示到结尾len
  • 省略max :表示到结尾len
  • 都省略:等于复制
slice[i:]  // 从 i 切到最尾部
slice[:j]  // 从最开头切到 j(不包含 j)
slice[:]   // 从头切到尾,等价于复制整个 slice

注意: 通过切片创建出来的切片是共享底层数据结构的(数组)

共享底层数组会导致相互影响, 比如修改原切片会影响多所有复制出来的切片

s1 := []int{10, 20, 30, 40}
s2 := s1[1:3]
fmt.Println(s2, len(s2), cap(s2))

fmt.Println(s1[1], s2[0])
s1[1] = 200
fmt.Println(s1[1], s2[0])

有扩容的原理也可以知道,当扩容后,就不共享底层数组了,比如:

s1 := []int{10, 20, 30, 40}
s2 := s1[1:3:3]
fmt.Println(s2, len(s2), cap(s2))

fmt.Println(s1[1], s2[0])
s2 = append(s2, 30)   // s2 扩容
s1[1] = 200           // 修改s1
fmt.Println(s1[1], s2[0]) // s1修改并不会影响s2

因此,一般不要修改切片,如果要修改请使用后面的深拷贝复制一个全新的切片

7、切片遍历

切片是一个集合,可以迭代其中的元素。Go有个特殊的关键字range,它可以配合关键字for来迭代切片里的元素

func TestSliceAppend1(t *testing.T) {
	s := make([]int, 0, 4)
	s = append(s, 10, 20, 30, 40)
	for i, v := range s {
		fmt.Println(i, v)
	}
	/*
	0 10
	1 20
	2 30
	3 40
	 */
}

这种方式底层的实现,也是拷贝一份切片提供给循环使用,因此同样会带来开销

当迭代切片时,关键字range会返回两个值。第一个值是当前迭代到的索引位置,第二个值是该位置对应元素值的一份副本。需要强调的是,range创建了每个元素的副本,而不是直接返回对该元素的引用。要想获取每个元素的地址,可以使用切片变量和索引值

8、切片拷贝

不能像数组一样直接使用赋值语句来拷贝一个切片,因为数组是值,而切片是指针, 真正的数据维护在底层数组里面

a1 := [2]{1,2}
a2 := a1    // 值拷贝, a1, a2 互不影响

s1 := []{1, 2}
s2 := s1   // 指针拷贝 s1, s2 指向同一*slice结构体, 就是一个东西,等于没拷贝

Go内置的copy()函数可以将一个切片中的元素拷贝到另一个切片中,其函数声明为

func copy(dst, src []Type) int

它表示把切片src中的元素拷贝到切片dst中,返回值为拷贝成功的元素个数。如果srcdst长,就截断;如果srcdst短,则只拷贝src那部分

s1 := []int{10, 20, 30, 40}
s2 := make([]int, 5)
num := copy(s2, s1)   // 这时候s1 和 s2 就是2个切片,包含底层数据, 互不影响
fmt.Println(num)  // 4
fmt.Println(s1, s2)  // [10 20 30 40] [10 20 30 40 0]
s1[0] = 100
fmt.Println(s1[0], s2[0])  // 100 10

9、切片作为函数参数

函数在调用传参时,都是值拷贝

切片的本质是指针,如果是切片作为函数的参数调用,则拷贝的是指针的地址

因此切片作为函数的参数时,最大的好处是传递效率高

因此切片的用法远多于数组,数组用来定义底层的数据结构

func TestSliceMain2(t *testing.T) {
	s1 := make([]int, 0, 4)
	s1 = append(s1, 10, 20, 30, 40) // 10, 20, 30, 40
	fmt.Println(Sum1(s1))  // 100
}

func Sum1(args []int) int {
	sum := 0
	for _, v := range args {
		sum += v
	}
	return sum
}

Golang数据类型之切片

上一篇:sublime 3同步编辑线上代码


下一篇:ansible恢复copy备份文件