slice数据结构#

数据结构我们每定义一个slice变量，golang底层都会构建一个slice结构的对象。slice结构体由3个成员变量构成：

array表示数组指针，数组用于存储数据。 len表示切片长度，也就是数组index从0到len-1已存储数据。 cap表示切片容量，当切片长度超过最大容量时，需要扩容申请更大长度的数组。

1
type slice struct {
2
    array unsafe.Pointer // 数组指针
3
    len   int // 切片长度
4
    cap   int // 切片容量
5
}

扩容原理#

切片的扩容流程源码位于 runtime/slice.go 文件的 growslice 方法当中，其中核心步骤如下：

• 倘若扩容后预期的新容量小于原切片的容量，则 panic

• 倘若切片元素大小为 0（元素类型为 struct{}），则直接复用一个全局的 zerobase 实例，直接返回

• 倘若预期的新容量超过老容量的两倍，则直接采用预期的新容量

• 倘若老容量小于 256，则直接采用老容量的2倍作为新容量

• 倘若老容量已经大于等于 256，则在老容量的基础上扩容 1/4 的比例并且累加上 192 的数值，持续这样处理，直到得到的新容量已经大于等于预期的新容量为止

• 结合 mallocgc 流程中，对内存分配单元 mspan 的等级制度，推算得到实际需要申请的内存空间大小

• 调用 mallocgc，对新切片进行内存初始化

• 调用 memmove 方法，将老切片中的内容拷贝到新切片中

• 返回扩容后的新切片

1
// nextslicecap computes the next appropriate slice length.
2
func nextslicecap(newLen, oldCap int) int {
3
 newcap := oldCap // 将新容量初始化为旧容量
4
 doublecap := newcap + newcap // 计算旧容量的两倍
5

6
 // 如果所需的新长度大于旧容量的两倍，则直接使用所需的新长度
7
 if newLen > doublecap {
8
  return newLen
9
 }
10

11
 const threshold = 256 // 定义一个阈值，用于区分小切片和大切片
12

13
 // 如果旧容量小于阈值，则直接将新容量设置为旧容量的两倍
14
 // 这种策略适用于小切片，可以快速扩容，减少扩容次数
15
 if oldCap < threshold {
16
  return doublecap
17
 }
18

19
 // 对于大切片，使用更平滑的扩容策略，避免过度分配内存
20
 // 从 2 倍增长过渡到 1.25 倍增长。 此公式给出了两者之间的平滑过渡。
21
 for {
22
  // 每次循环，将新容量增加 (newcap + 3*threshold) / 4
23
  // 相当于 newcap 增加 1/4 的比例，再加上 3/4 的 threshold(256)，即 192
24
  // 这样可以在一定程度上减少内存浪费，并保证切片的增长
25
  newcap += (newcap + 3*threshold) >> 2
26

27
  // Check for overflow and determine if the new calculated capacity
28
  // is greater or equal to the required new length.
29
  // newLen is guaranteed to be larger than zero, hence
30
  // when newcap overflows then `uint(newcap) > uint(newLen)`.
31
  // This allows to check for both with the same comparison.
32

33
  // 我们需要检查`newcap >= newLen`以及`newcap`是否溢出。
34
  // 保证 newLen 大于零，因此当 newcap 溢出时，'uint(newcap) > uint(newLen)'。
35
  // 这允许使用相同的比较来检查两者。
36

37
  // 检查新容量是否大于等于所需的新长度，并且检查是否发生了溢出
38
  if uint(newcap) >= uint(newLen) {
39
   break // 如果新容量足够大，或者发生了溢出，则退出循环
40
  }
41
 }
42

43
 // 当新容量计算溢出时，将新容量设置为请求的容量。
44
 // 如果计算过程中发生了溢出，则直接将新容量设置为所需的新长度，以确保切片能够容纳所有元素
45
 if newcap <= 0 {
46
  return newLen
47
 }
48

49
 return newcap // 返回计算得到的新容量
50
}

Golang 切片原理#

扩容规律#

切片作为参数#

Go 语言的函数参数传递，只有值传递，没有引用传递，切片作为参数也是如此

我们来验证这一点

1
package main
2

3
import "fmt"
4

5
func main() {
6
 sl := []int{6, 6, 6}
7
 f(sl)
8
 fmt.Println(sl)
9
}
10

11
func f(sl []int) {
12
 for i := 0; i < 3; i++ {
13
  sl = append(sl, i)
14
 }
15
 fmt.Println(sl)
16
}

可以看到，输出的 sl 的值是不一样的，也就是说，f 函数没能修改主函数中的 sl 变量，而只是修改了形参 sl 变量的内容

当我们传递一个切片给函数的时候，函数接收到的其实是这个切片的一个副本，但是他们的 array 字段指向的是同一个底层数组。

这意味着，如果我们修改底层数组，是会影响到实参和形参的。

我们看下面的例子：形参通过改变底层数组影响实参

1
package main
2

3
import "fmt"
4

5
func main() {
6
 sl := []int{6, 6, 6}
7
 f(sl)
8
 fmt.Println(sl)
9
}
10

11
func f(sl []int) {
12
 sl[1] = 1
13
 sl[2] = 2
14
}

通过指针传递影响实参#

1
package main
2

3
import "fmt"
4

5
func main() {
6
 sl := []int{6, 6, 6}
7
 f(&sl)
8
 fmt.Println(sl)
9
}
10

11
func f(sl *[]int) {
12
 *sl = append(*sl, 200)
13
}