当前位置:首页 > 短网址资讯 > 正文内容

Golang Slice 的一些事

www.ft12.com8年前 (2017-07-21)短网址资讯2059

女主宣言

使用 Golang 编程时,常会使用到一个数据结构 —— Slice,这篇文带大家看看 Slice 具体的数据结构以及常用手法。

PS:丰富的一线技术、多元化的表现形式,尽在“HULK一线技术杂谈”,点关注哦!

1. Slice 数据结构



首先,直接从源码$YOUR_GO_DIR/src/runtime/slice.go(其中$YOUR_GO_DIR指你自己go源代码的根目录)中找到定义的slice结构,如下:

type slice struct {
   // 任意类型指针(类似C语言中的 void* ), 指向实际存储slice数据的数组    array unsafe.Pointer    len   int // length, 长度    cap   int // capacity, 容量 }

从结构很好看出,通过make()函数(比如:make([]int, 10, 20))创建出来的slice,其实就是由两部分组成:slice的"描述"(上面的结构体) + 存储数据的数组(指针指向的数组)

备注:后文将使用SliceHeader代替上面的结构体,SliceHeader是Rob PikeGolang/slices博文中暂用来指代的名词,这里我也借用一下。为了方便理解,把slice拆成 SliceHeader + 存储数据的数组 两部分。


2. 使用 Slice 须知 



2.1 值传递下的Slice

我们知道Go的参数是值传递,那么这里有个问题需要考虑: 当把一个slice变量通过参数传递给某函数时,传的是SliceHeader、还是整个SliceHeader+数据(存储数据的数组)都被复制过去?

比如,这样的代码:

s := make([]string, 10)  
saveSlice(s)

当我们在项目中某个slice有10万元素,如果传参数直接复制SliceHeader + 数据,那么这是一定不能接受的。

Rob Pike有这样一句话定义Slice: slice不是数组,它是对数组进行了描述(A slice is not an array. A slice describes a piece of an array)。 实际上,在上面的代码片段中saveSlice(s)接收到的是变量s的一个副本(就是一个值跟s一样,但是是全新的变量),这个副本跟变量s一样,有一个指向同个数组的指针、len和cap相同值。

为什么?因为Go是值传递,简单试验就知道。

实验一:如果slice变量参数传递,是复制了数据,那么在函数中操作"被复制过来的"数据,不会对原数据造成影响。

// 代码片段
data := make([]int, 10)
fmt.Println("处理前数据: ", data)
changeIndex0(data)
fmt.Println("处理后数据: ", data)

函数 changeIndex0(data []int)

// 替换第一个元素的值
func changeIndex0(data []int)  {
    data[0] = 99
}

实验结果

处理前数据:  [0 0 0 0 0 0 0 0 0 0]
处理后数据:  [99 0 0 0 0 0 0 0 0 0]

显然,从结果中看得出,原始数据被修改了,所以可以得出结论是:传递slice变量时,并不是复制真正存储数据的数组进行传递。

所以,在实际项目中,直接传递slice变量与传递slice变量的指针,对内存的消耗区别并不是很大。一个SliceHeader的大小是24字节,而指针大小8字节。

备注: SliceHeader 24字节计算方式:8字节(指针) + 8字节(整型int, len) + 8字节(整型int, cap),这是以我自己电脑为例(64位),指针大小8字节;整型int大小也跟编译器有关,但Golang中最少是32bit,我在本机使用unsafe.SizeOf()实测是8字节。

2.2 Slice截取和扩充

说到底,slice由SliceHeader和数组构成。涉及到数组,避不开的问题就是定长,也就是一旦数组长度确定了就无法改变。如果非要改变长度,那只能一个办法:重新分配一个新的数组。

对于slice也一样,如果一个slice已经确定了容量(capacity),那么如果要扩充该slice的容量,也必须重新分配一个存数据的数组。

备注:slice的容量在使用make([]byte, 10, 20)时,第三个参数已经确定;第三个参数就是容量(capacity),如果不指定,默认跟第二个参数(长度len)一样。


i. 截取子Slice


当基于原Slice进行截取子Slice时,实际上操作的还是原Slice的元素。也就是对子Slice的元素进行修改,都会在原Slice中体现。

实验 二:操作从原 Slice 截取而获得的子 Slice

// 代码片段
data := make([]int, 10)
fmt.Println("处理前数据: ", data, len(data), cap(data))
subSlice(data)
fmt.Println("处理后数据: ", data, len(data), cap(data))

函数 subSlice(data []int)

// 截取slice
func subSlice(data []int)  {
    data[0] = 99
    data = data[0:8]
    fmt.Println("函数中数据: ", data, len(data), cap(data))
}

实验结果

处理前数据:  [0 0 0 0 0 0 0 0 0 0] 10 10
函数中数据:  [99 0 0 0 0 0 0 0] 8 10
处理后数据:  [99 0 0 0 0 0 0 0 0 0] 10 10

从实验结果可以看出,在Slice的容量(capacity)范围内子Slice截取,是直接使用了原Slice的数组,并没有为该子Slice分配新的数组。

如果我需要截取一个子Slice并且希望该子Slice有新的数组,该怎么操作?这是可以使用copy()函数。

sub := make([]int, 2)
copy(sub, data[3:5])
ii. 扩充Slice


事实上,扩充Slice的操作就是:重新创建一个更大容量的Slice,然后把原Slice中的数据复制到新的Slice里面。

比如:常用操作append()

fmt.Printf("append()前: len: %d, cap: %d \n", len(data), cap(data))
data = append(data, 5)
fmt.Printf("append()后: len: %d, cap: %d \n", len(data), cap(data))

结果

append()前: len: 10, cap: 10 
append()后: len: 11, cap: 20

append()中的操作就是新建了一个容量为原来两倍的Slice,然后把原来的数据复制到新Slice并且把新的元素加上。

3. Slice 常用操作函数


Go提供了方便操作的语法糖,如: data[2:5],以此来获取第二到第四(包括第四)个元素。

备注: ':' 左右都可以不指定值。右边的值不可以超过该Slice的容量大小,否则会Panic。

3.1 copy() 复制Slice的值到另外一个Slice,上面例子也用到了,这函数会自动参考len更小的那个Slice,不会发生报slice bounds out of range的异常。

3.2 append()给某个Slice添加元素,也是常用的,上面的例子也有体现。

4. 其他


4.1 关于string

从源码包runtimestring.go中可以看到字符串的struct。

type stringStruct struct {
    str unsafe.Pointer
    len int
}

也就是,string实际上就是只读的byte切片(Slice),只是从Golang语言层面提供的语法支持而已。因为只能读,所以容量的存在与否都无济于事。

4.2 关于Slice nil

我们知道make()方法专门用来新建Slice、map、chan,但是我们也可以用new()来建Slice,但是两者有区别。

// 代码片段
nilSlice := new([]int)
fmt.Printf("nilSlice is nil: %v \n", *nilSlice == nil)
emptySlice := make([]int, 0)
fmt.Printf("emptySlice is nil: %v \n", emptySlice == nil)

结果打印

nilSlice is nil: true 
emptySlice is nil: false

也就是用new()创建后的Slice变量是零值,而make()创建一个0长度的Slice并不是nil。

为什么?因为new() 和 make()做的事情不一样。

new()做了两件事

  • 为该类型分配内存

  • 置零值(不同类型的零值不一样,比如: bool是false,整型是0...等)

make()也做了两件事

  • 为该类型分配内存

  • 初始化

以Slice为例,new([]int)得到的SliceHeader是:

sliceHeader {
    array: nil,
    len: 0,
    cap: 0,
}

make([]int, 0)得到的SliceHeader应该是:

sliceHeader {
    array: 0x8201d0140, // 指向0个元素的数组
    len: 0,
    cap: 0,
}

5. 结语


从Slice的实现、使用场景进行更加全面的了解,会对在项目中的使用有更大的帮助以及尽量避免因为不知道细节而错用。


参考:

扫描二维码推送至手机访问。

版权声明:本文由短链接发布,如需转载请注明出处。

本文链接:https://www.ft12.com/article_316.html

分享给朋友:

相关文章

一次MySQL5.7线上故障分析

一次MySQL5.7线上故障分析

坑都是踩出来的。MySQL 5.7 GA已经有很长一段时间了,经过测试评估,在5.7.16版本release之后,我们开始在生产线上规模部署,一个多月相安无事,心中窃喜,在部署了大约200+实例之后,天有不测风云,故障开始接二连三。某日,一...

群殴百度之后,谁才能改写BAT的阵营?

6月26日,京东收盘价43.08元,总市值611.49亿美金,已很接近百度同期的总市值619.73亿美金,“JAT”在喧嚣中被提出。在BAT的阵营之中,不管是从营收和市值的角度,还是从业务发展的趋势,支付宝和微信都享有更大市场份额、更高增长...

细数互联网产品的开放策略:微信与支付宝走上相反的路子

小早说:开放不仅仅是一种策略,更是一种能力,不仅有取,更重要的是舍。带着合作方一起共赢,才是更好的选择。  “开放”一直以来都是互联网公司做到一定的量级之后必经的产物,从BAT、TMD到一些新锐企业,都在提开放战略。移动互联网发展到现在这个...

实战Guzzle抓取

虽然早就知道很多人用 Guzzle 爬数据,但是我却从来没有真正实践过,因为在我的潜意识里,抓取是 Python 的地盘。不过前段时间,当我抓汽车之家数据的时候,好心人跟我提起 Goutte 搭配 G...

摩拜用100%确保用户押金安全来回应交通部新政

交通运输部于昨天发布《对于鼓舞和标准互联网租赁自行车开展的指导定见》(征求定见稿),请求同享单车企业对用户押金施行“即租即押、即还即退”的形式,并鼓舞同享单车企业免押金提供效劳。摩拜单车今天对此作出回应。摩拜单车回应称,该定见稿表现了政府办...

HTTP的长连接和短连接

HTTP的长连接和短连接

 本文总结&分享网络编程中涉及的长连接、短连接概念。    关键字:Keep-Alive,并发连接数限制,TCP,HTTP一、什么是长连接     HTTP1.1...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。