当前位置:首页 > 短网址资讯 > 正文内容

Golang Slice 的一些事

www.ft12.com4年前 (2017-07-21)短网址资讯1077

女主宣言

使用 Golang 编程时,常会使用到一个数据结构 —— Slice,这篇文带大家看看 Slice 具体的数据结构以及常用手法。

PS:丰富的一线技术、多元化的表现形式,尽在“HULK一线技术杂谈”,点关注哦!

1. Slice 数据结构



首先,直接从源码$YOUR_GO_DIR/src/runtime/slice.go(其中$YOUR_GO_DIR指你自己go源代码的根目录)中找到定义的slice结构,如下:

type slice struct {
   // 任意类型指针(类似C语言中的 void* ), 指向实际存储slice数据的数组    array unsafe.Pointer    len   int // length, 长度    cap   int // capacity, 容量 }

从结构很好看出,通过make()函数(比如:make([]int, 10, 20))创建出来的slice,其实就是由两部分组成:slice的"描述"(上面的结构体) + 存储数据的数组(指针指向的数组)

备注:后文将使用SliceHeader代替上面的结构体,SliceHeader是Rob PikeGolang/slices博文中暂用来指代的名词,这里我也借用一下。为了方便理解,把slice拆成 SliceHeader + 存储数据的数组 两部分。


2. 使用 Slice 须知 



2.1 值传递下的Slice

我们知道Go的参数是值传递,那么这里有个问题需要考虑: 当把一个slice变量通过参数传递给某函数时,传的是SliceHeader、还是整个SliceHeader+数据(存储数据的数组)都被复制过去?

比如,这样的代码:

s := make([]string, 10)  
saveSlice(s)

当我们在项目中某个slice有10万元素,如果传参数直接复制SliceHeader + 数据,那么这是一定不能接受的。

Rob Pike有这样一句话定义Slice: slice不是数组,它是对数组进行了描述(A slice is not an array. A slice describes a piece of an array)。 实际上,在上面的代码片段中saveSlice(s)接收到的是变量s的一个副本(就是一个值跟s一样,但是是全新的变量),这个副本跟变量s一样,有一个指向同个数组的指针、len和cap相同值。

为什么?因为Go是值传递,简单试验就知道。

实验一:如果slice变量参数传递,是复制了数据,那么在函数中操作"被复制过来的"数据,不会对原数据造成影响。

// 代码片段
data := make([]int, 10)
fmt.Println("处理前数据: ", data)
changeIndex0(data)
fmt.Println("处理后数据: ", data)

函数 changeIndex0(data []int)

// 替换第一个元素的值
func changeIndex0(data []int)  {
    data[0] = 99
}

实验结果

处理前数据:  [0 0 0 0 0 0 0 0 0 0]
处理后数据:  [99 0 0 0 0 0 0 0 0 0]

显然,从结果中看得出,原始数据被修改了,所以可以得出结论是:传递slice变量时,并不是复制真正存储数据的数组进行传递。

所以,在实际项目中,直接传递slice变量与传递slice变量的指针,对内存的消耗区别并不是很大。一个SliceHeader的大小是24字节,而指针大小8字节。

备注: SliceHeader 24字节计算方式:8字节(指针) + 8字节(整型int, len) + 8字节(整型int, cap),这是以我自己电脑为例(64位),指针大小8字节;整型int大小也跟编译器有关,但Golang中最少是32bit,我在本机使用unsafe.SizeOf()实测是8字节。

2.2 Slice截取和扩充

说到底,slice由SliceHeader和数组构成。涉及到数组,避不开的问题就是定长,也就是一旦数组长度确定了就无法改变。如果非要改变长度,那只能一个办法:重新分配一个新的数组。

对于slice也一样,如果一个slice已经确定了容量(capacity),那么如果要扩充该slice的容量,也必须重新分配一个存数据的数组。

备注:slice的容量在使用make([]byte, 10, 20)时,第三个参数已经确定;第三个参数就是容量(capacity),如果不指定,默认跟第二个参数(长度len)一样。


i. 截取子Slice


当基于原Slice进行截取子Slice时,实际上操作的还是原Slice的元素。也就是对子Slice的元素进行修改,都会在原Slice中体现。

实验 二:操作从原 Slice 截取而获得的子 Slice

// 代码片段
data := make([]int, 10)
fmt.Println("处理前数据: ", data, len(data), cap(data))
subSlice(data)
fmt.Println("处理后数据: ", data, len(data), cap(data))

函数 subSlice(data []int)

// 截取slice
func subSlice(data []int)  {
    data[0] = 99
    data = data[0:8]
    fmt.Println("函数中数据: ", data, len(data), cap(data))
}

实验结果

处理前数据:  [0 0 0 0 0 0 0 0 0 0] 10 10
函数中数据:  [99 0 0 0 0 0 0 0] 8 10
处理后数据:  [99 0 0 0 0 0 0 0 0 0] 10 10

从实验结果可以看出,在Slice的容量(capacity)范围内子Slice截取,是直接使用了原Slice的数组,并没有为该子Slice分配新的数组。

如果我需要截取一个子Slice并且希望该子Slice有新的数组,该怎么操作?这是可以使用copy()函数。

sub := make([]int, 2)
copy(sub, data[3:5])
ii. 扩充Slice


事实上,扩充Slice的操作就是:重新创建一个更大容量的Slice,然后把原Slice中的数据复制到新的Slice里面。

比如:常用操作append()

fmt.Printf("append()前: len: %d, cap: %d \n", len(data), cap(data))
data = append(data, 5)
fmt.Printf("append()后: len: %d, cap: %d \n", len(data), cap(data))

结果

append()前: len: 10, cap: 10 
append()后: len: 11, cap: 20

append()中的操作就是新建了一个容量为原来两倍的Slice,然后把原来的数据复制到新Slice并且把新的元素加上。

3. Slice 常用操作函数


Go提供了方便操作的语法糖,如: data[2:5],以此来获取第二到第四(包括第四)个元素。

备注: ':' 左右都可以不指定值。右边的值不可以超过该Slice的容量大小,否则会Panic。

3.1 copy() 复制Slice的值到另外一个Slice,上面例子也用到了,这函数会自动参考len更小的那个Slice,不会发生报slice bounds out of range的异常。

3.2 append()给某个Slice添加元素,也是常用的,上面的例子也有体现。

4. 其他


4.1 关于string

从源码包runtimestring.go中可以看到字符串的struct。

type stringStruct struct {
    str unsafe.Pointer
    len int
}

也就是,string实际上就是只读的byte切片(Slice),只是从Golang语言层面提供的语法支持而已。因为只能读,所以容量的存在与否都无济于事。

4.2 关于Slice nil

我们知道make()方法专门用来新建Slice、map、chan,但是我们也可以用new()来建Slice,但是两者有区别。

// 代码片段
nilSlice := new([]int)
fmt.Printf("nilSlice is nil: %v \n", *nilSlice == nil)
emptySlice := make([]int, 0)
fmt.Printf("emptySlice is nil: %v \n", emptySlice == nil)

结果打印

nilSlice is nil: true 
emptySlice is nil: false

也就是用new()创建后的Slice变量是零值,而make()创建一个0长度的Slice并不是nil。

为什么?因为new() 和 make()做的事情不一样。

new()做了两件事

  • 为该类型分配内存

  • 置零值(不同类型的零值不一样,比如: bool是false,整型是0...等)

make()也做了两件事

  • 为该类型分配内存

  • 初始化

以Slice为例,new([]int)得到的SliceHeader是:

sliceHeader {
    array: nil,
    len: 0,
    cap: 0,
}

make([]int, 0)得到的SliceHeader应该是:

sliceHeader {
    array: 0x8201d0140, // 指向0个元素的数组
    len: 0,
    cap: 0,
}

5. 结语


从Slice的实现、使用场景进行更加全面的了解,会对在项目中的使用有更大的帮助以及尽量避免因为不知道细节而错用。


参考:

扫描二维码推送至手机访问。

版权声明:本文由短链接发布,如需转载请注明出处。

本文链接:https://www.ft12.com/article_316.html

分享给朋友:

相关文章

人生两件事:修炼定力,扩展心量

人生两件事:修炼定力,扩展心量

自然环保是术,心灵环保是道。既要在术上做文章,更要在道上下功夫。双管齐下,才能从根本上解决环境污染问题。升起过,发光过,温煦过,这就够了;云遮过,风吹过,雨淋过,又能怎样?旭日就是旭日。对未知世界,我一是好奇,二是恐惧。因为好奇,我有探索未...

如何将微信公众号文章的复杂网址生成短网址

FT12短网址的小编分享一下微信公众号运营的一些小技巧。微信公众号的地址非常长,所以需要将网址缩短发送到一切讨论组或者朋友圈,这样会更好看一些,也避免由于网址过长导致的分行截断而不能点击打开的窘境。方法一:利用腾讯的短地址服务优先推荐腾讯的...

Cassandra 初学者指南

Cassandra 初学者指南

本文是一篇科普文,适合 Cassandra 的初学者。 基本介绍 Apache Cassandra 是一种分布式非关系型数据库,具有高性能、可扩展、无中心化等特征。Cassandra 是适用于社交网络业务场景的数据...

通过谷歌搜索引擎挖掘细分市场的一个案例

通过谷歌搜索引擎挖掘细分市场的一个案例

【FT12短网址资讯】这篇文章篇幅较长,无阅读门槛,比较适合想兼职赚点零花钱的程序员、想找场景学习编程的小伙伴以及没有创业点子的兄弟。全文4000字,完好读完大概需求10分钟。理论上来说,假如咱们仅仅是想赚点小钱,而不是想像马云爸爸一样经过...

短网址服务运营中遇到的一些难题

FT12短网址运营已经6年了,从2011年的某一天开始到今天2018年8月15日。在这么多的日日夜夜中,我们力争保证所有用户的短网址能稳定、快速、有效,这对于一个几千万级别的数据库来说真的不是一件很简单的事情。大概在2012年,短网址运营一...

有赞支付微服务实践

有赞支付微服务实践

有赞技术发展历程2014年公司所有业务(交易,商品,ump,支付等等)都在一个单体应用中完成,使用php开发,满足了公司快速发展(我们姑且称为v1.0)。2015年到2016期间,随着业务流量增长,现有架构模式遇到了挑战,公司开始朝着业务拆...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。