百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Map的底层实现 & 为什么遍历Map总是乱序的

mhr18 2024-11-13 11:07 22 浏览 0 评论

Golang中Map的底层结构

其实提到Map,一般想到的底层实现就是哈希表,哈希表的结构主要是Hashcode + 数组。

  • 存储kv时,首先将k通过hashcode后对数组长度取余,决定需要放入的数组的index
  • 当数组对应的index已有元素时,此时产生一个【哈希冲突】。一般来说哈希冲突的解决方式为链表法,即在冲突的位置生成一个链表来存储元素

转自:https://www.jianshu.com/p/7aafee109f28

参考:go语言中文文档:www.topgoer.com

对于哈希表的具体实现和哈希冲突的解决方案这里就不赘述了,大家可以去看大神程序员小灰的漫画:什么是HashMap?。

Redis中的Dict结构(用于实现RedisDB、Hashmap,Set等)其实就是非常典型的哈希表。Golang中的Map结构与传统的哈希表稍有不同,它数组的基本单元并不是kv对,而是bucket。


每个bucket中可以放置8个kv对,这样可以减少对象的数量,有利于提升GC的性能;当bucket中放置不下时,会继续在溢出桶(overflow)中继续存储,串成一个链表的结构,如图所示:

链表法解决哈希冲突

Bucket中结构详解

// map 哈希表
type Hmap struct{
         count int // 元素数量
         ....
         B uint8 // 哈希表数组的容量大小=2^B
         ...
         buckets unsafe.Pointer
         oldBuckets unsafe.Pointer // 用于扩容
         ...
}

// Bucket 桶
type bmap struct{
    tophash [8]uint8 // 哈希值的高8位
    keys
        values 
    overflow *bmap
}
  1. key的哈希值的低B位(比如数组大小为32,2^5=32,则B=5)决定了它放入buckets中的index位置
  2. key的哈希值的高8位放入bucket中的tophash字段中,因为每个bucket中最多可以放8个KV对,所以tophash为大小为8的数组:tophash字段可以用于加速key的比较,当在一个bucket中查询某key时,可以先比较哈希值的高8位是否符合,如果符合才会比较对应的key,这样加速了key比较的过程;
  3. keys和values为分开存储的,因为key和value可能是不同类型,比如map[int64]int8,分开存储不需要进行字节补齐,可以节省空间;
  4. overflow即溢出桶,用于存储哈希冲突后超过8对的kv对

扩容操作

负载因子=元素数量/数组大小
redis是1时扩容;golang因为数组中元素为bucket,每个bucket可以放8个kv,所以是在load factor = 6.5时才会触发扩容逻辑:

  1. 扩容时容量翻倍,申请一个新的数组,采用渐进式哈希的方式进行迁移(和redis类似,可以避免影响性能)
  2. 迁移过程中支持读写:
  • 新增kv只写新表
  • 修改和删除双写,保证新老表中的数据一致
  • 读取时优先读老表,再读新表
  1. 迁移过程为每次update/remove操作时触发部分搬迁,每次搬迁2部分bucket中的数据:
  • 修改的key所在的当前Bucket
  • 按照顺序搬迁的一个Bucket(避免某些bucket一直未被访问导致无法搬迁成功)
  1. 直到所有数据搬迁完成后,删除oldBuckets,使得老哈希表中的Bucket对象被GC回收

遍历Map乱序之谜

在写代码时,当我们使用for k,v := range map {} 时会发现,每次输出的kv都是乱序的,既然map的底层是数组为什么不能按照固定顺序地输出呢?

结合上文我们说到扩容流程,由于扩容过程会新申请一个数组,并且将keys重新rehash后放入新的数组中。那么新的数组中的key的顺序就改变了,因此哈希表的底层实现使得map无法保证稳定地按照同一顺序输出keys。

Golang的作者为了”提醒“新手程序员不要依赖map遍历时返回的key顺序,采用随机选择遍历起始位置的方式使得遍历时返回是乱序的。

相关推荐

Dubai's AI Boom Lures Global Tech as Emirate Reinvents Itself as Middle East's Silicon Gateway

AI-generatedimageAsianFin--Dubaiisrapidlytransformingitselffromadesertoilhubintoaglob...

OpenAI Releases o3-pro, Cuts o3 Prices by 80% as Deal with Google Cloud Reported to Make for Compute Needs

TMTPOST--OpenAIisescalatingthepricewarinlargelanguagemodel(LLM)whileseekingpartnershi...

黄仁勋说AI Agent才是未来!但究竟有些啥影响?

,抓住风口(iOS用户请用电脑端打开小程序)本期要点:详解2025年大热点你好,我是王煜全,这里是王煜全要闻评论。最近,有个词被各个科技大佬反复提及——AIAgent,智能体。黄仁勋在CES展的发布...

商城微服务项目组件搭建(五)——Kafka、Tomcat等安装部署

1、本文属于mini商城系列文档的第0章,由于篇幅原因,这篇文章拆成了6部分,本文属于第5部分2、mini商城项目详细文档及代码见CSDN:https://blog.csdn.net/Eclipse_...

Python+Appium环境搭建与自动化教程

以下是保姆级教程,手把手教你搭建Python+Appium环境并实现简单的APP自动化测试:一、环境搭建(Windows系统)1.安装Python访问Python官网下载最新版(建议...

零配置入门:用VSCode写Java代码的正确姿

一、环境准备:安装JDK,让电脑“听懂”Java目标:安装Java开发工具包(JDK),配置环境变量下载JDKJava程序需要JDK(JavaDevelopmentKit)才能运行和编译。以下是两...

Mycat的搭建以及配置与启动(mycat2)

1、首先开启服务器相关端口firewall-cmd--permanent--add-port=9066/tcpfirewall-cmd--permanent--add-port=80...

kubernetes 部署mysql应用(k8s mysql部署)

这边仅用于测试环境,一般生产环境mysql不建议使用容器部署。这里假设安装mysql版本为mysql8.0.33一、创建MySQL配置(ConfigMap)#mysql-config.yaml...

Spring Data Jpa 介绍和详细入门案例搭建

1.SpringDataJPA的概念在介绍SpringDataJPA的时候,我们首先认识下Hibernate。Hibernate是数据访问解决技术的绝对霸主,使用O/R映射(Object-Re...

量子点格棋上线!“天衍”邀您执子入局

你是否能在策略上战胜量子智能?这不仅是一场博弈更是一次量子智力的较量——量子点格棋正式上线!试试你能否赢下这场量子智局!游戏玩法详解一笔一画间的策略博弈游戏目标:封闭格子、争夺领地点格棋的基本目标是利...

美国将与阿联酋合作建立海外最大的人工智能数据中心

当地时间5月15日,美国白宫宣布与阿联酋合作建立人工智能数据中心园区,据称这是美国以外最大的人工智能园区。阿布扎比政府支持的阿联酋公司G42及多家美国公司将在阿布扎比合作建造容量为5GW的数据中心,占...

盘后股价大涨近8%!甲骨文的业绩及指引超预期?

近期,美股的AI概念股迎来了一波上升行情,微软(MSFT.US)频创新高,英伟达(NVDA.US)、台积电(TSM.US)、博通(AVGO.US)、甲骨文(ORCL.US)等多股亦出现显著上涨。而从基...

甲骨文预计新财年云基础设施营收将涨超70%,盘后一度涨8% | 财报见闻

甲骨文(Oracle)周三盘后公布财报显示,该公司第四财季业绩超预期,虽然云基建略微逊于预期,但管理层预计2026财年云基础设施营收预计将增长超过70%,同时资本支出继上年猛增三倍后,新财年将继续增至...

Springboot数据访问(整合MongoDB)

SpringBoot整合MongoDB基本概念MongoDB与我们之前熟知的关系型数据库(MySQL、Oracle)不同,MongoDB是一个文档数据库,它具有所需的可伸缩性和灵活性,以及所需的查询和...

Linux环境下,Jmeter压力测试的搭建及报错解决方法

概述  Jmeter最早是为了测试Tomcat的前身JServ的执行效率而诞生的。到目前为止,它的最新版本是5.3,其测试能力也不再仅仅只局限于对于Web服务器的测试,而是涵盖了数据库、JM...

取消回复欢迎 发表评论: