百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

JVM规范系列之数据类型(jvm数据区)

mhr18 2024-10-19 06:17 32 浏览 0 评论

码神手记——资深攻城狮的私房笔记。微信公众平台/知乎/头条/简书同步发文,关注与转发。

JVM系列之数据类型

数据类型、类加载机制、JVM内存模型,很多人在面试中都会遇到这一类的问题。大部分人都是死记硬背,背完就忘。究其原因,是对JVM规范的不了解,没有内功,招式只是花架子。本篇是JVM系列的开篇,将从数据类型开始,一起深入学习JVM规范。

为确保严谨准确,参考资料为Oracle官方文档《The Java? Virtual Machine Specification》。

JVM规范与Java编程语言什么关系?

我们可以认为JVM是一个虚拟的计算机,而JVM规范就是这台计算机的设计蓝图,一个极度抽象的体系结构。它清晰地定义了数据类型、内存、操作指令语义等。平时经常提到的JVM一般是指HotSpot虚拟机,它只是对JVM规范的一种实现。任何人都可以在这套规范的约束下实现一个属于自己的虚拟机实例。

用Java编程语言编写出Java源代码文件,经过编译器的编译后产生class文件,class文件可以被JVM识别并执行。即便只是用记事本写了一段非Java的火星文,只要你可以将它编译成JVM能够识别的class文件,照样可以运行。Kotlin语言就是一个成功案例。在JVM系列的后续文章中会专门介绍面向JVM的编译。

不要将JVM规范与Java编程语言混为一谈,后续内容的上下文都是JVM规范体系内的。

接下来,言归正传。


数据类型分类

JVM操作两种类型:基本(原生)类型和引用类型。它们的值分别称为原生值和引用值,可以作为参数传递、作为返回值由方法返回、对其进行一系列的操作。

JVM期望尽可能多的类型检查(最好是所有的)都在进入运行时之前完成,通常是由编译器完成。对于基本类型的值,虚拟机使用对特定类型值进行操作的指令来区分类型,不需要专门标记类型。例如:iadd、ladd、fadd和dadd都是计算两个数值之和的虚拟机指令,每个指令都有其专门针对的操作数类型:int、long、float和double。

JVM对对象显式支持,对象可以是动态分配的类实例,也可以是数组。对对象的引用即虚拟机类型引用,类型引用的值可以看作是指向对象的指针,一个对象可以存在多个引用。对象总是通过类型引用的值被操作、传递。

基本类型

JVM支持的基本类型分为:数值类型、布尔类型和返回地址类型(returnAddress)。数值类型又分为:整数类型、浮点类型。

整数类型

  • byte,字节类型,8位有符号二补整数,默认值是0,取值范围是[-2^7,2^7-1]?。
  • short,短整型,16位有符号二补整数,默认值是0,取值范围是[-2^15,2^15-1]?。
  • int,整型,32位有符号二补整数,默认值是0,取值范围是?[-2^31,2^31-1]。
  • long,长整型,64位有符号二补整数,默认值是0,取值范围是[-2^63,2^63-1]?。
  • char,字符型,16位无符号,取值范围从0到65535。使用基本多文种平面中的Unicode代码点表示的整数,用UTF-16编码,默认值为null,UTF-16编码是\u0000。

浮点类型

  • float,单精度浮点类型,其值属于浮点值集中的元素,或(在支持的情况下)浮点扩展指数值集中的元素,默认值是0。
  • double,双精度浮点类型,其值是双精度值集中的元素,或(在支持的情况下)双扩展指数值集中的元素,默认值是0。

浮点值集、浮点扩展指数值集、双精度值集、双精度扩展指数值集并不是类型。在JVM实现中,用浮点值集中的元素表示一个float类型的值,但是在某些特定的上下文中,也可以使用浮点扩展指数集中的元素来代替。同样,JVM的实现用双精度值集中的元素表示一个double类型的值,在特定上下文中也可以用双精度扩展指数值集来代替。

float和double在概念上与32位单精度、64位双精度格式的IEEE 754值和操作相关联,这是在IEEE二进制浮点算术标准(ANSI/IEEE Std. 754-1985, New York)中指定的。该标准不仅包括正负符号数量级,还包括正负零、正负无穷大和特殊的Not-a-Number值(简称NaN),NaN值用于表示某些无效操作(比如0除以0)的结果。

扩展知识:浮点类型与IEEE 754标准

每种JVM实现都需要支持两套标准的浮点值,分别是浮点值集和双精度值集。此外,作为可选项,JVM实现可以支持两种扩展指数浮点值集(extended-exponent floating-point value sets)中的一个或者两个,分别是浮点扩展指数值集(float extended-exponent value set)和双扩展指数值集(double-extended-exponent value set)。在某些情况下,它们用于代替标准值集类表示类型为float或double的值。

任何浮点值集中的有限非零值都可以用以下形式表示:?



s是+1或-1,m是小于2N的正整数,e是?[Emin,Emax]之间的整数?。




N和K的取值依赖于具体的值集。在以上表示形式中,有些值可以用多种方式表示。举个例子:假设有一个值集中的值v,s、m、e等于某些具体值时,v就可以用以上公式表示。如果m碰巧是偶数,而且e小于等于2^(K-1),我们则可以将m减半,并将e加1,产生v的另外一种展现形式。

如果m≥2(N-1),则这种展现被称为是规范化的(normalized:规范化、归一化、标准化),否则就是非规范化的(denormalized)。如果值集中的一个值不能在m≥2N-1的情况下被表示,那么这个值就是一个非规范化的值。

对于两个必需的和两个可选浮点值集,参数N和K(以及派生参数Emin和Emax)的约束条件如下:

当一个JVM实现支持一个或两个可扩展指数值集时,则每个被支持的可扩展指数值集都有一个特定的与实现相关的常数K,K的值满足以上约束,K派生出?和?的值。

四个值集中的每一个都不仅包括有限非零值,还包括另外五个值:正零、负零、正无穷、负无穷和NaN。

在约束设计中,每一个浮点值集的元素也是浮点扩展指数值集中的元素,每一个双精度值集的元素也是双精度扩展指数值集中的元素。每个扩展指数值集都比其对应的标准值集拥有更大的取值范围,但并没有更大的精度。

JVM规范中浮点值集的元素正是可以用IEEE 754标准所定义的单浮点格式表示的值,除此之外JVM的浮点值集中只有一个NaN值(IEEE 754标准指定了?个不同的NaN值)。JVM规范中双精度扩展指数值集的元素也正是可以用IEEE 754标准所定义的双浮点格式表示的值,同时也只有一个NaN值(IEEE 754标准指定了?个不同的NaN值)。

JVM规范中浮点扩展指数值集和双扩展指数值集的元素值,可以不与IEEE 754 单扩展和双扩展格式表示的值各自对应。JVM规范并不要求浮点值集中的值有特定的表示形式,除非我们要在class文件中表示一个浮点值。

你可以简单的总结为:JVM规范中的值集元素遵循IEEE 754标准里的表示形式,但不同的是,JVM规范中只有一个NaN值,而IEEE 754标准中有多个不同的NaN值。

浮点值的顺序

除了NaN,浮点值集的值是有序的。从小到大依次是负无穷、负有限值、正零和负零、正有限值和正无穷。

浮点正零和浮点负零是相等的,但通过其它操作可以区分它们。例如:0除以0等于正无穷,而0除以-0等于负无穷。

NaN是无序的,在数值等式的比较中,如果有一个或者两个数都是NaN,则结果为false。当且仅当值为NaN时,值与本身相比结果为false。在数值不等式中,如果有一个值是NaN,则对不等式结果为true。总结一句话:NaN跟谁都不相等。

returnAddress类型

returnAddress类型由JVM的jsr、ret和jsr_w指令使用,其值是指向JVM指令操作码的指针。与基本类型不同,returnAddress类型与Java编程语言类型没有直接关联。

布尔类型

虽然JVM定义了布尔类型,但是却没有专门针对布尔值操作的JVM指令。Java编程语言中操作布尔值的表达式会被编译为操作JVM int数据类型值,JVM使用1表示true,0表示false。

JVM直接支持了布尔数组,使用newarray指令创建布尔数组,使用字节数组指令baload和bastore访问和修改布尔类型数组。

在Oracle的JVM实现中,Java编程语言中的布尔数组会被编码为JVM字节数组,每一个布尔元素使用8个bit位。

引用类型

引用类型分为三种:类、数组、接口。它们的值是引用,分别指向动态创建的类实例、数组、实现接口的类实例或者数组。

引用也可以是特殊的空引用,指向一个空对象,空对象用null表示。空引用在初始化时是没有运行时类型的,可以被转换为任意类型。

引用类型的默认值是null。

术语百科

二补整数(二进制补码整数)

计算机中的有符号数有三种表示方法,即:原码、反码和补码,三种表示方法均有符号位和数值位两部分。符号位用0表示正,用1表示负。而数值位,三种表示方法各有不同。

在计算机系统中,数值一律用补码来表示和存储。原因在于:使用补码可以将符号位和数值域统一处理,同时,加法与减法也可以统一处理。

基本多文种平面

BMP(Basic MultiMultilingual Plane),或称第零平面(Plane 0),是Unicode中的一个编码区段,编码从U+0000到U+FFFF。



每个写着数字的格子自代表256个码点。

相关推荐

【预警通报】关于WebLogic存在远程代码执行高危漏洞的预警通报

近日,Oracle官方发布了2021年1月关键补丁更新公告CPU(CriticalPatchUpdate),共修复了包括CVE-2021-2109(WeblogicServer远程代码执行漏洞)...

医院信息系统突发应急演练记录(医院信息化应急演练)

信息系统突发事件应急预案演练记录演练内容信息系统突发事件应急预案演练参与人员信息科参与科室:全院各部门日期xxxx-xx-xx时间20:00至24:00地点信息科记录:xxx1、...

一文掌握怎么利用Shell+Python实现完美版的多数据源备份程序

简介:在当今数字化时代,无论是企业还是个人,数据的安全性和业务的连续性都是至关重要的。数据一旦丢失,可能会造成无法估量的损失。因此,如何有效地对分布在不同位置的数据进行备份,尤其是异地备份,成为了一个...

docker搭建系统环境(docker搭建centos)

Docker安装(CentOS7)1.卸载旧版Docker#检查已安装版本yumlistinstalled|grepdocker#卸载旧版本yumremove-ydocker.x...

基础篇:数据库 SQL 入门教程(sql数据库入门书籍推荐)

SQL介绍什么是SQLSQL指结构化查询语言,是用于访问和处理数据库的标准的计算机语言。它使我们有能力访问数据库,可与多种数据库程序协同工作,如MSAccess、DB2、Informix、M...

Java21杀手级新特性!3行代码性能翻倍

导语某券商系统用这招,交易延迟从12ms降到0.8ms!本文揭秘Oracle官方未公开的Record模式匹配+虚拟线程深度优化+向量API神操作,代码量直降70%!一、Record模式匹配(代码量↓8...

一文读懂JDK21的虚拟线程(java虚拟线程)

概述JDK21已于2023年9月19日发布,作为Oracle标准Java实现的一个LTS版本发布,发布了15想新特性,其中虚拟线程呼声较高。虚拟线程是JDK21中引入的一项重要特性,它是一种轻量级的...

效率!MacOS下超级好用的Linux虚拟工具:Lima

对于MacOS用户来说,搭建Linux虚拟环境一直是件让人头疼的事。无论是VirtualBox还是商业的VMware,都显得过于笨重且配置复杂。今天,我们要介绍一个轻巧方便的纯命令行Linux虚拟工具...

所谓SaaS(所谓三维目标一般都应包括)

2010年前后,一个科技媒体的主编写一些关于云计算的概念性问题,就可以作为头版头条了。那时候的云计算,更多的还停留在一些概念性的问题上。而基于云计算而生的SaaS更是“养在深闺人未识”,一度成为被IT...

ORA-00600 「25027」 「x」报错(报错0xc0000001)

问题现象:在用到LOB大对象的业务中,进行数据的插入,失败了,在报警文件中报错:ORA-00600:内部错误代码,参数:[25027],[10],[0],[],[],[],[],[...

安卓7源码编译(安卓源码编译环境lunch失败,uname命令找不到)

前面已经下载好源码了,接下来是下载手机对应的二进制驱动执行编译源码命令下载厂商驱动https://developers.google.com/android/drivers?hl=zh-cn搜索NGI...

编译安卓源码(编译安卓源码 电脑配置)

前面已经下载好源码了,接下来是下载手机对应的二进制驱动执行编译源码命令下载厂商驱动https://developers.google.com/android/drivers?hl=zh-cn搜索NGI...

360 Vulcan Team首战告捷 以17.5万美金强势领跑2019“天府杯“

2019年11月16日,由360集团、百度、腾讯、阿里巴巴、清华大学与中科院等多家企业和研究机构在成都联合主办了2019“天府杯”国际网络安全大赛暨2019天府国际网络安全高峰论坛。而开幕当日最激荡人...

Syslog 日志分析与异常检测技巧(syslog发送日志配置)

系统日志包含有助于分析网络设备整体运行状况的重要信息。然而,理解并从中提取有效数据往往颇具挑战。本文将详解从基础命令行工具到专业日志管理软件的全流程分析技巧,助你高效挖掘Syslog日志价值。Gr...

从Oracle演进看数据库技术的发展(从oracle演进看数据库技术的发展的过程)

数据库技术发展本质上是应用需求驱动与基础架构演进的双向奔赴,如何分析其技术发展的脉络和方向?考虑到oracle数据库仍然是这个领域的王者,以其为例,管中窥豹,对其从Oracle8i到23ai版本的核...

取消回复欢迎 发表评论: