当前位置: 首页 > news >正文

C语言中的数据类型存储

1、二进制和进制转换

我们经常能听到 2 进制、 8 进制、 10 进制、 16 进制 这样的讲法,那是什么意思呢?

其实2进制、8进制、10进制、16进制是数值的不同表⽰形式⽽已。

⽐如:数值15的各种进制的表⽰形式(十六进制的数值之前写:0x ;8进制的数值之前写 :0):

15的二进制:1111

15的八进制:17

15的十进制:015

15的十六进制:0xF

我们重点介绍⼀下⼆进制:

⾸先我们还是得从10进制讲起,其实10进制是我们⽣活中经常使⽤的,我们已经形成了很多尝试:

• 10进制中满10进1

• 10进制的数字每⼀位都是0~9的数字组成

其实⼆进制也是⼀样的

• 2进制中满2进1

• 2进制的数字每⼀位都是0~1的数字组成 那么 1101 就是⼆进制的数字了。

1.12进制转10进制

其实10进制的123表⽰的值是⼀百⼆⼗三,为什么是这个值呢?其实10进制的每⼀位是有权重的,10 进制的数字从右向左是个位、⼗位、百位....,分别每⼀位的权重是 10 ,10 ,10 ...

如下图:

2进制和10进制是类似的,只不过2进制的每⼀位的权重,从右向左是: 2 ,2 ,2 ... 0 1 2 如果是2进制的1101,该怎么理解呢?

1.1.110进制转2进制数字

2.22进制转8进制和16进制

2.2.1 2进制转8进制 8进制的数字每⼀位是0~7的,0~7的数字,各⾃写成2进制,最多有3个2进制位就⾜够了,⽐如7的⼆ 进制是111,所以在2进制转8进制数的时候,从2进制序列中右边低位开始向左每3个2进制位会换算⼀ 个8进制位,剩余不够3个2进制位的直接换算。如:2进制的01101011,换成8进制:0153,0开头的数字,会被当做8进制。

2.2.22进制转16进制

16进制的数字每⼀位是0~9,a~f的,0~9,a~f的数字,各⾃写成2进制,最多有4个2进制位就⾜够了, ⽐如f的⼆进制是1111,所以在2进制转16进制数的时候,从2进制序列中右边低位开始向左每4个2进 制位会换算⼀个16进制位,剩余不够4个⼆进制位的直接换算。如:2进制的01101011,换成16进制:0x6b,16进制表⽰的时候前⾯加0x

3. 原码、反码、补码

整数的2进制表⽰⽅法有三种,即原码、反码和补码

有符号整数的三种表⽰⽅法均有符号位和数值位两部分,2进制序列中,最⾼位的1位是被当做符号位,剩余的都是数值位。

符号位都是⽤0表⽰“正”,⽤1表⽰“负”。

正整数的原、反、补码都相同。

负整数的三种表⽰⽅法各不相同。

原码:直接将数值按照正负数的形式翻译成⼆进制得到的就是原码。

反码:将原码的符号位不变,其他位依次按位取反就可以得到反码。

补码:反码+1就得到补码。(补码得到原码也是可以使⽤:取反,+1的操作。

-原码只是“人类直觉”的表示方式,补码是“CPU实际使用“的方式(给人读懂数值用的)

-反码也是给人类推导补码用的

-C语言中所有符号整数底层存储全部是补码(机器实际存储和运算唯一编码)

原码供人读时符号位只是一个正负的标志,并不参与计算

补码的符号为占权重参与计算

我们以同一个二进制1_0000001对比读法:

原码读法:
符号位 1 → 只表示"这是负数",不参与数值计算
数值位 0000001 → 直接读 = 1
结果:-1

补码读法:
符号位 1 → 权重 -128,参与计算
数值位 0000001 → 权重 1,参与计算
结果:-128 + 1 = -127

所以本质区别就是:
原码:符号位是"标签",只告诉你正负,不参与计算
补码:符号位是"权重",直接参与数值计算,只不过权重是负的
其余位在两种编码中读法完全相同,唯一的区别就在符号位怎么处理。

对于整形来说:数据存放内存中其实存放的是补码

为什么呢?

在计算机系统中,数值⼀律⽤补码来表⽰和存储。原因在于,使⽤补码,可以将符号位和数值域统⼀ 处理;同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算 过程是相同的,不需要额外的硬件电路。

4.移位操作符

<<左移操作符

> >右移操作符

注: 移位操作符的操作数只能是整数。

4.1左移操作符

移位规则:左边抛弃、右边补0

注释里的是10的原码,实际内存储存的是补码,但是正数的正反补相同

4.2右移操作符

移位规则:⾸先右移运算分两种:

1. 逻辑右移:左边⽤0填充,右边丢弃

2. 算术右移:左边⽤原该值的符号位填充,右边丢弃

逻辑右移:

逻辑左移:

警告⚠:对于移位运算符,不要移动负数位,这个是标准未定义的。

从上面也不难看出来左移相当于*2 , 右移相当于/2

5. 位操作符:&、|、^、~

位操作符有:

1 & //按位与

2 | //按位或

3 ^ //按位异或

4 ~ //按位取反

注: 他们的操作数必须是整数。

直接上代码:

⼀道变态的⾯试题:

不能创建临时变量(第三个变量),实现两个整数的交换。

练习1:编写代码实现:求⼀个整数存储在内存中的⼆进制中1的个数。

方法一:此方法过于基础和简单,这里不再详细讲解,而且这个方法不能计算负数,局限特别大

方法二:通过按位与&巧妙实现,但是必须循环32次,思考还能不能更加优化

方法三:

num & (num-1) 这个操作每次执行,会消去 num 二进制中最低位的那个 1。
举例,num = -1(即 0xFFFFFFFF,全 1),每次循环消掉一个 1,count++ 计数,直到 num == 0 退出。

为什么 num-1 能消掉最低位的 1?
以 num = 0b...10110100 为例:
num - 1 = 0b...10110011(最低位的 1 变 0,其后全变 1)
num & (num-1) = 0b...10110000(最低位的 1 被清除)

这就是著名的Brian Kernighan 位计数算法

练习2:⼆进制位置0或者置1

2. ⼤⼩端字节序和字节序判断

当我们了解了整数在内存中存储后,我们调试看⼀个细节:

调试的时候,我们可以看到在a中的0x11223344这个数字是按照字节为单位,倒着存储的。这是为什么呢?

2.1 什么是⼤⼩端?

其实超过⼀个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为⼤端字节序存储⼩端字节序存储,下⾯是具体的概念:

⼤端(存储)模式: 是指数据的低位字节内容保存在内存的⾼地址处,⽽数据的⾼位字节内容,保存在内存的低地址处。

⼩端(存储)模式: 是指数据的低位字节内容保存在内存的低地址处,⽽数据的⾼位字节内容,保存在内存的⾼地址处。 上述概念需要记住,⽅便分辨⼤⼩端

2.2 为什么有⼤⼩端?

为什么会有⼤⼩端模式之分呢? 这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着⼀个字节,⼀个字节为8 bit 位,但是在C语⾔中除了8bit的 char 之外,还有16bit的 short 型,32bit的 long 型(要看 具体的编译器),另外,对于位数⼤于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度⼤ 于⼀个字节,那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了⼤端存储模式和⼩端存 储模式。

例如:⼀个 16bit 的 short 型 x ,在内存中的地址为 0x11 为⾼字节, 0x0010 , x 的值为 0x22 为低字节。对于⼤端模式,就将 0x22 放在⾼地址中,即 0x1122 ,那么 0x11 放在低地址中,即 0x0011 中。⼩端模式,刚好相反。我们常⽤的 0x0010 中, X86 结构是⼩端模式,⽽ KEIL C51 则为⼤端模式。很多的ARM,DSP都为⼩端模式。有些ARM处理器还可以由硬件来选择是⼤端模式还是⼩端模式。

2.3 练习

2.3.1 练习1 请简述⼤端字节序和⼩端字节序的概念,设计⼀个⼩程序来判断当前机器的字节序。(10分)-百度笔 试题

3. 浮点数在内存中的存储

常⻅的浮点数:3.14159、1E10等,浮点数家族包括:float 、 double 、 long double 类型。

浮点数表⽰的范围: float.h 中定义

我们来看一段代码

3.2 浮点数的存储

上⾯的代码中,n和*pFloat在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么⼤?

要理解这个结果,⼀定要搞懂浮点数在计算机内部的表⽰⽅法。 根据国际标准IEEE(电⽓和电⼦⼯程协会)754,任意⼀个⼆进制浮点数V可以表⽰成下⾯的形式:

举例来说: ⼗进制的5.0,写成⼆进制是 101.0 ,相当于 (-1)^0 * 1.01 * 2^2 。

IEEE 754规定:

对于32位的浮点数,最⾼的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M

对于64位的浮点数,最⾼的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M

3.2.1 浮点数存的过程

IEEE 754对有效数字M和指数E,还有⼀些特别规定。 前⾯说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中 xxxxxx 表⽰⼩数部分。 IEEE 754规定,在计算机内部保存M时,默认这个数的第⼀位总是1,因此可以被舍去,只保存后⾯的 xxxxxx部分。⽐如保存1.01的时候,只保存01,等到读取的时候,再把第⼀位的1加上去。这样做的⽬ 的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第⼀位的1舍去以后,等于可以保 存24位有效数字。

⾄于指数E,情况就⽐较复杂 ⾸先,E为⼀个⽆符号整数(unsignedint)

这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我 们知道,科学计数法中的E是可以出现负数的,所以IEEE754规定,存⼊内存时E的真实值必须再加上 ⼀个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。⽐如,2^10的E是 10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

3.2.2 浮点数取的过程

指数E从内存中取出还可以再分成三种情况:E不全为0或不全为1这时,浮点数就采⽤下⾯的规则表⽰,即指数E的计算值减去127(或1023),得到真实值,再将有效 数字M前加上第⼀位的1。

⽐如:0.5的⼆进制形式为0.1,由于规定正数部分必须为1,即将⼩数点右移1位,则为1.0*2^(-1),其 阶码为-1+127(中间值)=126,表⽰为01111110,⽽尾数1.0去掉整数部分为0,补⻬0到23位 00000000000000000000000,则其⼆进制表⽰形式为:

1 0 01111110 00000000000000000000000

E全为0 这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第⼀位的1,⽽是还 原为0.xxxxxx的⼩数。这样做是为了表⽰±0,以及接近于0的很⼩的数字。(E全为0,则2^(1-127)=2^(-126)是一个非常非常小的数)

1 0 00000000 00100000000000000000000

E全为1 这时,如果有效数字M全为0,表⽰±⽆穷⼤(正负取决于符号位s)(E全为1,则2^(255-127)=2^128是一个非常非常大的数,我们可以看作接近正无穷)

1 0 11111111 00010000000000000000000

好了,关于浮点数的表⽰规则,就说到这⾥。

3.3 题⽬解析 下⾯,让我们回到⼀开始的代码

先看第1环节,为什么 9 还原成浮点数,就成了 0.000000 ?

9以整型的形式存储在内存中,得到如下⼆进制序列:

0000 0000 0000 0000 0000 0000 0000 1001

⾸先,将 9 的⼆进制序列按照浮点数的形式拆分,得到第⼀位符号位s=0,后⾯8位的指数 E=00000000 ,最后23位的有效数字M=00000000000000000001001。

由于指数E全为0,所以符合E为全0的情况。因此,浮点数V就写成:

V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146)

显然,V是⼀个很⼩的接近于0的正数,所以⽤⼗进制⼩数表⽰就是0.000000。

再看第2环节,浮点数9.0,为什么整数打印是 1091567616

首先,浮点数等于二进制的1001.0,即换算成科学计数法是:1.001x2^3

所以:9.0=(-1)^0 * 1.001 * 2^3

S=0

M=1.001

E=3

那么,第⼀位的符号位S=0,有效数字M等于001后⾯再加20个0,凑满23位,指数E等于3+127=130, 即10000010

所以,写成⼆进制形式,应该是S+E+M,即:

1 10000010 001 0000 0000 0000 0000 0000

这个32位的⼆进制数,被当做整数来解析的时候,就是整数在内存中的补码,原码正是

1091567616

http://www.jsqmd.com/news/794309/

相关文章:

  • FPGA千兆以太网1000BASE-T时钟恢复与均衡解码【附程序】
  • 国内用户访问海外服务器:延迟高、线路不稳定的解决方案详解
  • AI Agent赋能预测市场交易:Kalshi CLI与OpenClaw技能实战指南
  • AI编码助手安全护栏:Claude代码生成规则引擎实战指南
  • 软向量自旋系统在组合优化中的应用与实现
  • SharpKeys:免费Windows键盘重映射终极解决方案
  • 【FastAPI】ORM-01.基础配置
  • 基于PSCAD的光伏-火电打捆直流送出系统建模与扰动特性仿真研究
  • 第五部分-DockerCompose——25. Compose 高级特性
  • ARM虚拟化核心:HCR_EL2寄存器配置与优化实践
  • SkillForge:为AI编码代理设计的开源技能库,实现无状态Docker化部署
  • hplan:轻量级HTTP请求计划与重放工具的设计原理与实战应用
  • AI助手配置同步工具:解决多工具MCP服务器与指令文件统一管理难题
  • LangChain vs LlamaIndex 企业级 RAG 选型对比
  • Navicat Mac版无限重置试用期的终极指南:3种简单方法破解14天限制
  • 真心推荐!阿贝云免费云服务太适合新手与学生党了
  • 这下,很多大学老师要睡不着了!
  • 基于深度强化学习的《城市:天际线2》AI玩家:从视觉感知到决策执行
  • 【YOLO目标检测全栈实战专栏】08 多尺度特征融合:YOLO如何“一眼看尽”大小目标
  • 树的回顾(1)
  • 前端工程化:依赖管理最佳实践
  • 嵌入式产品设计的十大可用性错误与优化策略
  • Global 内存访问与 Memory Coalescing 实验解析
  • 低功耗CPLD技术演进与便携设备应用解析
  • 基于MCP协议的智能文档处理工具simdoc-mcp:从RAG原理到Claude集成实战
  • 基于LangChain与LLM的AI量化交易机器人:Hyperliquid永续合约实战
  • MVC 发布
  • clawhub-skills:43个AI技能包,零代码实现电商、财务、营销自动化
  • Codex桌面版接入DeepSeek-V4
  • SITS2026正式发布倒计时72小时:这4类AI研发团队已紧急升级知识治理体系,你还在用Wiki+钉钉硬扛?