两种判断计算机大小端模式的方法
在计算机系统里,数据存储有大端和小端两种模式。大端模式是高字节存在低地址,小端模式是低字节存在低地址。下面结合相关知识,用两种 C 语言方法判断大小端。
一、知识铺垫
(一)大小端存储规则
- 大端存储(Big - Endian):数据的高字节存储在内存的低地址。比如整数
0x12345678
(4 字节),大端模式下,存储地址从低到高依次是0x12
、0x34
、0x56
、0x78
。 - 小端存储(Little - Endian):数据的低字节存储在内存的低地址。还是整数
0x12345678
,小端模式下,存储地址从低到高依次是0x78
、0x56
、0x34
、0x12
。
一般 X86 架构采用小端模式,ARM 架构一般采用大端模式(但不绝对)。
(二)printf
长度修饰符
printf
的长度修饰符用于指定输出整数对应的参数类型,只影响输出内容,不改变数据本身。
hh
:后续整数转换对应signed char
或unsigned char
参数(针对输出,取整数低 1 字节)。h
:后续整数转换对应short int
或unsigned short int
参数(针对输出,取整数低 2 字节)。
(三)联合体特性
联合体变量的成员共用一块内存,每个成员起始地址相同。修改联合体中任意一个成员的值,都会影响其他成员的值,且不应同时对多个成员赋值。
二、判断方法
(一)利用 printf
长度修饰符
我们借助 printf
函数的 hh
长度修饰符,它能将整数转换为 unsigned char
类型输出,只取整数的低 1 字节,通过输出结果判断大小端。
代码如下:
#include <stdio.h>
int main() {// 输出 0x12345678 的低 1 字节printf("%#hhx\n", 0x12345678);return 0;
}
- 若输出
0x12
,说明是大端模式,因为大端模式下低地址存储高字节0x12
。 - 若输出
0x78
,说明是小端模式,因为小端模式下低地址存储低字节0x78
。
像 X86 架构(小端模式)运行这段代码,可能输出0x78
;ARM 架构(一般大端模式),可能输出0x12
。
可以知道该机器是数据的低位放在低地址空间,数据的高位放在高地址空间,因此是小端模式。
(二)使用联合体(Union)
利用联合体成员共用内存的特性,定义一个包含 int
类型和 char
类型成员的联合体。给 int
成员赋值后,通过 char
成员获取低地址存储的字节,进而判断大小端。
代码如下:
#include <stdio.h>
// 定义联合体
union Endian
{int a;char b;
};
int main(int argc,char const * argv[])
{union Endian data;// 给 int 成员赋值data.a = 0x12345678;// 判断低地址存储的字节if (data.b == 0x12) {printf("Big - Endian\n");} else {printf("Little - Endian\n");}return 0;
}
- 若
data.b
的值是0x12
,说明是大端模式,高字节0x12
存储在低地址。 - 若
data.b
的值是0x78
,说明是小端模式,低字节0x78
存储在低地址。
通过这两种方法,能轻松判断当前计算机的大小端模式,这对涉及底层数据存储和网络字节序转换等场景很有帮助。