网络编程大小端字节序
刚接触网络编程那会因为是同一种语言之间做数据交互所以并没有出现大小端问题,到后来鄙人因机缘巧合进入物联网行业然后就发现打开了新世界.(设备终端大多是嵌入式设备用的C,服务端用的是java)
然后我的状态(为什么这图会自动加水印??? 这图是我从网上拿的...)
本来项目中的问题解决了就算完事了,但是... 搞事情 搞事情 搞事情
让我写这篇笔记的动机是 , 某天某个问我大小端的问题,结果没把他唬住 这个让鄙人很是尴尬,然后决定记一笔以备查找
那么问题来了:
1.什么是大小端
2.什么情况下是大端什么情况下是小端
3.为什么同一种语言不会有这个问题
4.项目中如何解决不同端的问题
以下部分内容摘抄自 *:https://zh.wikipedia.org/wiki/%E5%AD%97%E8%8A%82%E5%BA%8F
问题1什么是大小端
小故事入场
端(endian)的起源
“endian”一词来源于十八世纪爱尔兰作家乔纳森·斯威夫特(Jonathan Swift)的小说《格列佛游记》(Gulliver's Travels)。小说中,小人国为水煮蛋该从大的一端(Big-End)剥开还是小的一端(Little-End)剥开而争论,争论的双方分别被称为“大端派”和“小端派”。以下是1726年关于大小端之争历史的描述:
“ | 我下面要告诉你的是,Lilliput和Blefuscu这两大强国在过去36个月里一直在苦战。战争开始是由于以下的原因:我们大家都认为,吃鸡蛋前,原始的方法是打破鸡蛋较大的一端,可是当今皇帝的祖父小时候吃鸡蛋,一次按古法打鸡蛋时碰巧将一个手指弄破了。因此他的父亲,当时的皇帝,就下了一道敕令,命令全体臣民吃鸡蛋时打破鸡蛋较小的一端,违令者重罚。老百姓们对这项命令极其反感。历史告诉我们,由此曾经发生过6次*,其中一个皇帝送了命,另一个丢了王位。这些*大多都是由Blefuscu的国王大臣们煽动起来的。*平息后,流亡的人总是逃到那个帝国去寻求避难。据估计,先后几次有11000人情愿受死也不肯去打破鸡蛋较小的一端。关于这一争端,曾出版过几百本大部著作,不过大端派的书一直是受禁的,法律也规定该派任何人不得做官。” | ” |
—— 《格列夫游记》 第一卷第4章 蒋剑锋(译) |
1980年,丹尼·科恩(Danny Cohen),一位网络协议的早期开发者,在其著名的论文"On Holy Wars and a Plea for Peace"中,为平息一场关于字节该以什么样的顺序传送的争论,而第一次引用了该词。
字节顺序
在哪种字节顺序更合适的问题上,人们表现得非常情绪化,实际上,就像鸡蛋的问题一样,没有技术上的原因来选择字节顺序规则,因此,争论沦为关于社会政治问题的争论,只要选择了一种规则并且始终如一地坚持,其实对于哪种字节排序的选择是任意的。
对于单一的字节(a byte),大部分处理器以相同的顺序处理位元(bit),因此单字节的存放方法和传输方式一般相同。
对于多字节数据,如整数(32位机中一般占4字节),在不同的处理器的存放方式主要有两种,以内存中0x0A0B0C0D的存放方式为例,分别有以下几种方式:
注: 0x前缀代表十六进制。
大端序
大端序(英:big-endian)或称大尾序。
- 数据以8bit为单位:
地址增长方向 → | |||||
... | 0x0A | 0x0B | 0x0C | 0x0D | ... |
示例中,最高位字节是0x0A 存储在最低的内存地址处。下一个字节0x0B存在后面的地址处。正类似于十六进制字节从左到右的阅读顺序。
- 数据以16bit为单位:
地址增长方向 → | |||||
... | 0x0A0B | 0x0C0D | ... |
最高的16bit单元0x0A0B存储在低位。
小端序
小端序(英:little-endian)或称小尾序。
- 数据以8bit为单位:
地址增长方向 → | |||||
... | 0x0D | 0x0C | 0x0B | 0x0A | ... |
最低位字节是0x0D 存储在最低的内存地址处。后面字节依次存在后面的地址处。
- 数据以16bit为单位:
地址增长方向 → | |||||
... | 0x0C0D | 0x0A0B | ... |
最低的16bit单元0x0C0D存储在低位。
- 更改地址的增长方向:
当更改地址的增长方向,使之由右至左时,表格更具有可阅读性。
← 地址增长方向 | |||||
... | 0x0A | 0x0B | 0x0C | 0x0D | ... |
最低有效位(LSB)是0x0D 存储在最低的内存地址处。后面字节依次存在后面的地址处。
← 地址增长方向 | |||||
... | 0x0A0B | 0x0C0D | ... |
最低的16bit单元0x0C0D存储在低位。
混合序
混合序(英:middle-endian)具有更复杂的顺序。以PDP-11为例,0x0A0B0C0D被存储为:
- 32bit在PDP-11的存储方式
地址增长方向 → | |||||
... | 0x0B | 0x0A | 0x0D | 0x0C | ... |
可以看作高16bit和低16bit以大端序存储,但16bit内部以小端存储。
问题2什么情况下是大端什么情况下是小端
问题的答案就是硬件设备(处理器)决定的,这个问题回答起来很简单但是个中原理很复杂
目前已知的CPU大小端情况如下:
处理器体系
- x86、MOS Technology 6502、Z80、VAX、PDP-11等处理器为小端序;
- Motorola 6800、Motorola 68000、PowerPC 970、System/370、SPARC(除V9外)等处理器为大端序;
- ARM、PowerPC(除PowerPC 970外)、DEC Alpha、SPARC V9、MIPS、PA-RISC及IA64的字节序是可配置的。
问题3为什么同一种语言不会有这个问题
网络传输一般采用大端序,也被称之为网络字节序,或网络序。IP协议中定义大端序为网络字节序(虽然是默认大端传输,但是私有协议用小端的方式传输数据这种情况也不少)
目前市面上用作服务端和客户端的CPU基本是大端字节序,而不同语言在默认情况下也会有默认的读取/写入端模式,以java为例默认大端 所以默认情况下是不会出现大小端问题
同一种语言会不会出现大小端问题?
答:会
在以下情况下:
1.客户端与服务端以不同的方式读写byte
2.服务端和客户端CPU端不一致
问题4项目中如何解决不同端的问题
答: 1.交互前需要商定协议,首先协议商定以什么的方式传输数据大端或者小端(运气不好的话有一端需要转换后再传输…(⊙_⊙;)… )
2.协议商定的同时给出协议数据demo,可以根据数据demo来确定是否一致
总结:
大小端问题取决于处理器,其次语言也有默认的端读/写
末尾
以上如果有不对的欢迎指出来,一起学习进步,谢谢.
自己选的路,跪着也要走完,