计算机理论学习之进制与编码

进制与编码

十进制：逢十进一

　　表示数字： 0123456789

二进制：逢二进一

　　表示数字： 0 1

八进制：逢八进一

　　表示数字：01234567

八进制的作用：在一些比较古老的Unix应用中在使用八进制，在一些编程语言里提供了使用八进制符号来表示数字的能力

八进制和二进制之间的转换：

　　2=>8 : 取三合一 8=>2 ：取一分三

十六进制：逢十六进一

　　表示数字： 01234567ABCDEF

二进制使用起来很不方便， 16进制或8进制可以解决这个问题。因为，进制越大，数的表达长度也就越短。2、8、16，分别是2的1次方、3次方、4次方，这一点使得三种进制之间可以非常直接地互相转换。8进制和16进制缩短了二进制数，但保持了二进制数的表达特点。

计算机中的存储单位：

位 bit (比特)(Binary Digits)：存放一位二进制数，即 0 或 1，最小的存储单位。
字节 byte：8个二进制位为一个字节(B)，最常用的单位。
1B（bytes） = 8bit
1KB (Kilobyte 千字节)=1024B，
1MB (Megabyte 兆字节简称“兆”)=1024KB，
1GB (Gigabyte 吉字节又称“千兆”)=1024MB，
1TB(Trillionbyte 万亿字节太字节)=1024GB，
1PB（Petabyte 千万亿字节拍字节）=1024TB，
1EB（Exabyte 百亿亿字节艾字节）=1024PB，
1ZB (Zettabyte 十万亿亿字节泽字节)= 1024 EB,
1YB (Yottabyte 一亿亿亿字节尧字节)= 1024 ZB,
1BB (Brontobyte 一千亿亿亿字节)= 1024 YB

32位和64位 /32bit和64bit的区别

1、对操作系统来说，64位和32位指最大内存寻址空间，32位最大4GB（2^32），64位理论上16EB(2^64)，但现在一般都是2^48

2、对硬件来说，64位和32位指数据宽度，64位一次取8字节也就是64bit，32取4字节也就是32bit，所以理论上64位比32位性能提高了一倍，但实际上达不到，内存变大，需要寻址更多空间。

3、对应用程序来说，应用程序基于操作系统和硬件，其使用的指令宽度随系统和硬件变化。

64位操作系统可以支持4G以上的内存，缺点也是内存占用，64位代码比32位代码占用更多的空间，64位操作系统兼容32位软件，反之则不行。

32位和64位最本质的区别是CPU来决定的，操作系统的位数是看最大能把CPU的性能发挥到多高。

二进制的编码

计算机内部是由集成电路这种电子部件构成的，电路只可以表示两种状态——通电、断电

因为这个特性，计算机内部只能处理二进制。那为什么我们能在计算机上看到字母和特殊字符呢？

如果我们用一个二进制数字表示一个字符，比如说用“0100 0001”来表示A。

根据这个对应关系，我们制作一个表格，这个表格里一个二进制数字对应一个字符。

计算机理论学习之进制与编码

这套编码叫ASCII（美国(国家)信息交换标准(代)码），使用7个或8个二进制位进行编码的方案，最多可以给256个字符。使用了ASCII码，不同的计算机之间就可以实现数据的标准化。
但是ASCII使用的时候有一些限制，它只可以表示256个字符。如果有其他的字符就无能为力了。ASCII只能表示26个基本的拉丁字母、阿拉伯数字和英式标点。因此也只能用于显示现代美国英语。
后来计算机世界开始有了其他语言，ASCII码已经无法满足需求。后来不同语言的人各自为自己定制了一套属于自己的编码，同时与ASCII保持兼容。这些编码统称MBCS。（中国的叫GB*，比如GBK）.
在后来有人开始觉得，这么多编码，有些编码之间还不兼容，太让人头大了，于是有这么一群人就坐在一起想出了一个办法：所有的语言都使用同一种编码，这种编码就是Unicode。 Unicode使用最少2个字节（1个字节=1BYTE=8bit=一个长度为8的二进制数）来表示字母和符号等,有时候是4个字节。这样就解决了上面遇到的问题。
Unicode又叫万国码，是业界的一种标准。但是有人又觉得如果我要表示一个ASCII里的字符，使用unicode来表示不是太浪费空间了吗，于是就有人想出了另外一种解决方案——UTF-8。
UTF-8是对Unicode编码的压缩和优化，最大的特点是它采用了变长的编码方式，他不再是最少使用2个字节，而是将所有的字符进行分类。ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存…

计算机理论学习之进制与编码

GB2312是1980年国家制定的汉字内码规范，收录了6千多汉字及符号，表示的符号有限；国家标准化委员会又制定了GB13000，GB13000制定的原则与GB2312不同，GB13000以国际化为目标，该标准编码参照了Unicode 2.0 标准编码，与GB2312完全不兼容，因早期的计算机中的汉卡采用了GB2312，无法顺利向GB13000过渡，所以GB13000变成了一个纸面上的标准，无法推广；有了这个经验之后，国家标准化委员会制定了GBK标准，他兼容GB2312标准，同时在GB2312标准的基础上扩展了GB13000包含的字。

计算机理论学习之进制与编码

相关推荐