Base64算法 编码

Base64作为一个历史悠久的算法,起初是为了电子邮件的传输而创立。因为它的算法和对应表公开, 所以Base64从严格意义上来说并不能算是现代加密算法。


如今学习Base64的意义在于 ,以它为例,学习单表置换算法。而且Base64经过改造后,可以达到加密的效果。


对于Base64算法来说,字符原本的编码格式很重要(这点可在后文算法的详细步骤中看出),不同的编码对结果影响差别很大。

具体步骤:


1)字符串以字符为单位转换为对应编码

这里以ASCII码来举例:取三个字符为一组,按照ASCII的表转化为24位二进制数字。


注意:24位二进制很重要,这就是为什么要以三个字符为一组的原因。所以在其他编码形式(如用到汉字时的GBK、UTF-18)从24位二进制倒推回编码前所要求的字符个数(如UTF-18里一个汉字是2-4个字节,当一个汉字为三字节时,就以这一个汉字为一组)

Base64算法 编码

这里只列了两个字符,有助于理解算法中是如何补位的


2)编码转换为二进制

十进制转二进制

Base64算法 编码


3)3个8位二进制,转为4个6位二进制

分组方式改变,例子如下

Base64算法 编码

分到第三个时,剩下的不够6位,在后面补零


4)4个6位二进制分别在高位加2个0

至此变为4个8位二进制,也就解释了base64编码后字符创的长度会增加三分之一左右。

Base64算法 编码


5)4个8位二进制转为十进制

二进制转十进制

Base64算法 编码


6)依据Base64的字符表转化

64个字符对应0到63的数字。而Base64的名字正是由此而来。(还有Base32、Base16算法)

Base64算法 编码

最后还应加上=,等号是用来补位的。

Base64算法 编码


综上所述,输入Me,经过编码后得出TWU=

解码的过程不再赘述,按编码方法倒推即可。


网上有在线的Base64自动编码器,自己手工算过后,可以对照进行检查。

本篇主要是为了了解此算法的原理,在实际应用操作中使用两个方法(对于Java)就可以完成,这部分以后会说。