mysql奇怪的字符编码

在项目的一次测试中,偶然发现一个怪异的现象

采用mysql5.0,数据库编码采用默认的latin1

然后通过程序添加了一些数据

在页面上,查询时,输入 "软"结果查找出来一些数据,根本和"软"字不匹配,我就纳闷了,难道我程序写错了

也不可能啊,其他的模糊查询都是好的,没理由的

在进行跟踪调试后,没有发现任何问题,然后就直接在 mysql数据库中,执行那条简单的sql语句,

结果出来20几条数据

mysql奇怪的字符编码

证明了程序没错!但是出来这20几条数据只有一条的clientname中包含了"软""字

其他的都没有,我就更加纳闷了!

通过对比这20几条数据的,发现他们的clientname 中都包含"上"字(当然这个也是测试出来的)

同样:出现了同样的20几条数据

mysql奇怪的字符编码

这个时候,我就开始怀疑,两个字"软"和"上"的问题了

很快我意识到可能上编码造成的问题!

难道这两个字的latin1编码是一样的?

为了确认是否是因为编码问题,引起的原因,
本人特意在Mysql下建立了一个gbk编码的数据库,表和字段的编码也都是gbk编码
mysql奇怪的字符编码
然后进行测试,现使用“上”字
mysql奇怪的字符编码
再使用“软”字

mysql奇怪的字符编码

可以看出问题应该是出在字符编码上了;
在gbk编码下,这两个字“上”和“软”不会出现混淆,但在latin1下确实存在问题!
总结:
latin1编码其实就是使用iso-8859-1进行编码的,也是国际通用的编码方式,它采用单字节编码
而gbk编码是针对中文进行编码的,它必须用两个字节才能对一个汉字进行编码,这两种编码之间的转换
在大多情况下不会有问题,但对一些汉字看来还是存在问题!