mysql奇怪的字符编码
在项目的一次测试中,偶然发现一个怪异的现象
采用mysql5.0,数据库编码采用默认的latin1
然后通过程序添加了一些数据
在页面上,查询时,输入 "软"结果查找出来一些数据,根本和"软"字不匹配,我就纳闷了,难道我程序写错了
也不可能啊,其他的模糊查询都是好的,没理由的
在进行跟踪调试后,没有发现任何问题,然后就直接在 mysql数据库中,执行那条简单的sql语句,
结果出来20几条数据
证明了程序没错!但是出来这20几条数据只有一条的clientname中包含了"软""字
其他的都没有,我就更加纳闷了!
通过对比这20几条数据的,发现他们的clientname 中都包含"上"字(当然这个也是测试出来的)
同样:出现了同样的20几条数据
这个时候,我就开始怀疑,两个字"软"和"上"的问题了
很快我意识到可能上编码造成的问题!
难道这两个字的latin1编码是一样的?
为了确认是否是因为编码问题,引起的原因,
本人特意在Mysql下建立了一个gbk编码的数据库,表和字段的编码也都是gbk编码
然后进行测试,现使用“上”字
再使用“软”字
可以看出问题应该是出在字符编码上了;
在gbk编码下,这两个字“上”和“软”不会出现混淆,但在latin1下确实存在问题!
总结:
latin1编码其实就是使用iso-8859-1进行编码的,也是国际通用的编码方式,它采用单字节编码
而gbk编码是针对中文进行编码的,它必须用两个字节才能对一个汉字进行编码,这两种编码之间的转换
在大多情况下不会有问题,但对一些汉字看来还是存在问题!