MySQL中的大小写问题

文简单介绍MySQL的列默认不区分大小写问题。

以用一幅图引出问题:

MySQL中的大小写问题

图中查询条件中是小写的bbb,结果却查到了大写的'BBB',看似有些不可思议,这不是MySQL的bug,是MySQL中的列默认是不区分大小写。

换一个a列再试一下:

MySQL中的大小写问题

上面这个图却又发现'aaa'没有查出'AAA'的记录,这时又区分大小写了,凌乱在风中~~~

看一下表的定义就清楚原因了:

MySQL中的大小写问题

可以看到a列的定义和普通的列不些不同,多出了这个不是很常见的设置:CHARACTER SET utf8 COLLATE utf8_bin。这就是按a列查询时可以区分出大小写的原因,下面就要解释下MySQL中的字符集和校验规则。

字符集与校验规则:

以上面图中看到的CHARACTER SET utf8 COLLATE utf8bin为例,utf8是字符集,utf8_bin是对应的校验规则。

字符集是表示字符的底层编码,在utf8字符集中,字符'A'用ascii码65表示,'a'为97。

校验规则指的是,在字符集内做比较时一种规则。如比较两个字符的大小时按其ascii码的大小比较,a>A。假设有另外一种比较方式,按ascii码值的相反数比较,则a<A。假如还有一种比较方式会先把大写转成小写再比较大小,则a=A。utf8字符集默认的校验规则是utf8_general_ci,其中ci就是case insensitive,是不区分大小写的,utf8_bin就是按utf8编码的二进制值比较大小,A和a的ascii分别是65和97,不相等,所以utf8_bin是区分大小写的。

可以通过show collation命令查看有哪些校验规则:

MySQL中的大小写问题

通过show character set查看有哪些字符集:

MySQL中的大小写问题

可以看到utf8的默认校验规则是utf8_general_ci。