MySQL学习笔记（一）基础架构

大体来说，MySQL可以分为Server层和存储引擎层两部分。

Server 层包括连接器、查询缓存、分析器、优化器、执行器等，涵盖MySQL大多数核心服务功能，以及所有内置函数（如日期、时间、数学和加密函数等），所有跨存储引擎的功能都在这一层实现，比如存储过程、触发器、视图等等。

而存储引擎层负责数据的存储和提取。其架构模式是插件式的，支持InnoDB、MyISAM、Memory等多个存储引擎。现在最常用的存储引擎是InnoDB，默认存储引擎。

create table建表，默认使用InnoDB。不同引擎的表数据存取方式不同，支持的功能也不同。

不同的存储引擎共用一个Server层

连接器

首先会连接数据库。连接器负责和客户端建立连接、获取权限、维持和管理连接。

mysql -h$ip -P$port -u$user -p

连接命令中的 mysql 是客户端工具，用来跟服务端建立连接。完成TCP握手后，连接器就要开始认证身份，这个时候就是你输入的用户名和密码。认证通过后，连接器会到权限表里面查出你拥有的权限。

长连接指连接成功后，如果客户端持续有请求，则一直使用同一个连接。短连接指每次执行完很少的几次查询就断开连接，下次查询再重新建立一个。（所以尽量使用长连接）

长连接累积下来可能导致内存占用太大，MySQL在执行过程中临时使用的内存是管理在连接对象里面的，这些资源在连接断开的时候才释放。内存太大，被系统强行杀掉（OOM），从现象看就是MySQL异常重启。

解决的方案：

1. 定期断开长连接。或者执行一个占用内存的大查询后，断开连接，之后要查询再重连。

2.如果版本新，可以在每次执行完大操作后，通过执行mysql_reset_connection重新初始化连接资源。这个不需要重连，会将连接恢复到刚刚创建完时的状态。

查询缓存

连接建立完后就可以执行select语句了。

MySQL拿到查询请求后会先到查询缓存看看之前是否执行过这条语句，若执行过，则将结果以key-value对的形式，直接缓存到内存中。

若不在查询缓存中，就会继续执行阶段。执行完成后，执行结果会被存入查询缓存中。

但是大多数时候不要用查询缓存，因为弊大于利。

失效非常频繁。因为只要对一个表有更新，查询缓存就会被清空。对于更新压力大的数据库，查询缓存的命中率会非常低。如果业务是一张静态表，才比较适合。（比如系统配置表）

将参数query_cache_type设置成DEMAND，这样默认不使用查询缓存。对于想使用查询缓存的语句，可以用SQL_CACHE显式指定。

mysql> select SQL_CACHE * from T where ID=10；
8.0后彻底删掉查询缓存这个功能。。。艹

分析器

没有命中查询缓存，就执行。

首先“词法分析”。MySQL 从你输入的"select"这个关键字识别出来，这是一个查询语句。也要把字符串“T”识别成“表名T”，把字符串“ID”识别成“列ID”。

然后“语法分析”。判断是否符合语法。

优化器

分析完了后，在开始执行前，要经过优化器。

在表里有多个索引的时候决定使用哪个索引；或者在一个语句有多表关联（join）的时候，决定各个表的连接顺序。

如：mysql> select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;

既可以先从表t1里面取出c=10的记录的id值，再根据id关联到表t2，再判断t2里面d的值是否=20

也可先从t2里面取出d=20的记录的ID值，再根据ID值关联到t1，再判断t1里面c的值是否等于10；

两种方案逻辑一样但是执行效率不同，优化器的作用就是决定选择哪一个方案。

执行器

执行语句。

执行的时候会判断你对这个表T有没有执行查询的权限，如果没有就会返回没有权限的错误。

有权限，就打开表。根据表的引擎定义，去使用这个引擎提供的接口。

mysql> select * from T where ID=10;

例如：这个表T中，ID字段没有索引，那么：

1、调用InnoDB引擎接口取这个表的第一行，判断ID是不是10，如果不是就跳过，如果是则将这行存在结果集中。

2、调用引擎接口取“下一行”，重复相同逻辑，直到取到最后一行。

3、执行器将上述满足条件的行作为结果集返回客户端。