SQL常用语句总结

前言

这篇博客,南国主要用来复习归纳关于SQL语句的一些基础知识。本博客的内容主要是在MySQL 5.x下执行的结果。

模式Schema

模式定义了数据如何存储、存储什么样的数据以及数据如何分解等信息,数据库和表都有模式。

主键的值不允许修改,也不允许复用(不能使用已经删除的主键值赋给新数据行的主键)。

SQL(Structured Query Language),标准 SQL 由 ANSI 标准委员会管理,从而称为 ANSI SQL。各个 DBMS 都有自己的实现,如 PL/SQL、Transact-SQL 等。

SQL 语句不区分大小写,但是数据库表名、列名和值是否区分依赖于具体的 DBMS 以及配置。

SQL 支持以下两种注释:

  • 单行注释 select * from account; #注释
  • 多行注释 select * from account;
    /* 注释

    */

数据库的显示 创建 使用

  • 显示: show databases;
  • 创建: create database test;
  • 使用: use test;

数据表中的操作

为了方便我们后续的SQL语句操作,我们在我们选定的数据库中新建一张表,并且插入相应的数据 显示出来。

创建表

CREATE TABLE `account` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(20) NOT NULL,
  `money` double DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8;

更新update

表中数据的修改 ,专业名词叫更新update
update account set money=1000 where id=‘3’;

修改表结构

1. 添加列
alter table account add month char(20);
2. 删除列
alter table account drop column month;
3. 删除表
drop table account; #删除表

表中插入数据

INSERT INTO `account` VALUES ('1', 'aaa', '1000');
INSERT INTO `account` VALUES ('2', 'bbb', '1000');
INSERT INTO `account` VALUES ('3', 'ccc', '1000');

查询数据

在SQL语句中,查询较为重要。select 是数据显示的出口,这里南国将所有能想到的在select语句用到的知识点都归纳在这一小节中。这里特别做出如下归纳总结:
1.这里先选用最简单的查询所有属性的值 (*)

select * from account;

运行结果:
SQL常用语句总结
2.还可将一个表中的内容插入到一个新表中
CREATE TABLE newtable AS SELECT * FROM mytable;

3.去重distinct
相同值只会出现一次。它作用于所有列,也就是说所有列的值都相同才算相同。当然这种情况很少【至少每行的主键值不同 一般是id】,一般而言 我们是看数据表中某些行的数据。如下:
select money from account; #查看某个属性的数据
SQL常用语句总结
select distinct money from account; #查看某个属性去重后的数据
SQL常用语句总结
4. limit 限制返回的行数
他可以有两个参数,第一个参数为起始行,从 0 开始;第二个参数为返回的总行数。
例如:
1.select * from account limit 5; #查询表中前5行数据
它等同于 select * from account limit 0,5;
2.select * from account limit 3,5; #查询表中第4行到9行的数据

5.排序

  • ASC :升序(默认)
  • DESC :降序

在SQL语句中,可以按多个列进行排序,并且为每个列指定不同的排序方式:
select * from account order by money desc; #按照money数值降序输出

6.过滤(where in and or not等)
不进行过滤的数据非常大,导致通过网络传输了多余的数据,从而浪费了网络带宽。因此尽量使用 SQL 语句来过滤不必要的数据,而不是传输所有的数据到客户端中然后由客户端进行过滤。

这里我们主要讲述的用于过滤的关键字是where and or in not等。

用where关键字
select * from account where money!=1000; #过滤掉money值为1000的数据
SQL常用语句总结
应该注意到,NULL 与 0、空字符串都不同

ANDOR 用于连接多个过滤条件。优先处理 AND,当一个过滤表达式涉及到多个 AND 和 OR 时,可以使用 () 来决定优先级,使得优先级关系更清晰。

IN 操作符用于匹配一组值,其后也可以接一个 SELECT 子句,从而匹配子查询得到的一组值。

NOT 操作符用于否定一个条件。

7.通配符
通配符也是用在过滤语句中,但它只能用于文本字段。

  • % 匹配 >=0 个任意字符;
  • _ 匹配 ==1 个任意字符;
  • 可以匹配集合内的字符,例如 [ab] 将匹配字符 a 或者 b。用脱字符 ^ 可以对其进行否定,也就是不匹配集合内的字符。

使用 Like 来进行通配符匹配。

SELECT *
FROM mytable
WHERE col LIKE '[^AB]%';  #不以 A 和 B 开头的任意文本

注意:不要滥用通配符,通配符位于开头处匹配会非常慢。

8.计算字段
计算字段通常需要使用 as 来取别名,否则输出的时候字段名为计算表达式。
select id*money as multi from account; #将id和money的乘积取别名multi输出
SQL常用语句总结
concat() 用于连接两个字段。许多数据库会使用空格把一个值填充为列宽,因此连接的结果会出现一些不必要的空格,使用 TRIM() 可以去除首尾空格。

select concat(trim(name),’(’,trim(money),’)’) as abcd from account;
SQL常用语句总结
9.常用的MySQL函数
SQL常用语句总结
还有一些文本处理的函数:

函数 说明
left() 左边的字符
right() 右边的字符
lower() 转换为小写字符
upper() 转换为大写字符
ltrim() 去除左边的空格
rtrim() 去除右边的空格
length() 长度

10.分组
分组就是把具有相同的数据值的行放在同一组中。

可以对同一分组数据使用汇总函数进行处理,例如求分组数据的平均值等。

指定的分组字段除了能按该字段进行分组,也会自动按该字段进行排序。

SELECT col, COUNT(*) AS num
FROM account
GROUP BY col;

GROUP BY 自动按分组字段进行排序,ORDER BY 也可以按汇总字段来进行排序。

SELECT col, COUNT(*) AS num
FROM mytable
GROUP BY col
ORDER BY num;

WHERE 过滤行,HAVING 过滤分组,行过滤应当先于分组过滤。

SELECT col, COUNT(*) AS num
FROM mytable
WHERE col > 2
GROUP BY col
HAVING num >= 2;

分组规定:

  • GROUP BY 子句出现在 WHERE 子句之后,ORDER BY 子句之前;
  • 除了汇总字段外,SELECT 语句中的每一字段都必须在 GROUP BY 子句中给出;
  • NULL 的行会单独分为一组;
  • 大多数 SQL 实现不支持 GROUP BY 列具有可变长度的数据类型。

11.子查询
子查询中只能返回一个字段的数据。

可以将子查询的结果作为 WHRER 语句的过滤条件:

SELECT *
FROM mytable1
WHERE col1 IN (SELECT col2
               FROM mytable2);

下面的语句可以检索出客户的订单数量,子查询语句会对第一个查询检索出的每个客户执行一次:

SELECT cust_name, (SELECT COUNT(*)
                   FROM Orders
                   WHERE Orders.cust_id = Customers.cust_id)
                   AS orders_num
FROM Customers
ORDER BY cust_name;

12.连接
连接用于连接多个表,使用 join关键字,并且条件语句使用 on 而不是 where。

连接可以替换子查询,并且比子查询的效率一般会更快。

可以用as给列名、计算字段和表名取别名,给表名取别名是为了简化 SQL 语句以及连接相同表。

内连接
内连接又称等值连接,使用inner join关键字。

select A.value, B.value
from tablea as A innner join tableb as B
on A.key = B.key;

也可以不明确使用inner join,而使用普通查询并在where中将两个表中要连接的列用等值方法连接起来。

select A.value, B.value
from tablea as A, tableb as B
where A.key = B.key;

在没有条件语句的情况下返回笛卡尔积。

自连接
自连接可以看成内连接的一种,只是连接的表是自身而已。

一张员工表,包含员工姓名和员工所属部门,要找出与 Jim 处在同一部门的所有员工姓名。

子查询版本:

select name
from employee
where department = (
      select department
      from employee
      where name = "Jim");

自连接版本:

select e1.name
from employee AS e1 inner join employee AS e2
on e1.department = e2.department
      and e2.name = "Jim";

自然连接
自然连接是把同名列通过等值测试连接起来的,同名列可以有多个。

内连接和自然连接的区别:内连接提供连接的列,而自然连接自动连接所有同名列。

select A.value, B.value
from tablea as A natural join tableb as B;

外连接
外连接保留了没有关联的那些行。分为左外连接,右外连接以及全外连接,左外连接就是保留左表没有关联的行。

检索所有顾客的订单信息,包括还没有订单信息的顾客。

select Customers.cust_id, Orders.order_num
from Customers left outer join Orders
on Customers.cust_id = Orders.cust_id;

SQL常用语句总结
13.组合查询
使用 union 来组合两个查询,如果第一个查询返回 M 行,第二个查询返回 N 行,那么组合查询的结果一般为 M+N 行。

每个查询必须包含相同的列、表达式和聚集函数。

默认会去除相同行,如果需要保留相同行,使用 union all

只能包含一个 order by 子句,并且必须位于语句的最后。

select col
from mytable
where col = 1
union
select col
from mytable
where col =2;

视图view

视图是虚拟的表,本身不包含数据,也就不能对其进行索引操作。

对视图的操作和对普通表的操作一样。

视图具有如下好处:

  • 简化复杂的 SQL 操作,比如复杂的连接;
  • 只使用实际表的一部分数据;
  • 通过只给用户访问视图的权限,保证数据的安全性;
  • 更改数据格式和表示。
create view myview as
select Concat(col1, col2) as concat_col, col3*col4 AS compute_col
from mytable
where col5 = val;

存储过程

存储过程可以看成是对一系列 SQL 操作的批处理。

使用存储过程的好处:

  • 代码封装,保证了一定的安全性;
  • 代码复用;
  • 由于是预先编译,因此具有很高的性能。

命令行中创建存储过程需要自定义分隔符,因为命令行是以 ; 为结束符,而存储过程中也包含了分号,因此会错误把这部分分号当成是结束符,造成语法错误。

包含 in、out 和 inout 三种参数。

给变量赋值都需要用 select into 语句。

每次只能给一个变量赋值,不支持集合的操作。

delimiter //

create procedure myprocedure( out ret int )
    begin
        declare y int;
        select sum(col1)
        from mytable
        into y;
        select y*y into ret;
    end //

delimiter ;
call myprocedure(@ret);
select @ret;

游标

在存储过程中使用游标可以对一个结果集进行移动遍历。

游标主要用于交互式应用,其中用户需要对数据集中的任意行进行浏览和修改。

使用游标的四个步骤:
1.声明游标,这个过程没有实际检索出数据;
2.打开游标;
3.取出数据;
4.关闭游标;

delimiter //
create procedure myprocedure(out ret int)
    begin
        declare done boolean default 0;

        declare mycursor cursor for
        select col1 from mytable;
        # 定义了一个 continue handler,当 sqlstate '02000' 这个条件出现时,会执行 set done = 1
        declare continue handler for sqlstate '02000' set done = 1;

        open mycursor;

        repeat
            fetch mycursor into ret;
            select ret;
        until done end repeat;

        close mycursor;
    end //
 delimiter ;

触发器

触发器会在某个表执行以下语句时而自动执行:delete、insert、update。

触发器必须指定在语句执行之前还是之后自动执行,之前执行使用 before 关键字,之后执行使用 after 关键字。before 用于数据验证和净化,after 用于审计跟踪,将修改记录到另外一张表中。

insert 触发器包含一个名为 NEW 的虚拟表。

create trigger mytrigger AFTER INSERT on mytable
FOE EACH ROW select NEW.col into @result;

select @result; -- 获取结果

DELETE 触发器包含一个名为 OLD 的虚拟表,并且是只读的。

UPDATE 触发器包含一个名为 NEW 和一个名为 OLD 的虚拟表,其中 NEW 是可以被修改的,而 OLD 是只读的。

MySQL 不允许在触发器中使用 CALL 语句,也就是不能调用存储过程。

事务管理

在南国上一篇博客数据库系统原理简要总结,第一节里我详细讲述了事物。
这里在做个简短介绍:

  • 事物(Transaction)指满足ACID的一组操作,我们这里把它称之为一组SQL语句吧。
  • 回退(Rollback)指撤销指定 SQL 语句的过程;
  • 提交(commit)指将未存储的 SQL 语句结果写入数据库表;
  • 保留点(savepoint)指事务处理中设置的临时占位符(placeholder),你可以对它发布回退(与回退整个事务处理不同)。

不能回退 SELECT 语句,回退 SELECT 语句也没意义;也不能回退 CREATE 和 DROP 语句。

MySQL 的事务提交默认是隐式提交,每执行一条语句就把这条语句当成一个事务然后进行提交。当出现 START TRANSACTION 语句时,会关闭隐式提交;当 COMMIT 或 ROLLBACK 语句执行后,事务会自动关闭,重新恢复隐式提交。

通过设置 autocommit 为 0 可以取消自动提交;autocommit 标记是针对每个连接而不是针对服务器的。

如果没有设置保留点,ROLLBACK 会回退到 START TRANSACTION 语句处;如果设置了保留点,并且在 ROLLBACK 中指定该保留点,则会回退到该保留点。

START TRANSACTION
// ...
SAVEPOINT delete1
// ...
ROLLBACK TO delete1
// ...
COMMIT

字符集

基本术语:

  • 字符集为字母和符号的集合;
  • 编码为某个字符集成员的内部表示;
  • 校对字符指定如何比较,主要用于排序和分组。

除了给表指定字符集和校对外,也可以给列指定:

CREATE TABLE mytable
(col VARCHAR(10) CHARACTER SET latin COLLATE latin1_general_ci )
DEFAULT CHARACTER SET hebrew COLLATE hebrew_general_ci;

可以在排序、分组时指定校对:

SELECT *
FROM mytable
ORDER BY col COLLATE latin1_general_ci;

参考资料:
CS-Notes SQL