MySQL基础总结合集(2万字总结)

MySQL
370
0
0
2023-05-26

mysql 是啥?数据库又是啥?

MySQL:

MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS (Relational Database Management System:关系数据库管理系统)应用软件之一。

数据库:

数据库( Database )是按照数据结构来组织、存储和管理数据的仓库。

每个数据库都有一个或多个不同的 API 用于创建,访问,管理,搜索和复制所保存的数据。

我们也可以将数据存储在文件中,但是在文件中读写数据速度相对较慢。

所以,我们使用关系型数据库管理系统一般是用来存储和管理大数据量。

关系型数据库 ( SQL ):关系型数据库指的是使用关系模型(二维表格模型)来组织数据的数据库。

非关系型数据库 ( NoSQL ):非关系型数据库又被称为 NoSQL(Not Only SQL ),意为不仅仅是 SQL。通常指数据以对象的形式存储在数据库中,而对象之间的关系通过每个对象自身的属性来决定,常用于存储非结构化的数据。

MySQL安装及配置

  1. 首先先下载到一个文件夹中
  2. 下载后在环境变量中Path路径 添加MySQL的bin目录的路径
  3. 在 mysql-5.7.19-winx64 文件夹中 创建一个 my.ini 文件,内容为:
  4. [client] port=3306 default-character-set=utf8 [mysqld] #设置为自己MYSQL的安装目录 basedir=D:hspmysqlmysql-5.7.19-winx64 #设置为MYSQL的数据目录 datadir=E:mysql-5.7.19-winx64data port=3306 character_set_server=utf8 ##跳过安全检查,注销后,需要输入正确的用户名和密码才能启动 skip-grant-tables
  5. 使用管理员的身份打开cmd,并切换到安装的MySQL的bin目录底下,执行 mysqld-install
  6. 初始化数据库:mysqld –initialize-insecure –user= MySQL 此句执行后就会生成一个 data 目录
  7. 启动服务 net start mysql (要看MySQL服务是否启动可以去任务管理器的服务栏看)
  8. 关闭服务 net stop my sql
  9. 进入MySQL管理终端 mysql -u root -p
  10. 使用 MySQL数据库 :use mysql; 然后 UPDATE user SET authentication_string = PASSWORD(‘新的密码’) WHERE user = ‘dbadmin’ AND host = ‘localhost’; FLUSH PRIVILEGES; 这句表示刷新一下权限
  11. quit 指退出管理终端

如果真在 5-10步骤中哪里出了非错,可删除MySQL后重新配置服务 (sc delete mysql 该语句工作时一定要慎用!!)

4~7步一定要以管理员身份运行控制台才行

MySQL的服务,默认是“启动”的状态,只有启动了mysql才能用。默认情况下是“自动”启动,自动启动表示下一次重启操作系统的时候自动启动该服务。

可以在服务上点击右键: 启动 重启服务 停止服务 …

还可以改变服务的默认配置: 服务上点击右键,属性,然后可以选择启动方式: 自动(延迟启动) 自动 手动 禁用

在windows操作系统当中,怎么使用命令来启动和关闭mysql服务呢? 语法: net stop 服务名称; net start 服务名称;

其它服务的启停都可以采用以上的命令。

使用命令行窗口连接MySQL数据库:

首先,MySQL是一种服务(可在任务管理器服务栏中查看到MySQL),而只要是一个服务都会监听一个端口

mysql -h 主机IP -P 端口 -u 用户名 -p密码 ( p和密码间不要有空格,如果-p后面没有写密码,回车后会要求输入密码 )

如果不写 -h 主机IP,默认就是连接到本地

如果不写-P 端口,默认就是3306

在实际工作中往往会修改 端口号 而不是使用此默认端口号,此处为了方便就不做改动了

MySQL数据库的 三层结构

数据在数据库中的存储形式

以表格的形式存储数据

任何一张表都有行和列:

行(row):被称为数据/记录。 列(column):被称为字段。

每一个字段都有:字段名、数据类型、约束等属性。 字段名 可以理解是一个普通的名字,见名知意就行。 数据类型: 字符串 ,数字,日期等。

什么是 SQL语句 ?

SQL:结构化查询语言 程序员 需要学习SQL语句,程序员通过编写SQL语句,然后 DBMS 负责执行SQL 语句,最终来完成数据库中数据的增删改查操作。

SQL语句分类

DQL :数据查询语言[select…… ]

DML :数据操作语言[增加insert ,修改update,删除delete] 操作的是表中的数据

DDL :数据定义语言[create、drop、 alter ] 操作的是表的结构

DCL : 数据控制语言 [管理数据库,比如:授权grant、撤销权限revoke…. ]

TCL :事务控制语言 [如:事务提交:commit; 事务回滚:rollback;]

数据库、数据库管理系统、SQL之间的关系

三者之间的关系? DBMS通过执行SQL来操作DB

先安装数据库管理系统MySQL,然后学习SQL语句怎么写,编写SQL语句之后,DBMS 对SQL语句进行执行,最终来完成数据库的数据管理。

常用命令

注意:这些命令不区分大小写都行。

注意:mysql是不见“;”不执行,“;”表示结束!

退出exit; 或者 quit;

查看mysql数据库的版本号: select version();

查看mysql中有哪些数据库? show databases; 注意:以 分号 结尾,分号是英文的分号。

mysql默认自带了4个数据库。

怎么选择使用某个数据库呢? mysql> use test; 表示使用一个名字叫做test的数据库。

查看当前使用的是哪个数据库? mysql> select database();

导入一下提前准备好的数据: bjpowernode.sql 是提前为练习准备的数据库表。 怎么将sql文件中的数据导入呢?(可以将文件拖入source空格 后) 要在使用某个数据库后才能使用该语句 mysql> source D:course3-MySQLdocumentbjpowernode.sql

注意:路径中不要有中文!!!!

不看表中的数据,只看表的结构,有一个命令: desc 表名;

简单查询

查询一个字段?

select 字段名 from 表名;

查询两个字段,或者多个字段怎么办? 使用逗号隔开“,”

查询所有字段?

使用:select * from 表名;

别把把这种写法写到 Java 程序中,因为到时还要把 * 先转换成字段

缺点:①效率低 ②可读性差。

在实际开发中不建议,可以自己玩没问题。 你可以在 DOS命令 窗口中想快速的看一看全表数据可以采用这种方式。

给查询的列起别名?

使用 as 关键字,可以省略 select deptno,dname as deptname from dept;

假设起别名的时候,别名里面有空格,怎么办? mysql> select deptno,dname dept name from dept; DBMS看到这样的语句,进行SQL语句的编译,不符合语法,编译报错。 怎么解决? select deptno,dname ‘dept name’ from dept; //加单引号 select deptno,dname “dept name” from dept; //加双引号

注意:在所有的数据库当中,字符串统一使用 单引号 括起来, 单引号是标准,双引号在 oracle 数据库中用不了。但是在mysql 中可以使用。

再次强调:数据库中的字符串都是采用单引号括起来。这是标准的。 双引号不标准。

字段可以使用数学表达式

select ename,sal*12 from emp;

显示时字段名是 sal*12 这样时一般取个别名 select ename,sal*12 year_sal from emp;

条件查询

什么是条件查询?

查询出来符合条件的 ​ 语法格式: ​ select ​ 字段1,字段2,字段3…. ​ from ​ 表名 ​ where ​ 条件;

都有哪些条件?

= 等于查询薪资等于800的员工姓名和编号? select empno,ename from emp where sal = 800;

<> 或 != 不等于查询薪资不等于800的员工姓名和编号? select empno,ename from emp where sal != 800;

同理还有:<=,<,>=,>

between … and …. 两个值之间, 等同于 >= and <=

查询薪资在2450和3000之间的员工信息?包括2450和3000?

注意: 使用between and的时候,必须遵循左小右大。 between and是闭区间,包括两端的值。

is null 表示为 null(is not null 不为空)

查询哪些员工的津贴/补助为null? select empno,ename,sal,comm from emp where comm = null;( 像这样用=是查不到的 ) Empty set (0.00 sec)

注意:在数据库当中null不能使用等号进行衡量。需要使用is null 因为数据库中的null代表什么也没有,它不是一个值,所以不能使用 等号衡量。

正确的:select empno,ename,sal,comm from emp where comm is null;

and 并且查询工作岗位是MANAGER并且工资大于2500的员工信息?

select empno,ename,job,sal from emp where job = ‘MANAGER’ and sal > 2500;

or 或者

查询工作岗位是MANAGER或SALESMAN的员工?

select empno,ename,job from emp where job = ‘MANAGER’ or job = ‘SALESMAN’;

and和or同时出现的话,有优先级问题吗?(开发中如不记得优先级,加小括号)查询工资大于2500,并且部门编号为10或20部门的员工? select * from emp where sal > 2500 and deptno = 10 or deptno = 20; 分析以上语句的问题? and优先级比or高。 以上语句会先执行and,然后执行or。 以上这个语句表示什么含义? 找出工资大于2500并且部门编号为10的员工,或者20部门所有员工找出来。 正确做法:select * from emp where sal > 2500 and (deptno = 10 or deptno = 20);

in 包含,相当于多个 or (not in 不在这个范围中)查询工作岗位是MANAGER和SALESMAN的员工? select empno,ename,job from emp where job = ‘MANAGER’ or job = ‘SALESMAN’; select empno,ename,job from emp where job in(‘MANAGER’, ‘SALESMAN’);

注意:in不是一个区间。in后面跟的是具体的值。

查询薪资是800和5000的员工信息? select ename,sal from emp where sal = 800 or sal = 5000; select ename,sal from emp where sal in(800, 5000); //这个不是表示800到5000都找出来。

not in 表示不在这几个值当中的数据。select ename,sal from emp where sal not in(800, 5000, 3000);

not 可以取非,主要用在 is 或 in 中 is null is not null in not in

like 称为模糊查询,支持%或下划线匹配 %匹配任意多个字符 下划线:任意一个字符。 (%是一个特殊的符号,_ 也是一个特殊符号)

找出名字中含有O的? mysql> select ename from emp where ename like ‘%O%’;

找出名字以T结尾的? select ename from emp where ename like ‘%T’;

找出名字以K开始的? select ename from emp where ename like ‘K%’;

找出第二个字每是A的? select ename from emp where ename like ‘_A%’;

找出第三个字母是R的? select ename from emp where ename like ‘__R%’;

找出名字中有“_”的? select name from t_student where name like ‘%_%’; //这样不行。

正确: select name from t_student where name like ‘%_%’; // 转义字符 。

对查询结果排序

排序 order by( 默认是升序!!!)

查询所有员工薪资,排序? select ename,sal from emp order by sal;

怎么降序(后面加上desc)?

指定降序: select ename,sal from emp order by sal desc;

可以两个字段排序吗?或者说按照多个字段排序? 查询员工名字和薪资,要求按照薪资升序,如果薪资一样的话, 再按照名字升序排列。 select ename,sal from emp order by sal desc, ename asc; // sal在前,起主导,只有sal相等的时候,才会考虑启用ename排序。

了解内容:根据字段的位置也可以排序 select ename,sal from emp order by 2; // 2表示第二列。第二列是sal 按照查询结果的第2列sal排序。

了解一下,不建议在开发中这样写,因为不健壮。 因为列的顺序很容易发生改变,列顺序修改之后,2就废了

综合一点的案例: 找出工资在1250到3000之间的员工信息,要求按照薪资降序排列。 select ename,sal from emp where sal between 1250 and 3000 order by sal desc;

以上语句的执行顺序必须掌握: 第一步:from 第二步:where 第三步:select 第四步:order by

数据处理函数

数据处理函数又被称为单行处理函数

单行处理函数的特点:一个输入对应一个输出。

和单行处理函数相对的是:多行处理函数。(多行处理函数特点:多个输入,对应1个输出!)

常见的单行处理行数

lower 转换小写select lower(ename) as ename from emp;

 +--------+
| ename  |
+--------+
| smith  |
| allen  |
| ward   |
| jones  |
| martin |
| blake  |
| clark  |
| scott  |
| king   |
| turner |
| adams  |
| james  |
| ford   |
| miller |
+--------+  

14个输入,最后还是14个输出。这是单行处理函数的特点。

upper 转换大写select upper(name) as name from t_student;

substr 取子串(substr( 被截取的字符串, 起始下标,截取的长度))select substr(ename, 1, 1) as ename from emp; 注意:起始下标从1开始,没有0.

LEFT (string2 , length )从 string2 中的左边起取 length 个字符

RIGHT (string2 ,length ) 从 string2 中的右边起取 length 个字符

找出员工名字第一个字母是A的员工信息? 第一种方式:模糊查询 select ename from emp where ename like ‘A%’; 第二种方式: substr函数 select ename from emp where substr(ename,1,1) = ‘A’;

学生名字首字母大写?

select concat(upper(substr(name,1,1)),substr(name,2,length(name) – 1)) as result from t_student;

注意:字符串拼接一定要用concat而不能用+

像这样不行:select upper(substr(name,1,1)) + substr(name,2,length(name) – 1) from t_student;

concat函数进行字符串的拼接select concat(empno,ename) from emp;

可以拼接多个concat(……,……,……)

length 取长度select length(ename) enamelength from emp;

trim 去两边空格

select * from emp where ename = trim(‘ KING’);

RTrim切除右边的空格,LTrim切除左边的空格

str_to_date 将字符串转换成日期 date_format 格式化日期 format 设置千分位

(后面讲)

一个诡异的现象

select ‘abc’ as bieming from emp; // select后面直接跟“字面量/字面值”

 +---------+
        | bieming |
        +---------+
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        +---------+  

select abc from emp; ERROR 1054 (42S22): Unknown column ‘abc’ in ‘field list’ 这样肯定报错,因为会把abc当做一个字段的名字,去emp表中找abc字段去了。

结论:select后面可以跟某个表的字段名(可以等同看做变量名),也可以跟字面量/字面值(数据)。select 21000 as num from dept;// 21000也是被当做一个字面量/字面值。

 +-------+
    | num   |
    +-------+
    | 21000 |
    | 21000 |
    | 21000 |
    | 21000 |
    +-------+  

round(要操作的数, 保留几位小数) 四舍五入

select round(21000.4, 0) as num from dept; //结果和上面一样

select round(1236.567, -1); // 保留到十位。

rand() 生成随机数 在 0 ≤ 随机数 ≤ 1.0 select floor(rand()*100); // 100以内的随机数

如果使用 rand (seed) 返回随机数, 范围 0 ≤ 随机数 ≤ 1.0, 如果 seed 不变,多次执行返回的结果也是不变的

ifnull是空处理函数。专门处理空的,可以将 null 转换成一个具体值

在所有的数据库当中,只要有null参与了数学运算,最终结果就是NULL

计算每个员工的年薪?

select ename, (sal + ifnull(comm, 0))*12 year_sal from emp;

case..when..then..when..then..else..end 当员工的工作岗位是MANAGER的时候,工资上调10%,当工作岗位是SALESMAN的时候,工资上调50%,其它正常。 (注意:不修改数据库,只是将查询结果显示为工资上调) select ename, job, sal as oldsal, (case job when ‘MANAGER’ then sal*1.1 when ‘SALESMAN’ then sal*1.5 else sal end) as newsal from emp;

select 后可以不接from 当作简单的测试工具

等同于接了from dual;

dual为 亚元表, 系统表 可以作为测试表使用

select round(3.14, 3);

 +----------------+
| round(3.14, 3) |
+----------------+
|          3.140 |
+----------------+  

select concat(’13’,’57’,’9′);

 +-----------------------+
| concat('13','57','9') |
+-----------------------+
| 13579                 |
+-----------------------+  

多行处理函数

五个分组函数

多行处理函数也叫分组函数

多行处理函数的特点:输入多行,最终输出一行。

5个: count 计数 sum 求和 avg 平均值 max 最大值 min 最小值

注意: 分组函数在使用的时候必须先进行分组,然后才能用。 如果你没有对数据进行分组,整张表默认为一组。

找出最高工资? mysql> select max(sal) from emp;

找出最低工资? mysql> select min(sal) from emp;

计算工资和: mysql> select sum(sal) from emp;

计算平均工资: mysql> select avg(sal) from emp;

计算员工数量? mysql> select count(ename) from emp;

计算员工数量? mysql> select count(ename) from emp;

注意:如果count中填的是表达式的话,要加上 or null, 因为 Mysql 中 count() 函数的一般用法是统计字段非空的记录数,利用这个特点来进行条件统计,如果字段是 NULL 就不会统计,但是 false 是会被统计到的

分组函数在使用的时候需要注意哪些?

分组函数自动忽略NULL,你不需要提前对NULL进行处理。

mysql> select sum(comm) from emp;

 +-----------+
    | sum(comm) |
    +-----------+
    |   2200.00 |
    +-----------+  

分组函数中count(*) 和 count(具体字段) 有什么区别?

count(具体字段):表示统计该字段下所有不为NULL的元素的总数。 count(*):统计表当中的总行数。(只要有一行数据count则++) 每一行记录不可能都为NULL(不存在一行全为null的表),一行数据中有一列不为NULL,则这行数据就是有效的。

 mysql> select count(*) from emp;
+----------+
| count(*) |
+----------+
|       14 |
+----------+
​
mysql> select count(comm) from emp;
+-------------+
| count(comm) |
+-------------+
|           4 |
+-------------+  

分组函数不能直接使用在where子句中

找出比最低工资高的员工信息。 select ename,sal from emp where sal > min(sal); 表面上意思感觉是没问题,运行一下发现: ERROR 1111 (HY000): Invalid use of group function ????????????????????????????????????????????????????????????????????? 分组函数在使用的时候必须先进行分组,而分组的group by 执行顺序是在where后的,也就是让分组函数 min 先于分组了,所以会报错

所有的分组函数可以组合起来一起用

select sum(sal),min(sal),max(sal),avg(sal),count(*) from emp;

 +----------+----------+----------+-------------+----------+
| sum(sal) | min(sal) | max(sal) | avg(sal)    | count(*) |
+----------+----------+----------+-------------+----------+
| 29025.00 |   800.00 |  5000.00 | 2073.214286 |       14 |
+----------+----------+----------+-------------+----------+  

分组查询

在实际的应用中,可能有这样的需求, 需要先进行分组,然后对每一组的数据进行操作。 这个时候我们需要使用分组查询,怎么进行分组查询呢? select … from … group by … 计算每个部门的工资和? 计算每个工作岗位的平均薪资? 找出每个工作岗位的最高薪资? ….

将之前的关键字全部组合在一起,他们的执行顺序? select … from … where … group by … order by …

以上关键字的顺序不能颠倒,需要记住。执行顺序是什么? 1.from 2.where 3.group by 4.select 5.order by

为什么分组函数不能直接使用在where后面? select ename,sal from emp where sal > min(sal);//报错。 因为分组函数在使用的时候必须先分组之后才能使用。 where执行的时候,还没有分组。所以where后面不能出现分组函数。

select sum(sal) from emp; ​ 这个没有分组,为啥sum()函数可以用呢? ​ 因为select在group by之后执行。

找出每个工作岗位的工资和? 实现思路:按照工作岗位分组,然后对工资求和。 select job,sum(sal) from emp group by job;

 +-----------+----------+
| job       | sum(sal) |
+-----------+----------+
| ANALYST   |  6000.00 |
| CLERK     |  4150.00 |
| MANAGER   |  8275.00 |
| PRESIDENT |  5000.00 |
| SALESMAN  |  5600.00 |
+-----------+----------+
以上这个语句的执行顺序?
先从emp表中查询数据。
根据job字段进行分组。
然后对每一组的数据进行sum(sal)  

重点结论: 在一条select语句当中,如果有group by语句的话, select后面只能跟:参加分组的字段,以及分组函数。 其它的一律不能跟。

找出“每个部门,不同工作岗位”的最高薪资?

两个字段联合分组select deptno, job, max(sal) from emp group by deptno, job;

使用having对分组后的数据进一步过滤

having不能单独使用,having不能代替where,having必须和group by联合使用。

找出每个部门最高薪资,要求显示最高薪资大于3000的?

select deptno, max(sal) from emp group by deptno having max(sal) > 3000;

单表查询大总结

select ​ … ​ from ​ … ​ where ​ … ​ group by ​ … ​ having ​ … ​ order by ​ …

执行顺序?

1.from

2.where

3.group by

4.having

5.select

6.order by

找出除MANAGER岗位之外,每个岗位的平均薪资,要求显示平均薪资大于1500的, 要求按照平均薪资降序排。

select job, avg(sal) from emp where job != ‘MANAGER’ group by job having avg(sal) > 1500 order by avg(sal);

distinct 关键字

把查询结果去除重复记录【distinct】 注意:原表数据不会被修改,只是查询结果去重。 去重需要使用一个关键字:distinct

distinct只能出现在所有字段的最前方,表示对各字段联合起来的查询结果去重

这样编写是错误的,语法错误。

select ename,distinct job from emp;

统计一下工作岗位的数量?select count(distinct job) from emp;

连接查询

什么是连接查询?

从一张表中单独查询,称为单表查询。 ​ 多张表联合起来查询数据,被称为连接查询。

根据语法的年代分类: SQL92:1992年的时候出现的语法 SQL99:1999年的时候出现的语法 我们这里重点学习SQL99.(这个过程中简单演示一个SQL92的例子)

根据表连接的方式分类: 内连接: 等值连接 非等值连接 自连接

外连接: ​ 左外连接(左连接) ​ 右外连接(右连接)

什么是笛卡尔积现象

当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是 两张表条数的乘积,这种现象被称为:笛卡尔积现象。(笛卡尔发现的,这是一个数学现象。)

怎么避免笛卡尔积现象

连接时加条件,满足这个条件的记录被筛选出来!

表起别名。很重要。效率问题。select e.ename,d.dname from emp e, dept d where e.deptno = d.deptno;

注意:通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量减少表的连接次数。

内连接

两张表连接时没有主次关系的连接称为内连接

等值连接

案例:查询每个员工所在部门名称,显示员工名和部门名? emp e和dept d表进行连接。条件是:e.deptno = d.deptno

SQL92语法: select e.ename,d.dname from emp e, dept d where e.deptno = d.deptno;

sql92的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。

SQL99语法: inner 可以省略,不省略可读性会好一些 select e.ename,d.dname from emp e inner join dept d on e.deptno = d.deptno;

sql99优点:表连接的条件是独立的,连接之后,如果还需要进一步筛选,再往后继续添加where

非等值连接

案例:找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级?

select e.ename, e.sal, s.grade from emp e join salgrade s on e.sal between s.losal and s.hisal;

自连接

内连接之自连接 案例:查询员工的上级领导,要求显示员工名和对应的领导名?

emp a 员工表、emp b 领导表

select a.ename 员工, b.ename 领导 from emp a join emp b on a.mgr = b.empno;

外连接

两张表连接时有主次关系

右(外)连接

// outer是可以省略的,带着可读性强。 select e.ename,d.dname from emp e right outer join dept d on e.deptno = d.deptno;

right代表什么:表示将join关键字右边的这张表看成主表,主要是为了将 这主表的数据全部查询出来,捎带着关联查询左边的表。(如果此表没有对应和主表满足 on 后条件的 ,那次表会自动补充 NULL ) 在外连接当中,两张表连接,产生了主次关系。

左(外)连接

左外连接同理

任何一个右连接都有左连接的写法。 任何一个左连接都有右连接的写法。

案例:查询每个员工的上级领导,要求显示所有员工的名字和领导名?

select a.ename ‘员工’, b.ename ‘领导’ from emp a left join emp b on a.mgr = b.empno;

三张表连接如下(四张表同理)

语法: select … from a join b on a和b的连接条件 join c on a和c的连接条件

案例:找出每个员工的部门名称以及工资等级, 要求显示员工名、部门名、薪资、薪资等级?

select e.ename, d.dname, s.grade from emp e join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal;

一条SQL中内连接和外连接可以混合。都可以出现!

案例:找出每个员工的部门名称以及工资等级,还有上级领导, 要求显示员工名、领导名、部门名、薪资、薪资等级?

select e.ename ‘员工’, u.ename ‘领导’, d.dname, e.sal, s.grade from emp e left join emp u on e.mgr = u.empno join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal;

什么是子查询?

select语句中嵌套select语句,被嵌套的select语句称为子查询。

子查询都可以出现在哪里呢?

select ​ ..(select). ​ from ​ ..(select). ​ where ​ ..(select).

where子句中的子查询

案例:找出比最低工资高100的员工姓名和工资?

select ​ ename,sal ​ from ​ emp ​ where ​ sal > min(sal);

ERROR 1111 (HY000): Invalid use of group function ​ where子句中不能直接使用分组函数。

正确:select e.ename, e.sal from emp e where e.sal > (select min(sal)+1000 from emp);

from子句中的子查询

案例:找出每个岗位的平均工资的薪资等级。

select a.*, s.grade from (select job, avg(sal) avg_sal from emp group by job) a join salgrade s on a.avg_sal between s.losal and s.hisal;

子查询中的avg(sal)一定要起个别名才能在内连接中使用

select后面出现的子查询(了解即可)

案例:找出每个员工的部门名称,要求显示员工名,部门名? select e.ename,e.deptno,(select d.dname from dept d where e.deptno = d.deptno) as dname from emp e;

select e.ename,e.deptno,(select dname from dept) as dname from emp e; //错误:ERROR 1242 (21000): Subquery returns more than 1 row

注意:对于select后面的子查询来说,这个子查询只能一次返回1条结果, 多于1条,就报错了。!

Union关键字

union作用:合并查询结果集

案例:查询工作岗位是MANAGER和SALESMAN的员工?

select ename,job from emp where job = ‘MANAGER’ or job = ‘SALESMAN’;

select ename,job from emp where job in(‘MANAGER’,’SALESMAN’);

select ename,job from emp where job = ‘MANAGER’ union select ename,job from emp where job = ‘SALESMAN’;

像下面这样是错误的:union在进行结果集合并的时候,要求两个结果集的列数相同。 select ename,job from emp where job = ‘MANAGER’ union select ename from emp where job = ‘SALESMAN’;

// MYSQL可以结果集合并时列和列的数据类型不一致 ,oracle语法严格 ,不可以,其结果集合并时列和列的数据类型也要一致。 select ename,job from emp where job = ‘MANAGER’ union select ename,sal from emp where job = ‘SALESMAN’;

limit关键字

limit作用:将查询结果集的一部分取出来。通常使用在分页查询当中。 百度默认:一页显示10条记录。 分页的作用是为了提高用户的体验,因为一次全部都查出来,用户体验差。 可以一页一页翻页看。

完整用法:limit startIndex, length startIndex是起始下标,length是长度。 limit起始下标从0开始。substr的起始下标从1开始

缺省用法:limit 5; 这是取前5.

select ename,sal from emp order by sal desc limit 0,5;

注意:mysql当中limit在order by之后执行!!!!!!

取出工资排名在[3-5]名的员工? select ename,sal from emp order by sal desc limit 2, 3; 2表示起始位置从下标2开始,就是第三条记录。 3表示长度。

通用分页方法:

每页显示3条记录 第1页:limit 0,3 [0 1 2] 第2页:limit 3,3 [3 4 5] 第3页:limit 6,3 [6 7 8] 第4页:limit 9,3 [9 10 11]

每页显示pageSize条记录 第pageNo页:limit (pageNo – 1) * pageSize , pageSize

DQL语句总结

关于DQL语句的大总结: select … from … where … group by … having … order by … limit …

执行顺序? 1.from 2.where 3.group by 4.having 5.select 6.order by 7.limit..

DDL及常见数据类型

create

建表的语法格式:

create table 表名(字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型);

create table 表名( 字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型 );

表名:建议以t_ 或者 tbl_开始,可读性强。见名知意。 字段名:见名知意。 表名和字段名都属于标识符。

drop

删除一个数据库

drop database [if exists] 库名; #if exists 如果库存在才删除

删除一张表:

drop table 表名;

Alter

对表结构的修改

什么是对表结构的修改? 添加一个字段,删除一个字段,修改一个字段!!!

第一:在实际的开发中,需求一旦确定之后,表一旦设计好之后,很少的 进行表结构的修改。因为开发进行中的时候,修改表结构,成本比较高。 修改表的结构,对应的java代码就需要进行大量的修改。成本是比较高的。 这个责任应该由设计人员来承担!

第二:由于修改表结构的操作很少,所以我们不需要掌握,如果有一天 真的要修改表结构,你可以使用工具!!!!

修改表结构的操作是不需要写到java程序中的。实际上也不是java程序员的范畴。

常见数据类型

varchar(最长255) 可变长度的字符串 比较智能,节省空间。 会根据实际的数据长度动态分配空间。

优点:节省空间 ​ 缺点:需要动态分配空间,速度慢。

char(最长255) 定长字符串 不管实际的数据长度是多少。 分配固定长度的空间去存储数据。 使用不恰当的时候,可能会导致空间的浪费。

优点:不需要动态分配空间,速度快。 ​ 缺点:使用不当可能会导致空间的浪费。

varchar和char我们应该怎么选择? 性别字段你选什么?因为性别是固定长度的字符串,所以选择char。 姓名字段你选什么?每一个人的名字长度不同,所以选择varchar。

int(最长11) 数字中的整数型。等同于java的int。

bigint 数字中的长整型。等同于java中的long。

float(数字a, 数字b) 其中数字a表示有效数字,数字b表示小数位 单精度浮点型数据

double(数字a, 数字b) 其中数字a表示有效数字,数字b表示小数位 双精度浮点型数据

date 短日期类型

datetime 长日期类型

clob 字符大对象 最多可以存储4G的字符串。 比如:存储一篇文章,存储一个说明。 超过255个字符的都要采用CLOB字符大对象来存储。 Character Large OBject:CLOB

blob 二进制大对象 Binary Large OBject 专门用来存储图片、声音、视频等流媒体数据。 往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,需要使用IO流才行。

案例:

创建一个学生表? 学号、姓名、年龄、性别、邮箱地址 create table t_student( no int, name varchar(32), sex char(1), age int(3), email varchar(255) );

数据类型后括号内的数字表示内容的长度,int(3) 表示最多3位数

删除表: drop table t_student; // 当这张表不存在的时候会报错!

像下面这样删就不会报错 drop table if exists t_student;

DML

插入数据insert (DML)

语法格式: insert into 表名(字段名1,字段名2,字段名3…) values(值1,值2,值3);

注意:字段名和值要一一对应。

注意:insert语句但凡是执行成功了,那么必然会多一条记录。 没有给其它字段指定值的话,默认值是NULL。

注意:字段名可以省略,省略了的话等于都写了且按顺序写的

注意:数据库中的有一条命名规范: 所有的标识符都是全部小写,单词和单词之间使用下划线进行衔接。

修改update

语法格式: update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3… where 条件;

注意:没有条件限制会导致所有数据全部更新。

删除数据 delete

语法格式? ​ delete from 表名 where 条件;

注意:没有条件,整张表的数据会全部删除!

delete from t_user where id = 2;

delete from t_user; // 删除所有!

快速创建一张表

mysql> create table emp2 as select * from emp;

原理: 将一个查询结果当做一张表新建,这个可以完成表的快速复制。表创建出来,同时表中的数据也存在了。

create table mytable as select empno,ename from emp where job = ‘MANAGER’;

将查询结果插入到一张表当中?insert相关的

create table dept_bak as select * from dept;

insert into dept_bak select * from dept; //很少用!

快速删除表中数据

快速删除表中的数据?【truncate比较重要,必须掌握】

//删除dept_bak表中的数据 delete from dept_bak; //这种删除数据的方式比较慢。

mysql> select * from dept_bak; Empty set (0.00 sec)

delete语句删除数据的原理?(DML操作) 表中的数据被删除了,但是这个数据在硬盘上的真实存储空间不会被释放!!!(相当于把表中格子内容擦掉,但不会把格子删掉,还占了空间) 这种删除缺点是:删除效率比较低 这种删除优点是:支持回滚,后悔了可以再恢复数据!!!

truncate语句删除数据的原理? 这种删除效率比较高,表被一次截断,物理删除。(相当于把占的那片空间给截了) 这种删除缺点:不支持回滚。 这种删除优点:快速

用法:truncate table dept_bak; (这种操作属于DDL操作。)

大表非常大,上亿条记录???? 删除的时候,使用delete,也许需要执行很久才能删除完!效率较低。 可以选择使用truncate删除表中的数据。只需要不到1秒钟的时间就删除结束。效率较高。 但是使用truncate之前,必须仔细询问客户是否真的要删除,并警告删除之后不可恢复!

truncate是删除表中的数据,表还在!

删除表操作drop table 表名; 会把表结构和表中的数据一起都删了

四大约束

什么是约束?

约束对应的英语单词:constraint 在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中数据的 完整性、有效性!!!

约束的作用就是为了保证表中的数据有效!!

约束包括哪些?

非空约束:not null ​ 唯一性约束: unique ​ 主键约束: primary key (简称PK) ​ 外键约束:foreign key(简称FK) ​ 检查约束:check(mysql不支持,oracle支持)

非空约束:not null

非空约束not null约束的字段不能为NULL。 drop table if exists t_vip; create table t_vip( id int, name varchar(255) not null );

insert into t_vip(id) values(3); ERROR 1364 (HY000): Field ‘name’ doesn’t have a default value

唯一性约束: unique

唯一性约束unique约束的字段不能重复,但是可以为NULL。 drop table if exists t_vip; create table t_vip( id int, name varchar(255) unique, email varchar(255) ); insert into t_vip(id,name,email) values(3,’wangwu’,’ wangwu@123.com ‘);

insert into t_vip(id,name,email) values(4,’wangwu’,’ wangwu@sina.com ‘); ERROR 1062 (23000): Duplicate entry ‘wangwu’ for key ‘name’

name字段虽然被unique约束了,但是可以为NULL。且可以有多个人的是null

新需求:name和email两个字段联合起来具有唯一性!!!! drop table if exists t_vip; create table t_vip( id int, name varchar(255) unique, // 约束直接添加到列后面的,叫做列级约束。 email varchar(255) unique ); 这张表这样创建是不符合我以上“新需求”的。 这样创建表示:name具有唯一性,email具有唯一性。各自唯一。

正确做法:

drop table if exists t_vip; ​ create table t_vip( ​ id int, ​ name varchar(255), ​ email varchar(255), ​ unique(name,email) // 约束没有添加在列的后面,这种约束被称为表级约束。 ​ );

需要给多个字段联合起来添加某一个约束的时候,需要使用表级约束

not null只有列级约束,没有表级约束!

在mysql当中,如果一个字段同时被not null和unique约束的话,该字段自动变成主键字段。(注意:oracle中不一样!)

主键约束(primary key,简称PK)

主键约束的相关术语?

主键约束:就是一种约束。 ​ 主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段 ​ 主键值:主键字段中的每一个值都叫做:主键值。

什么是主键?有啥用?

主键值是每一行记录的唯一标识。​ 主键值是每一行记录的身份证号!!!

记住:任何一张表都应该有主键(且仅有一个),没有主键,表无效!!

主键的特征:not null + unique(主键值不能是NULL,同时也不能重复!)

主键可以使用表级约束

表级约束主要是给多个字段联合起来添加约束

几个字段联合起来的主键叫 复合主键

在实际开发中不建议使用复合主键。建议使用单一主键

主键值建议使用: int bigint char 等类型。

不建议使用:varchar来做主键。主键值一般都是数字,一般都是定长的!

主键除了:单一主键和复合主键之外,还可以这样进行分类?

自然主键:主键值是一个自然数,和业务没关系。 ​ 业务主键:主键值和业务紧密关联,例如拿银行卡账号做主键值。这就是业务主键!

在实际开发中使用业务主键多,还是使用自然主键多一些? ​ 自然主键使用比较多,因为主键只要做到不重复就行,不需要有意义。 ​ 业务主键不好,因为主键一旦和业务挂钩,那么当业务发生变动的时候, ​ 可能会影响到主键值,所以业务主键不建议使用。尽量使用自然主键。

在mysql当中, 有一种机制,可以帮助我们自动维护一个主键值 drop table if exists t_vip; create table t_vip( id int primary key auto_increment, name varchar(255) );

auto_increment 表示自增,从1开始,以1递增!

外键约束(foreign key,简称FK)

外键约束涉及到的相关术语: 外键约束:一种约束(foreign key) 外键字段:该字段上添加了外键约束 外键值:外键字段当中的每一个值。

 业务背景:
        请设计数据库表,来描述“班级和学生”的信息?
​
        第一种方案:班级和学生存储在一张表中???
        t_student
        no(pk)      name        classno         classname
        -------------------------------------------------------------------------------
        1           jack        100         北京市大兴区亦庄镇第二中学高三12           lucy        100         北京市大兴区亦庄镇第二中学高三13           lilei       100         北京市大兴区亦庄镇第二中学高三14           hanmeimei   100         北京市大兴区亦庄镇第二中学高三15           zhangsan    101         北京市大兴区亦庄镇第二中学高三26           lisi        101         北京市大兴区亦庄镇第二中学高三27           wangwu      101         北京市大兴区亦庄镇第二中学高三28           zhaoliu     101         北京市大兴区亦庄镇第二中学高三2班
        分析以上方案的缺点:
            数据冗余,空间浪费!!!!
            这个设计是比较失败的!
        
        第二种方案:班级一张表、学生一张表??
        
        t_class 班级表
        classno(pk)         classname
        ------------------------------------------------------
        100                 北京市大兴区亦庄镇第二中学高三1101                 北京市大兴区亦庄镇第二中学高三1班
    
        t_student 学生表
        no(pk)          name            cno(FK引用t_class这张表的classno)
        ----------------------------------------------------------------
        1               jack            100
        2               lucy            100
        3               lilei           100
        4               hanmeimei       100
        5               zhangsan        101
        6               lisi            101
        7               wangwu          101
        8               zhaoliu         101
​
        当cno字段没有任何约束的时候,可能会导致数据无效。可能出现一个102,但是102班级不存在。
        所以为了保证cno字段中的值都是100101,需要给cno字段添加外键约束。
        那么:cno字段就是外键字段。cno字段中的每一个值都是外键值。  

注意:理解即记住

删除表的顺序? 先删子,再删父。

创建表的顺序? 先创建父,再创建子。

删除数据的顺序? 先删子,再删父。

插入数据的顺序? 先插入父,再插入子。

 create table t_class (
    classno int primary key,
    classname varchar(255);
);
create table t_student (
    no int primary key auto_increment,
    name varchar(255),
    cno int,
    foreign key(cno) references t_class(classno)
);  

思考:子表中的外键引用的父表中的某个字段,被引用的这个字段必须是主键吗? 不一定是主键,但至少具有unique约束。

即:外键引用的字段不一定是主键,但一定要有unique约束

测试:外键值可以为NULL吗? 外键只要满足至少含有unique约束即可,而有unique修饰的字段字段可以为NULL(而且可以有多个NULL),所以外键值当然可以为NULL。

存储引擎

什么是存储引擎,有什么用呢?

存储引擎是MySQL中特有的一个术语,其它数据库中没有。(Oracle中有,但是不叫这个名字) ​ 实际上 存储引擎是一个 表存储/组织数据 的方式 ​ 不同的存储引擎,表存储数据的方式不同。

怎么给表添加/指定“存储引擎”呢?

在建表的时候可以在最后小括号的”)”的右边使用: ENGINE来指定存储引擎。 CHARSET来指定这张表的字符编码方式。

结论: mysql默认的存储引擎是:InnoDB mysql默认的字符编码方式是:utf8

建表时指定存储引擎,以及字符编码方式。 create table t_product( id int primary key, name varchar(255) )engine=InnoDB default charset=gbk;

怎么查看mysql支持哪些存储引擎呢?

命令: show engines G

MySQL支持9大存储引擎,不同版本支持引擎不同,通过上面指令可以看出当前版本哪些支持

关于mysql常用的存储引擎的介绍

MyISAM存储引擎? 它管理的表具有以下特征: 使用三个文件表示每个表: 格式文件 — 存储表结构的定义(mytable.frm) 数据文件 — 存储表行的内容(mytable.MYD) 索引文件 — 存储表上索引(mytable.MYI):索引用于缩小扫描范围,提高查询效率的一种机制。 可被转换为压缩、只读表来节省空间

注意: 对于一张表来说, 主键或者加有unique约束的字段上会自动创建索引

MyISAM存储引擎特点: 可被转换为压缩、只读表来节省空间!

MyISAM不支持事务机制,安全性低。

InnoDB存储引擎 这是mysql默认的存储引擎,同时也是一个重量级的存储引擎。 InnoDB支持事务,支持数据库崩溃后自动恢复机制。 InnoDB存储引擎最主要的特点是:非常安全。

它管理的表具有下列主要特征: – 每个 InnoDB 表在数据库目录中以.frm 格式文件表示 – InnoDB 表空间 tablespace 被用于存储表的内容(表空间是一个逻辑名称。表空间存储数据和索引。)

– 提供一组用来记录事务性活动的日志文件 ​ – 用 COMMIT(提交)、SAVEPOINT 及ROLLBACK(回滚)支持事务处理 ​ – 提供全 ACID 兼容 ​ – 在 MySQL 服务器崩溃后提供自动恢复 ​ – 多版本(MVCC)和行级锁定 ​ – 支持外键及引用的完整性,包括级联删除和更新

InnoDB最大的特点就是:支持事务,以保证数据的安全。

效率不是很高,并且也不能压缩,不能转换为只读,不能很好的节省存储空间。

MEMORY存储引擎? 使用 MEMORY 存储引擎的表,其数据存储在内存中,且行的长度固定, 这两个特点使得 MEMORY 存储引擎非常快。

MEMORY 存储引擎管理的表具有下列特征: – 在数据库目录内,每个表均以.frm 格式的文件表示。 – 表数据及索引被存储在内存中。(目的就是快,查询快!) – 表级锁机制。 – 不能包含 TEXT 或 BLOB 字段。

MEMORY 存储引擎以前被称为HEAP 引擎。

MEMORY引擎优点:查询效率是最高的。不需要和硬盘交互。 MEMORY引擎缺点:不安全,关机之后数据消失。因为数据和索引都是在内存当中。

事务

一个事务其实就是一个完整的业务逻辑。是一个最小的工作单元。不可再分。

说到本质上,一个事务其实就是多条DML语句同时成功,或者同时失败!

 什么是一个完整的业务逻辑?
    假设转账,从A账户向B账户中转账10000.
    将A账户的钱减去10000(update语句)
    将B账户的钱加上10000(update语句)
    这就是一个完整的业务逻辑。
​
    以上的操作是一个最小的工作单元,要么同时成功,要么同时失败,不可再分。
    这两个update语句要求必须同时成功或者同时失败,这样才能保证钱是正确的。  

只有DML语句才会有事务这一说,其它语句和事务无关!!!insert delete update 只有以上的三个语句和事务有关系,其它都没有关系。

因为 只有以上的三个语句是数据库表中数据进行增、删、改的。 只要你的操作一旦涉及到数据的增、删、改,那么就一定要考虑安全问题。

数据安全第一位!!

事务是怎么做到多条DML语句同时成功和同时失败的呢?

InnoDB存储引擎:提供一组用来记录事务性活动的日志文件

事务开启了: insert insert delete update update 事务结束了!

在事务的执行过程中,每一条DML的操作都会记录到“事务性活动的日志文件”中。 在事务的执行过程中,我们可以提交事务,也可以回滚事务。

提交事务? 清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。 提交事务标志着,事务的结束。并且是一种全部成功的结束。

回滚事务? 将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件 回滚事务标志着,事务的结束。并且是一种全部失败的结束。

怎么提交事务,怎么回滚事务?

提交事务:commit; 语句 回滚事务:rollback; 语句(回滚永远都是只能回滚到上一次的提交点!)

事务对应的英语单词是:transaction

测试一下,在mysql当中默认的事务行为是怎样的? mysql默认情况下是支持自动提交事务的。(自动提交) 什么是自动提交? 每执行一条DML语句,则提交一次!

这种自动提交实际上是不符合我们的开发习惯,因为一个业务通常是需要多条DML语句共同执行才能完成的,为了保证数据的安全,必须要求同时成功之后再提交,所以不能执行一条 就提交一条。

怎么将mysql的自动提交机制关闭掉呢? 开启事务时先执行这个命令:start transaction;

事务的四个特性

事务包括4个特性?

A:原子性 说明事务是最小的工作单元。不可再分。所有操作必须同时成功,或者同时失败。

C:一致性 一个事务在执行前后,数据库都必须处于正确的状态,满足完整性约束。也就是说事务不能破坏数据库的完整性以及业务逻辑的一致性。

例如:

业务逻辑一致性:A给B转账,无论是否操作成功,两者的账户余额之和应该是不变的。

数据库完整性:数据库的约束关系应该是正确的,例如唯一索引,主键等。

I:隔离性 同时执行的事务是相互隔离的,它们不能相互冒犯。

D:持久性 事务最终结束的一个保障。事务提交,就相当于将没有保存到硬盘上的数据 保存到硬盘上!

4个隔离级别

读未提交:read uncommitted(最低的隔离级别,没有提交就读到了)

什么是读未提交? ​ 事务A可以读取到事务B未提交的数据。 ​ 这种隔离级别存在的问题就是: ​ 脏读现象 !(Dirty Read) ​ 我们称读到了脏数据。 ​ 这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!

读已提交:read committed(提交之后才能读到)

什么是读已提交? ​ 事务A只能读取到事务B提交之后的数据。 ​ 这种隔离级别解决了什么问题? ​ 解决了脏读的现象。 ​ 这种隔离级别存在什么问题? ​ 不可重复读取数据。 ​ 什么是不可重复读取数据呢? ​ 在事务开启之后,第一次读到的数据是3条,当前事务还没有 ​ 结束,可能第二次再读取的时候,读到的数据是4条,3不等于4 ​ 称为不可重复读取。

这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实。 ​ oracle数据库默认的隔离级别是:read committed

可重复读:repeatable read(提交之后也读不到,永远读取的都是刚开启事务时的数据)

什么是可重复读取? ​ 事务A开启之后,不管是多久,每一次在事务A中读取到的数据 ​ 都是一致的。即使事务B将数据已经修改,并且提交了,事务A ​ 读取到的数据还是没有发生改变,这就是可重复读。 ​ 可重复读解决了什么问题? ​ 解决了不可重复读取数据。 ​ 可重复读存在的问题是什么? ​ 会出现幻影读。 ​ 每一次读取到的数据都是幻象。不够真实!

早晨9点开始开启了事务,只要事务不结束,到晚上9点,读到的数据还是那样! ​ 读到的是假象。不够绝对的真实。

mysql中默认的事务隔离级别就是这个!!

序列化/串行化:serializable(最高的隔离级别)

这是最高隔离级别,效率最低。解决了所有的问题。 ​ 这种隔离级别表示事务排队,不能并发! ​ synchronized,线程同步(事务同步) ​ 每一次读取到的数据都是最真实的,并且效率是最低的。

什么是索引?

索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。 索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。

MySQL在查询方面主要就是两种方式: 第一种方式:全表扫描 第二种方式:根据索引检索。

在mysql数据库当中索引也是需要排序的,并且这个索引的排序和TreeSet 数据结构相同。TreeSet(TreeMap)底层是一个自平衡的二叉树!在mysql 当中索引是一个B-Tree数据结构。

遵循左小右大原则存放。采用中序遍历方式遍历取数据。

提醒1:在任何数据库当中主键上都会自动添加索引对象。另外在mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。

提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有 一个硬盘的物理存储编号。

提醒3:在mysql当中,索引是一个单独的对象,不同的存储引擎以不同的形式 存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。在InnoDB存储引擎中 索引存储在一个逻辑名称叫做tablespace的当中。在MEMORY存储引擎当中索引 被存储在内存当中。不管索引存储在哪里,索引在mysql当中都是一个树的形式 存在。(自平衡二叉树:B-Tree)

什么条件下,我们会考虑给字段添加索引呢?

条件1: 数据量庞大 (到底有多么庞大算庞大?这个需要测试,因为每一个硬件环境不同) ​ 条件2: 该字段经常出现在where的后面 ,以条件的形式存在,也就是说这个字段总是被扫描。 ​ 条件3: 该字段很少的DML (insert delete update)操作。(因为DML之后,索引需要重新排序。)

建议不要随意添加索引,因为索引也是需要维护的,太多的话反而会降低系统的性能。 建议通过主键查询,建议通过unique约束的字段进行查询,效率是比较高的。

索引怎么创建?怎么删除?语法是什么?

创建索引: mysql> create index emp_ename_index on emp(ename); 给emp表的ename字段添加索引,起名:emp_ename_index

删除索引: mysql> drop index emp_ename_index on emp; 将emp表上的emp_ename_index索引对象删除。

查看是否使用索引

mysql> explain select * from emp where ename = ‘KING’;

type=ALL 说明没有使用索引,如果是 typr=ref 则使用了索引

索引失效

失效的第1种情况: select * from emp where ename like ‘%T’;

ename上即使添加了索引,也不会走索引,为什么? 原因是因为模糊匹配当中以“%”开头了! 尽量避免模糊查询的时候以“%”开始。 在MySQL8开始好像会走索引了 这是一种优化的手段/策略。

失效的第2种情况: 使用or的时候会失效,如果使用or那么 要求or两边的条件字段都要有 索引,才会走索引 ,如果其中一边有一个字段没有索引,那么另一个 字段上的索引也会失效。所以这就是为什么不建议使用or的原因。

失效的第3种情况: 使用复合索引的时候,没有使用左侧的列查找,索引失效 什么是复合索引? 两个字段,或者更多的字段联合起来添加一个索引,叫做复合索引。

create index emp_job_sal_index on emp(job,sal);

explain select * from emp where sal = 800; 没走索引

失效的第4种情况: 在where当中索引列参加了运算,索引失效。

create index emp_sal_index on emp(sal);

explain select * from emp where sal+1 = 800; 没走索引

失效的第5种情况: 在where当中索引列使用了函数 explain select * from emp where lower(ename) = ‘smith’;

索引的类别

单一索引:一个字段上添加索引。 复合索引:两个字段或者更多的字段上添加索引。

主键索引:主键上添加索引。 唯一性索引:具有unique约束的字段上添加索引。 …..

注意:唯一性比较弱的字段上添加索引用处不大。

什么是视图?

view:站在不同的角度去看待同一份数据。

怎么创建视图对象?怎么删除视图对象?

 表复制:
mysql> create table dept2 as select * from dept;
​
dept2表中的数据:
mysql> select * from dept2;
+--------+------------+----------+
| DEPTNO | DNAME      | LOC      |
+--------+------------+----------+
|     10 | ACCOUNTING | NEW YORK |
|     20 | RESEARCH   | DALLAS   |
|     30 | SALES      | CHICAGO  |
|     40 | OPERATIONS | BOSTON   |
+--------+------------+----------+  

创建视图对象: create view dept2_view as select * from dept2;

删除视图对象: drop view dept2_view;

注意:只有DQL语句才能以view的形式创建。create view view_name as 这里的语句必须是DQL语句;

视图作用

我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致 原表被操作!(视图的特点:通过对视图的操作,会影响到原表数据。)

//面向视图查询 select * from dept2_view;

// 面向视图插入 insert into dept2_view(deptno,dname,loc) values(60,’SALES’, ‘BEIJING’);

select * from dept2;

视图对象在实际开发中到底有什么用?方便,简化开发,利于维护

假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用。 每一次使用这个sql语句的时候都需要重新编写,很长,很麻烦,怎么办? 可以 把这条复杂的SQL语句以视图对象的形式新建。 在需要编写这条SQL语句的位置直接使用视图对象,可以大大简化开发。 并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要 修改视图对象所映射的SQL语句。

我们以后面向视图开发的时候,使用视图的时候可以像使用table一样。 可以对视图进行增删改查等操作。视图不是在内存当中,视图对象也是 存储在硬盘上的,不会消失。

如下面这样,就是将一条SQL语句以视图的形式创建出来

 create view 
        emp_dept_view
    as
        select 
            e.ename,e.sal,d.dname
        from
            emp e
        join
            dept d
        on
            e.deptno = d.deptno;  

注意: 创建视图对应的语句只能是DQL语句。 但是视图对象创建完成之后,可以对视图进行增删改查等操作。

CRUD: 增删改查,又叫做:CRUD。 CRUD是在公司中程序员之间沟通的术语。一般我们很少说增删改查。 一般都说CRUD。

C:Create(增) R:Retrieve(查:检索) U:Update(改) D:Delete(删)

Java程序员必须会的DBA常用命令:

数据的导入和导出(数据的备份)​ 其它命令了解一下即可。(这个B站嫖的培训日志文档留着,以后忘了,可以打开文档复制粘贴。)

数据导出? 注意:在windows的dos命令窗口中: mysqldump bjpowernode>D:bjpowernode.sql -uroot -p123456

可以导出指定的表吗? mysqldump bjpowernode emp>D:bjpowernode.sql -uroot -p123456

数据导入? 注意:需要先登录到mysql数据库服务器上。 然后创建数据库:create database bjpowernode; 使用数据库:use bjpowernode 然后初始化数据库:source D:bjpowernode.sql 该语句后不需要跟分号

如果备份的是表则不需要创建数据库,直接使用需要导入表的数据即可

数据库设计范式共有3个

第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分。

第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键, 不要产生部分依赖。

第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键, 不要产生传递依赖。

设计数据库表的时候, 按照以上的范式进行,可以避免表中数据的冗余,空间的浪费。

第一范式

最核心,最重要的范式,所有表的设计都需要满足。 必须有主键,并且每一个字段都是原子性不可再分。

 学生编号 学生姓名 联系方式
------------------------------------------
1001        张三      zs@gmail.com,1359999999
1002        李四      ls@gmail.com,13699999999
1001        王五      ww@163.net,13488888888
​
以上是学生表,满足第一范式吗?
    不满足,第一:没有主键。第二:联系方式可以分为邮箱地址和电话
​
学生编号(pk) 学生姓名   邮箱地址            联系电话
----------------------------------------------------
1001        张三      zs@gmail.com    1359999999
1002        李四      ls@gmail.com    13699999999
1003        王五      ww@163.net      13488888888  

第二范式

4.4、第二范式: 建立在第一范式的基础之上, 要求所有非主键字段必须完全依赖主键,不要产生部分依赖。

学生编号 学生姓名 教师编号 教师姓名

1001 张三 001 王老师 1002 李四 002 赵老师 1003 王五 001 王老师 1001 张三 002 赵老师

这张表描述了学生和老师的关系:(1个学生可能有多个老师,1个老师有多个学生) 这是非常典型的:多对多关系!

分析以上的表是否满足第一范式? 不满足第一范式。

怎么满足第一范式呢?修改

学生编号+教师编号(pk) 学生姓名 教师姓名

1001 001 张三 王老师 1002 002 李四 赵老师 1003 001 王五 王老师 1001 002 张三 赵老师

学生编号 教师编号,两个字段联合做主键,复合主键(PK: 学生编号+教师编号) 经过修改之后,以上的表满足了第一范式。但是满足第二范式吗? 不满足,“张三”依赖1001,“王老师”依赖001,显然产生了部分依赖。 产生部分依赖有什么缺点? 数据冗余了。空间浪费了。“张三”重复了,“王老师”重复了。

为了让以上的表满足第二范式,你需要这样设计: 使用三张表来表示多对多的关系!!!! 学生表

学生编号(pk) 学生名字

1001 张三 ​ 1002 李四 ​ 1003 王五 ​

教师表

教师编号(pk) 教师姓名

001 王老师

002 赵老师

学生教师关系表

id(pk) 学生编号(fk) 教师编号(fk)

1 1001 001 2 1002 002 3 1003 001 4 1001 002

背口诀: 多对多怎么设计? 多对多,三张表,关系表两个外键!

第三范式

第三范式建立在第二范式的基础之上 ​ 要求所有非主键字典必须直接依赖主键,不要产生传递依赖。

学生编号(PK) 学生姓名 班级编号 班级名称

1001 张三 01 一年一班 1002 李四 02 一年二班 1003 王五 03 一年三班 1004 赵六 03 一年三班

以上表的设计是描述:班级和学生的关系。很显然是1对多关系! 一个教室中有多个学生。

分析以上表是否满足第一范式? 满足第一范式,有主键。

分析以上表是否满足第二范式? 满足第二范式,因为主键不是复合主键,没有产生部分依赖。主键是单一主键。

分析以上表是否满足第三范式? 第三范式要求:不要产生传递依赖! 一年一班依赖01,01依赖1001,产生了传递依赖。 不符合第三范式的要求。产生了数据的冗余。

那么应该怎么设计一对多呢?

班级表:一

班级编号(pk) 班级名称

01 一年一班 02 一年二班 03 一年三班

学生表:多

学生编号(PK) 学生姓名 班级编号(fk)

1001 张三 01 1002 李四 02 1003 王五 03 1004 赵六 03

背口诀: 一对多,两张表,多的表加外键!!

表的设计总结

总结表的设计?

一对多: 一对多,两张表,多的表加外键

多对多: 多对多,三张表,关系表两个外键

一对一: 一对一放到一张表中不就行了吗?为啥还要拆分表? 在实际的开发中,可能存在一张表字段太多,太庞大。这个时候要拆分表。 一对一怎么设计? 没有拆分表之前:一张表 t_user id login_name login_pwd real_name email

1 zhangsan 123 张三 zhangsan@xxx ​ 2 lisi 123 李四 lisi@xxx

这种庞大的表建议拆分为两张: t_login 登录信息表 id(pk) login_name login_pwd

1 zhangsan 123 ​ 2 lisi 123

t_user 用户详细信息表

id(pk) real_name email login_id(fk+unique)

100 张三 zhangsan@xxx 1 200 李四 lisi@xxx 2

口诀:一对一,外键唯一

数据库设计实际中要注意的

数据库设计三范式是理论上的。

实践和理论有的时候有偏差。

最终的目的都是为了满足客户的需求, 有的时候会拿冗余换执行速度。

因为在sql当中,表和表之间连接次数越多,效率越低。(笛卡尔积)

有的时候可能会存在冗余,但是为了减少表的连接次数,这样做也是合理的, 并且对于开发人员来说,sql语句的编写难度也会降低。