mysql 是啥?数据库又是啥?
MySQL:
MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS (Relational Database Management System:关系数据库管理系统)应用软件之一。
数据库:
数据库( Database )是按照数据结构来组织、存储和管理数据的仓库。
每个数据库都有一个或多个不同的 API 用于创建,访问,管理,搜索和复制所保存的数据。
我们也可以将数据存储在文件中,但是在文件中读写数据速度相对较慢。
所以,我们使用关系型数据库管理系统一般是用来存储和管理大数据量。
关系型数据库 ( SQL ):关系型数据库指的是使用关系模型(二维表格模型)来组织数据的数据库。
非关系型数据库 ( NoSQL ):非关系型数据库又被称为 NoSQL(Not Only SQL ),意为不仅仅是 SQL。通常指数据以对象的形式存储在数据库中,而对象之间的关系通过每个对象自身的属性来决定,常用于存储非结构化的数据。
MySQL安装及配置
- 首先先下载到一个文件夹中
- 下载后在环境变量中Path路径 添加MySQL的bin目录的路径
- 在 mysql-5.7.19-winx64 文件夹中 创建一个 my.ini 文件,内容为:
- [client] port=3306 default-character-set=utf8 [mysqld] #设置为自己MYSQL的安装目录 basedir=D:hspmysqlmysql-5.7.19-winx64 #设置为MYSQL的数据目录 datadir=E:mysql-5.7.19-winx64data port=3306 character_set_server=utf8 ##跳过安全检查,注销后,需要输入正确的用户名和密码才能启动 skip-grant-tables
- 使用管理员的身份打开cmd,并切换到安装的MySQL的bin目录底下,执行 mysqld-install
- 初始化数据库:mysqld –initialize-insecure –user= MySQL 此句执行后就会生成一个 data 目录
- 启动服务 net start mysql (要看MySQL服务是否启动可以去任务管理器的服务栏看)
- 关闭服务 net stop my sql
- 进入MySQL管理终端 mysql -u root -p
- 使用 MySQL数据库 :use mysql; 然后 UPDATE user SET authentication_string = PASSWORD(‘新的密码’) WHERE user = ‘dbadmin’ AND host = ‘localhost’; FLUSH PRIVILEGES; 这句表示刷新一下权限
- quit 指退出管理终端
如果真在 5-10步骤中哪里出了非错,可删除MySQL后重新配置服务 (sc delete mysql 该语句工作时一定要慎用!!)
4~7步一定要以管理员身份运行控制台才行
MySQL的服务,默认是“启动”的状态,只有启动了mysql才能用。默认情况下是“自动”启动,自动启动表示下一次重启操作系统的时候自动启动该服务。
可以在服务上点击右键: 启动 重启服务 停止服务 …
还可以改变服务的默认配置: 服务上点击右键,属性,然后可以选择启动方式: 自动(延迟启动) 自动 手动 禁用
在windows操作系统当中,怎么使用命令来启动和关闭mysql服务呢? 语法: net stop 服务名称; net start 服务名称;
其它服务的启停都可以采用以上的命令。
使用命令行窗口连接MySQL数据库:
首先,MySQL是一种服务(可在任务管理器服务栏中查看到MySQL),而只要是一个服务都会监听一个端口
mysql -h 主机IP -P 端口 -u 用户名 -p密码 ( p和密码间不要有空格,如果-p后面没有写密码,回车后会要求输入密码 )
如果不写 -h 主机IP,默认就是连接到本地
如果不写-P 端口,默认就是3306
在实际工作中往往会修改 端口号 而不是使用此默认端口号,此处为了方便就不做改动了
MySQL数据库的 三层结构
数据在数据库中的存储形式
以表格的形式存储数据
任何一张表都有行和列:
行(row):被称为数据/记录。 列(column):被称为字段。
每一个字段都有:字段名、数据类型、约束等属性。 字段名 可以理解是一个普通的名字,见名知意就行。 数据类型: 字符串 ,数字,日期等。
什么是 SQL语句 ?
SQL:结构化查询语言 程序员 需要学习SQL语句,程序员通过编写SQL语句,然后 DBMS 负责执行SQL 语句,最终来完成数据库中数据的增删改查操作。
SQL语句分类
DQL :数据查询语言[select…… ]
DML :数据操作语言[增加insert ,修改update,删除delete] 操作的是表中的数据
DDL :数据定义语言[create、drop、 alter ] 操作的是表的结构
DCL : 数据控制语言 [管理数据库,比如:授权grant、撤销权限revoke…. ]
TCL :事务控制语言 [如:事务提交:commit; 事务回滚:rollback;]
数据库、数据库管理系统、SQL之间的关系
三者之间的关系? DBMS通过执行SQL来操作DB
先安装数据库管理系统MySQL,然后学习SQL语句怎么写,编写SQL语句之后,DBMS 对SQL语句进行执行,最终来完成数据库的数据管理。
常用命令
注意:这些命令不区分大小写都行。
注意:mysql是不见“;”不执行,“;”表示结束!
退出exit; 或者 quit;
查看mysql数据库的版本号: select version();
查看mysql中有哪些数据库? show databases; 注意:以 分号 结尾,分号是英文的分号。
mysql默认自带了4个数据库。
怎么选择使用某个数据库呢? mysql> use test; 表示使用一个名字叫做test的数据库。
查看当前使用的是哪个数据库? mysql> select database();
导入一下提前准备好的数据: bjpowernode.sql 是提前为练习准备的数据库表。 怎么将sql文件中的数据导入呢?(可以将文件拖入source空格 后) 要在使用某个数据库后才能使用该语句 mysql> source D:course3-MySQLdocumentbjpowernode.sql
注意:路径中不要有中文!!!!
不看表中的数据,只看表的结构,有一个命令: desc 表名;
简单查询
查询一个字段?
select 字段名 from 表名;
查询两个字段,或者多个字段怎么办? 使用逗号隔开“,”
查询所有字段?
使用:select * from 表名;
别把把这种写法写到 Java 程序中,因为到时还要把 * 先转换成字段
缺点:①效率低 ②可读性差。
在实际开发中不建议,可以自己玩没问题。 你可以在 DOS命令 窗口中想快速的看一看全表数据可以采用这种方式。
给查询的列起别名?
使用 as 关键字,可以省略 select deptno,dname as deptname from dept;
假设起别名的时候,别名里面有空格,怎么办? mysql> select deptno,dname dept name from dept; DBMS看到这样的语句,进行SQL语句的编译,不符合语法,编译报错。 怎么解决? select deptno,dname ‘dept name’ from dept; //加单引号 select deptno,dname “dept name” from dept; //加双引号
注意:在所有的数据库当中,字符串统一使用 单引号 括起来, 单引号是标准,双引号在 oracle 数据库中用不了。但是在mysql 中可以使用。
再次强调:数据库中的字符串都是采用单引号括起来。这是标准的。 双引号不标准。
字段可以使用数学表达式
select ename,sal*12 from emp;
显示时字段名是 sal*12 这样时一般取个别名 select ename,sal*12 year_sal from emp;
条件查询
什么是条件查询?
查询出来符合条件的 语法格式: select 字段1,字段2,字段3…. from 表名 where 条件;
都有哪些条件?
= 等于查询薪资等于800的员工姓名和编号? select empno,ename from emp where sal = 800;
<> 或 != 不等于查询薪资不等于800的员工姓名和编号? select empno,ename from emp where sal != 800;
同理还有:<=,<,>=,>
between … and …. 两个值之间, 等同于 >= and <=
查询薪资在2450和3000之间的员工信息?包括2450和3000?
注意: 使用between and的时候,必须遵循左小右大。 between and是闭区间,包括两端的值。
is null 表示为 null(is not null 不为空)
查询哪些员工的津贴/补助为null? select empno,ename,sal,comm from emp where comm = null;( 像这样用=是查不到的 ) Empty set (0.00 sec)
注意:在数据库当中null不能使用等号进行衡量。需要使用is null 因为数据库中的null代表什么也没有,它不是一个值,所以不能使用 等号衡量。
正确的:select empno,ename,sal,comm from emp where comm is null;
and 并且查询工作岗位是MANAGER并且工资大于2500的员工信息?
select empno,ename,job,sal from emp where job = ‘MANAGER’ and sal > 2500;
or 或者
查询工作岗位是MANAGER或SALESMAN的员工?
select empno,ename,job from emp where job = ‘MANAGER’ or job = ‘SALESMAN’;
and和or同时出现的话,有优先级问题吗?(开发中如不记得优先级,加小括号)查询工资大于2500,并且部门编号为10或20部门的员工? select * from emp where sal > 2500 and deptno = 10 or deptno = 20; 分析以上语句的问题? and优先级比or高。 以上语句会先执行and,然后执行or。 以上这个语句表示什么含义? 找出工资大于2500并且部门编号为10的员工,或者20部门所有员工找出来。 正确做法:select * from emp where sal > 2500 and (deptno = 10 or deptno = 20);
in 包含,相当于多个 or (not in 不在这个范围中)查询工作岗位是MANAGER和SALESMAN的员工? select empno,ename,job from emp where job = ‘MANAGER’ or job = ‘SALESMAN’; select empno,ename,job from emp where job in(‘MANAGER’, ‘SALESMAN’);
注意:in不是一个区间。in后面跟的是具体的值。
查询薪资是800和5000的员工信息? select ename,sal from emp where sal = 800 or sal = 5000; select ename,sal from emp where sal in(800, 5000); //这个不是表示800到5000都找出来。
not in 表示不在这几个值当中的数据。select ename,sal from emp where sal not in(800, 5000, 3000);
not 可以取非,主要用在 is 或 in 中 is null is not null in not in
like 称为模糊查询,支持%或下划线匹配 %匹配任意多个字符 下划线:任意一个字符。 (%是一个特殊的符号,_ 也是一个特殊符号)
找出名字中含有O的? mysql> select ename from emp where ename like ‘%O%’;
找出名字以T结尾的? select ename from emp where ename like ‘%T’;
找出名字以K开始的? select ename from emp where ename like ‘K%’;
找出第二个字每是A的? select ename from emp where ename like ‘_A%’;
找出第三个字母是R的? select ename from emp where ename like ‘__R%’;
找出名字中有“_”的? select name from t_student where name like ‘%_%’; //这样不行。
正确: select name from t_student where name like ‘%_%’; // 转义字符 。
对查询结果排序
排序 order by( 默认是升序!!!)
查询所有员工薪资,排序? select ename,sal from emp order by sal;
怎么降序(后面加上desc)?
指定降序: select ename,sal from emp order by sal desc;
可以两个字段排序吗?或者说按照多个字段排序? 查询员工名字和薪资,要求按照薪资升序,如果薪资一样的话, 再按照名字升序排列。 select ename,sal from emp order by sal desc, ename asc; // sal在前,起主导,只有sal相等的时候,才会考虑启用ename排序。
了解内容:根据字段的位置也可以排序 select ename,sal from emp order by 2; // 2表示第二列。第二列是sal 按照查询结果的第2列sal排序。
了解一下,不建议在开发中这样写,因为不健壮。 因为列的顺序很容易发生改变,列顺序修改之后,2就废了
综合一点的案例: 找出工资在1250到3000之间的员工信息,要求按照薪资降序排列。 select ename,sal from emp where sal between 1250 and 3000 order by sal desc;
以上语句的执行顺序必须掌握: 第一步:from 第二步:where 第三步:select 第四步:order by
数据处理函数
数据处理函数又被称为单行处理函数
单行处理函数的特点:一个输入对应一个输出。
和单行处理函数相对的是:多行处理函数。(多行处理函数特点:多个输入,对应1个输出!)
常见的单行处理行数
lower 转换小写select lower(ename) as ename from emp;
+--------+
| ename |
+--------+
| smith |
| allen |
| ward |
| jones |
| martin |
| blake |
| clark |
| scott |
| king |
| turner |
| adams |
| james |
| ford |
| miller |
+--------+
14个输入,最后还是14个输出。这是单行处理函数的特点。
upper 转换大写select upper(name) as name from t_student;
substr 取子串(substr( 被截取的字符串, 起始下标,截取的长度))select substr(ename, 1, 1) as ename from emp; 注意:起始下标从1开始,没有0.
LEFT (string2 , length )从 string2 中的左边起取 length 个字符
RIGHT (string2 ,length ) 从 string2 中的右边起取 length 个字符
找出员工名字第一个字母是A的员工信息? 第一种方式:模糊查询 select ename from emp where ename like ‘A%’; 第二种方式: substr函数 select ename from emp where substr(ename,1,1) = ‘A’;
学生名字首字母大写?
select concat(upper(substr(name,1,1)),substr(name,2,length(name) – 1)) as result from t_student;
注意:字符串拼接一定要用concat而不能用+
像这样不行:select upper(substr(name,1,1)) + substr(name,2,length(name) – 1) from t_student;
concat函数进行字符串的拼接select concat(empno,ename) from emp;
可以拼接多个concat(……,……,……)
length 取长度select length(ename) enamelength from emp;
trim 去两边空格
select * from emp where ename = trim(‘ KING’);
RTrim切除右边的空格,LTrim切除左边的空格
str_to_date 将字符串转换成日期 date_format 格式化日期 format 设置千分位
(后面讲)
一个诡异的现象
select ‘abc’ as bieming from emp; // select后面直接跟“字面量/字面值”
+---------+
| bieming |
+---------+
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
| abc |
+---------+
select abc from emp; ERROR 1054 (42S22): Unknown column ‘abc’ in ‘field list’ 这样肯定报错,因为会把abc当做一个字段的名字,去emp表中找abc字段去了。
结论:select后面可以跟某个表的字段名(可以等同看做变量名),也可以跟字面量/字面值(数据)。select 21000 as num from dept;// 21000也是被当做一个字面量/字面值。
+-------+
| num |
+-------+
| 21000 |
| 21000 |
| 21000 |
| 21000 |
+-------+
round(要操作的数, 保留几位小数) 四舍五入
select round(21000.4, 0) as num from dept; //结果和上面一样
select round(1236.567, -1); // 保留到十位。
rand() 生成随机数 在 0 ≤ 随机数 ≤ 1.0 select floor(rand()*100); // 100以内的随机数
如果使用 rand (seed) 返回随机数, 范围 0 ≤ 随机数 ≤ 1.0, 如果 seed 不变,多次执行返回的结果也是不变的
ifnull是空处理函数。专门处理空的,可以将 null 转换成一个具体值
在所有的数据库当中,只要有null参与了数学运算,最终结果就是NULL
计算每个员工的年薪?
select ename, (sal + ifnull(comm, 0))*12 year_sal from emp;
case..when..then..when..then..else..end 当员工的工作岗位是MANAGER的时候,工资上调10%,当工作岗位是SALESMAN的时候,工资上调50%,其它正常。 (注意:不修改数据库,只是将查询结果显示为工资上调) select ename, job, sal as oldsal, (case job when ‘MANAGER’ then sal*1.1 when ‘SALESMAN’ then sal*1.5 else sal end) as newsal from emp;
select 后可以不接from 当作简单的测试工具
等同于接了from dual;
dual为 亚元表, 系统表 可以作为测试表使用
select round(3.14, 3);
+----------------+
| round(3.14, 3) |
+----------------+
| 3.140 |
+----------------+
select concat(’13’,’57’,’9′);
+-----------------------+
| concat('13','57','9') |
+-----------------------+
| 13579 |
+-----------------------+
多行处理函数
五个分组函数
多行处理函数也叫分组函数
多行处理函数的特点:输入多行,最终输出一行。
5个: count 计数 sum 求和 avg 平均值 max 最大值 min 最小值
注意: 分组函数在使用的时候必须先进行分组,然后才能用。 如果你没有对数据进行分组,整张表默认为一组。
找出最高工资? mysql> select max(sal) from emp;
找出最低工资? mysql> select min(sal) from emp;
计算工资和: mysql> select sum(sal) from emp;
计算平均工资: mysql> select avg(sal) from emp;
计算员工数量? mysql> select count(ename) from emp;
计算员工数量? mysql> select count(ename) from emp;
注意:如果count中填的是表达式的话,要加上 or null, 因为 Mysql 中 count() 函数的一般用法是统计字段非空的记录数,利用这个特点来进行条件统计,如果字段是 NULL 就不会统计,但是 false 是会被统计到的
分组函数在使用的时候需要注意哪些?
分组函数自动忽略NULL,你不需要提前对NULL进行处理。
mysql> select sum(comm) from emp;
+-----------+
| sum(comm) |
+-----------+
| 2200.00 |
+-----------+
分组函数中count(*) 和 count(具体字段) 有什么区别?
count(具体字段):表示统计该字段下所有不为NULL的元素的总数。 count(*):统计表当中的总行数。(只要有一行数据count则++) 每一行记录不可能都为NULL(不存在一行全为null的表),一行数据中有一列不为NULL,则这行数据就是有效的。
mysql> select count(*) from emp;
+----------+
| count(*) |
+----------+
| 14 |
+----------+
mysql> select count(comm) from emp;
+-------------+
| count(comm) |
+-------------+
| 4 |
+-------------+
分组函数不能直接使用在where子句中
找出比最低工资高的员工信息。 select ename,sal from emp where sal > min(sal); 表面上意思感觉是没问题,运行一下发现: ERROR 1111 (HY000): Invalid use of group function ????????????????????????????????????????????????????????????????????? 分组函数在使用的时候必须先进行分组,而分组的group by 执行顺序是在where后的,也就是让分组函数 min 先于分组了,所以会报错
所有的分组函数可以组合起来一起用
select sum(sal),min(sal),max(sal),avg(sal),count(*) from emp;
+----------+----------+----------+-------------+----------+
| sum(sal) | min(sal) | max(sal) | avg(sal) | count(*) |
+----------+----------+----------+-------------+----------+
| 29025.00 | 800.00 | 5000.00 | 2073.214286 | 14 |
+----------+----------+----------+-------------+----------+
分组查询
在实际的应用中,可能有这样的需求, 需要先进行分组,然后对每一组的数据进行操作。 这个时候我们需要使用分组查询,怎么进行分组查询呢? select … from … group by … 计算每个部门的工资和? 计算每个工作岗位的平均薪资? 找出每个工作岗位的最高薪资? ….
将之前的关键字全部组合在一起,他们的执行顺序? select … from … where … group by … order by …
以上关键字的顺序不能颠倒,需要记住。执行顺序是什么? 1.from 2.where 3.group by 4.select 5.order by
为什么分组函数不能直接使用在where后面? select ename,sal from emp where sal > min(sal);//报错。 因为分组函数在使用的时候必须先分组之后才能使用。 where执行的时候,还没有分组。所以where后面不能出现分组函数。
select sum(sal) from emp; 这个没有分组,为啥sum()函数可以用呢? 因为select在group by之后执行。
找出每个工作岗位的工资和? 实现思路:按照工作岗位分组,然后对工资求和。 select job,sum(sal) from emp group by job;
+-----------+----------+
| job | sum(sal) |
+-----------+----------+
| ANALYST | 6000.00 |
| CLERK | 4150.00 |
| MANAGER | 8275.00 |
| PRESIDENT | 5000.00 |
| SALESMAN | 5600.00 |
+-----------+----------+
以上这个语句的执行顺序?
先从emp表中查询数据。
根据job字段进行分组。
然后对每一组的数据进行sum(sal)
重点结论: 在一条select语句当中,如果有group by语句的话, select后面只能跟:参加分组的字段,以及分组函数。 其它的一律不能跟。
找出“每个部门,不同工作岗位”的最高薪资?
两个字段联合分组select deptno, job, max(sal) from emp group by deptno, job;
使用having对分组后的数据进一步过滤
having不能单独使用,having不能代替where,having必须和group by联合使用。
找出每个部门最高薪资,要求显示最高薪资大于3000的?
select deptno, max(sal) from emp group by deptno having max(sal) > 3000;
单表查询大总结
select … from … where … group by … having … order by …
执行顺序?
1.from
2.where
3.group by
4.having
5.select
6.order by
找出除MANAGER岗位之外,每个岗位的平均薪资,要求显示平均薪资大于1500的, 要求按照平均薪资降序排。
select job, avg(sal) from emp where job != ‘MANAGER’ group by job having avg(sal) > 1500 order by avg(sal);
distinct 关键字
把查询结果去除重复记录【distinct】 注意:原表数据不会被修改,只是查询结果去重。 去重需要使用一个关键字:distinct
distinct只能出现在所有字段的最前方,表示对各字段联合起来的查询结果去重
这样编写是错误的,语法错误。
select ename,distinct job from emp;
统计一下工作岗位的数量?select count(distinct job) from emp;
连接查询
什么是连接查询?
从一张表中单独查询,称为单表查询。 多张表联合起来查询数据,被称为连接查询。
根据语法的年代分类: SQL92:1992年的时候出现的语法 SQL99:1999年的时候出现的语法 我们这里重点学习SQL99.(这个过程中简单演示一个SQL92的例子)
根据表连接的方式分类: 内连接: 等值连接 非等值连接 自连接
外连接: 左外连接(左连接) 右外连接(右连接)
什么是笛卡尔积现象
当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是 两张表条数的乘积,这种现象被称为:笛卡尔积现象。(笛卡尔发现的,这是一个数学现象。)
怎么避免笛卡尔积现象
连接时加条件,满足这个条件的记录被筛选出来!
表起别名。很重要。效率问题。select e.ename,d.dname from emp e, dept d where e.deptno = d.deptno;
注意:通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量减少表的连接次数。
内连接
两张表连接时没有主次关系的连接称为内连接
等值连接
案例:查询每个员工所在部门名称,显示员工名和部门名? emp e和dept d表进行连接。条件是:e.deptno = d.deptno
SQL92语法: select e.ename,d.dname from emp e, dept d where e.deptno = d.deptno;
sql92的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。
SQL99语法: inner 可以省略,不省略可读性会好一些 select e.ename,d.dname from emp e inner join dept d on e.deptno = d.deptno;
sql99优点:表连接的条件是独立的,连接之后,如果还需要进一步筛选,再往后继续添加where
非等值连接
案例:找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级?
select e.ename, e.sal, s.grade from emp e join salgrade s on e.sal between s.losal and s.hisal;
自连接
内连接之自连接 案例:查询员工的上级领导,要求显示员工名和对应的领导名?
emp a 员工表、emp b 领导表
select a.ename 员工, b.ename 领导 from emp a join emp b on a.mgr = b.empno;
外连接
两张表连接时有主次关系
右(外)连接
// outer是可以省略的,带着可读性强。 select e.ename,d.dname from emp e right outer join dept d on e.deptno = d.deptno;
right代表什么:表示将join关键字右边的这张表看成主表,主要是为了将 这主表的数据全部查询出来,捎带着关联查询左边的表。(如果此表没有对应和主表满足 on 后条件的 ,那次表会自动补充 NULL ) 在外连接当中,两张表连接,产生了主次关系。
左(外)连接
左外连接同理
任何一个右连接都有左连接的写法。 任何一个左连接都有右连接的写法。
案例:查询每个员工的上级领导,要求显示所有员工的名字和领导名?
select a.ename ‘员工’, b.ename ‘领导’ from emp a left join emp b on a.mgr = b.empno;
三张表连接如下(四张表同理)
语法: select … from a join b on a和b的连接条件 join c on a和c的连接条件
案例:找出每个员工的部门名称以及工资等级, 要求显示员工名、部门名、薪资、薪资等级?
select e.ename, d.dname, s.grade from emp e join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal;
一条SQL中内连接和外连接可以混合。都可以出现!
案例:找出每个员工的部门名称以及工资等级,还有上级领导, 要求显示员工名、领导名、部门名、薪资、薪资等级?
select e.ename ‘员工’, u.ename ‘领导’, d.dname, e.sal, s.grade from emp e left join emp u on e.mgr = u.empno join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal;
什么是子查询?
select语句中嵌套select语句,被嵌套的select语句称为子查询。
子查询都可以出现在哪里呢?
select ..(select). from ..(select). where ..(select).
where子句中的子查询
案例:找出比最低工资高100的员工姓名和工资?
select ename,sal from emp where sal > min(sal);
ERROR 1111 (HY000): Invalid use of group function where子句中不能直接使用分组函数。
正确:select e.ename, e.sal from emp e where e.sal > (select min(sal)+1000 from emp);
from子句中的子查询
案例:找出每个岗位的平均工资的薪资等级。
select a.*, s.grade from (select job, avg(sal) avg_sal from emp group by job) a join salgrade s on a.avg_sal between s.losal and s.hisal;
子查询中的avg(sal)一定要起个别名才能在内连接中使用
select后面出现的子查询(了解即可)
案例:找出每个员工的部门名称,要求显示员工名,部门名? select e.ename,e.deptno,(select d.dname from dept d where e.deptno = d.deptno) as dname from emp e;
select e.ename,e.deptno,(select dname from dept) as dname from emp e; //错误:ERROR 1242 (21000): Subquery returns more than 1 row
注意:对于select后面的子查询来说,这个子查询只能一次返回1条结果, 多于1条,就报错了。!
Union关键字
union作用:合并查询结果集
案例:查询工作岗位是MANAGER和SALESMAN的员工?
select ename,job from emp where job = ‘MANAGER’ or job = ‘SALESMAN’;
select ename,job from emp where job in(‘MANAGER’,’SALESMAN’);
select ename,job from emp where job = ‘MANAGER’ union select ename,job from emp where job = ‘SALESMAN’;
像下面这样是错误的:union在进行结果集合并的时候,要求两个结果集的列数相同。 select ename,job from emp where job = ‘MANAGER’ union select ename from emp where job = ‘SALESMAN’;
// MYSQL可以结果集合并时列和列的数据类型不一致 ,oracle语法严格 ,不可以,其结果集合并时列和列的数据类型也要一致。 select ename,job from emp where job = ‘MANAGER’ union select ename,sal from emp where job = ‘SALESMAN’;
limit关键字
limit作用:将查询结果集的一部分取出来。通常使用在分页查询当中。 百度默认:一页显示10条记录。 分页的作用是为了提高用户的体验,因为一次全部都查出来,用户体验差。 可以一页一页翻页看。
完整用法:limit startIndex, length startIndex是起始下标,length是长度。 limit起始下标从0开始。substr的起始下标从1开始
缺省用法:limit 5; 这是取前5.
select ename,sal from emp order by sal desc limit 0,5;
注意:mysql当中limit在order by之后执行!!!!!!
取出工资排名在[3-5]名的员工? select ename,sal from emp order by sal desc limit 2, 3; 2表示起始位置从下标2开始,就是第三条记录。 3表示长度。
通用分页方法:
每页显示3条记录 第1页:limit 0,3 [0 1 2] 第2页:limit 3,3 [3 4 5] 第3页:limit 6,3 [6 7 8] 第4页:limit 9,3 [9 10 11]
每页显示pageSize条记录 第pageNo页:limit (pageNo – 1) * pageSize , pageSize
DQL语句总结
关于DQL语句的大总结: select … from … where … group by … having … order by … limit …
执行顺序? 1.from 2.where 3.group by 4.having 5.select 6.order by 7.limit..
DDL及常见数据类型
create
建表的语法格式:
create table 表名(字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型);
create table 表名( 字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型 );
表名:建议以t_ 或者 tbl_开始,可读性强。见名知意。 字段名:见名知意。 表名和字段名都属于标识符。
drop
删除一个数据库
drop database [if exists] 库名; #if exists 如果库存在才删除
删除一张表:
drop table 表名;
Alter
对表结构的修改
什么是对表结构的修改? 添加一个字段,删除一个字段,修改一个字段!!!
第一:在实际的开发中,需求一旦确定之后,表一旦设计好之后,很少的 进行表结构的修改。因为开发进行中的时候,修改表结构,成本比较高。 修改表的结构,对应的java代码就需要进行大量的修改。成本是比较高的。 这个责任应该由设计人员来承担!
第二:由于修改表结构的操作很少,所以我们不需要掌握,如果有一天 真的要修改表结构,你可以使用工具!!!!
修改表结构的操作是不需要写到java程序中的。实际上也不是java程序员的范畴。
常见数据类型
varchar(最长255) 可变长度的字符串 比较智能,节省空间。 会根据实际的数据长度动态分配空间。
优点:节省空间 缺点:需要动态分配空间,速度慢。
char(最长255) 定长字符串 不管实际的数据长度是多少。 分配固定长度的空间去存储数据。 使用不恰当的时候,可能会导致空间的浪费。
优点:不需要动态分配空间,速度快。 缺点:使用不当可能会导致空间的浪费。
varchar和char我们应该怎么选择? 性别字段你选什么?因为性别是固定长度的字符串,所以选择char。 姓名字段你选什么?每一个人的名字长度不同,所以选择varchar。
int(最长11) 数字中的整数型。等同于java的int。
bigint 数字中的长整型。等同于java中的long。
float(数字a, 数字b) 其中数字a表示有效数字,数字b表示小数位 单精度浮点型数据
double(数字a, 数字b) 其中数字a表示有效数字,数字b表示小数位 双精度浮点型数据
date 短日期类型
datetime 长日期类型
clob 字符大对象 最多可以存储4G的字符串。 比如:存储一篇文章,存储一个说明。 超过255个字符的都要采用CLOB字符大对象来存储。 Character Large OBject:CLOB
blob 二进制大对象 Binary Large OBject 专门用来存储图片、声音、视频等流媒体数据。 往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,需要使用IO流才行。
案例:
创建一个学生表? 学号、姓名、年龄、性别、邮箱地址 create table t_student( no int, name varchar(32), sex char(1), age int(3), email varchar(255) );
数据类型后括号内的数字表示内容的长度,int(3) 表示最多3位数
删除表: drop table t_student; // 当这张表不存在的时候会报错!
像下面这样删就不会报错 drop table if exists t_student;
DML
插入数据insert (DML)
语法格式: insert into 表名(字段名1,字段名2,字段名3…) values(值1,值2,值3);
注意:字段名和值要一一对应。
注意:insert语句但凡是执行成功了,那么必然会多一条记录。 没有给其它字段指定值的话,默认值是NULL。
注意:字段名可以省略,省略了的话等于都写了且按顺序写的
注意:数据库中的有一条命名规范: 所有的标识符都是全部小写,单词和单词之间使用下划线进行衔接。
修改update
语法格式: update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3… where 条件;
注意:没有条件限制会导致所有数据全部更新。
删除数据 delete
语法格式? delete from 表名 where 条件;
注意:没有条件,整张表的数据会全部删除!
delete from t_user where id = 2;
delete from t_user; // 删除所有!
快速创建一张表
mysql> create table emp2 as select * from emp;
原理: 将一个查询结果当做一张表新建,这个可以完成表的快速复制。表创建出来,同时表中的数据也存在了。
create table mytable as select empno,ename from emp where job = ‘MANAGER’;
将查询结果插入到一张表当中?insert相关的
create table dept_bak as select * from dept;
insert into dept_bak select * from dept; //很少用!
快速删除表中数据
快速删除表中的数据?【truncate比较重要,必须掌握】
//删除dept_bak表中的数据 delete from dept_bak; //这种删除数据的方式比较慢。
mysql> select * from dept_bak; Empty set (0.00 sec)
delete语句删除数据的原理?(DML操作) 表中的数据被删除了,但是这个数据在硬盘上的真实存储空间不会被释放!!!(相当于把表中格子内容擦掉,但不会把格子删掉,还占了空间) 这种删除缺点是:删除效率比较低 这种删除优点是:支持回滚,后悔了可以再恢复数据!!!
truncate语句删除数据的原理? 这种删除效率比较高,表被一次截断,物理删除。(相当于把占的那片空间给截了) 这种删除缺点:不支持回滚。 这种删除优点:快速
用法:truncate table dept_bak; (这种操作属于DDL操作。)
大表非常大,上亿条记录???? 删除的时候,使用delete,也许需要执行很久才能删除完!效率较低。 可以选择使用truncate删除表中的数据。只需要不到1秒钟的时间就删除结束。效率较高。 但是使用truncate之前,必须仔细询问客户是否真的要删除,并警告删除之后不可恢复!
truncate是删除表中的数据,表还在!
删除表操作drop table 表名; 会把表结构和表中的数据一起都删了
四大约束
什么是约束?
约束对应的英语单词:constraint 在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中数据的 完整性、有效性!!!
约束的作用就是为了保证表中的数据有效!!
约束包括哪些?
非空约束:not null 唯一性约束: unique 主键约束: primary key (简称PK) 外键约束:foreign key(简称FK) 检查约束:check(mysql不支持,oracle支持)
非空约束:not null
非空约束not null约束的字段不能为NULL。 drop table if exists t_vip; create table t_vip( id int, name varchar(255) not null );
insert into t_vip(id) values(3); ERROR 1364 (HY000): Field ‘name’ doesn’t have a default value
唯一性约束: unique
唯一性约束unique约束的字段不能重复,但是可以为NULL。 drop table if exists t_vip; create table t_vip( id int, name varchar(255) unique, email varchar(255) ); insert into t_vip(id,name,email) values(3,’wangwu’,’ wangwu@123.com ‘);
insert into t_vip(id,name,email) values(4,’wangwu’,’ wangwu@sina.com ‘); ERROR 1062 (23000): Duplicate entry ‘wangwu’ for key ‘name’
name字段虽然被unique约束了,但是可以为NULL。且可以有多个人的是null
新需求:name和email两个字段联合起来具有唯一性!!!! drop table if exists t_vip; create table t_vip( id int, name varchar(255) unique, // 约束直接添加到列后面的,叫做列级约束。 email varchar(255) unique ); 这张表这样创建是不符合我以上“新需求”的。 这样创建表示:name具有唯一性,email具有唯一性。各自唯一。
正确做法:
drop table if exists t_vip; create table t_vip( id int, name varchar(255), email varchar(255), unique(name,email) // 约束没有添加在列的后面,这种约束被称为表级约束。 );
需要给多个字段联合起来添加某一个约束的时候,需要使用表级约束
not null只有列级约束,没有表级约束!
在mysql当中,如果一个字段同时被not null和unique约束的话,该字段自动变成主键字段。(注意:oracle中不一样!)
主键约束(primary key,简称PK)
主键约束的相关术语?
主键约束:就是一种约束。 主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段 主键值:主键字段中的每一个值都叫做:主键值。
什么是主键?有啥用?
主键值是每一行记录的唯一标识。 主键值是每一行记录的身份证号!!!
记住:任何一张表都应该有主键(且仅有一个),没有主键,表无效!!
主键的特征:not null + unique(主键值不能是NULL,同时也不能重复!)
主键可以使用表级约束
表级约束主要是给多个字段联合起来添加约束
几个字段联合起来的主键叫 复合主键
在实际开发中不建议使用复合主键。建议使用单一主键
主键值建议使用: int bigint char 等类型。
不建议使用:varchar来做主键。主键值一般都是数字,一般都是定长的!
主键除了:单一主键和复合主键之外,还可以这样进行分类?
自然主键:主键值是一个自然数,和业务没关系。 业务主键:主键值和业务紧密关联,例如拿银行卡账号做主键值。这就是业务主键!
在实际开发中使用业务主键多,还是使用自然主键多一些? 自然主键使用比较多,因为主键只要做到不重复就行,不需要有意义。 业务主键不好,因为主键一旦和业务挂钩,那么当业务发生变动的时候, 可能会影响到主键值,所以业务主键不建议使用。尽量使用自然主键。
在mysql当中, 有一种机制,可以帮助我们自动维护一个主键值 drop table if exists t_vip; create table t_vip( id int primary key auto_increment, name varchar(255) );
auto_increment 表示自增,从1开始,以1递增!
外键约束(foreign key,简称FK)
外键约束涉及到的相关术语: 外键约束:一种约束(foreign key) 外键字段:该字段上添加了外键约束 外键值:外键字段当中的每一个值。
业务背景:
请设计数据库表,来描述“班级和学生”的信息?
第一种方案:班级和学生存储在一张表中???
t_student
no(pk) name classno classname
-------------------------------------------------------------------------------
1 jack 100 北京市大兴区亦庄镇第二中学高三1班
2 lucy 100 北京市大兴区亦庄镇第二中学高三1班
3 lilei 100 北京市大兴区亦庄镇第二中学高三1班
4 hanmeimei 100 北京市大兴区亦庄镇第二中学高三1班
5 zhangsan 101 北京市大兴区亦庄镇第二中学高三2班
6 lisi 101 北京市大兴区亦庄镇第二中学高三2班
7 wangwu 101 北京市大兴区亦庄镇第二中学高三2班
8 zhaoliu 101 北京市大兴区亦庄镇第二中学高三2班
分析以上方案的缺点:
数据冗余,空间浪费!!!!
这个设计是比较失败的!
第二种方案:班级一张表、学生一张表??
t_class 班级表
classno(pk) classname
------------------------------------------------------
100 北京市大兴区亦庄镇第二中学高三1班
101 北京市大兴区亦庄镇第二中学高三1班
t_student 学生表
no(pk) name cno(FK引用t_class这张表的classno)
----------------------------------------------------------------
1 jack 100
2 lucy 100
3 lilei 100
4 hanmeimei 100
5 zhangsan 101
6 lisi 101
7 wangwu 101
8 zhaoliu 101
当cno字段没有任何约束的时候,可能会导致数据无效。可能出现一个102,但是102班级不存在。
所以为了保证cno字段中的值都是100和101,需要给cno字段添加外键约束。
那么:cno字段就是外键字段。cno字段中的每一个值都是外键值。
注意:理解即记住
删除表的顺序? 先删子,再删父。
创建表的顺序? 先创建父,再创建子。
删除数据的顺序? 先删子,再删父。
插入数据的顺序? 先插入父,再插入子。
create table t_class (
classno int primary key,
classname varchar(255);
);
create table t_student (
no int primary key auto_increment,
name varchar(255),
cno int,
foreign key(cno) references t_class(classno)
);
思考:子表中的外键引用的父表中的某个字段,被引用的这个字段必须是主键吗? 不一定是主键,但至少具有unique约束。
即:外键引用的字段不一定是主键,但一定要有unique约束
测试:外键值可以为NULL吗? 外键只要满足至少含有unique约束即可,而有unique修饰的字段字段可以为NULL(而且可以有多个NULL),所以外键值当然可以为NULL。
存储引擎
什么是存储引擎,有什么用呢?
存储引擎是MySQL中特有的一个术语,其它数据库中没有。(Oracle中有,但是不叫这个名字) 实际上 存储引擎是一个 表存储/组织数据 的方式 不同的存储引擎,表存储数据的方式不同。
怎么给表添加/指定“存储引擎”呢?
在建表的时候可以在最后小括号的”)”的右边使用: ENGINE来指定存储引擎。 CHARSET来指定这张表的字符编码方式。
结论: mysql默认的存储引擎是:InnoDB mysql默认的字符编码方式是:utf8
建表时指定存储引擎,以及字符编码方式。 create table t_product( id int primary key, name varchar(255) )engine=InnoDB default charset=gbk;
怎么查看mysql支持哪些存储引擎呢?
命令: show engines G
MySQL支持9大存储引擎,不同版本支持引擎不同,通过上面指令可以看出当前版本哪些支持
关于mysql常用的存储引擎的介绍
MyISAM存储引擎? 它管理的表具有以下特征: 使用三个文件表示每个表: 格式文件 — 存储表结构的定义(mytable.frm) 数据文件 — 存储表行的内容(mytable.MYD) 索引文件 — 存储表上索引(mytable.MYI):索引用于缩小扫描范围,提高查询效率的一种机制。 可被转换为压缩、只读表来节省空间
注意: 对于一张表来说, 主键或者加有unique约束的字段上会自动创建索引 。
MyISAM存储引擎特点: 可被转换为压缩、只读表来节省空间!
MyISAM不支持事务机制,安全性低。
InnoDB存储引擎 这是mysql默认的存储引擎,同时也是一个重量级的存储引擎。 InnoDB支持事务,支持数据库崩溃后自动恢复机制。 InnoDB存储引擎最主要的特点是:非常安全。
它管理的表具有下列主要特征: – 每个 InnoDB 表在数据库目录中以.frm 格式文件表示 – InnoDB 表空间 tablespace 被用于存储表的内容(表空间是一个逻辑名称。表空间存储数据和索引。)
– 提供一组用来记录事务性活动的日志文件 – 用 COMMIT(提交)、SAVEPOINT 及ROLLBACK(回滚)支持事务处理 – 提供全 ACID 兼容 – 在 MySQL 服务器崩溃后提供自动恢复 – 多版本(MVCC)和行级锁定 – 支持外键及引用的完整性,包括级联删除和更新
InnoDB最大的特点就是:支持事务,以保证数据的安全。
效率不是很高,并且也不能压缩,不能转换为只读,不能很好的节省存储空间。
MEMORY存储引擎? 使用 MEMORY 存储引擎的表,其数据存储在内存中,且行的长度固定, 这两个特点使得 MEMORY 存储引擎非常快。
MEMORY 存储引擎管理的表具有下列特征: – 在数据库目录内,每个表均以.frm 格式的文件表示。 – 表数据及索引被存储在内存中。(目的就是快,查询快!) – 表级锁机制。 – 不能包含 TEXT 或 BLOB 字段。
MEMORY 存储引擎以前被称为HEAP 引擎。
MEMORY引擎优点:查询效率是最高的。不需要和硬盘交互。 MEMORY引擎缺点:不安全,关机之后数据消失。因为数据和索引都是在内存当中。
事务
一个事务其实就是一个完整的业务逻辑。是一个最小的工作单元。不可再分。
说到本质上,一个事务其实就是多条DML语句同时成功,或者同时失败!
什么是一个完整的业务逻辑?
假设转账,从A账户向B账户中转账10000.
将A账户的钱减去10000(update语句)
将B账户的钱加上10000(update语句)
这就是一个完整的业务逻辑。
以上的操作是一个最小的工作单元,要么同时成功,要么同时失败,不可再分。
这两个update语句要求必须同时成功或者同时失败,这样才能保证钱是正确的。
只有DML语句才会有事务这一说,其它语句和事务无关!!!insert delete update 只有以上的三个语句和事务有关系,其它都没有关系。
因为 只有以上的三个语句是数据库表中数据进行增、删、改的。 只要你的操作一旦涉及到数据的增、删、改,那么就一定要考虑安全问题。
数据安全第一位!!
事务是怎么做到多条DML语句同时成功和同时失败的呢?
InnoDB存储引擎:提供一组用来记录事务性活动的日志文件
事务开启了: insert insert delete update update 事务结束了!
在事务的执行过程中,每一条DML的操作都会记录到“事务性活动的日志文件”中。 在事务的执行过程中,我们可以提交事务,也可以回滚事务。
提交事务? 清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。 提交事务标志着,事务的结束。并且是一种全部成功的结束。
回滚事务? 将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件 回滚事务标志着,事务的结束。并且是一种全部失败的结束。
怎么提交事务,怎么回滚事务?
提交事务:commit; 语句 回滚事务:rollback; 语句(回滚永远都是只能回滚到上一次的提交点!)
事务对应的英语单词是:transaction
测试一下,在mysql当中默认的事务行为是怎样的? mysql默认情况下是支持自动提交事务的。(自动提交) 什么是自动提交? 每执行一条DML语句,则提交一次!
这种自动提交实际上是不符合我们的开发习惯,因为一个业务通常是需要多条DML语句共同执行才能完成的,为了保证数据的安全,必须要求同时成功之后再提交,所以不能执行一条 就提交一条。
怎么将mysql的自动提交机制关闭掉呢? 开启事务时先执行这个命令:start transaction;
事务的四个特性
事务包括4个特性?
A:原子性 说明事务是最小的工作单元。不可再分。所有操作必须同时成功,或者同时失败。
C:一致性 一个事务在执行前后,数据库都必须处于正确的状态,满足完整性约束。也就是说事务不能破坏数据库的完整性以及业务逻辑的一致性。
例如:
业务逻辑一致性:A给B转账,无论是否操作成功,两者的账户余额之和应该是不变的。
数据库完整性:数据库的约束关系应该是正确的,例如唯一索引,主键等。
I:隔离性 同时执行的事务是相互隔离的,它们不能相互冒犯。
D:持久性 事务最终结束的一个保障。事务提交,就相当于将没有保存到硬盘上的数据 保存到硬盘上!
4个隔离级别
读未提交:read uncommitted(最低的隔离级别,没有提交就读到了)
什么是读未提交? 事务A可以读取到事务B未提交的数据。 这种隔离级别存在的问题就是: 脏读现象 !(Dirty Read) 我们称读到了脏数据。 这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!
读已提交:read committed(提交之后才能读到)
什么是读已提交? 事务A只能读取到事务B提交之后的数据。 这种隔离级别解决了什么问题? 解决了脏读的现象。 这种隔离级别存在什么问题? 不可重复读取数据。 什么是不可重复读取数据呢? 在事务开启之后,第一次读到的数据是3条,当前事务还没有 结束,可能第二次再读取的时候,读到的数据是4条,3不等于4 称为不可重复读取。
这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实。 oracle数据库默认的隔离级别是:read committed
可重复读:repeatable read(提交之后也读不到,永远读取的都是刚开启事务时的数据)
什么是可重复读取? 事务A开启之后,不管是多久,每一次在事务A中读取到的数据 都是一致的。即使事务B将数据已经修改,并且提交了,事务A 读取到的数据还是没有发生改变,这就是可重复读。 可重复读解决了什么问题? 解决了不可重复读取数据。 可重复读存在的问题是什么? 会出现幻影读。 每一次读取到的数据都是幻象。不够真实!
早晨9点开始开启了事务,只要事务不结束,到晚上9点,读到的数据还是那样! 读到的是假象。不够绝对的真实。
mysql中默认的事务隔离级别就是这个!!
序列化/串行化:serializable(最高的隔离级别)
这是最高隔离级别,效率最低。解决了所有的问题。 这种隔离级别表示事务排队,不能并发! synchronized,线程同步(事务同步) 每一次读取到的数据都是最真实的,并且效率是最低的。
什么是索引?
索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。 索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。
MySQL在查询方面主要就是两种方式: 第一种方式:全表扫描 第二种方式:根据索引检索。
在mysql数据库当中索引也是需要排序的,并且这个索引的排序和TreeSet 数据结构相同。TreeSet(TreeMap)底层是一个自平衡的二叉树!在mysql 当中索引是一个B-Tree数据结构。
遵循左小右大原则存放。采用中序遍历方式遍历取数据。
提醒1:在任何数据库当中主键上都会自动添加索引对象。另外在mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。
提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有 一个硬盘的物理存储编号。
提醒3:在mysql当中,索引是一个单独的对象,不同的存储引擎以不同的形式 存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。在InnoDB存储引擎中 索引存储在一个逻辑名称叫做tablespace的当中。在MEMORY存储引擎当中索引 被存储在内存当中。不管索引存储在哪里,索引在mysql当中都是一个树的形式 存在。(自平衡二叉树:B-Tree)
什么条件下,我们会考虑给字段添加索引呢?
条件1: 数据量庞大 (到底有多么庞大算庞大?这个需要测试,因为每一个硬件环境不同) 条件2: 该字段经常出现在where的后面 ,以条件的形式存在,也就是说这个字段总是被扫描。 条件3: 该字段很少的DML (insert delete update)操作。(因为DML之后,索引需要重新排序。)
建议不要随意添加索引,因为索引也是需要维护的,太多的话反而会降低系统的性能。 建议通过主键查询,建议通过unique约束的字段进行查询,效率是比较高的。
索引怎么创建?怎么删除?语法是什么?
创建索引: mysql> create index emp_ename_index on emp(ename); 给emp表的ename字段添加索引,起名:emp_ename_index
删除索引: mysql> drop index emp_ename_index on emp; 将emp表上的emp_ename_index索引对象删除。
查看是否使用索引
mysql> explain select * from emp where ename = ‘KING’;
type=ALL 说明没有使用索引,如果是 typr=ref 则使用了索引
索引失效
失效的第1种情况: select * from emp where ename like ‘%T’;
ename上即使添加了索引,也不会走索引,为什么? 原因是因为模糊匹配当中以“%”开头了! 尽量避免模糊查询的时候以“%”开始。 在MySQL8开始好像会走索引了 这是一种优化的手段/策略。
失效的第2种情况: 使用or的时候会失效,如果使用or那么 要求or两边的条件字段都要有 索引,才会走索引 ,如果其中一边有一个字段没有索引,那么另一个 字段上的索引也会失效。所以这就是为什么不建议使用or的原因。
失效的第3种情况: 使用复合索引的时候,没有使用左侧的列查找,索引失效 什么是复合索引? 两个字段,或者更多的字段联合起来添加一个索引,叫做复合索引。
create index emp_job_sal_index on emp(job,sal);
explain select * from emp where sal = 800; 没走索引
失效的第4种情况: 在where当中索引列参加了运算,索引失效。
create index emp_sal_index on emp(sal);
explain select * from emp where sal+1 = 800; 没走索引
失效的第5种情况: 在where当中索引列使用了函数 explain select * from emp where lower(ename) = ‘smith’;
索引的类别
单一索引:一个字段上添加索引。 复合索引:两个字段或者更多的字段上添加索引。
主键索引:主键上添加索引。 唯一性索引:具有unique约束的字段上添加索引。 …..
注意:唯一性比较弱的字段上添加索引用处不大。
什么是视图?
view:站在不同的角度去看待同一份数据。
怎么创建视图对象?怎么删除视图对象?
表复制:
mysql> create table dept2 as select * from dept;
dept2表中的数据:
mysql> select * from dept2;
+--------+------------+----------+
| DEPTNO | DNAME | LOC |
+--------+------------+----------+
| 10 | ACCOUNTING | NEW YORK |
| 20 | RESEARCH | DALLAS |
| 30 | SALES | CHICAGO |
| 40 | OPERATIONS | BOSTON |
+--------+------------+----------+
创建视图对象: create view dept2_view as select * from dept2;
删除视图对象: drop view dept2_view;
注意:只有DQL语句才能以view的形式创建。create view view_name as 这里的语句必须是DQL语句;
视图作用
我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致 原表被操作!(视图的特点:通过对视图的操作,会影响到原表数据。)
//面向视图查询 select * from dept2_view;
// 面向视图插入 insert into dept2_view(deptno,dname,loc) values(60,’SALES’, ‘BEIJING’);
select * from dept2;
视图对象在实际开发中到底有什么用?方便,简化开发,利于维护
假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用。 每一次使用这个sql语句的时候都需要重新编写,很长,很麻烦,怎么办? 可以 把这条复杂的SQL语句以视图对象的形式新建。 在需要编写这条SQL语句的位置直接使用视图对象,可以大大简化开发。 并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要 修改视图对象所映射的SQL语句。
我们以后面向视图开发的时候,使用视图的时候可以像使用table一样。 可以对视图进行增删改查等操作。视图不是在内存当中,视图对象也是 存储在硬盘上的,不会消失。
如下面这样,就是将一条SQL语句以视图的形式创建出来
create view
emp_dept_view
as
select
e.ename,e.sal,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno;
注意: 创建视图对应的语句只能是DQL语句。 但是视图对象创建完成之后,可以对视图进行增删改查等操作。
CRUD: 增删改查,又叫做:CRUD。 CRUD是在公司中程序员之间沟通的术语。一般我们很少说增删改查。 一般都说CRUD。
C:Create(增) R:Retrieve(查:检索) U:Update(改) D:Delete(删)
Java程序员必须会的DBA常用命令:
数据的导入和导出(数据的备份) 其它命令了解一下即可。(这个B站嫖的培训日志文档留着,以后忘了,可以打开文档复制粘贴。)
数据导出? 注意:在windows的dos命令窗口中: mysqldump bjpowernode>D:bjpowernode.sql -uroot -p123456
可以导出指定的表吗? mysqldump bjpowernode emp>D:bjpowernode.sql -uroot -p123456
数据导入? 注意:需要先登录到mysql数据库服务器上。 然后创建数据库:create database bjpowernode; 使用数据库:use bjpowernode 然后初始化数据库:source D:bjpowernode.sql 该语句后不需要跟分号
如果备份的是表则不需要创建数据库,直接使用需要导入表的数据即可
数据库设计范式共有3个
第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分。
第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键, 不要产生部分依赖。
第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键, 不要产生传递依赖。
设计数据库表的时候, 按照以上的范式进行,可以避免表中数据的冗余,空间的浪费。
第一范式
最核心,最重要的范式,所有表的设计都需要满足。 必须有主键,并且每一个字段都是原子性不可再分。
学生编号 学生姓名 联系方式
------------------------------------------
1001 张三 zs@gmail.com,1359999999
1002 李四 ls@gmail.com,13699999999
1001 王五 ww@163.net,13488888888
以上是学生表,满足第一范式吗?
不满足,第一:没有主键。第二:联系方式可以分为邮箱地址和电话
学生编号(pk) 学生姓名 邮箱地址 联系电话
----------------------------------------------------
1001 张三 zs@gmail.com 1359999999
1002 李四 ls@gmail.com 13699999999
1003 王五 ww@163.net 13488888888
第二范式
4.4、第二范式: 建立在第一范式的基础之上, 要求所有非主键字段必须完全依赖主键,不要产生部分依赖。
学生编号 学生姓名 教师编号 教师姓名
1001 张三 001 王老师 1002 李四 002 赵老师 1003 王五 001 王老师 1001 张三 002 赵老师
这张表描述了学生和老师的关系:(1个学生可能有多个老师,1个老师有多个学生) 这是非常典型的:多对多关系!
分析以上的表是否满足第一范式? 不满足第一范式。
怎么满足第一范式呢?修改
学生编号+教师编号(pk) 学生姓名 教师姓名
1001 001 张三 王老师 1002 002 李四 赵老师 1003 001 王五 王老师 1001 002 张三 赵老师
学生编号 教师编号,两个字段联合做主键,复合主键(PK: 学生编号+教师编号) 经过修改之后,以上的表满足了第一范式。但是满足第二范式吗? 不满足,“张三”依赖1001,“王老师”依赖001,显然产生了部分依赖。 产生部分依赖有什么缺点? 数据冗余了。空间浪费了。“张三”重复了,“王老师”重复了。
为了让以上的表满足第二范式,你需要这样设计: 使用三张表来表示多对多的关系!!!! 学生表
学生编号(pk) 学生名字
1001 张三 1002 李四 1003 王五
教师表
教师编号(pk) 教师姓名
001 王老师
002 赵老师
学生教师关系表
id(pk) 学生编号(fk) 教师编号(fk)
1 1001 001 2 1002 002 3 1003 001 4 1001 002
背口诀: 多对多怎么设计? 多对多,三张表,关系表两个外键!
第三范式
第三范式建立在第二范式的基础之上 要求所有非主键字典必须直接依赖主键,不要产生传递依赖。
学生编号(PK) 学生姓名 班级编号 班级名称
1001 张三 01 一年一班 1002 李四 02 一年二班 1003 王五 03 一年三班 1004 赵六 03 一年三班
以上表的设计是描述:班级和学生的关系。很显然是1对多关系! 一个教室中有多个学生。
分析以上表是否满足第一范式? 满足第一范式,有主键。
分析以上表是否满足第二范式? 满足第二范式,因为主键不是复合主键,没有产生部分依赖。主键是单一主键。
分析以上表是否满足第三范式? 第三范式要求:不要产生传递依赖! 一年一班依赖01,01依赖1001,产生了传递依赖。 不符合第三范式的要求。产生了数据的冗余。
那么应该怎么设计一对多呢?
班级表:一
班级编号(pk) 班级名称
01 一年一班 02 一年二班 03 一年三班
学生表:多
学生编号(PK) 学生姓名 班级编号(fk)
1001 张三 01 1002 李四 02 1003 王五 03 1004 赵六 03
背口诀: 一对多,两张表,多的表加外键!!
表的设计总结
总结表的设计?
一对多: 一对多,两张表,多的表加外键
多对多: 多对多,三张表,关系表两个外键
一对一: 一对一放到一张表中不就行了吗?为啥还要拆分表? 在实际的开发中,可能存在一张表字段太多,太庞大。这个时候要拆分表。 一对一怎么设计? 没有拆分表之前:一张表 t_user id login_name login_pwd real_name email
1 zhangsan 123 张三 zhangsan@xxx 2 lisi 123 李四 lisi@xxx
这种庞大的表建议拆分为两张: t_login 登录信息表 id(pk) login_name login_pwd
1 zhangsan 123 2 lisi 123
t_user 用户详细信息表
id(pk) real_name email login_id(fk+unique)
100 张三 zhangsan@xxx 1 200 李四 lisi@xxx 2
口诀:一对一,外键唯一
数据库设计实际中要注意的
数据库设计三范式是理论上的。
实践和理论有的时候有偏差。
最终的目的都是为了满足客户的需求, 有的时候会拿冗余换执行速度。
因为在sql当中,表和表之间连接次数越多,效率越低。(笛卡尔积)