全面的实用教程
> Photo by Tom Winckels on Unsplash
SQL是一种编程语言,用于管理以表格形式(即表)存储在关系数据库中的数据。
关系数据库由多个相互关联的表组成。表之间的关系是在共享列的意义上形成的。
有许多不同的关系数据库管理系统(例如MySQL,PostgreSQL,SQL Server)。他们采用的SQL语法可能略有不同。但是,两者之间的差别很小,因此,如果您学习如何使用一种,则可以轻松切换到另一种。
在本文中,我们将介绍30个示例,这些示例涉及SQL的以下操作:
· 创建数据库和表
· 将数据插入表
· 从表中删除数据
· 更新表格
· 使用各种选择语句查询表
在您的计算机或云中有许多使用SQL的替代方法。我目前正在通过终端在Linux计算机上使用MySQL。另一个常用的替代方法是安装MySQL Workbench。
实例1
我们首先从终端连接到MySQL服务器并创建一个数据库。
~$ sudo mysql -u root
我们将被提示输入密码。现在,我们已连接到计算机中的MySQL服务器。
以下命令创建一个名为"零售"的数据库。
mysql> create database retail;
mysql> use retail;
我们不在尚未包含任何表的零售数据库中。
实例2
我们将首先使用create table命令创建一个名为" customer"的表。
mysql> create table customer (
-> cust_id int primary key,
-> age int,
-> location varchar(20),
-> gender varchar(20)
-> );
我们在括号内定义列的名称和关联的数据类型。将cust_id列指定为主键。
主键是唯一标识每一行的列。就像熊猫数据框的索引一样。
实例3
我们将创建第二个表,称为"订单"。
mysql> create table orders (
-> order_id int primary key,
-> date date,
-> amount decimal(5,2),
-> cust_id int,
-> foreign key (cust_id) references customer(cust_id)
-> on delete cascade
-> );
在一开始,我们提到关系表通过共享列相互关联。关联两个表的列是外键。
外键是将表与另一个表相关联的东西。外键包含另一个表的主键。
订单表中的cust_id列是外键,并将订单表与客户表相关。我们在创建表时指定此条件。
在最后一行,我们用"在删除级联上"短语指定另一个条件。它告诉MySQL当删除客户表中的一行时该怎么做。订单表中的每一行都属于一个客户。客户表中的每一行都包含一个唯一的客户ID,并代表一个客户。如果客户表中的行被删除,则意味着我们不再有该客户。结果,属于该客户的订单不再具有关联的客户ID。"删除时级联"表示没有关联客户ID的订单也将被删除。
实例4
零售数据库现在包含两个表。我们可以使用show table命令查看数据库中存在的表。
mysql> show tables;
+------------------+
| Tables_in_retail |
+------------------+
| customer |
| orders |
+------------------+
注意:SQL中的命令以分号(";")结尾。
实例5
desc或describe命令从列名,数据类型和一些其他信息的角度概述了该表。
mysql> desc orders;
+----------+--------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+----------+--------------+------+-----+---------+-------+
| order_id | int(11) | NO | PRI | NULL | |
| date | date | YES | | NULL | |
| amount | decimal(5,2) | YES | | NULL | |
| cust_id | int(11) | YES | MUL | NULL | |
+----------+--------------+------+-----+---------+-------+
实例6
我们可以修改现有表。例如,alter table命令可用于添加新列或删除现有列。
让我们在订单表中添加一列" is_sale"。
mysql> alter table orders add is_sale varchar(20);
我们编写列名和数据类型以及add关键字。
mysql> desc orders;
+----------+--------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+----------+--------------+------+-----+---------+-------+
| order_id | int(11) | NO | PRI | NULL | |
| date | date | YES | | NULL | |
| amount | decimal(5,2) | YES | | NULL | |
| cust_id | int(11) | YES | MUL | NULL | |
| is_sale | varchar(20) | YES | | NULL | |
+----------+--------------+------+-----+---------+-------+
is_sale列已添加到订单表中。
实例7
alter table也可以用于删除语法稍有更改的列。
mysql> alter table orders drop is_sale;
使用drop关键字而不是add关键字。我们也不必编写数据类型来删除列。
实例8
我们有表,但它们不包含任何数据。填充表的一种方法是insert语句。
mysql> insert into customer values (
-> 1000, 42, 'Austin', 'female'
-> );
指定的值以相同的顺序插入到列中。因此,我们需要保持顺序一致。
实例9
我们可以通过分隔每一行来同时插入多行。
mysql> insert into customer values
-> (1001, 34, 'Austin', 'male'),
-> (1002, 37, 'Houston', 'male'),
-> (1003, 25, 'Austin', 'female'),
-> (1004, 28, 'Houston', 'female'),
-> (1005, 22, 'Dallas', 'male'),
-> ;
我添加了一些行,并以相同的方式填充了orders表。
还有其他方法可以用数据填充表。例如,我们可以使用加载数据infile或加载数据本地infile语句来加载csv文件。
实例10
delete from语句可用于删除表中的现有行。我们需要通过提供条件来标识要删除的行。例如,下面的语句将删除订单ID为17的行。
mysql> delete from orders
-> where order_id = 17;
如果我们不指定条件,则删除给定表中的所有行。
实例11
我们还可以更新现有行。让我们更新订单表中的一行。
+----------+------------+--------+---------+
| order_id | date | amount | cust_id |
+----------+------------+--------+---------+
| 1 | 2020-10-01 | 24.40 | 1001 |
+----------+------------+--------+---------+
这是订单表中的第一行。我们想将订单金额更改为27.40。
mysql> update orders
-> set amount = 27.40-> where order_id = 1;
mysql> select * from orders limit 1;
+----------+------------+--------+---------+
| order_id | date | amount | cust_id |
+----------+------------+--------+---------+
| 1 | 2020-10-01 | 27.40 | 1001 |
+----------+------------+--------+---------+
我们将更新后的值写在set关键字之后。通过在where关键字之后提供条件来标识要更新的行。
实例12
如果要通过复制现有表的结构来创建表,则可以使用带有like关键字的create table语句。
mysql> create table orders_copy like orders;
mysql> show tables;
+------------------+
| Tables_in_retail |
+------------------+
| customer |
| orders |
| orders_copy |
+------------------+
orders_copy表具有与orders表相同的结构,但不包含任何数据。
实例13
我们还可以通过使用create table和select语句一起使用数据创建现有表的副本。
mysql> create table new_orders
-> select * from orders;
似乎是两个单独的语句的组合。第一行创建表,第二行用orders表中的数据填充该表。
实例14
drop table语句可用于删除数据库中的表。
mysql> drop table orders_copy, new_orders;
mysql> show tables;
+------------------+
| Tables_in_retail |
+------------------+
| customer |
| orders |
+------------------+
我们已经成功删除了在上一个示例中创建的表。
我们在数据库中有两个关系表。以下示例将说明我们如何使用选择查询从这些表中检索数据。
实例15
最简单的查询是查看表中的所有列。
mysql> select * from orders
-> limit 3;
+----------+------------+--------+---------+
| order_id | date | amount | cust_id |
+----------+------------+--------+---------+
| 1 | 2020-10-01 | 27.40 | 1001 |
| 2 | 2020-10-01 | 36.20 | 1000 |
| 3 | 2020-10-01 | 65.45 | 1002 |
+----------+------------+--------+---------+
" *"选择所有列,而limit关键字对要显示的行数施加约束。
实例16
通过写列名而不是" *",我们只能选择某些列。
mysql> select order_id, amount
-> from orders
-> limit 3;
+----------+--------+
| order_id | amount |
+----------+--------+
| 1 | 27.40 |
| 2 | 36.20 |
| 3 | 65.45 |
+----------+--------+
实例17
我们可以使用where子句指定要选择的行的条件。以下查询将返回2020–10–01的所有订单。
mysql> select * from orders
-> where date = '2020-10-01';
+----------+------------+--------+---------+
| order_id | date | amount | cust_id |
+----------+------------+--------+---------+
| 1 | 2020-10-01 | 27.40 | 1001 |
| 2 | 2020-10-01 | 36.20 | 1000 |
| 3 | 2020-10-01 | 65.45 | 1002 |
+----------+------------+--------+---------+
实例18
where子句接受多个条件。让我们在上一个示例中为查询添加另一个条件。
mysql> select * from orders
-> where date = '2020-10-01' and amount > 50;
+----------+------------+--------+---------+
| order_id | date | amount | cust_id |
+----------+------------+--------+---------+
| 3 | 2020-10-01 | 65.45 | 1002 |
+----------+------------+--------+---------+
实例19
我们可能想对查询结果进行排序,这可以通过使用order by子句来完成。
以下查询将返回2020–10–02的订单,并根据金额对它们进行排序。
mysql> select * from orders
-> where date = '2020-10-02'-> order by amount;
+----------+------------+--------+---------+
| order_id | date | amount | cust_id |
+----------+------------+--------+---------+
| 5 | 2020-10-02 | 18.80 | 1005 |
| 6 | 2020-10-02 | 21.15 | 1009 |
| 4 | 2020-10-02 | 34.40 | 1001 |
| 7 | 2020-10-02 | 34.40 | 1008 |
| 8 | 2020-10-02 | 41.10 | 1002 |
+----------+------------+--------+---------+
实例20
默认情况下,order by子句对行进行升序排序。我们可以使用desc关键字将其更改为降序。
mysql> select * from orders
-> where date = '2020-10-02'-> order by amount desc;
+----------+------------+--------+---------+
| order_id | date | amount | cust_id |
+----------+------------+--------+---------+
| 8 | 2020-10-02 | 41.10 | 1002 |
| 4 | 2020-10-02 | 34.40 | 1001 |
| 7 | 2020-10-02 | 34.40 | 1008 |
| 6 | 2020-10-02 | 21.15 | 1009 |
| 5 | 2020-10-02 | 18.80 | 1005 |
+----------+------------+--------+---------+
实例21
SQL是一种通用语言,也可以用作数据分析工具。它提供许多功能,可在从数据库查询时分析和转换数据。
例如,我们可以在订单表中计算唯一天数。
mysql> select count(distinct(date)) as day_count
-> from orders;
+-----------+
| day_count |
+-----------+
| 4 |
+-----------+
订单表包含4个不同日期的订单。" as"关键字用于重命名查询结果中的列。否则,该列的名称将为" count(distinct(date))"。
实例22
订单表中有4天。我们还可以找出每天有多少订单。group by子句将帮助我们完成此任务。
mysql> select date, count(order_id) as order_count
-> from orders
-> group by date;
+------------+-------------+
| date | order_count |
+------------+-------------+
| 2020-10-01 | 3 |
| 2020-10-02 | 5 |
| 2020-10-03 | 6 |
| 2020-10-04 | 2 |
+------------+-------------+
我们计算订单并将其按日期列分组。
实例23
我们将计算每天的平均订单金额,并根据平均金额以降序排列结果。
mysql> select date, avg(amount)
-> from orders
-> group by date-> order by avg(amount) desc;
+------------+-------------+
| date | avg(amount) |
+------------+-------------+
| 2020-10-01 | 43.016667 |
| 2020-10-04 | 42.150000 |
| 2020-10-03 | 37.025000 |
| 2020-10-02 | 29.970000 |
+------------+-------------+
实例24
我们要修改上一个示例中的查询,并且只包含平均金额大于30的天。
mysql> select date, avg(amount)
-> from orders
-> group by date-> having avg(amount) > 30-> order by avg(amount) desc;
+------------+-------------+
| date | avg(amount) |
+------------+-------------+
| 2020-10-01 | 43.016667 |
| 2020-10-04 | 42.150000 |
| 2020-10-03 | 37.025000 |
+------------+-------------+
重要的是要注意,查询中语句的顺序很重要。例如,如果将order by子句放在having子句之前,则会产生错误。
实例25
我们想找出每天的最大订购量。
mysql> select date, max(amount)
-> from orders
-> group by date;
+------------+-------------+
| date | max(amount) |
+------------+-------------+
| 2020-10-01 | 65.45 |
| 2020-10-02 | 41.10 |
| 2020-10-03 | 80.20 |
| 2020-10-04 | 50.10 |
+------------+-------------+
实例26
我们要在select语句中组合多个聚合函数。为了说明这一点,让我们详细说明前面的示例。我们希望看到每个客户的最大订单量与最小订单量之间的差异。我们还希望根据升序的差异对结果进行排序,并显示前三个结果。
mysql> select cust_id, max(amount) - min(amount) as dif
-> from orders
-> group by cust_id
-> order by dif desc-> limit 3;
+---------+-------+
| cust_id | dif |
+---------+-------+
| 1007 | 46.00 |
| 1009 | 28.95 |
| 1002 | 24.35 |
+---------+-------+
diff列是通过从最大数量减去最小数量获得的。
实例27
我们现在切换到客户表。让我们找出每个城市有多少女性和男性顾客。我们需要在group by子句中同时写位置和性别列。
mysql> select location, gender, count(cust_id)
-> from customer
-> group by location, gender;
+----------+--------+----------------+
| location | gender | count(cust_id) |
+----------+--------+----------------+
| Austin | female | 2 |
| Austin | male | 1 |
| Dallas | female | 2 |
| Dallas | male | 2 |
| Houston | female | 2 |
| Houston | male | 1 |
+----------+--------+----------------+
实例28
客户表和订单表基于cust_id列相互关联。我们可以使用SQL连接从两个表中查询数据。
我们希望在客户表中查看每个城市的平均订单金额。
mysql> select customer.location, avg(orders.amount) as avg
-> from customer
-> join orders
-> on customer.cust_id = orders.cust_id
-> group by customer.location;
+----------+-----------+
| location | avg |
+----------+-----------+
| Austin | 33.333333 |
| Dallas | 34.591667 |
| Houston | 44.450000 |
+----------+-----------+
由于我们从两个不同的表中选择列,因此将使用关联的表名指定列名。上面查询的第二,第三和第四行基于每个表中的cust_id列将customer andorders表联接在一起。
请注意,列名不必相同。无论我们使用" on"关键字提供什么列名,都将基于这些列进行比较或匹配。
实例29
我们希望查看在2020–10–03年下订单的客户的平均年龄。
mysql> select avg(c.age) as avg_age
-> from customer c
-> join orders o
-> on c.cust_id = o.cust_id
-> where o.date = '2020-10-03';
+---------+
| avg_age |
+---------+
| 30.0000 |
+---------+
我们也可以为表名使用别名。当我们需要多次键入表名时,它很方便。
实例30
我们想查看订单量最大的客户的位置。
mysql> select c.location, o.amount
-> from customer c
-> join orders o
-> on c.cust_id = o.cust_id
-> where o.amount = (select max(amount) from orders)
-> ;
+----------+--------+
| location | amount |
+----------+--------+
| Dallas | 80.20 |
+----------+--------+
在此查询中,我们有一个嵌套的select语句。金额条件是使用订单表中单独的select语句计算得出的。
可以通过其他方式完成此任务。我选择了这种方法来介绍嵌套查询的概念。
结论
我相信本文中的30个示例将全面介绍SQL。我们涵盖了以下主题:
· 用关系表创建数据库
· 修改表格
· 将数据插入表
· 从表中删除数据
· 编写查询以从表中检索数据
当然,SQL可以完成更高级的查询和操作。熟悉基础知识后,最好继续进行更高级的操作。
感谢您的阅读。如果您有任何反馈意见,请告诉我。
(本文由闻数起舞翻译自undefined的文章《30 Examples to Master SQL》,转载请注明出处,原文链接:
https://towardsdatascience.com/30-examples-to-master-sql-c8004705479a)