SQL GROUP BY子句详解：从基础用法到多列分组与HAVING筛选

来源：站长平台作者：高永康时间：05-01

导读：本期聚焦于小伙伴创作的《SQL GROUP BY子句详解：从基础用法到多列分组与HAVING筛选》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《SQL GROUP BY子句详解：从基础用法到多列分组与HAVING筛选》有用，将其分享出去将是对创作者最好的鼓励。

SQL查询中GROUP BY的含义与用法详解

在SQL查询中，GROUP BY 是一种用于将结果集按照一个或多个列的值进行分组的子句。其核心含义是：对数据记录进行归类，使得每个分组内的行具有相同的分组列值，从而允许我们对每个分组执行聚合计算（如求和、计数、求平均值等）。

一、GROUP BY的核心作用

GROUP BY的主要目的是与聚合函数（如 COUNT()、SUM()、AVG()、MAX()、MIN()）配合使用，以实现对数据的分类汇总。当我们在查询中使用GROUP BY时，数据库引擎会先将数据按照指定列进行分组，然后对每个分组独立地应用聚合函数，最后返回每个分组的聚合结果。如果没有GROUP BY，聚合函数会作用于整个结果集，从而只返回一个汇总值。

二、GROUP BY的语法结构

GROUP BY子句通常位于 WHERE 子句之后，HAVING 或 ORDER BY 子句之前。其基本语法格式如下：

SELECT 列名1, 列名2, ..., 聚合函数(列名)
FROM 表名
WHERE 条件
GROUP BY 列名1, 列名2, ...
HAVING 分组条件
ORDER BY 排序列;

需要注意的是：在 SELECT 子句中出现的非聚合列，必须全部包含在 GROUP BY 子句中。

三、通过示例理解GROUP BY

假设我们有一个名为 orders 的订单表，其结构和数据如下：

表结构：

CREATE TABLE orders (
    order_id INT,
    product_name VARCHAR(50),
    category VARCHAR(20),
    quantity INT,
    price DECIMAL(10,2),
    order_date DATE
);

示例数据：

INSERT INTO orders VALUES
(1, '手机', '电子产品', 2, 2999.00, '2024-01-10'),
(2, '笔记本', '办公用品', 5, 8.50, '2024-01-10'),
(3, '手机', '电子产品', 1, 3499.00, '2024-01-11'),
(4, '铅笔', '办公用品', 10, 1.20, '2024-01-12'),
(5, '手机', '电子产品', 3, 2499.00, '2024-01-12');

示例1：计算每个分类的销售总数量

需求：统计每个产品分类的销售总数量。

SELECT category, SUM(quantity) AS total_quantity
FROM orders
GROUP BY category;

结果：

category	total_quantity
电子产品	6
办公用品	15

这个查询将数据按 category 列分组，并对每个分组内的 quantity 列求和。

示例2：多列分组（按分类和日期分组）

需求：统计每个分类在每一天的销售数量。

SELECT category, order_date, SUM(quantity) AS daily_quantity
FROM orders
GROUP BY category, order_date;

这里使用两列进行分组，结果中每个分组包含唯一的 (category, order_date) 组合。

示例3：GROUP BY与HAVING搭配（筛选分组）

需求：找出销售总数量大于等于5的产品分类。

SELECT category, SUM(quantity) AS total_quantity
FROM orders
GROUP BY category
HAVING SUM(quantity) >= 5;

使用 HAVING 子句可以在分组后对分组结果进行过滤。注意：如果需要对原始行数据进行过滤，应使用 WHERE 子句，它作用于分组之前。

四、WHERE与HAVING的区别

在带有GROUP BY的查询中，WHERE 用于在分组之前过滤行，而 HAVING 用于在分组之后过滤分组。两者的执行顺序如下：

WHERE：从表中筛选出符合条件的行。
GROUP BY：将筛选后的行进行分组。
HAVING：对分组后的结果进行条件过滤。
ORDER BY：最后对结果进行排序。

例如，以下查询会先筛选出价格大于10元的订单，然后按分类分组并计算总数量，最后只保留总数量大于等于3的分类：

SELECT category, SUM(quantity) AS total_quantity
FROM orders
WHERE price > 10
GROUP BY category
HAVING SUM(quantity) >= 3;

五、常见注意事项

SELECT中的非聚合列必须出现在GROUP BY中：否则会导致语法错误或不确定的结果（取决于数据库系统）。例如：SELECT product_name, SUM(quantity) FROM orders GROUP BY category; 是错误的，因为 product_name 既不是聚合函数的一部分，也不在GROUP BY子句中。
聚合函数不参与分组：聚合函数（如 SUM(), COUNT()）总是对每个分组内的行进行计算，不能出现在GROUP BY子句中。
NULL值的处理：在分组时，所有NULL值会被视为同一个组。如果分组列中存在NULL，它们会被归到同一个分组中。
性能影响：对大型数据集进行GROUP BY操作可能会消耗较多资源，建议在必要列上建立索引以提升性能。

六、进阶：ROLLUP和CUBE

在某些数据库系统（如MySQL、PostgreSQL）中，GROUP BY可以配合 WITH ROLLUP 或 GROUP BY ROLLUP() 生成小计和总计行。例如：

SELECT category, order_date, SUM(quantity) AS total_quantity
FROM orders
GROUP BY category, order_date WITH ROLLUP;

该查询会额外返回分组列层级的小计行以及一个总计行，其中上层分组列的值会被设置为NULL。

总结

GROUP BY是SQL中用于数据分组和聚合的核心工具，它将数据按列分组，并与聚合函数结合，实现对分组数据的统计分析。理解GROUP BY的语法规则（尤其是SELECT与GROUP BY的列对应关系）以及WHERE与HAVING的执行顺序，是正确使用它的关键。掌握GROUP BY后，可以灵活地进行各种分类汇总查询，是数据分析与报表开发中不可或缺的技能。

SQLGROUPBY 分组查询聚合函数 HAVING子句多列分组

免责声明：已尽一切努力确保本网站所含信息的准确性。网站部分内容来源于网络或由用户自行发表，内容观点不代表本站立场。本站是个人网站免费分享，内容仅供个人学习、研究或参考使用，如内容中引用了第三方作品，其版权归原作者所有。若内容触犯了您的权益，请联系我们进行处理。