窗口函数保留原表行数并支持同行字段访问与有序计算,GROUP BY 压缩行数且仅允许分组键和聚合列;二者执行时机、逻辑层级及典型用途均不可互换。

SQL 窗口函数与 GROUP BY 的本质差异  第1张

窗口函数和 GROUP BY 都能做聚合计算,但根本目标不同:窗口函数保留原始行粒度,只为每行“附加”一个计算结果;GROUP BY 则强制压缩数据,输出行数通常少于输入行数。

计算粒度与结果行数不同

这是最直观的区别:

  • GROUP BY 按分组字段合并多行 → 输出一行代表一组 → 行数 ≤ 原表行数(常显著减少)
  • 窗口函数 不改变原始行结构 → 每行都参与计算,也每行都输出结果 → 输出行数 = 原表行数

例如对销售表按地区分组求总销售额:GROUP BY region 返回每个地区一行;而 SUM(sales) OVER (PARTITION BY region) 则在原表每一行后追加本地区的累计销售额,行数不变。

能否访问当前行的“同行其他字段”

GROUP BY 后的 SELECT 列必须是分组键或聚合表达式,无法直接引用非分组、非聚合字段(如 SELECT region, name, SUM(sales) FROM t GROUP BY region 会报错);

窗口函数运行在完整结果集上,所有原始列都可用:

  • 可写 SELECT name, region, SUM(sales) OVER (PARTITION BY region) —— nameregion 同时出现,不冲突
  • 还能结合排序(ORDER BY 子句)实现累计、排名、前后行比较等,GROUP BY 完全不支持这类有序上下文操作

执行时机与逻辑层级不同

SQL 执行顺序中,GROUP BY 发生在 WHERE 之后、HAVINGSELECT 之前,属于“行压缩层”;

窗口函数实际在 SELECT 阶段最后执行(甚至晚于 ORDER BY),它看到的是已过滤、已分组(如果用了 GROUP BY)、已投影的中间结果集 —— 所以你甚至可以在 GROUP BY 的结果上再开窗:

  • GROUP BY region, year 算出各年各地区总销量
  • 再用 AVG(total_sales) OVER (PARTITION BY region) 算每个地区多年平均值

这种“聚合后再分析聚合结果”的能力,GROUP BY 单独做不到。

典型用途不可互换

有些需求只能靠其中一种实现:

  • 给每条订单标出“该客户第几笔订单” → 必须用 ROW_NUMBER() OVER (PARTITION BY customer_id ORDER BY order_date)
  • 显示每个员工工资及部门平均工资差额 → salary - AVG(salary) OVER (PARTITION BY dept),不能用 GROUP BY 因为要保留每人一行
  • 统计每个品类销量占比(品类销量 / 总销量)→ 可用 SUM(sales) OVER () 得全局和,再除;若用 GROUP BY 就得两次查询或子查询,更重且难读

反过来说,单纯统计“各城市订单数”,用 GROUP BY city 更直接轻量,没必要开窗。