【PostgreSQL】使用开窗函数获取历史表最新记录 及 MySQL 旧版本实现
创始人
2025-05-30 20:55:54
0

文章目录

    • 1. 前言
    • 2. 需求与实现
      • 2.1 实现说明
      • 2.2 ROW_NUMBER () 的限制
      • 2.2.1 RANK() 实现
      • 2.2.2 RANK() 的限制
      • 2.2.3 DENSE_RANK() 实现
    • 3. MySQL 使用 User-Defined Variables 实现开窗函数
      • 3.1 实现
      • 3.2 进一步学习:官网资料
        • 3.2.1 用户变量作用的时机
        • 3.2.2 可不可以不初始化,就使用
      • 3.3 进一步学习:Spring 相关
    • 4. 后记

1. 前言

项目用了 PostgreSQL 作为数据库。用上了一直感兴趣的开窗函数,这里记录以下。
考虑到使用MySQL的项目也可能有这种需求,思考 MySQL 8.0 以前的实现方式(8.0开始就有开窗函数了,不用自己造轮子)。探索的过程中,把 User-Defined Variables 也学起来了,结合官网资料做一下笔记。

2. 需求与实现

  • 需求
    主表要关联历史表,取历史表最新的一条数据,根据最新时间关联上的历史表中的数据要全部带出来
  • PostgreSQL 实现:
SELECT*
FROMmain main
LEFT JOIN (SELECT* FROM( SELECT *, ROW_NUMBER () OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history ) TEMP WHERE TEMP.rw = 1
) history ON main.main_id = history.main_id;
  • 拆解sql
SELECT*
FROMmain main
LEFT JOIN (SELECT* FROM( 【这一部分是本文讨论的重点, 拆出来放到下文】) TEMP WHERE TEMP.rw = 1
) history ON main.main_id = history.main_id;

后文讨论 ROW_NUMBER () 、RANK()、DENSE_RANK 关注以下sql即可

SELECT *, ROW_NUMBER () OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history 

2.1 实现说明

  • OVER ( PARTITION BY main_id ORDER BY create_time DESC )
    数据根据 main_id 分组 (与group by 不同,这里多条数据不会被合并成一条),组内的数据按 create_time 倒序排列

  • ROW_NUMBER ()
    根据 OVER 的排序规则,为数据编号,如果 create_time 相同,依旧会保证 1,2,3…n 的连续序号

2.2 ROW_NUMBER () 的限制

SELECT *, ROW_NUMBER () OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history 

在这里插入图片描述
使用 ROW_NUMBER () 实现需求,默认了以下行为:
一个主表有多个历史表,但是历史表同一时刻(尽管create_time相同),只会取一条记录。
如果主表希望查出两个历史表记录,需要用到 rank()

2.2.1 RANK() 实现

SELECT *, rank() OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history

在这里插入图片描述

2.2.2 RANK() 的限制

可以看到上文main_id = 1 的分组中 rw 列的排列是 1, 1, 3。
如果需要1 , 1, 2 这种稠密的编码,则需要使用到dense_rank

2.2.3 DENSE_RANK() 实现

SELECT *, dense_rank() OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history

在这里插入图片描述

3. MySQL 使用 User-Defined Variables 实现开窗函数

这一部分是结合网上的资料,用mysql能解析的方式实现了开窗函数。一开始看这些变量真的挺头晕的,后面查阅官方资料,也算是清晰了。

3.1 实现

  • ROW_NUMBER()
SELECThistory.*, IF( @pre_main_id = history.main_id, @cur_rank := @cur_rank + 1, @cur_rank := 1 ) row_number , @pre_main_id := history.main_id 
FROM-- 连接可能被线程池工具复用,避免变量污染, 每次使用都重新初始化 变量main_history history  ,( SELECT @cur_rank := 0, @pre_main_id := NULL ) r 
ORDER BYhistory.main_id, history.create_time DESC
  • DENSE_RANK()
SELECT history.*,
IF(@pre_main_id = history.main_id, IF(@pre_create_time = history.create_time, @cur_rank, @cur_rank := @cur_rank + 1), @cur_rank := 1) dense_rank,
-- 后置处理
@pre_create_time := history.create_time temp2, @pre_main_id := history.main_id temp3
FROM -- 连接可能被线程池工具复用,避免变量污染, 每次使用都重新初始化 变量main_history history, (SELECT @cur_rank := 0, @pre_main_id := NULL, @pre_create_time := NULL, @rank_counter := 1) r
ORDER BY history.main_id, history.create_time DESC
) temp where dense_rank = 1;
  • RANK()
SELECT history.*,
-- 前置处理, 保证总数递增,确保形如 1, 1, 3 这种排列,而不是 1, 1, 2
IF(@pre_main_id = history.main_id, @rank_counter := @rank_counter + 1, @rank_counter := 1) temp1,
IF(@pre_main_id = history.main_id, IF(@pre_create_time = history.create_time, @cur_rank, @cur_rank := @rank_counter), @cur_rank := 1) rank,
-- 后置处理
@pre_create_time := history.create_time temp2, @pre_main_id := history.main_id temp3
FROM -- 连接可能被线程池工具复用,避免变量污染, 每次使用都重新初始化 变量main_history history, (SELECT @cur_rank := 0, @pre_main_id := NULL, @pre_create_time := NULL, @rank_counter := 1) r
ORDER BY history.main_id, history.create_time DESC

3.2 进一步学习:官网资料

User-Defined Variables 官方文档
【前置知识】一个sql语句的执行过程:存储引擎 -> server -> client

3.2.1 用户变量作用的时机

In a SELECT statement, each select expression is evaluated only when sent to the client. This means that in a HAVING, GROUP BY, or ORDER BY clause, referring to a variable that is assigned a value in the select expression list does not work as expected: SELECT (@aa:=id) AS a, (@aa+3) AS b FROM tbl_name HAVING b=5;

释意: 用户变量作用在select语句上,只有在发送到客户端的时候才会被解析.
言下之意是:以下语句执行时,用户变量还没处理数据,所以不要使用用户变量。

  • HAVING
  • GROUP BY
  • ORDER BY

3.2.2 可不可以不初始化,就使用

If you refer to a variable that has not been initialized, it has a value of NULL and a type of string.

释意:未初始化使用,默认值为string 类型的 null

3.3 进一步学习:Spring 相关

使用了用户变量,很自然就要在意变量是不是线程安全的。类似Spring 集成线程池,连接是共享的,要特别在意线程安全问题。
对于这个问题,有网友解答了:参考连接 (内容是搬运stackoverflow的)

Including (select @num := 0) initializes the variable at the beginning of the query. User-defined variables are scoped to the individual connection, and a connection can only run one query at a time, so this specific case is perfectly “thread-safe.”
However, it’s also a bit of a hack.

select
@num := (@num + 1) as row_number
from
user u,
(select @num := 0);

简要释义:一个connection同一时刻只会允许一个语句执行。(select @num := 0) 声明了一个connection作用域的用户变量。如果connection是隔离的,用户变量这个时候是安全的。

补充:

(select @num := 0)

Spring 会复用 connection,但是使用用户变量时都重新初始化,也不用担心connenction的上个使用者传递一个使用过的用户变量给下一个使用者。

4. 后记

最近 chatGPT好火,可以想象 chatGPT 以后能把开窗函数的 sql 转化成 MySQL 5.x 的对等实现。希望国内早点引进这种提高生产力的技术。

相关内容

热门资讯

王凤英入职小鹏3年终获股权,此... 5月7日消息,小鹏汽车披露的监管及年报信息显示,公司总裁王凤英已正式进入股东名册,入职小鹏3年后股权...
五块钱红酒卖断货,便宜红酒为何... 最近一段时间,中国的酒类消费市场可以说是显得格外奇怪,一方面,各种高端酒特别是白酒的消费量出现了明显...
财联社C50风向指数调查:4月... 财联社5月8日讯(记者 夏淑媛)新一期财联社“C50风向指数”结果显示,市场机构对4月新增人民币贷款...
央视硬刚国际足联拒掏20亿,背... 作者| 史大郎&猫哥 来源| 是史大郎&大猫财经Pro 央视这次太刚了,离世界杯开幕还有1个月,死活...
新CEO上任直接放大招!Air... 快科技5月8日消息,苹果即将上任的CEO John Ternus对未来一系列新产品充满信心,称这些设...
“特朗普拟邀英伟达、波音等CE... 据路透社当地时间5月7日报道,特朗普政府正邀请英伟达、苹果、埃克森美孚、波音等大公司首席执行官,于下...
世界杯,还能看到直播吗? 2026年美加墨世界杯距离开幕,仅剩一个多月时间。多方信息显示,中央广播电视总台(以下简称“央视”)...
机构警告AI芯片热潮风险,超威... 5月7日,据央视财经,隔夜超威半导体公司(AMD)股价飙升近19%,带动AI芯片热潮持续升温。AMD...
银行员工转走储户1800万最新... 银行员工转走储户1800万最新进展:2名储户已收到银行全部款项
原创 中... 1994年,安徽省的经济格局曾发生过一次戏剧性的转折。在那一年,一座名为安庆的城市,其国内生产总值(...
昆都仑区:政策“蓄力”消费焕新 “一台5000多元的空调,叠加‘国补’和商场的以旧换新活动,能优惠1000元左右,旧机还能免费上门拆...
乐悦置业竞得佛山顺德乐从镇一商... 观点网讯:5月6日,佛山市顺德区乐从镇一商业地块成功出让,由广东省乐悦置业有限公司竞得,乐从南区·邻...
原创 亦... 《爱情没有神话》这部剧,一开始的命运颇为多舛,经历了几次撤档的波折后,终于在观众面前亮相,但其首播的...
美联储34年最大分歧叠加油价飙... 美联储按预期维持利率不变,但内部出现34年来最严重分歧,叠加布油创2022年6月以来新高,美债遭抛售...
支付宝消费券回收后,资金是否支... 摘要: 支付宝消费券回收变现后,资金能否直接转入信用卡?本文解答到账方式的相关规则,帮助用户了解资金...
中医介绍5个化痰穴位!收藏这篇... 很多人忽略了“痰”的危害,觉得咳几下就没事,殊不知,肺里的痰长期堆积,只会一步步加重身体负担。 中医...
黄金平台“杰我睿”涉嫌经济犯罪... 红星资本局5月7日消息,深圳水贝知名金店“杰我睿”兑付困难事件有了新进展。日前,深圳市公安局罗湖分局...
多地出台购房新政促楼市升温 记... 今年的“五一”假期,伴随着多个城市楼市新政密集落地,在叠加市场信心持续修复的作用下,房地产市场热度持...
谁是五一“吸金王”?这5座城市... 来源:市场资讯 (来源:21城市观) 哪座城市成为“五一”假期的大赢家? 图源:摄图网 作者|赵晓...
“低招低裁”格局稳固劳动力市场... 智通财经APP获悉,美国上周初请失业金人数在经历前一周回落至近几十年来最低水平后出现小幅反弹,表明尽...