回答

收藏

与PARTITION BY和GROUPBY截然不同

技术问答 技术问答 195 人阅读 | 0 人回复 | 2023-09-14

我在正在检查的应用程序中找到了一些SQL查询如下:
6 N5 O: M! G( f5 M# B. x; ASELECT DISTINCTCompany,Warehouse,Item,SUM(quantity) OVER (PARTITION BY Company,Warehouse,Item) AS stock我确定会产生与以下结果相同的结果:/ ~# H+ ~+ s7 y7 {; g
SELECTCompany,Warehouse,Item,SUM(quantity) AS stockGROUP BY Company,Warehouse,Item与第一种方法相比,使用第一种方法是否有任何好处(性能、可读性、额外的灵活性、可维护性等)?
1 P1 {, V+ I  i* M' S" \8 I                                                                9 [/ ~  Q$ d; o* e5 ]; _
    解决方案:                                                                " J4 F- X$ |- F! t2 H' U& _9 ^# e
                                                                表现:优胜者:GROUP BY. k' P# M/ M. O! I7 n
一些非常基本的测试显示,至少在我看来,这两个查询生成了完全不同的查询计划。PARTITION BY速度明显较慢。
1 Y" Z4 H* h. |& ?该GROUP BY查询计划只包括表扫描和聚集操作,PARTITION BY该计划有两个嵌套循环自连接。PARTITIONBY第二次运行约2800ms,则GROUP BY只用了500毫秒。
* v9 X$ b4 A# o可读性/可维护性:优胜者:GROUP BY/ d2 Y7 l: ~( I8 M2 n6 B/ E
根据评论员的意见,PARTITION BY对大多数开发人员来说,它的可读性很差,所以将来可能很难维护。' _$ Y$ E' j$ X5 Z3 K7 E
灵活性优胜者:PARTITION BY6 H2 \9 @# e$ Y  k9 ^* l3 ^
PARTITION BY使您在选择分组列时更加灵活。GROUP BY,所有聚合列只能有一组组列。DISTINCT  PARTITION BY你可以在每个分区有不同的列。同样,在某些领域DBMS上,你可以从OVER选择句子中更多的聚合/分析功能。
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则