回答

收藏

在SQL中使用JOIN成本是多少?性能和标准化之间的选择是什么?

技术问答 技术问答 124 人阅读 | 0 人回复 | 2023-09-14

我发现了一个类似的线程,但它并没有真正捕捉到我想内容的本质-因此,我创建了一个新的线程。3 A( L$ B$ s1 Q7 u3 q4 g: {7 H
我知道我们需要权衡标准化和性能之间的选择。我想知道画线的最佳实践是什么?在我的具体情况下,我有一个信息传输系统,它有三个不同的表:messages_threads(总信息持有人),messages_recipients(涉及谁)和messages_messages(实际消息 时间戳记)。2 E) X& ?* K' S" D/ [8 h
我必须返回收件箱视图messages_threads表,users表和pictures表连接到messages_recipients表,以获取填充视图的信息(配置文件图片、发件人名称、线程ID)。0 d- _/ K! m: n
..而且我还是给消息添加了一个联系,从最后一条消息中搜索文本,以便向用户展示最后一条消息的预览。" j8 D; k! i3 V) K
我的问题是:SQL中的JOINS性能有多贵?例如,我可以存储发件人的名称(必须离开用户才能连接发件人的名称)messages_threads表中名为“
/ r! s( l" h; q. f( vsendername”的字段下-但在标准化方面,我一直被教导避免数据冗余?6 h# [7 _  b- _: e/ u- [- n
你在哪里划界线?或者我高估了影响性能的影响SQL连接程度?7 j% S1 K. ]7 M: X
                                                               
8 [4 z- D$ a) w2 O! F$ a1 Z* l    解决方案:                                                               
" f3 f: }7 ^& L! ]4 Y                                                                是最好的方法始终    从3NF一开始,只有在发现特定的性能问题时才。
' `3 ]+ l% \+ m1 D) R  `性能只是你必须处理数据库的问题 之一& o- x9 W* j; {: |
。通过复制数据,你运行,从而不一致的数据在你的数据库的风险,从而抵消的关系数据库,一致性(的核心原则之一C的ACID)一个。! H2 b! g6 B, q4 P
是的,加入需要付出一定的代价,这是不可避免的。然而,成本通常比你想象的要低得多,而且通常会因为其他因素(如网络传输时间)而陷入困境。通过确保正确索引相关列,您可以避免大量此类费用。1 c: T  V/ ?$ Y1 ?% S7 W
而且,请记住优化的口头禅: 测量,不要猜测!    并在类似的生产环境中进行测量。保持
7 `) ]0 {4 r8 [  C: X1 U定期测量(和调整)-假如你的架构和数据永远不会改变(极不可能),那么优化只是一套完整的设置,而忘记了操作。! F- }7 q8 N* N; ^& Z& A
a)通常,使用触发器保持一致性可以安全恢复性能。当然,这会减慢你的更新速度,但它仍然可能使你的选择运行得更快。
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则