innerjoin优化
inner join 优化
mlgbd什么意思数据库中,像table a inner join table b 、table a left join table b 像这样的SQL语句是如何⼯作的?也就是说SQL Server 使⽤什么算法实现两个表的join操作?
SQL Server 2000有三种⽅式:nested loop 嵌套循环、merge合并、hash。Oracle也是使⽤这三种⽅式。
yomite1、nested loop
⽰例sql:lect * from table A inner join table B l1 and ...
table A 中没有建⽴任何索引,table B中在col1上建⽴⼀个主键(聚簇索引)
使⽤nested loop 的条件是:a) outer input 的记录数不⼤,最好在1000~2000以下,⼀般超过3000就很难说了,基本不⼤会选择nested loop;b) 作为inner put 的表中,有可以这样的索引。在三种join种,nested loop 是消耗内存与cpu最少的⽅式。
lookatmauna loa>decrea2、merge
第⼀个步骤是确保两个关联表都按关联的字段进⾏排序。如果关联的字段有可⽤的索引,直接使⽤merger join 操作;否
则SQL Server 需要先对关联的表按照关联字段进⾏⼀次排序(就是在merge join 前的两个输⼊上,可能都需要两个sorted操作,再进⾏merge join )
apanda>boner3、hashdrugs
hash算法主要是⽤于⼤数据量的搜索,为了避免像merge join ⼀样在全部的字段中进⾏搜索匹配,通过合适的hash函数,先要给要搜索的数据根据hash key建⽴hash值作为索引,在搜索时,先通过hash值定位到⼀个较⼩的范围之内,然后在这个范围中搜索匹配的结果,提⾼效率。
SQL Server 将数据量较⼩的表作为build input,尽量使根据build input构造hash table 能够完全放在内存中,这样probe阶段的匹配操作都放在了内存,因此这种hash join 也被成为In-Memory hash join。如果build input ⾮常⼤,构建hash table ⽆法在内存中容纳时,SQL Server分别将build input 和probe input 切分成多个分区。
三种join ⽅法,都是拥有两个输⼊。优化的基本原则是:
缝隙英文① 尽量避免⼤数据量的hash join ,尽量使其转化为⾼效的merge join 和nested looped。表结构设计
、索引调整、SQL优化以
光棍节 短信及业务设计优化
② 尽量减少两个输⼊端数据量。