查询计划与优化

逻辑计划与物理计划

逻辑计划与物理计划两者的区别在于：逻辑计划告诉你算子的控制流程，而物理计划指定算子的具体执行方法。

具体来说，一个逻辑计划的算子为Scan, 物理计划可以生成Index Scan或者Seq Scan。再比如Join: 可能存在Sort Join,Hash Join…

因为查找一个最优的查询计划是一个NP问题，所以我们需要找到停下来的方法。

启发式算法：通过规则，执行从逻辑到物理的转化方法。

对于符合要求的，总是应用规则。所以这是静态的优化方式。

缺点在于各种配置需要写在代码里面。

Example: System R

使用静态的规则进行最初的优化。然后使用动态规划进行join reorder(通过分治)。

最初只进行左深树的优化。

分层搜索

Starburst:

火山优化

基于成本的优化器。

查询优化概述

查询优化的两种方法：

逻辑计划和物理计划的区别：

逻辑计划生成关系代数表达式，物理计划使用具体的操作符，是实际执行的底层逻辑。逻辑计划和物理计划不一定一一对应。

Predicate Pushdown,通过提前执行谓语（从语法树上往下推），来减少工作量

单一关系模型

首先判断是否sargable(Search Argument Able)是否又对应索引。

现在大多数DBMS采用heuristics(启发式)而不是精确的模型。

一个sargable的query能很容易被启发式的模型执行。

多个关系模型

可以枚举的：

随着join数量的增加，可行的所有方法也会增加，故不能使用枚举，要限制搜索的数量来在可接受的时间内找到优化的方案。

自底向上：从nothing逐渐构建方案。例子：IBM System R, DB2, MySQL, Postgres, most open-source DBMSs
自顶向下：从想要的结果开始，然后从语法树上到下优化。例子：MSSQL, Greenplum, CockroachDB, Volcano
遗传算法 PostgreSQL(GEQ)

自底向上优化：System R