承接国内外服务器租用托管、定制开发、网站代运营、网站seo优化托管接单、网站代更新,新老站点皆可!!咨询QQ:3787320601

PostgreSQL索引扫描时为何index only scan不返回ctid

管理员 2023-06-29 08:03:04 互联网圈 10 ℃ 0 评论 5148字 收藏

PostgreSQL索引扫描时为何index only scan不返回ctid

我们都知道在PostgreSQL中使用索引扫描时,是通过索引中存储的ctid去表中得到数据的。同时在PostgreSQL中如果要查询的列都在索引中,我们还可使用index only scan。

既然如此,当我们在查询中用到ctid时,会不会还可以使用index only scan呢?

按理来讲是没有问题的,例如在Oracle中:

SQL> select rowid,id from t1 where id = 1;
—————————————————————————
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
—————————————————————————
| 0 | SELECT STATEMENT | | 1 | 25 | 1 (0)| 00:00:01 |
|* 1 | INDEX RANGE SCAN| IDX_T1 | 1 | 25 | 1 (0)| 00:00:01 |
—————————————————————————

我们的查询包括了rowid,依然不需要回表TABLE ACCESS BY INDEX ROWID BATCHED的步骤。但是在PostgreSQL仿佛其实不是这样。

index only scan:

bill=# explain analyze select c1 from t1 where c1 = 10;
QUERY PLAN
———————————————————————————————————————
Index Only Scan using idx_t1 on t1 (cost=0.29..10.74 rows=523 width=4) (actual time=0.021..0.117 rows=523 loops=1)
Index Cond: (c1 = 10)
Heap Fetches: 0
Planning Time: 0.076 ms
Execution Time: 0.196 ms
(5 rows)

带上ctid后:

bill=# explain analyze select ctid,c1 from t1 where c1 = 10;
QUERY PLAN
—————————————————————————————————————–
Index Scan using idx_t1 on t1 (cost=0.29..81.71 rows=523 width=10) (actual time=0.038..0.447 rows=523 loops=1)
Index Cond: (c1 = 10)
Planning Time: 0.098 ms
Execution Time: 0.537 ms
(4 rows)

可以看到没有再去使用index only scan,取而代之的是普通的索引扫描。

为何会这样呢?ctid必定是包括在任何btree索引中的,为何用到ctid的时候就不能用index only scan?

在网上看到类似的问题:

传送门

解答是说和HOT有关,乍一看仿佛有点道理,但是仔细想一想,如果是HOT那末也会通过vm文件去判断多版本,那末对ctid我们只要通过vm文件判断其可见性不是就能够了,最少当表中没有任何不可见的行时应当要使用index only scan啊。

这其实由于在使用vm文件进行可见性判断前,优化器在parse阶段就已决定了是使用index scan或者index only scan,通过check_index_only函数来判断会不会使用index only scan:

for (i = 0; i < index->ncolumns; i++)
{
int attno = index->indexkeys[i];
/*
* For the moment, we just ignore index expressions. It might be nice
* to do something with them, later.
*/
if (attno == 0)
continue;
if (index->canreturn[i])
index_canreturn_attrs =
bms_add_member(index_canreturn_attrs,
attno – FirstLowInvalidHeapAttributeNumber);
else
index_cannotreturn_attrs =
bms_add_member(index_cannotreturn_attrs,
attno – FirstLowInvalidHeapAttributeNumber);
}
index_canreturn_attrs = bms_del_members(index_canreturn_attrs,
index_cannotreturn_attrs);
/* Do we have all the necessary attributes? */
result = bms_is_subset(attrs_used, index_canreturn_attrs);

简单解释下上面这段代码的逻辑,pg在判断会不会使用index only scan时,就是将索引列取出放到一个bitmap位图index_canreturn_attrs中,将查询用到的列放到一个bitmap位图attrs_used中,然后判断attrs_used位图会不会是index_canreturn_attrs的子集,如果是则使用index only scan,而这里的index_canreturn_attrs信息是从pg_index中去获得的,自然是不会寄存ctid的信息。

到此这篇关于PostgreSQL索引扫描时为何index only scan不返回ctid的文章就介绍到这了,更多相关PostgreSQL index only scan内容请搜索之前的文章或继续浏览下面的相关文章希望大家以后多多支持!

文章来源:丸子建站

文章标题:PostgreSQL索引扫描时为何index&nbsp;only&nbsp;scan不返回ctid

https://www.wanzijz.com/view/60620.html

X

截屏,微信识别二维码

微信号:weimawl

(点击微信号复制,添加好友)

打开微信