当前位置: 首页 > news >正文

DeepSeek总结的PostgreSQL 表访问方法

来源:https://thebuild.com/blog/2026/05/20/table-access-methods-wake-up/

PostgreSQL 表访问方法,醒醒吧

作者:Christophe Pettus
日期:2026-05-20

表访问方法 API 自 PostgreSQL 12 版本开始就存在了。在它存在的大部分时间里,它一直是一个安静的底层设施,几乎没有扩展活动与之相关——一种在文档中占一个段落、在会议上有一个热情的演讲,然后就是五年沉默的 API。

这种情况正在改变。

在过去的一个月里,两个与 TAM 相关的扩展发布了重要版本。storage_engine1.0.7 为 PG 16-18 增加了面向列的压缩和行压缩访问方法。pg_sorted_heap0.13.0 提供了一个物理排序的堆,带有区域映射修剪和一个与规划器集成的向量搜索钩子。这两者都不会在明天取代默认的堆。但它们都在做一些足够有趣的事情,值得一看。

最初的承诺,以及它为何停滞不前

TAM API 最初的承诺是,存储布局可以按表进行交换,而无需触及规划器和执行器的其余部分。实际情况则不那么干净。

TAM 接口在几个地方假设了一个元组形状的记录,这对于行存储变体来说没问题,但对于列式存储来说则不舒服。默认情况下,成本估计不知道你自定义存储的访问模式,因此规划器会愉快地为那些本应进行区域映射修剪的布局生成顺序扫描计划。大多数早期的 TAM 扩展要么接受规划器的成本(导致慢速计划),要么提供扩展特定的规划器钩子(这带来了维护负担,并且每个主要版本都会出现问题)。这两种结果都没有激发出后续工作的浪潮。

现在不同的是,在扩展中提供规划器钩子的成本已经降低,并且对其的需求已经增加。

pg_sorted_heap实际在做什么

pg_sorted_heap有趣之处在于,它将用于范围和向量相似性查询的规划器钩子直接集成到访问方法中。堆按用户指定的键进行物理排序。该键上的区域映射与堆一起维护。规划器被告知这两者。

对排序键的范围查询在扫描时修剪整个区域,无需索引。向量域中的最近邻查询使用相同的机制作为粗略的第一遍,然后进行精炼。这是一个真实的架构模式——它出现在 DuckDB、ClickHouse、每个现代 Parquet 读取器以及早期的pg_lake扩展代码中——最终通过 TAM 进入标准 PostgreSQL。

实现的稳健性是另一个问题。0.13.0 版本还很早期。但其设计是正确的设计。

storage_engine在做什么

storage_engine1.0.7 做了一些不同的事情,新颖程度较低,但更直接有用。colcompress访问方法将列打包到压缩的运行中,并在读取时支付解包成本。rowcompress访问方法在常规行布局之上进行块级压缩。

两者都是有限度的实验。都不会成为你的主要 OLTP 表。两者在堆和 TOAST 无法满足需求的特定场景中都很有用。如果你有宽列的、主要追加的表,包含高基数的 varchar 列,并且你一直在说服自己构建一个单独的分析副本,在你这样做之前,请先看看这个。

接下来会发生什么

未来一年值得关注的是,为 PG19/PG20 提出的核心列式工作与 TAM 扩展生态系统是趋同还是分化。

社区的方向广泛地朝向更强的可插拔性——更细粒度的 TAM 钩子、无需解析pgsql-hackers上每个补丁的规划器集成点,以及一个自定义存储可以插入的真实成本估算方案。供应商的方向(Snowflake、Databricks、Microsoft,都在其 Postgres 形态产品的下面有专有存储层)则广泛地背离这一点,因为它们的差异化位于 TAM 线之下,而可插拔性会削弱其护城河。

无论哪一方赢得未来两年的架构心智份额,都将决定 2028 年“Postgres”的含义。我有一个偏好。你可以猜到是什么。

今天,实际的答案是:运行基准测试。两个扩展都有足够稳定的版本,你可以这样做。TAM 时代不再是假设。

http://www.cnnetsun.cn/news/2498353.html

相关文章:

  • 深入解析Buzz语音转文字工具:Faster Whisper模型下载失败的技术挑战与解决方案
  • Python逆向工程深度解析:百度网盘直链获取技术实战指南
  • OpenRPA完全指南:免费企业级RPA自动化工具快速上手教程
  • 告别小屏幕!5个专业技巧让你在Windows大屏上高效刷酷安
  • 专业干货:低查重AI教材编写工具,助力教材创作新高度!
  • 轻松解决微信网页版登录限制的智能浏览器插件方案
  • 3步掌握Jellyfin智能字幕插件:新手快速上手指南
  • OpenClaw 3 机集群(Windows + Linux 混合)一键脚本 + 完整配置
  • 应对 Claude Code 服务不稳定,迁移至 Taotoken 的完整操作路径与考量
  • 边仓线与线边仓详解:边仓线和线边仓如何协同优化物料流转效率?
  • AzurLaneAutoScript深度解析:如何构建智能化的碧蓝航线自动化解决方案
  • 通过修改ESXi与vCenter防火墙规则,仅允许指定IP可登陆访问
  • Govee Matter户外灯柱降价40%,智能庭院照明新选择
  • 软考高项案例分析12:项目立项管理及招投标管理
  • AIoT网关50+AI算法硬核加持,AIoT边缘计算赋能千行百业
  • 宇视VM告警联动存储配置指导(B3359P30)
  • Claude Citations API 实战:让模型自动标注引用来源,RAG 准确率提升 15%
  • 【Prompt实战】角色扮演法:如何让AI分别扮演“小白用户”、“黑客”与“刁钻PM”?
  • 为你的开源项目配置 Taotoken 作为 Claude Code 的稳定后备方案
  • 思大电子丨M12 316L不锈钢防水连接器产品介绍
  • OpenBoardView终极指南:免费PCB分析工具与电路板查看器完全解析
  • 将Taotoken集成至自动化工作流实现内容批量生成
  • Buzz音频转录终极指南:3步掌握本地AI转录的完整技巧
  • Midjourney拟态风终极内参(2024.06最新版):含6类行业专属LORA融合权重表、11个失效规避checklist及3个已验证绕过--v 6.2限流机制的prompt结构
  • 老挝语TTS项目被拒3次?ElevenLabs合规性红线清单(含Lao语言政策备案要求、儿童语音禁用场景、宗教术语过滤规则)
  • 构建企业级 AI 编程助手(AI-OS)v1.0,集成 Matt Pocock 全套技能,实现零幻觉开发
  • 如何用Wannakey免费恢复WannaCry加密文件?3步内存密钥恢复指南
  • 从IO视角深度对比:BST、红黑树、B树、B+树
  • 2026年阿里云OpenClaw/Hermes Agent配置Token Plan集成保姆攻略
  • Java 常用类 - 比较两个 Integer 对象、Integer 转 Long、Long 转 Integer