当前位置: 首页 > news >正文

MySQL MVCC 详解

原文链接:https://www.rendering.me/blog/7CRB6e

MySQL MVCC 详解

维基百科上关于 MVCC 的介绍:

多版本并发控制(Multiversion concurrency control, MCC 或 MVCC),是数据库管理系统常用的一种并发控制,也用于程序设计语言实现事务内存。
MVCC意图解决读写锁造成的多个、长时间的读操作饿死写操作问题。每个事务读到的数据项都是一个历史快照,并依赖于实现的隔离级别。写操作不覆盖已有数据项,而是创建一个新的版本,直至所在操作提交时才变为可见。快照隔离使得事务看到它启动时的数据状态。

MVCC 的核心是“数据多版本”,即同一数据在系统中可以存在多个版本,每个事务看到的数据是特定版本的快照。具体来说:

  • 读操作:无需加锁,直接读取数据的某个历史版本,避免了与写操作的冲突。
  • 写操作:只锁定当前操作的数据,不影响其他事务的读操作。

这种机制使得读写操作可以并发执行,大大提高了数据库的并发性能。

MVCC 实现机制

MySQL中,MVCC的实现基于以下基石:

隐藏字段

InnoDB 中,每一行数据除了我们定义的字段外,还会存在一些额外的隐藏列:

  • DB_TRX_ID:事务ID,表示插入或更新该行的最后一个事务的事务标识符;
  • DB_ROLL_PTR:回滚指针,回滚指针指向写入回滚段的 undo log 记录;
  • DB_ROW_ID:行ID,随着新行插入而单调增加。

事务ID

每次启动一个事务,InnoDB 会为其分配一个唯一递增的事务 ID。事务 ID 用于判断数据版本的可见性。

回滚段(Rollback Segment)与 undo 日志

当数据被修改时,InnoDB 会将旧数据复制到回滚段中,并通过DB_ROLL_PTR指针链接到 undo 日志。这些历史版本数据用于支持事务回滚和 MVCC 的读操作。

Read View(读视图)

每个读操作启动时会生成一个 Read View,包含当前活跃事务的列表。Read View 用于判断事务能看到哪些数据版本。Read View 包含以下四个关键属性:

  • creator_trx_id:当前创建 Read View 的事务 ID。用于标识生成该 Read View 的事务。
  • trx_ids:活跃事务列表,创建 Read View 时,当前所有未提交的事务 ID 列表(即活跃事务)。这些事务的修改对当前 Read View 可能不可见,需要根据规则判断。
  • low_limit_id:创建 Read View 时,系统中已分配的最大事务 ID + 1。表示大于等于该值的事务 ID 在 Read View 创建后生成,对当前 Read View 不可见。
  • low_limit_no:删除版本号:用于判断行的删除操作是否对当前事务可见(与 purge 操作相关)。核心是前三个属性。

对于读已提交事务隔离级别,在事务中每次执行查询都会重新创建一次Read View,因此可能会读取到其它事务提交的数据。
对于可重复读事务隔离级别,在事务中只会创建一次Read View,后续每次查询都使用第一次创建的Read View,因此保证了每次读取的数据都是一致的。

流程

  • 数据准备,当前事务隔离级别为读已提交
    createtablet1(idintprimarykey,c2int);insertintot1values(1,100);
  • 事务1
    STARTTRANSACTION;updatet1setc2=200wheret1=1;
  • 事务2 开启并进行查询
    STARTTRANSACTION;select*fromt1whereid=1;
  • 事务3
    STARTTRANSACTION;updatet1setc2=300wheret1=1;
  • 事务2第二次次查询
    select*fromt1whereid=1;
  • 事务1提交
    COMMIT;
  • 事务2第三次查询
    select*fromt1whereid=1;commit;


假设上述事务1的事务ID=120,事务2的事务ID=130,事务3的事务ID=140。

对于事务2第一次查询时,事务1先一步开启进行数据修改,并且没有提交,MVCC 的处理流程如下:

  1. 生成 Read View:
    • creator_trx_id:事务 2 的 ID = 130。
    • trx_ids:活跃事务列表,包含事务 1,为 120。
    • low_limit_id:创建 Read View 时,系统中已分配的最大事务 ID + 1 ,假定为131。
  2. 查询操作获取到最新行中的DB_TRX_ID=120,为事务1修改
  3. 可见性判断:
    • 120 在trx_ids中,因此当前数据未提交,对于当前事务不可见;
    • 根据DB_ROLL_PTR查找undo log,事务ID为110,未被其它事务修改,数据可见;
  4. 因此事务2第一次查询结果为 100。

对于事务2第二次查询时,新开启了事务3修改了数据,并且也没有提交,MVCC 的处理流程如下:

  1. 生成 Read View:
    • creator_trx_id:事务 2 的 ID = 130。
    • trx_ids:活跃事务列表,包含事务1,事务3,为 120,140。
    • low_limit_id:创建 Read View 时,系统中已分配的最大事务 ID + 1,假定为141。
  2. 查询操作获取到最新行中的DB_TRX_ID=140,为事务3修改;
  3. 可见性判断:
    • 140 在trx_ids中,因此当前数据未提交,对于当前事务不可见;
    • 根据DB_ROLL_PTR查找undo log,事务ID为120,仍然在trx_ids中,被事务1修改,对于当前事务不可见;
    • 继续根据DB_ROLL_PTR查找undo log,事务ID为110,未被其它事务修改,数据可见;
  4. 因此事务2第二次查询结果为 100。

对于事务3第三次查询时,事务1提交,事务3仍然开启,MVCC 的处理流程如下:

  1. 生成 Read View:
    • creator_trx_id:事务 2 的 ID = 130。
    • trx_ids:活跃事务列表,由于事务1已提交,因此只包含事务3,为140。
    • low_limit_id:创建 Read View 时,系统中已分配的最大事务 ID + 1,假定为141。
  2. 查询操作获取到最新行中的DB_TRX_ID=140,为事务3修改;
  3. 可见性判断:
    • 140 在trx_ids中,因此当前数据未提交,对于当前事务不可见;
    • 根据DB_ROLL_PTR查找undo log,事务ID为120,事务已提交,数据可见;
  4. 因此事务2第二次查询结果为 200。
http://www.cnnetsun.cn/news/2963703.html

相关文章:

  • Pike与主流IAC工具集成指南:Terraform、CloudFormation最佳实践
  • TC850高速积分型ADC:工业噪声环境下的高精度数据采集解决方案
  • 如何快速上手Unity2D Components:初学者必备的10个核心组件
  • Tag Editor未来路线图:AI标签识别与云同步功能展望
  • Playnite开源游戏库管理神器:三招解决多平台游戏统一管理痛点
  • GPT-4.1三模型架构解析:Turbo/Reasoning/LongContext工程落地指南
  • Circuit错误处理与降级策略:构建健壮的Go微服务架构的终极指南
  • Grok-4实测真相:识别灰盒模型的能力边界与落地风险
  • Cuckoo3终极指南:如何快速搭建开源恶意软件分析沙箱
  • 抖音无水印下载神器:5分钟学会批量保存高清视频
  • 跨平台应用开发技术栈选型指南
  • 【算法】专题一:双指针之呈最多水的容器,有效三角型的个数,和为 s 的两个数字,三数之和,四数之和
  • Qt Quick 粒子系统(十一):行为影响器——游走、湍流与年龄
  • 2026 年大模型求职难?看看码士集团面试突击班都讲了啥
  • Burp Suite 2024.7.3专业版实测:拦截优化与性能提升深度解析
  • 仿 Boots 大规模钓鱼攻击的技术机理与防御研究
  • 24AA024H/24LC024H EEPROM应用指南:低功耗设计、I2C驱动与数据可靠性
  • Gemini 3 Flash动态推理与视频理解工程实践指南
  • ONNX模型生产部署:封装、服务与监控全链路实践
  • TC1027四路比较器在嵌入式低功耗系统中的电源监控实战
  • AI驱动数字孪生的实时闭环:从建模到产线落地的7个关键步骤
  • 光盘救急工具:跳过加密限制、提取划痕盘数据、找回隐藏文件
  • JMeter压力测试全链路实战:从环境搭建到瓶颈定位
  • DeepSeek为何选择华为昇腾芯片?MoE架构与训推分离的硬核解析
  • 从CVE-2022-23366漏洞修复实战,详解SQL注入防御全链路策略
  • AI测试简历实战:零项目经验如何包装出高价值经历
  • LaneNet车道线检测完整工程包:含Tusimple数据适配、双主干网络训练与C++/Python双实现推理
  • 从模型转接到基础设施:2026企业大模型API聚合平台选型深度剖析
  • Java并发编程原理精讲:CAS与Atomic原子操作详解
  • 终极OpenCore Legacy Patcher指南:让老旧Mac免费运行最新macOS的完整教程