当前位置：首页 > news >正文

LCA算法三兄弟：从‘爬楼梯’到‘坐电梯’，图解倍增与Tarjan到底快在哪

news 2026/6/12 4:01:13

LCA算法三兄弟：从‘爬楼梯’到‘坐电梯’，图解倍增与Tarjan到底快在哪

想象一下，你正在一座摩天大楼里寻找两位同事的最近会面地点。如果只能一层层爬楼梯确认（朴素算法），效率显然低下；如果掌握电梯跳层技巧（倍增算法），或是提前拿到所有人的行程表（Tarjan算法），问题就会迎刃而解。这正是LCA（最近公共祖先）算法优化的核心逻辑——用空间换时间，用预处理换查询效率。

1. 从"爬楼梯"开始：朴素算法的局限与启示

当我们面对一棵家谱树，需要快速找出两个人的最近共同祖先时，最直观的做法就是让两人沿着父节点逐步上溯，直到首次相遇。这个过程就像两个人在不同楼层爬楼梯：

def naive_lca(x, y): # 确保x是较深的节点 while depth[x] > depth[y]: x = parent[x] while depth[y] > depth[x]: y = parent[y] # 同步上溯 while x != y: x = parent[x] y = parent[y] return x

这种方法的缺陷显而易见：

时间复杂度：最坏情况O(n)（当树退化为链表时）
重复计算：每次查询都要重新遍历路径
无法应对高频查询：百万次查询需要百万次遍历

提示：朴素算法虽然效率低，但其"同步上溯"的核心思想，正是所有优化算法的基础框架。

2. "坐电梯"的艺术：倍增算法的分层跳跃

倍增算法的精妙之处在于预先计算跳跃路径，就像为大楼安装高速电梯，允许直接跳到2的幂次楼层。其核心数据结构是一个二维数组fa[i][j]，表示节点i向上跳2^j步到达的祖先。

2.1 预处理阶段的智慧

构建倍增表的过程采用动态规划思想：

# 初始化：每个节点跳1步（2^0）就是其直接父节点 for j in range(1, MAX_LOG): for i in range(1, n+1): fa[i][j] = fa[fa[i][j-1]][j-1] # 2^j = 2^(j-1) + 2^(j-1)

这个递推关系可以直观理解为：要跳到8层（2³），可以先跳到4层（2²），再从4层跳到8层。

2.2 查询阶段的跳跃策略

实际查询时采用贪心策略——尽可能跨大步：

对齐深度：让较深节点跳跃到与较浅节点同深度

if depth[u] < depth[v]: u, v = v, u for k in range(MAX_LOG-1, -1, -1): if depth[u] - (1 << k) >= depth[v]: u = fa[u][k]

同步跳跃：当处于同一深度时，从最大步长尝试

if u == v: return u for k in range(MAX_LOG-1, -1, -1): if fa[u][k] != fa[v][k]: u, v = fa[u][k], fa[v][k] return fa[u][0]

倍增算法的优势在于：

特性	朴素算法	倍增算法
预处理时间	O(1)	O(nlogn)
单次查询时间	O(n)	O(logn)
适用场景	低频查询	在线查询

3. "先知"的魔法：Tarjan的离线预计算

如果说倍增算法是安装电梯，那么Tarjan算法更像是提前拿到所有人的移动轨迹图。它通过DFS遍历和并查集（Union-Find）的巧妙结合，实现O(1)时间复杂度的查询。

3.1 算法流程解析

Tarjan算法的核心在于后序遍历时的染色机制：

初始化：每个节点自成一个集合，祖先指向自己
DFS遍历：
- 访问子节点后，将子节点集合合并到当前节点
- 当前节点的祖先更新为自身
查询处理：
- 当两个节点都被访问过时，其LCA就是第一个节点的祖先

def tarjan(u): ancestor[u] = u visited[u] = True for v in children[u]: tarjan(v) union(u, v) ancestor[find(u)] = u for query in queries[u]: if visited[query.v]: lca_result[query.id] = ancestor[find(query.v)]

3.2 并查集的染色机制

Tarjan算法的精妙之处在于：

白色节点：尚未访问
灰色节点：正在访问其子树
黑色节点：已完成访问

当处理查询(u,v)时：

如果v是灰色，LCA就是u
如果v是黑色，LCA就是v被染成黑色时的当前根节点

注意：Tarjan算法必须预先知道所有查询，适合批量处理场景。

4. 实战选型：何时用电梯，何时当先知

三种算法的本质区别在于时间分配策略：

算法	预处理时间	查询时间	空间复杂度	适用场景
朴素算法	O(1)	O(n)	O(n)	极低频次查询
倍增算法	O(nlogn)	O(logn)	O(nlogn)	动态树/在线查询
Tarjan算法	O(nα(n))	O(1)	O(n)	静态树/批量离线查询