构建二叉树问题¶

Question

给定一个二叉树的前序遍历 preorder 和中序遍历 inorder ，请从中构建二叉树，返回二叉树的根节点。

原问题定义为从 preorder 和 inorder 构建二叉树，其是一个典型的分治问题。

问题可以被分解：从分治的角度切入，我们可以将原问题划分为两个子问题：构建左子树、构建右子树，加上一步操作：初始化根节点。而对于每个子树（子问题），我们仍然可以复用以上划分方法，将其划分为更小的子树（子问题），直至达到最小子问题（空子树）时终止。
子问题是独立的：左子树和右子树是相互独立的，它们之间没有交集。在构建左子树时，我们只需要关注中序遍历和前序遍历中与左子树对应的部分。右子树同理。
子问题的解可以合并：一旦得到了左子树和右子树（子问题的解），我们就可以将它们链接到根节点上，得到原问题的解。

根据以上分析，这道题是可以使用分治来求解的，但如何通过前序遍历 preorder 和中序遍历 inorder 来划分左子树和右子树呢？

根据定义，preorder 和 inorder 都可以被划分为三个部分。

以上图数据为例，我们可以通过下图所示的步骤得到划分结果。

前序遍历的首元素 3 是根节点的值。
查找根节点 3 在 inorder 中的索引，利用该索引可将 inorder 划分为 [ 9 | 3 ｜ 1 2 7 ] 。
根据 inorder 划分结果，易得左子树和右子树的节点数量分别为 1 和 3 ，从而可将 preorder 划分为 [ 3 | 9 | 2 1 7 ] 。

根据以上划分方法，我们已经得到根节点、左子树、右子树在 preorder 和 inorder 中的索引区间。而为了描述这些索引区间，我们需要借助几个指针变量。

如下表所示，通过以上变量即可表示根节点在 preorder 中的索引，以及子树在 inorder 中的索引区间。

表根节点和子树在前序和中序遍历中的索引

请注意，右子树根节点索引中的 \((m-l)\) 的含义是“左子树的节点数量”，建议配合下图理解。

为了提升查询 \(m\) 的效率，我们借助一个哈希表 hmap 来存储数组 inorder 中元素到索引的映射。

PythonC++JavaC#GoSwiftJSTSDartRustCZig

build_tree.py

[class]{}-[func]{dfs}

[class]{}-[func]{build_tree}

build_tree.cpp

[class]{}-[func]{dfs}

[class]{}-[func]{buildTree}

build_tree.java

[class]{build_tree}-[func]{dfs}

[class]{build_tree}-[func]{buildTree}

build_tree.cs

[class]{build_tree}-[func]{dfs}

[class]{build_tree}-[func]{buildTree}

build_tree.go

[class]{}-[func]{dfsBuildTree}

[class]{}-[func]{buildTree}

build_tree.swift

[class]{}-[func]{dfs}

[class]{}-[func]{buildTree}

build_tree.js

[class]{}-[func]{dfs}

[class]{}-[func]{buildTree}

build_tree.ts

[class]{}-[func]{dfs}

[class]{}-[func]{buildTree}

build_tree.dart

[class]{}-[func]{dfs}

[class]{}-[func]{buildTree}

build_tree.rs

[class]{}-[func]{dfs}

[class]{}-[func]{build_tree}

build_tree.c

[class]{}-[func]{dfs}

[class]{}-[func]{buildTree}

build_tree.zig

[class]{}-[func]{dfs}

[class]{}-[func]{buildTree}

下图展示了构建二叉树的递归过程，各个节点是在向下“递”的过程中建立的，而各条边（即引用）是在向上“归”的过程中建立的。

每个递归函数内的前序遍历 preorder 和中序遍历 inorder 的划分结果如下图所示。

设树的节点数量为 \(n\) ，初始化每一个节点（执行一个递归函数 dfs() ）使用 \(O(1)\) 时间。因此总体时间复杂度为 \(O(n)\) 。

哈希表存储 inorder 元素到索引的映射，空间复杂度为 \(O(n)\) 。最差情况下，即二叉树退化为链表时，递归深度达到 \(n\) ，使用 \(O(n)\) 的栈帧空间。因此总体空间复杂度为 \(O(n)\) 。