Python根据路径信息构建多叉树

一、问题背景

假设现在存在一个树形的目录结构,类似操作系统中的文件层级关系。更精确的描述是java项目中代码的模块层级关系。如下图:

Python根据路径信息构建多叉树

然而,一方面因为项目太大,手动建立树形结构非常耗时耗力,另一方面是或许我们知道的信息只有几条路径,我们需要根据掌握的几条路径尽可能地恢复出它们所在的模块层级。

如上图,当我们只知道“root/a/b/d”,“root/a/c/e/f”和“root/a/c/e/g”这三条路径的时候,希望能构建出图中展示出的层级结构

二、解决思路

这棵树的每个节点应包括两个元素,第一是当前节点的名称用来标记节点,第二是一个字典,用来保存它的所有子节点,然后遍历已知的所有路径,将每个节点挂接到树上即可。

三、具体实现(Python代码)

class TreeNode:
    def __init__(self, name):
        self.name = name
        self.children = {}


def construct_tree(paths):
    root = TreeNode('root')
    paths = eval(paths)
    for p in paths:
        f = p.split('/')
        pointer = root
        for i in range(1, len(f)):
            if f[i] not in pointer.children.keys():
                node = TreeNode(f[i])
                pointer.children[f[i]] = node
                pointer = node
            else:
                pointer = pointer.children[f[i]]

    tree2lin = dfs(root)
    tree2lin = '(' + tree2lin + ')'
    return tree2lin


def dfs(root):
    if len(root.children) == 0:
        return root.name
    children = root.children
    if len(children) == 1:
        return root.name + ' ' + dfs(root.children[root.children.keys()[0]])
    else:
        result = root.name
        for c in children:
            result += ' (' + dfs(children[c]) +') '
        return result

if __name__ == '__main__':
    temps = "['root/2/3/4/5/6/7', 'root/2/3/5/8/6/9']"
    result = construct_tree(temps)
    print(result)

为了验证是否正确地构建了树结构,我们用深度优先搜索的方式将树结构串行化然后输出:
 

样例输入:

"['root/2/3/4/5/6/7', 'root/2/3/5/8/6/9']"

样例输出:

"(root 2 3 (5 8 6 9) (4 5 6 7) )"

当然,这份代码只考虑了最核心的目标,并没有考虑格式等问题,因此存在一些硬编码现象,可在此基础上根据自己的需要进行修改。