Python根据路径信息构建多叉树
一、问题背景
假设现在存在一个树形的目录结构,类似操作系统中的文件层级关系。更精确的描述是java项目中代码的模块层级关系。如下图:
然而,一方面因为项目太大,手动建立树形结构非常耗时耗力,另一方面是或许我们知道的信息只有几条路径,我们需要根据掌握的几条路径尽可能地恢复出它们所在的模块层级。
如上图,当我们只知道“root/a/b/d”,“root/a/c/e/f”和“root/a/c/e/g”这三条路径的时候,希望能构建出图中展示出的层级结构
二、解决思路
这棵树的每个节点应包括两个元素,第一是当前节点的名称用来标记节点,第二是一个字典,用来保存它的所有子节点,然后遍历已知的所有路径,将每个节点挂接到树上即可。
三、具体实现(Python代码)
class TreeNode:
def __init__(self, name):
self.name = name
self.children = {}
def construct_tree(paths):
root = TreeNode('root')
paths = eval(paths)
for p in paths:
f = p.split('/')
pointer = root
for i in range(1, len(f)):
if f[i] not in pointer.children.keys():
node = TreeNode(f[i])
pointer.children[f[i]] = node
pointer = node
else:
pointer = pointer.children[f[i]]
tree2lin = dfs(root)
tree2lin = '(' + tree2lin + ')'
return tree2lin
def dfs(root):
if len(root.children) == 0:
return root.name
children = root.children
if len(children) == 1:
return root.name + ' ' + dfs(root.children[root.children.keys()[0]])
else:
result = root.name
for c in children:
result += ' (' + dfs(children[c]) +') '
return result
if __name__ == '__main__':
temps = "['root/2/3/4/5/6/7', 'root/2/3/5/8/6/9']"
result = construct_tree(temps)
print(result)
为了验证是否正确地构建了树结构,我们用深度优先搜索的方式将树结构串行化然后输出:
样例输入:
"['root/2/3/4/5/6/7', 'root/2/3/5/8/6/9']"
样例输出:
"(root 2 3 (5 8 6 9) (4 5 6 7) )"
当然,这份代码只考虑了最核心的目标,并没有考虑格式等问题,因此存在一些硬编码现象,可在此基础上根据自己的需要进行修改。