数据结构与算法--图相关
目录
图
图中元素叫做顶点(vertex),顶点和顶点之间的关系叫做边(edge)
有向图中,跟顶点相连接的条数叫做度(degree)
度分为入度(in-degree)和出度(out-degree)
带权图(weightd graph),每条边都有一个权重(weight)
图的存储方式
邻接矩阵存储方法
用一个二维数组来存储元素,也就是邻接矩阵(Adjacency Matrix)
可以存储无向图,也可以存储有向图
如果存储的是稀疏图,则会很浪费空间
邻接矩阵存储方式简单,直接,因为基于数组,获取两个顶点关系时就非常高效
用邻接矩阵存储图的好处是方便计算,用邻接矩阵方式存储图,可以将很多图的运算转换成矩阵之间的运算
比如求最短路劲问题时的 Floyd-Warshall算法,是利用邻接矩阵循环相乘若干次得到结果
邻接表存储方法
针对邻接矩阵比较浪费空间的问题,另一种图的存储方式是 邻接表(Adjacency List)
可以将邻接表中的链表改成平衡二叉树,如红黑树,跳表,动态有序数组等
微博的存储关系,假设需要支持下面几个操作
- 判断用户A是否关注了用户B
- 判断用户A是否是用户B的粉丝
- 用户A关注用户B
- 用户A取消关注用户B
- 根据用户名的首字母排序,分页获取用户的粉丝列表
- 根据用户名称的首字母排序,分页获取用户的关注列表
这里使用两个邻接表
一个是普通的邻接表,用来存储每个用户的关注情况
还有一个逆邻接表,用来存储用户的被关注度,即粉丝情况
邻接表,逆邻接表中的链接关系,可以改成红黑树,跳表,动态有序数组,散列表等
因为微博的用户很多,可以将邻接表,逆邻接表根据规则做分片,分配到不同机器上
图的遍历
包括深度优先搜索
广度优先搜索
public class Graph { // 无向图
private int v; // 顶点的个数
private LinkedList<Integer> adj[]; // 邻接表
public Graph(int v) {
this.v = v;
adj = new LinkedList[v];
for (int i=0; i<v; ++i) {
adj[i] = new LinkedList<>();
}
}
public void addEdge(int s, int t) { // 无向图一条边存两次
adj[s].add(t);
adj[t].add(s);
}
}
广度优先搜索(BFS)
广度优先搜索(Breadth-First-Search),简称BFS
一种地毯式的层层推进搜索策略
广度优先搜索的代码实现
public void bfs(int s, int t) {
if (s == t) return;
boolean[] visited = new boolean[v];
visited[s]=true;
Queue<Integer> queue = new LinkedList<>();
queue.add(s);
int[] prev = new int[v];
for (int i = 0; i < v; ++i) {
prev[i] = -1;
}
while (queue.size() != 0) {
int w = queue.poll();
for (int i = 0; i < adj[w].size(); ++i) {
int q = adj[w].get(i);
if (!visited[q]) {
prev[q] = w;
if (q == t) {
print(prev, s, t);
return;
}
visited[q] = true;
queue.add(q);
}
}
}
}
private void print(int[] prev, int s, int t) { // 递归打印 s->t 的路径
if (prev[t] != -1 && t != s) {
print(prev, s, prev[t]);
}
System.out.print(t + " ");
}
上面的代码包含了三个辅助变量 visited,queue,prev
- visited,是用来记录已经被访问的顶点,用来避免重复访问
- queue,是一个队列,用来存储已经被访问,但相连接的顶点还没有被访问的顶点,广度优先搜索是逐层访问的,只有把第k层的顶点都访问完之后,才能访问第k+1层的顶点
- pre,用来记录搜索路径,当从顶点s开始,广度优先搜索到顶点t后,prev数组中存储的是搜索的路径,这个路径是反向存储的,比如通过顶点2的邻接表访问到顶点3,那么prev[3]就等于2
下面是广度优先搜索的执行过程
广度优先搜索的时间复杂度是O(V+E),其中V是顶点个数,E是边的个数
因为E肯定要远大于V-1,所以广度优先搜索的时间复杂度可以简写为O(E)
空间消耗主要在几个辅助遍历visited数组,queue队列,prev数组上,他们不会超过顶点个数,
所以空间复杂度是O(V)
深度优先搜索(DFS)
深度优先搜索(Depth-First-Search),简称DFS,最直观的列子就是走迷宫
下图是深度优先搜索的遍历方式
深度优先搜索的代码实现
boolean found = false; // 全局变量或者类成员变量
public void dfs(int s, int t) {
found = false;
boolean[] visited = new boolean[v];
int[] prev = new int[v];
for (int i = 0; i < v; ++i) {
prev[i] = -1;
}
recurDfs(s, t, visited, prev);
print(prev, s, t);
}
private void recurDfs(int w, int t, boolean[] visited, int[] prev) {
if (found == true) return;
visited[w] = true;
if (w == t) {
found = true;
return;
}
for (int i = 0; i < adj[w].size(); ++i) {
int q = adj[w].get(i);
if (!visited[q]) {
prev[q] = w;
recurDfs(q, t, visited, prev);
}
}
}
从图中可以看到,每条边最多会被访问两次,一次是遍历,一次是回退
所以深度优先搜索的算法时间复杂度是O(E),E是边的个数
内存消耗主要是在visited,prev和递归调用栈,两个数组大小跟顶点V个数成正比,
递归调用栈最大深度不会超过顶点个数,所以空间复杂度是O(V)