数据结构与算法--图相关

目录

图的遍历

广度优先搜索(BFS)

深度优先搜索(DFS)


图中元素叫做顶点(vertex),顶点和顶点之间的关系叫做边(edge)
有向图中,跟顶点相连接的条数叫做度(degree)
度分为入度(in-degree)和出度(out-degree)
带权图(weightd graph),每条边都有一个权重(weight)

 

图的存储方式
邻接矩阵存储方法
用一个二维数组来存储元素,也就是邻接矩阵(Adjacency Matrix)
可以存储无向图,也可以存储有向图

数据结构与算法--图相关

如果存储的是稀疏图,则会很浪费空间
邻接矩阵存储方式简单,直接,因为基于数组,获取两个顶点关系时就非常高效
用邻接矩阵存储图的好处是方便计算,用邻接矩阵方式存储图,可以将很多图的运算转换成矩阵之间的运算
比如求最短路劲问题时的 Floyd-Warshall算法,是利用邻接矩阵循环相乘若干次得到结果

邻接表存储方法
针对邻接矩阵比较浪费空间的问题,另一种图的存储方式是 邻接表(Adjacency List)

数据结构与算法--图相关

可以将邻接表中的链表改成平衡二叉树,如红黑树,跳表,动态有序数组等

微博的存储关系,假设需要支持下面几个操作

  • 判断用户A是否关注了用户B
  • 判断用户A是否是用户B的粉丝
  • 用户A关注用户B
  • 用户A取消关注用户B
  • 根据用户名的首字母排序,分页获取用户的粉丝列表
  • 根据用户名称的首字母排序,分页获取用户的关注列表

这里使用两个邻接表
一个是普通的邻接表,用来存储每个用户的关注情况
还有一个逆邻接表,用来存储用户的被关注度,即粉丝情况

数据结构与算法--图相关

邻接表,逆邻接表中的链接关系,可以改成红黑树,跳表,动态有序数组,散列表等
因为微博的用户很多,可以将邻接表,逆邻接表根据规则做分片,分配到不同机器上

数据结构与算法--图相关

 

图的遍历

包括深度优先搜索
广度优先搜索

public class Graph { // 无向图
  private int v; // 顶点的个数
  private LinkedList<Integer> adj[]; // 邻接表

  public Graph(int v) {
    this.v = v;
    adj = new LinkedList[v];
    for (int i=0; i<v; ++i) {
      adj[i] = new LinkedList<>();
    }
  }

  public void addEdge(int s, int t) { // 无向图一条边存两次
    adj[s].add(t);
    adj[t].add(s);
  }
}

 

广度优先搜索(BFS)

广度优先搜索(Breadth-First-Search),简称BFS
一种地毯式的层层推进搜索策略

数据结构与算法--图相关

广度优先搜索的代码实现

public void bfs(int s, int t) {
  if (s == t) return;
  boolean[] visited = new boolean[v];
  visited[s]=true;
  Queue<Integer> queue = new LinkedList<>();
  queue.add(s);
  int[] prev = new int[v];
  for (int i = 0; i < v; ++i) {
    prev[i] = -1;
  }
  while (queue.size() != 0) {
    int w = queue.poll();
   for (int i = 0; i < adj[w].size(); ++i) {
      int q = adj[w].get(i);
      if (!visited[q]) {
        prev[q] = w;
        if (q == t) {
          print(prev, s, t);
          return;
        }
        visited[q] = true;
        queue.add(q);
      }
    }
  }
}

private void print(int[] prev, int s, int t) { // 递归打印 s->t 的路径
  if (prev[t] != -1 && t != s) {
    print(prev, s, prev[t]);
  }
  System.out.print(t + " ");
}

上面的代码包含了三个辅助变量 visited,queue,prev

  • visited,是用来记录已经被访问的顶点,用来避免重复访问
  • queue,是一个队列,用来存储已经被访问,但相连接的顶点还没有被访问的顶点,广度优先搜索是逐层访问的,只有把第k层的顶点都访问完之后,才能访问第k+1层的顶点
  • pre,用来记录搜索路径,当从顶点s开始,广度优先搜索到顶点t后,prev数组中存储的是搜索的路径,这个路径是反向存储的,比如通过顶点2的邻接表访问到顶点3,那么prev[3]就等于2

下面是广度优先搜索的执行过程

数据结构与算法--图相关

广度优先搜索的时间复杂度是O(V+E),其中V是顶点个数,E是边的个数
因为E肯定要远大于V-1,所以广度优先搜索的时间复杂度可以简写为O(E)
空间消耗主要在几个辅助遍历visited数组,queue队列,prev数组上,他们不会超过顶点个数,
所以空间复杂度是O(V)

 

深度优先搜索(DFS)

深度优先搜索(Depth-First-Search),简称DFS,最直观的列子就是走迷宫
下图是深度优先搜索的遍历方式

数据结构与算法--图相关

深度优先搜索的代码实现

boolean found = false; // 全局变量或者类成员变量

public void dfs(int s, int t) {
  found = false;
  boolean[] visited = new boolean[v];
  int[] prev = new int[v];
  for (int i = 0; i < v; ++i) {
    prev[i] = -1;
  }
  recurDfs(s, t, visited, prev);
  print(prev, s, t);
}

private void recurDfs(int w, int t, boolean[] visited, int[] prev) {
  if (found == true) return;
  visited[w] = true;
  if (w == t) {
    found = true;
    return;
  }
  for (int i = 0; i < adj[w].size(); ++i) {
    int q = adj[w].get(i);
    if (!visited[q]) {
      prev[q] = w;
      recurDfs(q, t, visited, prev);
    }
  }
}

从图中可以看到,每条边最多会被访问两次,一次是遍历,一次是回退
所以深度优先搜索的算法时间复杂度是O(E),E是边的个数
内存消耗主要是在visited,prev和递归调用栈,两个数组大小跟顶点V个数成正比,
递归调用栈最大深度不会超过顶点个数,所以空间复杂度是O(V)