数据结构与算法--图相关

图

图中元素叫做顶点(vertex)，顶点和顶点之间的关系叫做边(edge)
有向图中，跟顶点相连接的条数叫做度(degree)
度分为入度(in-degree)和出度(out-degree)
带权图(weightd graph)，每条边都有一个权重(weight)

图的存储方式
邻接矩阵存储方法
用一个二维数组来存储元素，也就是邻接矩阵(Adjacency Matrix)
可以存储无向图，也可以存储有向图

数据结构与算法--图相关

如果存储的是稀疏图，则会很浪费空间
邻接矩阵存储方式简单，直接，因为基于数组，获取两个顶点关系时就非常高效
用邻接矩阵存储图的好处是方便计算，用邻接矩阵方式存储图，可以将很多图的运算转换成矩阵之间的运算
比如求最短路劲问题时的 Floyd-Warshall算法，是利用邻接矩阵循环相乘若干次得到结果

邻接表存储方法
针对邻接矩阵比较浪费空间的问题，另一种图的存储方式是邻接表(Adjacency List)

数据结构与算法--图相关

可以将邻接表中的链表改成平衡二叉树，如红黑树，跳表，动态有序数组等

微博的存储关系，假设需要支持下面几个操作

判断用户A是否关注了用户B
判断用户A是否是用户B的粉丝
用户A关注用户B
用户A取消关注用户B
根据用户名的首字母排序，分页获取用户的粉丝列表
根据用户名称的首字母排序，分页获取用户的关注列表

这里使用两个邻接表
一个是普通的邻接表，用来存储每个用户的关注情况
还有一个逆邻接表，用来存储用户的被关注度，即粉丝情况

数据结构与算法--图相关

邻接表，逆邻接表中的链接关系，可以改成红黑树，跳表，动态有序数组，散列表等
因为微博的用户很多，可以将邻接表，逆邻接表根据规则做分片，分配到不同机器上

数据结构与算法--图相关

图的遍历

包括深度优先搜索
广度优先搜索

public class Graph { // 无向图
  private int v; // 顶点的个数
  private LinkedList<Integer> adj[]; // 邻接表

  public Graph(int v) {
    this.v = v;
    adj = new LinkedList[v];
    for (int i=0; i<v; ++i) {
      adj[i] = new LinkedList<>();
    }
  }

  public void addEdge(int s, int t) { // 无向图一条边存两次
    adj[s].add(t);
    adj[t].add(s);
  }
}

广度优先搜索(BFS)

广度优先搜索(Breadth-First-Search)，简称BFS
一种地毯式的层层推进搜索策略

数据结构与算法--图相关

广度优先搜索的代码实现

public void bfs(int s, int t) {
  if (s == t) return;
  boolean[] visited = new boolean[v];
  visited[s]=true;
  Queue<Integer> queue = new LinkedList<>();
  queue.add(s);
  int[] prev = new int[v];
  for (int i = 0; i < v; ++i) {
    prev[i] = -1;
  }
  while (queue.size() != 0) {
    int w = queue.poll();
   for (int i = 0; i < adj[w].size(); ++i) {
      int q = adj[w].get(i);
      if (!visited[q]) {
        prev[q] = w;
        if (q == t) {
          print(prev, s, t);
          return;
        }
        visited[q] = true;
        queue.add(q);
      }
    }
  }
}

private void print(int[] prev, int s, int t) { // 递归打印 s->t 的路径
  if (prev[t] != -1 && t != s) {
    print(prev, s, prev[t]);
  }
  System.out.print(t + " ");
}

上面的代码包含了三个辅助变量 visited，queue，prev

visited，是用来记录已经被访问的顶点，用来避免重复访问
queue，是一个队列，用来存储已经被访问，但相连接的顶点还没有被访问的顶点，广度优先搜索是逐层访问的，只有把第k层的顶点都访问完之后，才能访问第k+1层的顶点
pre，用来记录搜索路径，当从顶点s开始，广度优先搜索到顶点t后，prev数组中存储的是搜索的路径，这个路径是反向存储的，比如通过顶点2的邻接表访问到顶点3，那么prev[3]就等于2

下面是广度优先搜索的执行过程

数据结构与算法--图相关

广度优先搜索的时间复杂度是O(V+E)，其中V是顶点个数，E是边的个数
因为E肯定要远大于V-1，所以广度优先搜索的时间复杂度可以简写为O(E)
空间消耗主要在几个辅助遍历visited数组，queue队列，prev数组上，他们不会超过顶点个数，
所以空间复杂度是O(V)

深度优先搜索(DFS)

深度优先搜索(Depth-First-Search)，简称DFS，最直观的列子就是走迷宫
下图是深度优先搜索的遍历方式

数据结构与算法--图相关

深度优先搜索的代码实现

boolean found = false; // 全局变量或者类成员变量

public void dfs(int s, int t) {
  found = false;
  boolean[] visited = new boolean[v];
  int[] prev = new int[v];
  for (int i = 0; i < v; ++i) {
    prev[i] = -1;
  }
  recurDfs(s, t, visited, prev);
  print(prev, s, t);
}

private void recurDfs(int w, int t, boolean[] visited, int[] prev) {
  if (found == true) return;
  visited[w] = true;
  if (w == t) {
    found = true;
    return;
  }
  for (int i = 0; i < adj[w].size(); ++i) {
    int q = adj[w].get(i);
    if (!visited[q]) {
      prev[q] = w;
      recurDfs(q, t, visited, prev);
    }
  }
}

从图中可以看到，每条边最多会被访问两次，一次是遍历，一次是回退
所以深度优先搜索的算法时间复杂度是O(E)，E是边的个数
内存消耗主要是在visited，prev和递归调用栈，两个数组大小跟顶点V个数成正比，
递归调用栈最大深度不会超过顶点个数，所以空间复杂度是O(V)

数据结构与算法--图相关

图

图的遍历

广度优先搜索(BFS)

深度优先搜索(DFS)

相关推荐