图计算简介

 

  1. 图计算是专门针对图结构数据的处理
  2. 图结构数据能很好表达数据关联性->相关推荐、追根溯源等
  3. 传统图计算算法典型问题
    1. 常常表现出较差内存访问性
    2. 针对单个顶点的处理工作过少
    3. 计算过程中伴随着并行度改变
  4. 传统图计算问题的解决方案
    1. 为特定的图应用定制相应的分布式实现(通用性不佳)
    2. 基于现有的分布式计算平台进行图计算->MapReduce(粗粒度数据,性能不佳,对于解决复杂问题不太友好)
    3. 使用单机的图算法库(egBGL、LEAD、NetWorkX、JDSL、Standford GraphBase和FGL等)(对于大规模图计算问题存在局限性)
    4. 使用已有的并行图计算系统(eg:Parallel BGL、CGM Graph)(没有很好的实现容错)
  5. 图计算通用软件->基于BSP模型
    1. 基于遍历算法的、实时的图数据库(Neo4j、OrientDB、DEX、Infinite Graph)
    2. 以图顶点为中心的、基于消息传递批处理的并行引擎(GoldenOrb、Giraph、Pregel、Hama)
  6. BSP模型(Bulk Synchronous Parallel Computing Model=整体同步并行计算模型/大同步模型)

图计算简介

 

 

图计算简介