图计算简介
- 图计算是专门针对图结构数据的处理
- 图结构数据能很好表达数据关联性->相关推荐、追根溯源等
-
传统图计算算法典型问题
- 常常表现出较差内存访问性
- 针对单个顶点的处理工作过少
- 计算过程中伴随着并行度改变
-
传统图计算问题的解决方案
- 为特定的图应用定制相应的分布式实现(通用性不佳)
- 基于现有的分布式计算平台进行图计算->MapReduce(粗粒度数据,性能不佳,对于解决复杂问题不太友好)
- 使用单机的图算法库(eg:BGL、LEAD、NetWorkX、JDSL、Standford GraphBase和FGL等)(对于大规模图计算问题存在局限性)
- 使用已有的并行图计算系统(eg:Parallel BGL、CGM Graph)(没有很好的实现容错)
-
图计算通用软件->基于BSP模型
- 基于遍历算法的、实时的图数据库(Neo4j、OrientDB、DEX、Infinite Graph)
- 以图顶点为中心的、基于消息传递批处理的并行引擎(GoldenOrb、Giraph、Pregel、Hama)
- BSP模型(Bulk Synchronous Parallel Computing Model=整体同步并行计算模型/大同步模型)