Hadoop学习笔记(一)

大数据概论

大数据(Big Data):指无法在一定时间范围内用常用的软件工具进行捕捉、管理和处理的数据的集合,是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
主要解决,海量数据的存储和海量数据的分析计算问题。
数据的存储单位:
bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
1 Byte = 8 bit ;1 K = 1024 Byte ;1 MB = 1024K
1 G = 1024 M ;1 T = 1024 GB ;1 P = 1024 T;

大数据的特点(4V)

   1、Volume(大量)
   2、Velocity(高速)
   3、Variety(多样)
   4、Value(低价值密度)

大数据的应用场景

     1、物流仓储
     2、零售
     3、风控系统
     4、用户画像
     5、人工智能....

大数据部门业务流程分析

Hadoop学习笔记(一)

大数据部门组织结构

Hadoop学习笔记(一)