价值一个亿的文章

数据中台必备的4个核心能力

  • 1.汇聚整合
  • 2.提纯加工
  • 3.服务可视化
  • 4.价值变现

数据中台VS业务中台

  • 业务中台是抽象业务流程的共性形成通用业务服务能力;
  • 数据中台则是抽象数据能力的共性形成通用数据服务能力;

数据中台建设方法论

  • 1种战略行动:把用数据中台驱动业务发展定位为企业级战略,全局谋划。
  • 2项保障条件:通过宣导统一组织间的数据认知,通过流程加速组织变革。
  • 3条目标准则:将数据的可见、可用、可运营3个核心准则始终贯穿于中台建设的全过程,保障建设在正确轨道上。
  • 4套建设内容:通过技术体系、数据体系、服务体系、运营体系建设保证中台建设的全面性和可持续性。
  • 5个关键步骤:通过理现状、立架构、建资产、用数据、做运营5个关键行动控制中台建设关键节点的质量。

:— 表1 数据中台建设目标评估表 —:

评分项 评分细则 评分细项描述 是/否
数据可见 指标管理的可视化 是否已经具备统一的指标管理能力,如指标的定义、修改、删除、生命周期管理等
元数据管理的可视化 是否已经具备针对元数据(如表、字段、分区、任务和标签名等)的可视化管理工具
数据资产类目的可视化 是否已经具备资产的可视化类目管理,可*增、删、改、查类目结构和类目下的标签名称或指标名称
数据源的可视化 是否具备对中台所涉及的所有业务数据源的可视化管理,可*增删
数据集成可视化 是否已经具备对业务数据到数据中台的批量或实时集成的可视化操作能力
数据ETL的可视化 是否具备对数据处理ETL的可视化开发、发布能力
数据建模的可视化 是否具备对数据建模的可视化管理能力,如批量生成指标,模型标准管理等
数据消费者的可视化 是否已经具备数据消费方统一的管理能力,包括权限、限速、并发、高可用等
算法建模的可视化 是否已经具备可拖拽式可视化和notebook建模方式
数据可用 数据内容的可用性 数据内容是否无歧义,符合业务所需的标准和质量要求
数据服务的可用性 是否已经具备数据服务的快速生成,可通过可视化的形式完成
数据任务的可用性 是否已经具备数据任务的运维能力,可自动重跑、补数据、空跑、自动调整任务资源配比等
数据指标化 是否已经把数据定义为指标,企业的日常经营分析依赖于各类的BI报表和可视化大屏
数据标签化 是否已经把数据定义为标签,标签来源于原始字段,统计类加工后的字段和算法类加工后的字段,企业的数据应用依赖于各类标签体系
资产(指标或标签)的易阅性 对于业务人员来说,资产和资产类目是否看得懂,易查找
数据可运营 数据质量化管理 是否已经可以通过任务失败次数,产出时间稳定性、标签覆盖率等构建数据质量量化模型,数据研发团队日常已根据分值进行优化管理
价值量化管理 是否已经可以通过任务资源占用情况、表生命周期和最近访问周期构建价值量化模型,数据研发团队日常已根据分值进行优化管理
数据运营角色 是否已经配有针对数据本身运营角色或岗位,该角色通过围绕核心KPI进行数据质量优化和价值挖掘

数据质量评估的标准

1)准确性:描述数据是否与其对应客观实体的特征一致。

2)完整性:描述数据是否存在缺失记录或缺失字段。

3)一致性:描述同一实体同一属性的值在不同的系统中是否一致。

4)有效性:描述数据是否满足用户定义的条件或在一定的取值范围内。

5)唯一性:描述数据是否存在重复记录。

6)及时性:描述数据的产生和供应是否及时。

7)稳定性:描述数据的波动是否稳定,是否在其有效范围内。

8)连续性:描述数据的编号是否连续。

9)合理性:描述两个字段之间逻辑关系是否合理。

价值一个亿的文章