面试题——数据仓库的输入输出是什么

面试题——数据仓库的输入输出是什么

你们的数仓的数仓的数据来源是哪些?数据的目的地又有哪些?

数据来源: 日志采集系统、业务系统数据库、爬虫系统、财务系统、OA系统等

  • 日志采集系统:采集用户在网站的停留时间,搜索的关键字以及喜好,数据存在file日志文件中,数据量可以很大
  • 业务系统数据库:比如电商网站的一些主要的业务数据,支付数据,订单数据等,存在mysql等数据库中,数据量有限
  • 爬虫系统:爬取的其他企业的一些商品信息数据

数据目的地:

报表系统(最基本的数据输出),用户画像,推荐系统,机器学习,风控系统等