用户画像理解
一、用户画像几大模块
-
结合业务设定指标体系,从常用的用户属性、行为、消费、风险控制这4个维度设定指标体系。
-
用户画像的存储:标签相关数据的存储,包括Hive存储、MySQL存储、HBase存储和Elasticsearch存储。不同的存储方式适用于不同的场景和业务需要。
-
标签数据及相关脚本的开发是用户画像构建工作的重点:常见的统计类、规则类、挖掘类、流式计算类标签以及用户特征库等与用户相关的数据的开发,还进一步介绍了如何计算人群数据、打通数据到服务层通路的开发。通过GraphX图计算用户2度关系熟人的案例介绍了如何深度挖掘用户间的关联关系。
-
用户画像的应用场景,包括、用户特征分析、短信、邮件、站内信、Push消息的精准推送、客服针对用户的不同话术、针对高价值用户的极速退货退款等VIP服务应用、经营分析、精准营销、个性化推荐、应用方向,方便业务人员、产品经理、数据分析师更好地了解用户、触达用户。
二、数据架构
三、指标体系
建立的用户标签按标签类型可以分为统计类、规则类和机器学习挖掘类。从建立的标签维度来看,可以将其分为用户属性类、用户行为类、用户消费类和风险控制类等常见类型。
-
用户属性维度:用户属性是刻画用户的基础。常见用户属性指标包括:用户的年龄、性别、安装时间、注册状态、城市、省份、活跃登录地、历史购买状态、历史购买金额等。
-
行为属性维度:通过用户行为可以挖掘其偏好和特征。常见用户行为维度指标包括:用户订单相关行为、下单/访问行为、用户近30天行为类型指标、用户高频活跃时间段、用户购买品类、点击偏好、营销敏感度等相关行为。
-
消费属性维度:,可从用户浏览、加购、下单、收藏、搜索商品对应的品类入手,品类越细越精确,给用户推荐或营销商品的准确性越高。如图2-1所示,根据用户相关行为对应商品品类建设指标体系,本案例精确到商品三级品类。
-
风控属性维度:互联网企业的用户可能会遇到薅羊毛、恶意刷单、借贷欺诈等行为的用户,为了防止这类用户给平台带来损失和风险,互联网公司需要在风险控制维度构建起相关的指标体系,有效监控平台的不良用户。结合公司业务方向,例如可从账号风险、设备风险、借贷风险等维度入手构建风控维度标签体系。下面详细介绍一些常见的风险控制维度的标签示例,如表2-4所示。
-
社交属性维度:用于了解用户的家庭成员、社交关系、社交偏好、社交活跃程度等方面,通过这些信息可以更好地为用户提供个性化服务。表2-5是常用的社交属性维度标签示例。
四、 标签体系
·标签数据开发:用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提供接口服务等开发内容。
- 1.统计类标签
最常见标签:性别、年龄、城市等 - 2.规则类别标签
基于用户行为确定的规则产生:对平台“投资活跃用户”定义为“近30天投资大于2次” - 3.机器学习挖掘标签
对于用户属性或者行为进行预判断 - 4.流式计算类标签
面向人群
只有业务人员在日常工作中真正应用画像数据、画像产品,才能更好地推动画像标签的迭代优化,带来流量提升和营收增长,产出业绩价值。
五、用户画像应用
1.构建知识图谱
六、 金融领域的应用
1.银行
2.保险
参考文献
1.http://www.woshipm.com/pmd/226648.html
2.https://blog.****.net/weixin_42058609/article/details/104949741?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase