用户画像建模
用户基本属性表
根据用户所填写的属性标签和推算出来的标签。用于了解用户的人口属性的基本情况和按不同属性维度统计。
作用:按人口属性营销、比如营销80后,对金牛座的优惠,生日营销。
主要数据来源:用户表、用户调查表、孕妇模型表、马甲模型表。
用户表:记录用户最基本的属性特性。
用户调查表:补充用户的其他基本信息。
用户所填写的基本信息:用户ID、用户名、密码、性别、手机号、邮箱、年龄、户籍省份、身份证编号、注册时间、收货地址等
用户所填信息计算得到的指标:
生日、星座、城市等级、手机前几位、手机运营商、邮件运营商
用户调查表得到:学历、收入、职业、婚姻、是否有小孩、是否有车有房、使用手机品牌。
根据算法得到:
身高、体重、性别模型、孩子性别概率、潜在汽车用户概率、是否孕妇、孩子年龄概率、手机品牌、更换手机频率、是否有小孩,是否有车,使用手机档次,疑似马甲标准、疑似马甲账号数、用户忠诚度、用户购物类型。
1、模型算法—性别模型
- 用户自己也填写了性别,但仍然要用算法算一次性别
性别 | 男女标志 | 判断策略 |
---|---|---|
用户性别 | 1男 0女 -1未识别 | 1、商品性别得分 2、用户购买上述商品计算用户性别等得分 3、最优算法训练阈值,根据阈值判断 |
孩子性别 | 0仅有男孩 1仅有女孩 2男女都有 3无法识别 | 1、选择男孩女孩商品 2、确定用户购买商品的男女性别比例 3、训练阈值,判断孩子性别,同用户性别类似 |
- 性别验证方法
随机抽样几千条数据让客服打电话确认。
与用户自己填的性别做对比,确认百分比。
2、模型算法—用户汽车模型
Tables | Are | Cool |
---|---|---|
用户是否有车 | 1有 0没有 -1未识别 | 根据用户购买汽车相关产品,判断是否有车 |
潜在汽车用户 | 1有 0没有 -1未识别 | 用户浏览或搜索汽车,用户数据判断 |
3、模型算法—用户忠诚度模型
- 忠诚度越高的用户越多,对网站的发展越有利
Tables | Are | Cool |
---|---|---|
用户忠诚度 | 1忠诚型用户 2偶尔型用户 3投资型用户 4游览型用户 -1未识别 | 总体规则是判断+聚类算法 1、游览用户型:只游览不购买的2、购买天数大于一定天数的为忠诚用户3、购买天数小于一定天数,大部分是有优惠才购买的4、其他类型根据购买天数,购买最后一次距今时间,购买金额进行聚类 |
4、模型算法—用户身高尺码模型
Tables | Are | Cool |
---|---|---|
男性身高尺码 | xxx-xxx身高段,-1未识别 | 用户购买服装鞋帽等用户判断 |
男性身材 | 1偏瘦、2标准、3偏胖4肥胖、-1未识别 | 用户购买服装鞋帽等用户判断 |
女性身高尺码 | xxx-xxx身高段,-1未识别 | 用户购买服装鞋帽等用户判断 |
女性身材 | 1偏瘦、2标准、3偏胖4肥胖、-1未识别 | 用户购买服装鞋帽等用户判断 |
5、模型算法—用户马甲标志模型
- 马甲是指一个用户注册多个账号
- 多次访问地址相同的用户账号是同一个人所有
- 同一台手机登陆多次的用户是同一个人所有
- 收货手机号相同的账号同一个人所有
6、模型算法—手机相关标签模型
- 对于手机营销参考意义比较大
- 使用手机品牌: 最常用手机直接得到
- 使用手机品牌档次:根据档次维表
- 使用多少种不同的手机:手机登陆情况
- 更换手机频率(月份):按时间段看手机登陆情况
客户消费订单表
根据客户消费的情况提取的客户标签,用于了解用户的消费总体情况,
最终的目的根据用户消费习惯与消费能力做营销。
主要数据来源:订单表、退货表、用户表、购物车表
1、订单表可以得到相关标签
- 第一次消费时间、
- 最近一次消费时间、
- 首单距今时间、
- 尾单距今时间——分析用户什么时候来购买商品以及多久没有购买了。
- 最小消费金额、
- 最大消费金额、
- 累计消费次数(不含退拒)、
- 累计消费金额(不含退拒)、
- 累计使用代金券金额、
- 累计使用代金券次数。—–分析用户总体消费情况。
- 客单价(含退拒)、
- 近60天客单价(含退拒)—–分析用户消费水平。
- 常用收货地址、
- 常用支付方式—-分析用户常用的消费属性,方便做定向营销。
2、退货表可以得到相关标签
- 近30天购买次数(不含退拒)、
- 近30天购买金额(不含退拒)
- 近30天购买次数(含退拒)、
- 近30天购买金额(含退拒)—-分析用户最近的消费能力。
- 退货商品数量、
- 退货商品金额、
- 拒收商品数量、
- 拒收商品金额、
- 最近一次退货时间—–分析用户拒收和退货习惯。
3、购物车表可以得到相关标签
- 最近30天购物车次数、
- 最近30天购物车商品件数、
- 最近30天购物车提交商品件数、
- 最近30天购物车放弃件数、
- 最近30天购物车成功率——分析用户购物车使用习惯
4、订单表和用户表可以得到相关标签
- 学校下单总数、
- 单位下单总数、
- 家里下单总数、
- 上午下单总数、
- 下午下单总数、
- 晚上下单总数—-分析用户购物时间与地点习惯。
客户购买类目表
根据客户购买类目的情况提取客户标签,用于了解类目的购买人群情况和针对某一类目的营销等。
主要数据来源:订单表、购物车表、类目维表
1、类目维表可以得到相关标签
- 一级分类ID、
- 一级分类名称、
- 二级分类ID、
- 二级分类名称、
- 三级分类ID、
- 三级分类名称—–分析用户都购买了哪些类目。
电商的三级类目:
京东商城:
淘宝:
2、订单表和类目维表可以得到相关标签:
- 近30天购买类目次数、
- 近30天购买类目金额、
- 近90天购买类目次数、
- 近90天购买类目金额、
- 近180天购买类目次数、
- 近180天购买类目金额、
- 累计购买类目次数、
- 累计购买类目金额—-分析用户最近都购买了哪些类目。
- 最近一次购买类目时间、
- 最后一次购买类目距今天数—-分析用户多久没有购买这个类目。
3、购物车表和类目维表可以得到相关标签
- 近30天购物车类目次数、
- 近30天购物车类目金额、
- 近90天购物车类目次数、
- 近90天购物车类目金额—-分析用户最近都挑中哪些类目。
用户访问信息表
根据客户访问的情况提取相关客户标签。
用于了解用户的访问总体情况,方便根据客户游览习惯做营销
主要数据来源:点击流日志行为表(PC/APP端)
点击流日志行为表可以得到相关标签
- 最近一次APP/PC端访问日期、
- 最近一次APP/PC端访问使用操作系统、
- 最近一次APP/PC端访问使用游览器、
- 最近一次访问IP地址、
- 最近一次访问城市、
-
最近一次访问的省份—–分析用户最近一次访问情况。
-
第一次APP/PC端访问日期、
- 第一次APP/PC端访问使用操作系统、
- 第一次APP/PC端访问使用游览器、
- 第一次访问IP地址、
- 第一次访问城市、
-
第一次访问的省份—–分析用户第一次访问情况。
-
近7天APP/PC端访问次数、
- 近30天APP/PC访问次数、
- 近60天APP/PC端访问次数、
- 近90天APP/PC端访问次数、
- 近180天APP/PC端访问次数、
-
近365天APP/PC端访问次数—-分析用户APP/PC端访问次数。
-
近30天PC/APP端访问天数、
- 近30天PC/APP端访问并购买次数、
- 近30天PC/APP端访问PV、
- 近30天PC/APP端访问平均PV、
- 近30天PC/APP端最常用的游览器、
- 近30天PC/APP端不同IP数、
-
近30天PC/APP端最常用IP—–分析用户访问详情。
-
近30天0-5点访问的次数、
- 近30天6-7点访问的次数、
- 近30天8-9点访问的次数、
- 近30天10-12点访问的次数、
- 近30天13-14点访问的次数、
- 近30天15-17点访问的次数、
- 近30天18-19点访问的次数、
- 近30天20-21点访问的次数、
- 近30天22-23点访问的次数—-分析用户喜欢在哪个时间上网访问。