基于大数据的运营商流失用户分析
- 首页 >> 其他基于大数据的运营商流失用户分析
一、项目背景
随着业务的快速发展、移动业务市场的竞争愈演愈烈。如何最大程度地挽留在网用户、吸取新客户,是电信企业最关注的问题之一。竞争对手的促销、公司资费软着陆措施的出台和政策法规
的不断变化,影响了客户消费心理和消费行为,导致客户的流失特征不断变化。对于电信运营商而言,流失会给电信企业带来市场占有率下降、营销成本增加、利润下降等一系列问题。在发
展用户每月增加的同时,如何挽留和争取更多的用户,是一项非常重要的工作。
随着大数据挖掘技术的不断发展和应用,移动运营商希望能借助数据挖掘技术识别哪些用户可能流失,什么时候会发生流失。而通过建立流失预测模型,分析用户的历史数据和当前数据,提
取辅助决策的关键性数据,并从中发现隐藏关系和模式,进而预测未来可能发生的行为,就可以帮助移动运营商实现这些要求。
二、原始数据
(1)主要数据:运营商用户的基础信息和使用行为信息。
(2)数据集说明:建模用户数据集user_info_m
(3)数据格式:原始文件为压缩包,解压后为CSV格式。
(4)字段说明:如下表1所示:
表1 数据描述
名称字段描述
MONTH_ID月份
USER_ID用户ID
INNET_MONTH在网时长
IS_AGREE是否合约有效用户
AGREE_EXP_DATE合约计划到期时间
CREDIT_LEVEL信用等级
VIP_LVLVIP等级
ACCT_FEE本月费用(元)
CALL_DURA通话时长(秒)
NO_ROAM_LOCAL_CALL_DURA本地通话时长(秒)
NO_ROAM_GN_LONG_CALL_DURA国内长途通话时长(秒)
GN_ROAM_CALL_DURA国内漫游通话时长(秒)
CDR_NUM通话次数(次)
NO_ROAM_CDR_NUM非漫游通话次数(次)
NO_ROAM_LOCAL_CDR_NUM本地通话次数(次)
NO_ROAM_GN_LONG_CDR_NUM国内长途通话次数(次)
GN_ROAM_CDR_NUM国内漫游通话次数(次)
P2P_SMS_CNT_UP短信发送数(条)
TOTAL_FLUX上网流量(MB)
LOCAL_FLUX本地非漫游上网流量(MB)
GN_ROAM_FLUX国内漫游上网流量(MB)
CALL_DAYS有通话天数
CALLING_DAYS有主叫天数
CALLED_DAYS有被叫天数
CALL_RING语音呼叫圈
CALLING_RING主叫呼叫圈
CALLED_RING被叫呼叫圈
CUST_SEX性别
CERT_AGE年龄
CONSTELLATION_DESC星座
MANU_NAME手机品牌名称
MODEL_NAME手机型号名称
OS_DESC操作系统描述
TERM_TYPE终端硬件类型(0=无法区分,4=4g、3=3g、2=2g)
IS_LOST用户在3月是否流失标记(1=是,0=否),1月和2月值为空
三、挖掘目标
(1)利用用户的短信、流量、通话、消费的使用情况以及客户基本信息的数据,采用数据挖掘技术对用户进行分群。
(2)分析不同群体用户的使用规律,识别各群体客户流失的重要特征。
(3)建立不同群体用户流失模型,结合结果为运营商提供差异化的意见和建议。