基于大数据的运营商流失用户分析

- 首页 >> 其他

基于大数据的运营商流失用户分析

一、项目背景

随着业务的快速发展、移动业务市场的竞争愈演愈烈。如何最大程度地挽留在网用户、吸取新客户,是电信企业最关注的问题之一。竞争对手的促销、公司资费软着陆措施的出台和政策法规


的不断变化,影响了客户消费心理和消费行为,导致客户的流失特征不断变化。对于电信运营商而言,流失会给电信企业带来市场占有率下降、营销成本增加、利润下降等一系列问题。在发


展用户每月增加的同时,如何挽留和争取更多的用户,是一项非常重要的工作。

随着大数据挖掘技术的不断发展和应用,移动运营商希望能借助数据挖掘技术识别哪些用户可能流失,什么时候会发生流失。而通过建立流失预测模型,分析用户的历史数据和当前数据,提


取辅助决策的关键性数据,并从中发现隐藏关系和模式,进而预测未来可能发生的行为,就可以帮助移动运营商实现这些要求。

二、原始数据

(1)主要数据:运营商用户的基础信息和使用行为信息。

(2)数据集说明:建模用户数据集user_info_m

(3)数据格式:原始文件为压缩包,解压后为CSV格式。

(4)字段说明:如下表1所示:

表1  数据描述

名称字段描述

MONTH_ID月份

USER_ID用户ID

INNET_MONTH在网时长

IS_AGREE是否合约有效用户

AGREE_EXP_DATE合约计划到期时间

CREDIT_LEVEL信用等级

VIP_LVLVIP等级

ACCT_FEE本月费用(元)

CALL_DURA通话时长(秒)

NO_ROAM_LOCAL_CALL_DURA本地通话时长(秒)

NO_ROAM_GN_LONG_CALL_DURA国内长途通话时长(秒)

GN_ROAM_CALL_DURA国内漫游通话时长(秒)

CDR_NUM通话次数(次)

NO_ROAM_CDR_NUM非漫游通话次数(次)

NO_ROAM_LOCAL_CDR_NUM本地通话次数(次)

NO_ROAM_GN_LONG_CDR_NUM国内长途通话次数(次)

GN_ROAM_CDR_NUM国内漫游通话次数(次)

P2P_SMS_CNT_UP短信发送数(条)

TOTAL_FLUX上网流量(MB)

LOCAL_FLUX本地非漫游上网流量(MB)

GN_ROAM_FLUX国内漫游上网流量(MB)

CALL_DAYS有通话天数

CALLING_DAYS有主叫天数

CALLED_DAYS有被叫天数

CALL_RING语音呼叫圈

CALLING_RING主叫呼叫圈

CALLED_RING被叫呼叫圈

CUST_SEX性别

CERT_AGE年龄

CONSTELLATION_DESC星座

MANU_NAME手机品牌名称

MODEL_NAME手机型号名称

OS_DESC操作系统描述

TERM_TYPE终端硬件类型(0=无法区分,4=4g、3=3g、2=2g)

IS_LOST用户在3月是否流失标记(1=是,0=否),1月和2月值为空

三、挖掘目标

(1)利用用户的短信、流量、通话、消费的使用情况以及客户基本信息的数据,采用数据挖掘技术对用户进行分群。

(2)分析不同群体用户的使用规律,识别各群体客户流失的重要特征。

(3)建立不同群体用户流失模型,结合结果为运营商提供差异化的意见和建议。