信息通信基于大数据技术的高校用户识别方法研究郭向红,魏国华,包志刚(中国移动通信集团内蒙古有限公司,内蒙古呼和浩特010010)摘要:文章提出了一种新的高校用户的识别方法,在指定的高校基站范围内,通过分析客户的交往圈、通话行为、流量使用情况、活跃时间、常驻活动位置等信息,依据交往圈交往程度及位置驻留时长等维度,构建校园用户识别模型,进一步提升对校园用户的识别能力,为公司对校园市场的精确营销及运营分析提供有力支撑。关键词:大数据;交往圈;校园市场中图分类号:TP3092023年第05期(总第245期)文献标识码:B文章编号:2096-9759(2023)05-0157-031引言校园市场作为年轻人市场的核心组成部分,一直是电信运营商特别关注的焦点市场。互联网时代下,学生的消费行为已发生了巨大变化,现有校园用户识别模型的识别能力已不能有效提供运营支撑。为了更好地支撑公司运营,强筑大数据支撑能力,充分发挥大数据平台数据资源优势,不断提升精准运营能力,对“校园用户识别模型”进行了重点优化,通过提升模型基站覆盖率,提高数据识别准确率,为分公司精准运营提供有力保障。本文提出了一种新的高校用户的识别方法,在指定的高校基站范围内,通过分析客户的交往圈、通话行为、流量使用情况、活跃时间、常驻活动位置等信息,依据交往圈交往程度及位置驻留时长等维度,构建校园用户识别模型。在校园用户识别能力建设的基础上,进一步统计出省内校园数量、各校园中电信运营商的校园用户的分布情况及省内省外用户的占比,从而为后期的运营分析提供有力支撑。2模型历史方案及缺陷分析校园用户的运营由来已久,早期的校园用户识别模型主要基于本省校园区域及校园区域内用户的通信及交往圈特征,建立了分类模型,提炼训练结果,最终形成规则进行模型落地,历史模型的构建规则如下。2.1校园基站信息采集主要依靠各地市进行手工维护,即由各地市将区域内所属校园基站数据通过手工收集,并不定期的手工录入到大数据平台中,大数据平台对录入数据按月进行汇总整理,剔除重复数据及失效数据,保留有效数据,为下一步模型建设做准备。2.2校园区域下全量用户圈定(1)移动校园区域用户:当月校园基站下通话的所有非漫游用户;(2)友商校园区域用户:当月与我网校园基站下通信用户产生通信的友商用户。2.3月模型下校园用户识别规则(1)我网校园用户识别①语音通信天数大于5天以上、校园通信占比大于30%以上;②流量通信天数大于5天以上、校园流量占比...