会员中心
用户名:
密 码:
 
  忘记密码
通信管理
移动互联网流量经营业务模型研究与应用
文章来源:本站原创  发布时间:2014-10-31  浏览次数:1095
作者:别小妹
(中国移动通信集团辽宁有限公司 信息技术中心 110179)
摘要:移动互联网时代的今天,流量经营对于运营商的重要性日益突出, 移动互联网应用推荐做为流量经营中很重要的一个组成部分,本文研究设计了移动互联网应用推荐模型,并基于现有系统,结合大数据、数据挖掘技术和神经网络技术,构建了一个移动互联网应用推荐系统,并结合实际工作给出了应用案例。
关键词:移动互联网 流量经营 神经网络 大数据 Hadoop
1 研究背景
      2013年移动互联网呈现井喷式的发展,国内移动互联网用户规模和流量都呈现爆炸式的增长。截至2013年底,国内移动互联网用户模达到5亿人,比上年增加8009万人;移动互联网流量达到132138.1万GB,同比增长71.3%,月户均移动互联网接入流量达到139.4M,同比增长42%。移动互联网时代已经到来。
      然而,随着移动互联网的发展及传统互联网运营商的业务拓展,运营商面临的“被管道化”威胁更为严峻,运营商正逐步趋向被产业链边缘化的地步;同时,由于大带宽视频类、P2P类业务流量的日益增加,运营商网络的扩容压力也越来越大,带宽和收入之间存在的剪刀差日益扩大。向流量要效益、向流量要前途已经成为了各大运营商战略思维的重点,运营商需要通过流量经营来提升流量价值,以增加收入和优化成本。
      那么,如何在做好流量规模的同时提升流量质量和价值,做到市场规模与价值的同步增长呢?流量经营时代,表面上用户消费的是流量,实质上消费的是各种各样的业务和应用。运营商必须充分利用智能管道的优势,发挥产品服务、营销模式、客户管理及产业协作模式方面的创新,充分发挥自身管道控制的优势的同时调动产业链资源,在提升流量规摸的同时促进流量价值的提升。
      本文通过研究移动互联网用户的行为和交往圈,提取出移动互联网应用推荐的几个关键因素,采用神经网络算法对用户进行综合评估,以此设计了面向流量经营的移动互联网应用推荐模型,并结合大数据和数据挖掘技术,基于现有的数据网管、计费、经营分析等系统,构建了一个移动互联网应用推荐系统。
2移动互联网应用推荐模型的研究
2.1移动互联网流量经营
      流量经营是指在智能管道(物理网络)与综合平台(商业网络)的依托下,以扩大流量规模、提升流量层次、丰富流量内涵为经营方向,以释放流量价值为目的的一系列理念、策略和行动的集合。流量经营绝不是“卖流量”,规模只是流量经营的基础,关键在于如何将流量转化为价值。面临移动互联网流量激增导致流量与收益剪刀差的挑战、“哑管道化”的威胁,国内外电信运营商纷纷提出了流量经营和智能管道战略,以期跳出“增量不增收”的怪圈。而无论“流量经营”还是“智能管道”,其目的都是为了实现流量价值的提升。其中投入产出比较高的方法就是针对性的进行移动互联网应用推荐。
      移动互联网受限于移动终端的屏幕尺寸以及耗电,其业务形态和内容与传统互联网存在区别。运营商要研究移动用户使用互联网的习惯,以及在移动状态下对互联网业务的需求,基于手机移动性、位置性等特点,分析用户行为,深度细分客户群,准确把握住客户的行为模式和需求,根据这些行为模式量身打造应用,满足客户的各种需求,开展差异化营销,提升流量价值。
2.2移动互联网应用推荐模型构造
2.2.1影响因素分析
      移动互联网的流量经营,要整合分析资源,通过分析用户基本信息、行为习惯、上网偏好、交往圈等多方面信息,将用户与应用形成对应关系,我们将从四个方面分析一个用户对某些应用的接纳程度。
第一,通过分析DPI数据获得用户上网行为,通过分析得出用户的上网偏好;
第二,从用户基本信息中获得用户的某些固有属性,如ARPU值、性别、年龄等,以此确定用户的消费水平以及其所属用户群的消费偏好;
第三,通过话单分析用户的交往圈,以反映用户的潜在需求,每个人都会受到周围人的影响,同时这种影响与关系强弱程度正相关。
第四,通过分析用户对已有的应用使用程度,得出用户对这类应用的认可程度和需求程度。
      我们将以上四种数据结合起来,就将用户与应用之间形成了一种映射关键,如图1所示。
      影响应用推荐的3个内因只涉及用户本人,通过关联分析、聚类分群等数据挖掘算法即可得到;而用户交往圈数据涉及到用户及其交往人群,而且随用户与其交往者交往的密切程度不同,用户对其使用应用的反应程度亦不同,下面将针对用户交往圈数据进行建模分析。
2.2.2用户交往圈数据模型设计
      用户之间的影响伴随着亲密程度增强而增大,用户交往圈信息可从通话详单数据中获得,进而通过挖掘得到用户关系亲密程度。用户关系亲密程度受以下几个方面影响:
(1)联系数量影响:联系较多的用户具有更亲密的程度。亲密程度与联系的数量呈非线性关系,随着联系数量的增长,亲密程度的增长速度减缓,亲密程度的函数一阶导数呈下降趋势,符合对数函数的特点;
(2)联系间隔影响:密集的联系体现出用户之间有较高的亲密程度。我们选择窗口法[1,2,3,4]对数据进行平滑。以7天为一个周期,计算7天内用户之间联系的总次数;
(3)联系时间段影响:用户之间的联系时间段也体现出了用户之间的亲密程度。通常,白天工作时间段发生的联系更多的体现出了工作关系等亲密程度较弱的关系,而发生在休息时间或夜间的联系体现出了亲密程度较为密切的个人关系;
(4)联系时间的影响:用户之间联系的时间远近体现出了用户之间的亲密程度,对用户当前影响也不同,最近的联系比久远时间的联系更为亲密。
基于上述分析,我们在计算用户亲密程度的时候要考虑次数、间隔、通话时间段、通话时间四个因素。具体算法如下:
(1)取最近6个月内的通话详单,按照7天一共周期对数据进行窗口划分;
(2)对每个窗口进行编号,按照离当前的时间距离从1到N逐渐增大,并将每个窗口赋以权值wi:
(1)
(3)对每个窗口内的数据进行归一化;
(4)设某个窗口归一化的数据为n,则该窗口的紧密度为f:
(2)
(5)所有窗口亲密度为f:
(3)
      我们刻画出了用户之间的亲密程度,但是用户之间的关系是非常复杂的,一个人不仅对别人有影响,亦会受到别人的影响,这样就形成了一张大网。我们使用pagerank算法[5,6,7,8]计算出交往圈中的其他人对这个用户是否选择此产品影响的大小,计算公式如下:
(4)
      其中,为间接影响里的大小,是常数,为这个用户和每个用户之间的紧密程度。得出的即为某个用户由于间接影响而产生的对这个产品的倾向。
2.2.3数据融合评估
      将用户上网信息、用户基本信息、用户同类应用情况、用户受影响程度几类数据分别进行挖掘计算之后,要将数据进行融合评估,得出最终结果,步骤如下:
(1)建立用户宽表;
(2)采用神经网络算法对用户进行综合评估,首先选取样本数据,正样本数据为推送应用成功的用户,负样本为失败的用户。
(3)将用户的上述信息提取出,对这些数据使用归一化处理[9,10,11]。
(4)选取BP神经网络算法[12,13,14,15],对上述数据进行训练,得到神经网络分类器。当要评估某个用户是否容易接受所要推荐的应用时,将这个用户的上述信息输入到这个分类器当中进行评估。
      至此,我们得到了用户应用推荐系统的模型。
3 移动互联网应用推荐系统设计与实现
3.1系统功能架构
      移动互联网应用推荐系统是以数据网管、经营分析系统、DPI系统等系统采集的数据为基础,经过数据采集、抽取、清洗、转换、整合等步骤,建立数据仓库,并针对不同分析维度,采取对应的分析模型,通过数据挖掘和神经网络算法,输出最终结论来指导流量经营中的移动互联网应用推荐业务。系统功能架构图如图2所示。
      数据源:数据网管、经营分析系统、DPI系统;
      数据处理层:大数据量和传统RDBMS两种方式并存,大数据量基于Hadoop平台来处理DPI系统、话单类的数据,存储方式有HBase和RDBMS来存放;
      数据分析层:对数据进行归一化汇合冗余存放,建模分析;
      应用层:前台页面。
3.2系统技术架构
      移动互联网应用推荐系统采用B/S模式,分层处理。系统技术架构图如图3所示。
      其中,数据处理技术涉及到:Hadoop平台的大数据量处理机制结合传统的SQL应用程序处理机制。前者Hadoop的处理对象是用户级、信令业务等超大数据,后者SQL应用程序是处理传统普通数据。
      数据存储二大类HBase和RDBMS数据库。HBase不同于一般的RDBMS数据库,它是一个适合于非结构化数据存储的数据库,以其读写大数据内容可保证效率。RDBMS数据库来存储数据量小的关联性较强的像资源和高度汇总后的数据。
      系统中用到的第三方工具主要是调度工具SSIS、多维报表工具SSRS及Hadoop平台(开源)。
3.3 移动互联网应用推荐系统应用案例
      为了验证模型成功率和系统可用性,我们选取活跃移动互联网用户进行推送试验。
      首先我们选取有上网记录的用户,然后过滤用户状态。根据业务人员给出的规则,我们每款应用选取100000名用户分三次进行推荐,推送成功率结果如表1所示。
      然后,我们使用移动互联网应用推荐系统对用户进行评估和分析,每款应用选取100000名用户同样分三次进行推送,推送成功率结果如表2所示。
      我们搜集三次推荐结果的用户数据,选取成功用户20000条做为正样本,失败用户20000条做为负样本,对模型重新训练,然后再次进行推送,成功率结果如表3所示。
      实验结果表明,经系统推送的业务成功率比随机推送有大幅度提高。且随着训练次数的增加,成功率稳中有升。
4 总结
      本文以移动互联网的流量经营为研究背景,选取其中的移动互联网应用推荐为着眼点,通过研究用户行为和交往圈,提取出移动互联网应用推荐的几个关键因素,以此设计了分析模型,同时结合大数据、数据挖掘和神经网络技术,基于现有的数据网管、经营分析、DPI等系统,构建了一个移动互联网应用推荐系统,并结合市场给出了1个应用案例,验证了移动互联网应用推荐模型在流量经营工作中的实施效果。该模型通过用户个人行为结合用户交往圈来对用户进行评估,对用户的需求进行了深度挖掘,具有较高的实际应用价值,不仅可以提高推荐的成功率,并且提高了用户的感知,增加了客户粘性,提高客户的忠诚度。
      在今后的工作中,我们将继续深入进行流量经营分析,丰富和完善流量经营业务模型,以期更好地支撑流量经营决策和多样化、个性化的流量经营业务需求。
参考文献:
[1] Kernighan B W,Lin S.An efficient heuristic procedure for portioning graphs[J].Bell System Technical Journal,1970,49:291—307.
[2] Fiedler M.Algebraic connectivity of graphs[J].Czechoslovak Mathematical Journal,1973,23(98):298—305.
[3] Pothen A,Simon n,Liou K P.Partitioning sparse matrices with eigenvectors of graphs[J].SIAM Journal on Matrix hnalysiS and Applications.1990,11(3):430—452.
[4] Pons P and Latapy M.Computing Communities in Large Networks Using Random Walks[J]. Computer and Information Sc iences.2005,284—293.
[5] Pons P and Latapy M.Computing Communities in Large Networks Using Random Walks[J3. Computer and Information Sc iences.2005,284—293.
[6] Palla G,Derenyi I,Farkas I et a1.Uncovering the Overlapping Community Structure of Complex Networks in Nature and Society[J].Nature,2005 435(7043):814-818.
[7] Palla G,Farkas I,Pollner P,Derenyi I et a1.Directed network modules[J].Phys.New. J,2007,186.
[8] Tyler J,Wilkinson D,Huberman B.Email as spectroscopy:Automated discovery of community structure within organizations[C].International Conference on Communities and Techn0109ies,2003,81—96.
[9] Radicchi F,Castellano C,Cecconi F et a1.Defining and identifying communities in.networks[J].Eur.Phys。J.B,2004,101:2658—2663.
[10] 313Wu F,Huberman B A.Find communities in linear time:A physics approach[J].Euro.Phys. J B,2003,38:331—338.
[11] Rosvall M’Bergstrom C T.An information—theoretic framework for resolving community structure in complex networks[J].PNAS,2007,104(18):7327-7331.
[12] 343Newman M E J,Girvan M.Finding and evaluating community structure in networks[J]. Physical Review E,2004,69(2):026113.
[13] Clauset A,Newman M E J,Moore C.Finding community structure in very large networks[J]. Phys.Rev.E,2004,70:0661 11.
[14] Duch J,Arenas A.Community detection in complex networks using extreme optimization[J]. Physical Revi ew E,2005,72:027104.
[15] Guimer6 R and Amaral L A N,Funct ional cartography of compl ex metabol ic networks[J]. Nature,2005,433:895-900.
网站首页 关于我们免责声明联系我们
版权所有:辽宁省通信学会  备案号:辽ICP备11005629
联系电话:024-22517766  地址:沈阳市沈河区北站路72号


网站建设:恒昊互联网络