基于
会话
嵌入
应用程序
使用
预测
余泽鹏
基于会话嵌入的应用程序使用预测*余泽鹏1,安业腾2,张 烁2,杨自兴2,陆继翔3,曹蓉蓉3,陈轶洲1,李文中1,陆桑璐1(1.南京大学计算机软件新技术国家重点实验室,江苏 南京 2 1 0 0 4 6;2.国家电网有限公司客户服务中心,天津 3 0 0 3 0 9;3.南瑞集团有限公司智能电网保护和运行控制国家重点实验室,江苏 南京 2 1 1 1 0 6)摘 要:如今,智能手机用户在他们的手机上安装了几十个甚至上百个应用程序。预测应用程序的使用不仅有助于手机系统加快应用程序的启动,也能够减少用户寻找所需应用程序的时间。关注一种新颖的基于会话的应用程序的使用预测问题,即预测一段时间内将使用的一系列应用程序,提出了一个基于会话的嵌入框架(简称S EM)。针对应用程序会话的可变长性与会话语义上的异构性,提出了一种会话嵌入方法,形成了统一的特征表示,缓解了用户稀疏性的问题,得到了会话的向量表示;基于会话的嵌入表示,训练了一个2层的循环神经网络模型,用于应用程序使用会话的预测。基于真实数据集的大量实验结果表明,该框架优于传统的应用推荐方法。关键词:应用使用预测;会话嵌入;循环神经网络;门控循环单元中图分类号:T P 3 9 1.4 1 文献标志码:Ad o i:1 0.3 9 6 9/j.i s s n.1 0 0 7-1 3 0 X.2 0 2 3.0 6.0 1 5A p p u s a g e p r e d i c t i o n w i t h s e s s i o n-b a s e d e m b e d d i n gYU Z e-p e n g1,AN Y e-t e n g2,Z HANG S h u o2,YANG Z i-x i n g2,L U J i-x i a n g3,C AO R o n g-r o n g3,CHE N Y i-z h o u1,L I W e n-z h o n g1,L U S a n g-l u1(1.S t a t e K e y L a b o r a t o r y f o r N o v e l S o f t w a r e T e c h n o l o g y,N a n j i n g U n i v e r s i t y,N a n j i n g 2 1 0 0 4 6;2.C u s t o m e r S e r v i c e C e n t e r o f S t a t e G r i d C o r p o r a t i o n o f C h i n a,T i a n j i n 3 0 0 3 0 9;3.S t a t e K e y L a b o r a t o r y o f S m a r t G r i d P r o t e c t i o n a n d A p e r a t i o n C o n t r o l o f NA R I G r o u p C o.,L t d.,N a n j i n g 2 1 1 1 0 6,C h i n a)A b s t r a c t:N o w a d a y s,s m a r t p h o n e u s e r s i n s t a l l d o z e n s o r e v e n h u n d r e d s o f A p p s o n t h e i r p h o n e s.P r e d i c t i n g A p p u s a g e n o t o n l y h e l p s t h e m o b i l e p h o n e s y s t e m t o s p e e d u p A p p l a u n c h i n g b u t a l s o r e d u c e t h e t i m e f o r u s e r s t o s e a r c h A p p.T h i s p a p e r f o c u s e s o n a n o v e l s e s s i o n-b a s e d A p p u s a g e p r e d i c t i o n p r o b l e m t h a t t e n d s t o p r e d i c t a s e q u e n c e o f A p p s t o b e u s e d i n a p e r i o d.A s e s s i o n-b a s e d e m b e d d i n g f r a m e w o r k c a l l e d S EM i s p r o p o s e d t o s o l v e t h e p r o b l e m.A i m i n g a t t h e s i d e l e n g t h o f a p p l i c a t i o n s e s s i o n a n d t h e h e t e r o g e n e i t y o f s e s s i o n s e m a n t i c s,a s e s s i o n e m b e d d i n g m e t h o d i s p r o p o s e d t o f o r m u n i f o r m f e a t u r e r e p r e s e n t a t i o n,w h i c h a l l e v i a t e s t h e p r o b l e m o f u s e r s p a r s i t y a n d o b t a i n s t h e v e c t o r r e p r e s e n t a-t i o n o f s e s s i o n s.B a s e d o n s e s s i o n e m b e d d i n g,a t w o-l a y e r G RU-b a s e d r e c u r s i v e n e u r a l n e t w o r k m o d e l i s t r a i n e d f o r A p p u s a g e s e s s i o n p r e d i c t i o n.E x t e n s i v e e x p e r i m e n t s b a s e d o n r e a l d a t a s e t s s h o w t h a t t h e p r o p o s e d f r a m e w o r k o u t p e r f o r m s c o n v e n t i o n a l A p p r e c o mm e n d a t i o n a p p r o a c h e s.K e y w o r d s:A p p u s a g e p r e d i c t i o n;s e s s i o n-b a s e d e m b e d d i n g;r e c u r r e n t n e u r a l n e t w o r k;g a t e d r e c u r-r e n t u n i t*收稿日期:2 0 2 1-1 1-0 9;修回日期:2 0 2 2-0 1-0 8基金项目:国家电网有限公司总部管理科技项目(5 7 0 0-2 0 2 1 5 3 1 7 2 A-0-0-0 0);智能电网保护和运行控制国家重点实验室开放课题通信作者:安业腾(a y t f l y s i n a.c o m)通信地址:3 0 0 3 0 9 天津市东丽区智景东道国家电网有限公司客户服务中心A d d r e s s:C u s t o m e r S e r v i c e C e n t e r o f S t a t e G r i d C o r p o r a t i o n o f C h i n a,Z h i j i n g E a s t R o a d,D o n g l i D i s t r i c t,T i a n j i n 3 0 0 3 0 9,P.R.C h i n a C N 4 3-1 2 5 8/T PI S S N 1 0 0 7-1 3 0 X 计算机工程与科学C o m p u t e r E n g i n e e r i n g&S c i e n c e第4 5卷第6期2 0 2 3年6月 V o l.4 5,N o.6,J u n.2 0 2 3 文章编号:1 0 0 7-1 3 0 X(2 0 2 3)0 6-1 0 7 9-0 81 引言如今,智能手机已经成为人们生活中不可缺少的一部分。一份2 0 1 9年的报告显示,谷歌P l a y上可下载的应用程序A p p(A p p l i c a t i o n)数量为2 5 7万个,苹果应用程序商店上可下载的应用程序数量为1 8 4万个。大多数智能手机用户在他们的手机上安装了几十个甚至上百个应用程序。当智能手机用户想要使用一个特定的应用程序时,往往需要在手机上滑动屏幕,搜索该应用程序,这是不方便且耗时的。此外,即使有好的手机硬件配置,运行一个应用程序仍然需要几秒钟的时间。因此,预测应用程序的使用情况是至关重要的,这可以缩短搜索应用程序的时间,并通过预测来加速应用程序的启动。应用程序使用预测在过去的十年中得到了广泛的研究。C h u r c h等人1总结了智能手机使用学习的挑战,例如启动预测和应用程序推荐。很多研究人员提出使用上下文信息来应对这一挑战,正如V e r k a s a l o2所发现的,时间和位置是预测应用程序使用情况的2个重要的上下文信息。S h i n等人3针对个人用户采用了一种个性化的朴素贝叶斯模型,他们的研究均使用智能手机上的传感器数据作为上下文信息来改善预测结果。C h e n等人4将地点和时间作为上下文信息,同时还使用了属性信息。此外,还有各种算法和信息类型,被用于不同领域的预测和推荐。与传统的预测用户将使用的下一个应用程序的应用程序推荐工作不同,本文关注的是基于会话的应用程序使用预测问题,即预测用户在将来的一段时间内连续使用的一系列应用程序。本文提出了一个基于会话的嵌入框架S EM(S e s s i o n-b a s e d EM b e d d i n g),用于应用程序的使用会话预测。考虑到应用程序使用会话的长度是可变的,并且包含不同的异构语义和上下文信息,本文提出了一种特征嵌入学习方法来嵌入异构会话,形成了统一的特征表示;基于所嵌入的特征向量,提出了一个带有门控循环单元G RU(G a t e d R e c u r r e n t U n i t)模型的2层 循 环 神 经 网 络R NN(R e c u r r e n t N e u r a l N e t w o r k)来预测下一个会话。本文的主要工作总结如下:(1)本文关注的是一类新颖的基于会话的应用程序使用预测问题,即预测一段时间内将使用的一组应用程序。所提出的研究问题具有挑战性和广泛的实际意义。(2)针对应用程序会话的异构性,本文提出了一种基于会话的嵌入方法,形成了统一的特征表示,缓解了用户稀疏性问题,最终得到会话的向量表示。(3)在会话嵌入的基础上,本文训练了一个基于G RU的2层循环神经网络模型,用于应用程序使用会话的预测。(4)在2个真实的数据集上评估了所提出的模型,大量的实验表明了本文模型在预测A p p使用情况方面的有效性。2 相关工作本节简要总结了应用程序使用预测和使用嵌入技术获得特征表示的相关工作。2.1 应用程序使用预测之前的一些工作已经研究了预测智能手机应用程序使用的问题。S h i n等人3发现可以