欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
博士论文
当前位置:首页 > 博士论文
一种基于用户评论自动分析的APP维护和演化方法_肖建茂
来源:一起赢论文网     日期:2021-03-13     浏览数:2554     【 字体:

 第4 卷第1 2 0 2 0 年1 1 月计算机学报CH I N ESEJ O URN A LOFCOMP U TERSVo i. 4 3No. 1 1Nov.2 0 2 0一种基于用户评论自动分析的AP P 维护和演化方法肖建茂陈世展冯志勇刘朋立薛霄( 天津市认知计算与应用重点实验室天津3 0 0 3 5 0 )( 天津大学智能与计算学部天津3 0 0 3 5 0 )摘要应用程序分发平台( 如Go og le P la y Sto r e 或A pp le Ap pSt o re ) 允许用户以评分或者评论等形式向下载的应用程序提交反馈. 这些反馈信息可以直接或者间接地反映用户意图, 及时准确地挖掘用户意图可以极大地帮助移动开发人员持续维护和改善他们的a PP , 从而更好地满足用户期望. 然而, 对于很多流行的应用来说, 由于其用户评论数据量大、非结构化以及评论质量不一致等, 使得识别其中有价值的信息成为一项极具挑战的任务. 因此, 将用户评论进行自动化分析以减缓人工分析工作量成为a p p 评论挖掘的新思路. 本文我们提出了一种自动化用户评论分析方法 AR I CA ( Automat i c Re vi e wI n t e nt i onCla s si f ic a t i on Anal ys i s ). 首先, AR ICA根据用户的评论反馈, 自动将评论信息进行意图分类, 并使用L DA 主题模型对每个分类意图下评论进行主题划分; 其次, 在每个主题下对表达语义相似的评论进行聚类, 进一步, A RI C A 使用情感分析工具Sen t iSt re ng t h 获取用户情感, 然后对用户评论的情感分布进行分析来识别用户的重要意图; 最后, 综合考虑用户意图和用户情感偏好等多维度信息计算用户评论得分并以此划分评论优先级, 从而为开发者进行用户评论意见推荐. 我们使用Go og l e P la y 中真实的a p p 评论数据来验证ARIC A 的评论意图分类和句子聚类的性能. 实验结果表明, ARICA 在用户评论意图分类过程中准确度达到8 0 % , 和现有的基于卷积神经网络的方法T ext CN N 的相比, ARICA 的F - Mea s ur e 提髙了 1 9 . 1 % ? 同时, 评论句子聚类过程中获得8 6 % 的准确率. 另外, 为了验证ARICA 推荐用户评论的有效性, 我们使用官方的aPP 更新日志来实证分析A RICA 推荐的用户评论建议是否可以真实地被开发者釆用. 结果表明, AR IC A 可以高效为开发者推荐具有价值信息的评论, 这对于开发者进行后续的a p p 维护和演化任务具有重要意义.关键词用户评论; 意图分类; 情感分析; 维护和演化; 意见推荐中图法分类号TP 3 1 1DOI 号 1 0. 1 1 8 9 7 / SP . J .  1 0 1 6 .  2 0 2 0 . 0 2 1 8 4AnAutomati cAna l ysi sofUs erRev iewsMet hodfo rAP PEvo lut ion an dMaint en anc eX I A OJ i a n-M aoCH ENSh i-Z ha nFE NG Zhi-Y ongLI UPe n g- L iXUE-Xi a o( Ti a nj in  KeyLa b o ra to ry o fCo g n i t i ve Co m p u t in g a nd A pp l ica t i o n * T ia n jin3 0 0 3 5 0 )(.Co ll eg e of I n te ll ig en ce a n d Com p u tin g ? Tia njin  Un i vers i t y? Ti a nji n 3 0 0 3 50 )A bs trac tApp l i ca t io nd i s t r i b ut i onp l a t fo rms su ch a s G oog le P l a ySt o r eo r App l eA ppS t or e a l l owuser s  tos ubmit fe edbacks todow nl oada ppl icat i on sin the formof  ra ti ngs or r evi ews .Th esefe edba cksca ndi r e c tl y or i n di re ct l y r ef l e ct us e rs? i nt en t io n ,a ndi tca n gre a t l y he l pmob i l e de ve lo pe r s ( orap ppr ovi de r )t oco n ti n uo us l ym a in t a in a n di m pro ve t he i ra p pl i ca t i on s ,su c ha sf i xt h ee xi s t i ngb ugs ,a ddo rr e f in i n gt h ea p pfe a t ur es *e t c.an dsoast obe t te r s a ti s fy i ngu s e rex p ec ta t i on scon t i n u ou sl y .Ap pr e vi ew sp ro v id ean opp or t u n i t y t op roa c t i v el yco l l e c t us e r com pl a i n ts a n d收稿日期: 2 0 1 9 - 1 1-1 9; 在线发布日期: 2 0 2 0 -0 5-1 3 . 本课题得到国家自然科学基金重点基金( 6 1 8 3 2 0 1 4 ) 、国家自然科学基金( 6 1 5 7 2 3 50 )、国家重点研发计划( 2 0 1 7 YFB 1 4 0 1 2 0 1 ) 资助. 肖建茂, 博士研究生, 中国计算机学会( CCF) 学生会员, 主要研究方向为服务计算、智能化软件工程. E-ma i l : z t_xj m@ tju . ed u . cn. 陈世展,博士, 副教授, 中国计算机学会( CCF) 会员, 主要研究方向为服务计算、面向服务的体系架构.冯志勇, 博士, 教授, 中国计算机学会( CCF ) 会员, 主要研究领域为知识工程、服务计算、计算机认知. 刘朋立,硕士研究生, 主要研究方向为服务计算、软件工程. 薛霄( 通信作者), 博士, 教授, 中国计算机学会( CCF) 会员, 主要研究领域为服务计算、计算实验. E-ma il : j ZX U e xi a〇@tju. e d u . cn .肖建茂等:一种基于用户评论自动分1 1 期 析 的 APP 维 护和演化方 法 2 1 85pr ompt l y i mpro vea p ps^u s er ex per ie nce ,i nte rmso fbu gfi xi nga ndf ea t ur er e fi nem e nt.H ow eve r ,f o r ma ny pop ul a r a p pli ca t i on s >s in c et h e l arg e am ou nt o fu se rr evi e w da t a ,un s t ruc t u r edr e vi ewd a ta , a ndi nc on s i s t en tr e vi e wqu al i t y , i de nt i f yi ng th ev a l u a bl er ev ie w in fo rma t i on be co me sac ha l le n gi n gt a sk .Th e r e for e , cl a s s if i ca t i on of u s err e vi ew si n tos pe ci f ic t op i csa n da ut om at e da n a l ysi s  t or ed uc e t h ework l oa dof ma n ua l  an a l ys i sha s be com ea ne wi d ea fo r a p p r evi e wmi ni n ga n al ysi s . In t h isp ap er ,wep rop os eam et h odnam edA RI CA ( A u to ma t i cRe v i ew I n t en t io nC l a s s if i c a t i onA na l y si s )toa u to ma ti c a l l ya na l yz e c rowdu s er r ev ie w st oe f fi c i en t l yp rovi d ede ve l op e r s wit h sof t w a r ema i nt e na n ce a nd e vol u t i on s ugg e s t i on s . Fi r s tl y ,A R IC Ac la s si f i e st h er e vi e ws i n t od i ff er entc a te go r i es a cc ord in g t oth e us er?s f ee db a ck s , a n d t he nu s e s th e LD At op i cmo de lt oc l a ss i f yt h er e vi e w sun d ere ac hus er’si n t en tca t eg ory .T h i sa l l ows apr e l i m in a rys c r e e ni ng ofu s err ev ie w st o o bt a in r e vi e wi n fo rm at i on u nd er ea c hi n te n tc a t e g or y .Se co nd l y ,A RI CAc l u s t e r s us e r v ie w s w it hs im il a r s em a nt i ce x pr e s s i on su nd ere a ch r e vi ew to pi ct of u r t he rf il t e r th er e d un da n ti n f orma t io ni nre vi e ws , s o t ha t ca ne a si e ran di n t ui t iv et ou n de r s t a n dt h eus e r’sor i g i na lf e ed b ac ka ndc a pt ur et he us er’st rue i nt e nt i onm or ea c cu r a te l y .Aft e rw a rds ,A RICAu s est h e s e n tim en ta na l y si s t oo lc a l l ed Sen t i St r e n gt ht oo b ta i nu s e r s e n t i me nt ,a n dt h e na na l yz es t h es e n t im e nt d is t r i bu ti o no f u s e r r ev i e ws to i de n ti f yt h eus e r’ss i gn i fi c a nti n te n t io ns.Fi n al l y , th e m ul ti d i me ns io na li n fo rma t io ns uc h a sus e r in t en ti o nsa nd s en t im e ntp r e fe r e n c e sa r eco n s i d er edc omp r e h en s i ve l yfor  ca l c ul a t in g th e r e vi e w sco r e an d t he nA RI CApri ori t iz e s r e vi e wsfo r r e a l iz i ngt h eop i ni on s r e co mme n da t io nf or t h ed e ve l op er s .We us e r ea l a pp revi e w da t a fro mGoo gl e P l a yt ov er i fy t h epe r fo rma n ceof r ev ie wi nt e nt c l a s s if i ca t i ona nd s e nt e n ce c l u s t e r i ngofAR I CA.T h e e xp er im e nt a lr es ul t s sh ow  t ha t AR ICAh a spr e ci s i on of 8 0 %i n t h ep roc es s of u s e rr ev i ewi n t en ti onc l a s si f i ca t i o n ,com pa r e dwi t h t he st a t e - of-t h e - ar t ex i s t i nga ut om a t ic u s e ri nt e nt io n s mi ni n gm e t hodT e xt CN Nw hi c h ba s e d on Con vo l ut io n al Neu ra lN e t wo rk s( CN N ) ,t heF-M ea s ur e ofA RI CA i s im pr ov e db y1 9 .  1 % .Me a nw h i l e ,A R ICA ac h ie ve s  8 6 %o ft h e p r ec i si ondu r i ngt he c l us t er i ngofr e vi e ws e nt e n ce s , w hi c hpro vi de se ff ec ti v esu pp or t fors ub se qu e ntde ve l o pe r s tor e com me n da pp upd a te t a s ks.F ur t he r , w eu s et heo ff i c i a la pp ch a ng el o ga sagrou ndt ru t h , a ndemp i r i ca l l ya n al yz e d w he t he rou rr ec omm e nd edu s e r r e vi ew sca nb et ru l yad opt e db yde ve l op e r s , th e r es u l t ssh ow t ha tAR ICAc a ne ff i ci e nt l yhe l pd e ve lop e r sbe tt e ru n de r st a nd th eu s e r?sr ea l req ui r e me nt s , whi c h i sof g rea t s i gn i fi ca n ce f o rd eve l o pe rst op e r fo rmsu bs eq ue n ta ppma i n t en a nc e an d ev ol u ti on t a sk s .I n a ddi t i on , w e a l sop ub l i sht h e or i g i na ld a tas e t ,t hem a nu a l l yl a be l e dd at as e ta nd th es o u r c eco deo fA RI CAo ng it h u bwh i ch p rovi d em at e r i a l s  fo rot h e r r el eva n tr e s e a r c he rs .Keywordsu s e rr e vie w s ;i n t e n tcl a s s i fi c at i on ;se n ti m en ta na l y s i s ;ma i n t en a nc ea nde vo l ut i on ;o pi n io n r e com me nd ati o nsi 引言移动用户可以在应用程序分发平台( 如A pp l e的AppSto r e 和谷歌的Googl e P l a y ) 获取他们想要的应用程序并分享他们对应用程序的意见和反馈[ 1 ]. 这些反馈信息可以作为用户和开发者进行沟通的一个重要渠道, 用户使用a p p 后的反馈信息可以指导a p p 开发者完成多项软件维护和演化任务:比如修复相关的bu gs 或i s s ue s 、或者改进a pp 现有的特性或功能[2]. 然而, 去处理、分析和找出这些有价值的用户评论信息存在诸多挑战. 首先, 应用平台每天都会产生大量的用户评论. Pa ga n o 等人M 通过实证研究发现手机应用程序每天大约收到2 3 条评论, 而像F ac e boo k 这样的热门应用程序每天会在Goo gl e P l a y 上收到超过1 万条评论?, 如果人工进CDAp pA nn i e, ht t p s : / / ww w. a p p a nni e. com/ en /2 1 8 6 计算机学报 2 0 2 0年行分析将耗时耗力. 其次, 用户评论中夹杂大量的噪声数据, 比如拼写错误的单词、重复的单词和非英语的单词, 并且大多数ap p 评论文本长度较短, 并且不遵循语法规则的特点, 导致没有足够的信息量来进行统计推理[ 1 ]. 再次, 用户评论的质量差别很大, 从提供改进想法的有用评论, 到一般性的表扬以及用户的投诉抱怨( 比如“A c c ou nt h a sn’t be e n ha c ke d ,p le a s eHx th i s!”,“il ove i t , i ju stl ov ei t”,“t hi s i sav ery ba da pp ! ! !”) 都大量散布在a p p 评论中? 对于这些评论, 如果采用人工阅读的方式进行处理将会消耗大量的时间[5]. 因此, 对用户评论信息进行自动化分析, 系统地过滤、聚合和分类具有十分重要的意义.自动化评论分析方法主要是根据特定的主题( 例如: bu g 修复、功能改善等) 对用户评论进行分类( 或者优先级排序)[6 1 1 ].M aa l ej 等人W 结合文本分类、自然语言处理和情感分析等技术来实现对应用评论的分类, 将应用评论分为错误报告, 特征请求,用户体验和评级四个大类, Pa ni ch e l l a 等人[8 “ 2] 同样采用自然语言处理、文本分析和情感分析技术组合的方式将评论分为寻求信息、信息搜寻、功能要求、问题发现等有限的几个类别. 虽然这些工作可以从冗余的移动应用评论中自动提取部分有效的信息.但对一些流行的a pp 来说, 由于其评论数据庞大, 用上述方法分析得到的结果对开发者进行具体的维护任务仍然是不够的, 这些研究工作都是根据非常有限的一组类别对评论进行分类, 并产生一个非结构化评论集群列表, 最后仍然需要手动分析才能理解他们讨论的主题, 而用户真正关心a p p 哪一方面具体的信息仍不够准确.据我们查阅目前所发表的文献发现, 只有DiSo rb o 等人[1 3提出的SURF 方法结合了用户评论主题提取、用户意图分类以及系统地定义了围绕a p p 具体某些方面( 比如: UI 、下载信息等) 需要进行维护的工作, 并可以有效帮助开发人员规划下一步的a PP 更新任务. 但我们认为这个方法还是不够自动化, SURF 的主题分类需要自定义概念词典, 然后人工去验证, 同时随着新的用户评论产生, 字典的有效性会受到限制; 另一方面, SU RF 推荐建议时没有考虑用户评论的真实情感倾向, 评论时间等维度信息. 事实上, 这些信息对于帮助反应真实的用户意图具有重要作用, 可以更准确地帮助开发者高效地识别用户的真实需求. 因此, 本文我们提出一种更加自动化的用户评论挖掘分析方法A R ICA.ARI CA 首先利用N LP 最新的BERT[ 1 5] 模型将用户评论意图进行自动分类; 其次, 在意图分类的基础上, 利用主题模型LD A 技术和词向量技术结合实现评论主题聚类; 并进一步将各个评论主题下的评论进行聚类分析, 得到最能表达用户意图的语句; 最后, 将聚类后的评论, 结合用户情感倾向, 评论时间信息以及用户评论点赞数等信息综合进行开发者建议推荐. 这样可以实现自动化高效的用户评论信息挖掘, 从而为开发者推荐关于a p p 维护更新最相关的评论内容. 本文的贡献如下:( 1 ) 提出了一种利用最新的自然语言处理技术BERT 模型来实现的用户评论意图自动分类的方法, 大大的提高了用户意图分类的准确性. 和现有的最好基于卷积神经网络( Con v ol u ti on a lN e ura lN et w o rk s , CN N ) 方法Te x tCN N [ 1 6:1的用户意图自动挖掘相比, A R IC A 的F-M ea s ur e 提高了 1 9 . 1 % .( 2 ) 综合考虑了用户评论的情感、评论意图、评论时间等多维度等的信息对用户评论进行优先级排序, 为开发人员推荐用户真实需求, 为后续a p p 的版本演化和维护提供高效建议.( 3 ) 我们公开了本文方法使用到的原始数据集和人工标注的数据集( 用于复现以及未来的研究) ,以及该方法实现的源代码?.( 4 ) 我们使用官方的a pp 更新日志来进行详细的案例分析, 验证了A R I CA 为开发者进行评论意见推荐的高效性.本文第2 节介绍本文的相关工作; 第3 节阐述我们方法的整体思路和使用到的相关技术; 第4 节阐述我们设计的实验和分析方法; 第5 节展示和讨论实验结果; 第6 节描述可能影响我们工作有效性的威胁; 第7 节总结论文并概述了下一步的研究工作.2 相关工作对于人类而言, 理解应用评论十分简单, 这是因为人能够根据积累的知识做出判断. 例如“Il i k et h isa pp li ca ti on”和“t hi s  a pp l i c a t io ni sgo od , lik e i t”. 人类可以清楚的知道这两句话表达的意思是相似的.然而对应用评论进行理解和自动化分析则是一项充①htt p s : / /git h u b. com/ xu a nh u i0 1 2 9 / AR I CA肖建茂等:一种基于用户评论自动分析的APP 维护和演化方法 2 1 8 7 1 1 期满挑战的任务. APP 评论数据和长文本数据不同,大多数ap p 评论具有短小并且不遵循语法规则的特点, 因此没有足够的信息量来进行统计推理W . 传统对评论的分析方法主要是检查评论中是否包含某个关键字并手动定义关键字列表, 然后检查文本中是否包含关键字来挖掘评论的价值[ 1 7], 如Ba ki u 等人D 8] 提出一种基于评论分析用户情感的方法, 他们将用户评论中经常出现的关键词识别为特征, 并将提取的特征与用户情感关联, 然后使用主题建模进行分组, 最后将提取的功能相关的评论分类为与可用性和用户体验相关的需求类别来进行评论挖掘.Da b rowsk i 等人[ 1 9 ] 针对用户评论分类的类别, 提出了一种对用户感兴趣的特定功能检索工具, 从而能够进一步支持需求工程师了解用户针对ap p 特定功能的需求, 以更好地维护对应的a pp .近年来, 已经有相关学者对用户评论自动分类方法进行了研究. Ch e n 等人[6 ] 对大量的ap p 评论进行研究, 发现在评论中有很多用户单纯的表达喜恶,如“goo d , Il i k e i t”等, 这些评论无论对于开发者还是其他的用户来说, 都没有提供有效的信息. 基于此现象, 他们开发了一种工具可以将评论分为信息性和非信息性, 并过滤无用的信息, 从而提取评论中有效的信息. Ci ur ume l e a 等人[ 2° ] 基于用户评论定义了一个包含移动应用特定类别( 例如性能、资源、电池、内存等) 的高级和低级分类, 并基于此构建了用户请求引用器( URR ) 原型, 然后使用机器学习和信息检索技术进行评论自动分类. G uz ma n 等人[ 2] 应用N L TK 工具对应用评论进行特征提取并使用Se nt i S tr en gt h 工具进行情感分析, 从而挖掘用户评论中的细粒度特征. 为了使挖掘得到评论更好的方便开发人员进行开发, 在文献[ 2 ] 的基础上, G uzm a n等人[ 1 ° ] 进一步提出了一种以用户评论特征和情感为中心的检索方法DI VERSE , 它可以自动为开发人员提供一个多样化的用户评论样本, 这些样本代表着整个评论集中用户提到的不同意见和体验.Dh i n ak ara n 等人[2 1] 提出了一种结合主动学习以减少a p p 评论分析中涉及到的人工操作的方法, 其将评论分为功能请求、错误、评级和用户体验几个类别, 并使用主动学习相关策略应用到评论分类中进行分析. Me s s a ou d 等人[ 2 2] 针对开发人员难以手动分析用户评论并将它们归类到适当的评论类别中,提出了一种使用多标签主动学习方法来实现用户评论的分类问题, 从而更好地保证评论的快速准确挖掘. Kh al id 等人[2 3] 重点研究了2 0 个免费下载的i 〇S 应用程序的低评级用户评论, 他们发现了1 2 种类型的用户投诉以及它们的频率和影响, 这可以帮助开发者更好地优先考虑利用现有的资源来保证a p p 的质量. L i u 等人[ 2 4] 通过提取a pp 描述中的特征词的方法来指导评论的分析, 并建立了用户情感和主题特征词之间的关联, 该方法将贡献最大的词作为主题名, 并通过时间、评论的评分及评论的客观与否来设置评论优先级, 从而实现评论推荐. 但是,他们忽略了同一个问题可能会被多个用户提起, 也忽略了其他有贡献的主题词的作用. Sc a l a bri n o 等人[2 5 ] 提出了用DBSCAN 聚类算法来实现对评论的聚类, 从而挖掘用户评论的意见. Ga o 等人[2 S] 基于在线ap p 评论数据, 提出了一种自动化框架ID EA来自动分析用户评论, I DE A 分别使用了LDA 主题模型检测和推断分析来识别评论中的紧急问题, 并通过a pp 官方更新日志验证了I DEA 的有效性? 除此之外, 也有一些比较新颖的工作来进行ap p 评论数据分析挖掘用户需求, 比如Da l pi a z 等人[2 7] 提出来一个工具RESWO T , 用于通过对应用程序商店中竞争对手a pp 的评论分析中挖掘用户需求. 上述方法都可以在某种程度上缓解人工分析用户评论的工作, 但不能细粒度让开发者理解用户的真实意图,从而难以指导开发者直接进行后续a pp 维护和演化任务.为了更好地理解用户细粒度需求, Di So rb o 等人[2 8 ] 提出了意图挖掘的概念. 具体来说, 他们提出了一种意图分类法, 将开发人员讨论中的句子从邮件列表中分为六类: 特征请求、意见询问、问题发现、解决方案建议、信息寻求和信息提供. G u zma n 等人? 提出了用于将应用程序评论分类为与软件维护相关类别的方法. 具体来讲, 他们将用户评论分为错误报告、功能优势、功能缺陷、用户请求, 好评、投诉和使用情况这几个类别, 这可以为开发人提供细致的用户评论建议. M a a le j 等人[7] 结合文本分类、自然语言处理和情感分析等技术来实现对应用评论的分类, 将应用评论分为错误报告, 特征请求, 用户体验和评级四个大类. P an i ch e l l a 等人M 同样采用自然语言处理、文本分析和情感分析技术组合的方式将评论分为信息提供、信息搜寻、特征请求、解决方案以及问题发现等几个类别[1 1], 并公开了一个基于这个分类的评论数据集[2 9]. 在文献[ 8] 工作的基础上, Hu a ng 等人[ 1 6 ] 基于卷积神经网络( CNN ) 的基础上提出了T e xt CN N 用于评论意图的分类, 该工作将文献[8] 中的用户意图增加了方面评估和无意2 1 8 8 计算机学报 2 02 0年义这2 个类别, 然后用标记的文本进行训练, 和直接基于CNN[ 3° ]、L i b SVM[3 1 ] 等分类算法相比, 获得了当前意图分类最好的效果. 相比于直接进行用户评论主题提取或聚类, 上述这些方法都将用户评论信息数据进行了进一步的细化. 经过我们调研大量的文献发现. 目前只有Di S or b o 等人[ 13 ] 研究工作不仅将用户评论意图进行了细粒度分类, 同时重点考虑开发者关注的ap p 多个方面相关的主题信息. 但他们的主题分类需要自定义概念字典, 然后人工去验证, 这将导致评论推荐的效果受到字典的丰富性影响, 且分类的自动化程度不够.综上, 无论是基于传统的关键词提取用户评论信息还是基于用户意图分类进行自动用户评论分析, 最重要的是用户意图划分的合理性以及意图分类的准确性, 同时需要考虑多维度因素实现综合的评论优先级推荐, 这是挖掘用户评论中的蕴含的价值信息的核心内容, 也是开发者能否顺利实施后续a pp 维护和演化任务的关键.3AR ICA 整体框架我们的目的是为了给开发者在其更新维护应用时提供高效的参考意见. 为了实现这一目标, 我们将用户评论分析定位到句子级别, 因为在原始用户评论中, 有些句子与软件开发和维护相关, 而有些则与之无关. A RI C A 可以自动实现: ( 1 ) 对用户评论进行意图分类, 分类成和ap p 更新和维护方面相关的类别以2 ) 对各个意图下用户评论进行主题分类, 从而进一步提高评论的内聚性, 同时将各个主题下用户评论进行句子聚类, 得到和用户评论意图最相关的句子; ( 3 ) 重点分析用户评论的情感分布并识别用户重要意图d 4 ) 综合考虑用户意图、情感倾向以及评论时间等多维度信息计算用户评论综合得分,并制定评论优先级规则进行用户评论推荐. 图1 展示了方法的整体框架处理流程, 下面我们进行逐一介绍."ca"Wo rdMap perL DA +Wo rd 2 vecA ) 评论主题分类Wo rdMap pe r +Wo rd 2 vec,一、'Z. J 丨 DBSCANB ) 评论句子聚类② 主题分类和句子聚类Vvw用户情感获取0用户情感分布③ 情感分析■■■■■:)评论优先级④ 综合意见推荐图1A R1 C A 整体框架3. 1 数据预处理移动用户通过终端( 比如智能手机) 提交的评论一般包含许多噪声数据, 比如随意的单词, 重复的单词以及非英文的单词等, 这些会影响对数据处理的结果. 因此, 我们首先需要对评论数据进行数据预处理. 本文我们使用N LP 相关技术实现评论的数据预处理, 具体包括过滤掉非英文词汇, 无用的表情符号等, 同时使用正则表达式过滤掉网址、邮箱等干扰信息. 另一方面, 由于用户通常在移动设备上提交他们的评论, 而这些移动设备通常尺寸比较小, 没有实体键盘, 因此打字既困难又耗时. 很容易会产生错误.这种情况导致在用户对这些移动应用的评论中经常出现拼写错误( 即拼错单词) 、缩略词和缩写, 比如单词“ us ef u l l”, 显然用户是想要表达的是“ us ef u l ”,“f rien d s” 缩写成了“fmd s”. 这样就会导致我们在进行评论分析时将他们当成不同的词来处理, 这会对数据分析结果造成不良的影响, 产生噪声数据. 因此需要将拼写错误、缩略词和缩写的词进行还原. 本文肖建茂等:一种基于用户评论自动分1 1 期 析的 APP 维护 和演化方法 2 1 8 9我们基于文献[3 2] 自定义的词典wo r dM a p p er?,一个手工整理了近3 0 0 0 0 0 和a p p 评论相关的词汇字典, 其中包含了在用户评论中常见的拼写错误、缩写和缩略的单词及其校正后的单词. 在该字典的基础上. 我们进一步往字典中增加ap p 评论相关的更细致词汇, 比如“yo u’r e —you ar e” 等? 最后利用完善后的字典可以很好地将常见的容易拼写错误或者缩略的单词进行校正还原.3 . 2 评论意图分类为了帮助开发人员更容易地理解用户在应用市场的评论反馈, E) i S or bo 等人[1 4] 提出用户评论反馈分类方法SUR F , 旨在从软件维护和演化的角度对应用程序评论中包含的信息段落进行建模. 如表1所示. 他们把用户的评论意图分为5 类, 分别为信息提供、信息搜寻、特征请求、问题发现以及其他, 并且证明这种分类可以很好地被开发者所理解并进行后续a p p 维护和演化任务. 本文我们使用的也是这种意图分类方法, 因为这些意图可以很好表达用户对a p p 的真实诉求, 同时也可以让开发者容易理解.表】用户评论意图分类类别类别 描述信息提供 告知其他用户或者开发者AP P 某方面信息的句子信息搜寻描述试图从其他用户或开发人员获取信息或帮助的句子特征请求 表达用户观点、建议或APP 某些方面需要增强的句子问题发现 报告异常行为或问题的句子其他 不属于任何以上类别的句子传统的文本分类通常使用T F- I D F 方法来提取特征进行分类, 但这种方法忽略了同一语义的不同表达方式. 因此, H u a ng 等人基于CN N 进行句子意图的分类, 该方法将句子进行向量化表示, 向量间的距离代表了句子的相似度, 与T F-I DF 相比, 该方法考虑了词与词之间的关系, 有效地提高了分类效率, 但他们的方法的效率还是不够的, 因为他们只是考虑了词与词之间的关系, 并没有考虑词上下文之间的关系. 因此, 本文我们采用了最新的自然处理模型BE RT 进行自动的用户意图分类, BE RT 是一种基于t r a n s f o rm er 架构的双向模型, 它在进行评论句子向量化后包含了上下文的信息, 可以有效地弥补基于CN N 方法的不足.BE R T的输入表7K ( in p utr e pr e s en t a t i o n ) 能够在一个词( t ok e n ) 序列中明确地表示单个文本句子或一对文本句子( 例如, [ Q u e s t io n , A n sw e r ] ). 对于给定词, 其输人表示通过对相应的词嵌人( to ke ne mb ed di n gs ) 、分割嵌人( s e gm en te mb e dd in gs ) 和位置嵌人( pos i t i o n e mb ed di n g ) 进行求和来构造. 图2展示了一个基于BE RT 进行评论意图分类的例子,输人的评论句子“ W en ee dn igh tmo d e”作为一? 个句子整体输人到B E RT 模型中, 第一个词是一个特殊的符号[ CL S] , 表示为分类, 然后经过词、分割和位置嵌入进行求和操作, 每个位置对应的输出为一个维度为h i d de n_s i z e ( BER TBa s e中为 7 6 8 ) 的向量?. 本文我们执行的是评论句子意图分类任务, 因此我们只关注第一个位置的输出( 也就是被我们用[ CL S] 符号代替的位置) 向量. 输出的这个向量作为我们前馈神经网络( F ee d- f o rw a r d n e u r al n e t w or k )分类器的输入, 最后得到用户评论句子的意图分类结果. 图中句子的分类结果为特征请求.评论句子[CLS]WeTok ennbed ding In e n tPo si t i o nd d in gEmbedd i ng^ [CL S]ea E〇^w eeane edn i g h t !〇 +EAe2Ebe3ebE,[ SEP :输入Eb EsBERT AS ASE RVI CE分类器( Feed -fo rwa r dn e u ra l ne two rk +so ftmax )|分类结果信息给予|信息搜寻U 特?!请求问题发现其他输出图2 基于BE R T 的评论意图分类示例3 . 3 主题分类及句子聚类用户的意图分类只能在宏观层面表示用户的想法, 开发者并不能直接基于这个意图分类进行a p p维护任务. 因此, 需要进一步对各个意图分类下的评论信息进一步进行提取, 从而实现更加细粒度的用户评论挖掘. 这里主要包含评论的主题分类和每个主题下句子聚类.3 . 3 .1 评论主题分类单从句子意图分类这个维度对充分利用评论中的信息是不够的. 比如, 当信息搜寻类别中存在大量的评论句子时, 开发者要从中找到和a pp 维护相关信息仍然费时费力. 因此, 我们需要进一步提取出每个意图下用户评论隐藏的主题, 这些主题可以表达出该意图类别下用户关心的内容, 这可以帮助开发者更直接地了解用户的具体意图.①h t tp s : / /git h u b .  c om / xu an h u i 0 1 2 9 / ARI CA/ b l ob / mast er / fil e/wo r d Map p er . t x t②h t t ps : / / g i t h u b . c om / g o og l e-r e s ea rc h / b e r t2 1 9 0 计算机学报 2 0 2 0 年LDA[ M ] 是一种经典的主题建模算法, 可以用来识别大规模文档集或语料库中潜藏的主题信息. 本文我们使用LD A 主题模型来实现用户评论主题分类,并采用w〇rd 2 ve c[ 3 4] 词向量实现用户评论的向量化. 同时, 为了保证LDA 模型能够对新产生的用户评论进行主题划分, 我们取每个主题下概率最大的前N 个词进行加权求和作为该主题的中心向量, 对于新产生的用户评论, 我们计算它和各个主题中心距离, 并把距离主题最近的评论划分为该评论的主题. 这样可以使得用户新产生的评论及时地进行主题自动划分. 这里向量距离为余弦距离,计算公式如式( 1 ) 所示:nR ev i ew一Sim=—f——( 1 )其中, a?, 和y, 分别表示为主题中心向量和新产生的评论句子向量. 的取值范围为( 0 , 1 ) ,取值越大, 距离越近. 句子主题分类过程的伪代码如算法1 所示?算法1 . 用户评论主题分类.输人: D: thes et o f u se r一r ev iew ;k: the num be r of t opi cs iz e :th e  si ze o f wo rd embe d di ngre v iew \p endi ng r ev iew^: t o p i c_i d: t h e t op i c_i do f inpu t r ev i ewP roc edur e:1 .in it i al i zatio n:  t opi c s^LDA C Df k )2 . FOREACH t op ic sto pi c sDO3.t op i cjwo rdst op ic,k eywor ds4.FOREAC H t opi c_xvord6t o p icjwords DO5.ca l c u l a t e we igh t v ec t o rsu m ;6.ENDFOR7.we ig ht ve c t o r sum a s sum_vec\8 .a dds um_jve c t ot opi c_ve cs;9. ENDFOR1 0 . re vie zv_v ec^*—Vec t o r ( r ev i exv )1 1. in i t i a liz a t io n: mi n Ve c1 2. ini t ia li z a tio ns  to pi c_id ^*1;1 3. FO REACH topi c_ve c ^:t 〇pi c_v ec sDO1 4 .IFd i sta n ce ( t opi c_v ec, re v iew _vec ) 〈m in Ve cT HEN1 5 .mi n Vec —d i sta n ce ( t op i c_ve c ’ revi ew一ve c )1 6 .t op i c_i d-* ̄t opi c_ve c.i d1 7.END IF1 8.ENDF OR1 9.RE TURN t 〇pi c_i d3 . 3 . 2 评论句子聚类在同一个评论主题下, 评论的句子仍然较多, 尤其是对于一些流行的a pp , 存在一系列的句子是在讨论a P P 同一个方面的内容, 即存在语义相关. 因此, 我们进一步在每个主题下把语义相似的句子进行聚类, 这样可以为开发者过滤大量冗余信息, 从而更加容易和直观地理解用户的原始反馈并能更快地捕获用户的真实意图, 为进一步进行a pp 相关的实际维护和演化任务提供支撑.另一方面, 由于每个主题下用户评论的聚类个数未知. 因此, 本文我们采用一种基于密度的聚类算法DBSCAN[3 5] 来对每个评论主题下的语句进行聚类, 这可以避免々- m ea n s 聚类时选择初始聚类中心对聚类结果影响. 同时, 由于DBSCAN 算法的输入为向量, 并且考虑到用户评论语句存在相似性, 我们同样使用word 2 vec 对评论句子处理, 从而得到词向量模型. 进一步, 在进行聚类时, 我们对句子进行预处理后分别求出各个词的向量, 并对词向量加权求和. 加权之后的向量不仅对数据进行了降维, 同时也表示了句子的语义信息. 最后, 将加权之后的向量使用D BSCAN 算法进行聚类, 找到句子之间距离较短、相似度较高的并将其聚类到一块, 从而帮助开发者快速识别用户的真实意图.3 . 4 评论情感分析在不同的时间段下, 用户的情感会可能发生大幅度的变化, 尤其在ap p 出现bug 或隐私安全等问题时, 会导致用户情感可能出现诸如波峰和波谷等趋势. 当用户情感出现波峰或者波谷时, 这很大程度上是和app 相关的特征发生变化所导致, 比如当a p p 出现崩溃或隐私等问题时, 用户会通过评论及时表达出很多负面的情感, 当a pp 出现新的功能特征, 或者发布新版本时( 此时一般伴随新功能的产生) , 用户整体会通过评论及时表达出较高正面的情感, 而在一般情况下, 用户的情感趋于平稳.图3 展示了用户的情感演化趋势. 在T, 时间片下用户情感达到波谷, 在T,时间片下达到波峰, 其他时间片下变化较小. 我们基于不同时间段的用户情感倾向来对用户意图进行权重分配, 比如当用户情感趋势处在波谷时, 推荐权重更大, 而在用户情感趋势在波峰或者稳定时, 推荐的权重较小, 这是因为情感波峰或者稳定时, 用户可能没有遇到明显的问题, 此时用户更多的可能是在表达使用a pp 的一些体验信息. 而在波谷时可能由于ap p 出现b u g 等情况, 此时用户更有可能表达出对a pp 的相关意图( 如肖建茂等:一种基于用户评论自动分1 1 期 析 的 APP 维护 和 演化方 法 2 1 9 1请求修复b ug 等) . 这可以帮助开发者了解用户的情感以及这些情感如何和用户的意图相关联, 从而为开发者推荐更精准的用户建议.时间片图3 用户情感趋势示意图3 . 4 .1 获取评论情感得分情感分析是为每个评论分配固定的正值或负值的过程[ 3 S ]. 为了分析用户评论中的情感, 我们使用S e nt i St r en g t h" 、情感分析工具来实现用户评论情感分析, 它对于诸如T w i t t e r 和电影评论之类的社交媒体中的短文本具有很高的准确性::i 8]. P a ga no等人[3 ] 发现, A p pS t or e 中8 0 .  4 % 的评论所包含字符少于1 6 0. 同时, S e nt i S t r e n g t h 可以很好地计算短文本中正面和负面的情感强度, 即使是非正式语言也是如此? 而a p p 的评论信息与S e nt i St r en g t h 的这些优势刚好非常匹配, 这使得S e m i S t r e ng t h 成为分析a p p 用户评论情感的理想工具.S e m i S t r e n gt h 可以将评论信息进行句子级别处理, 并分配相应的正值或负值. 其中分值范围是[― 5 , 5] , 其中[ + 1, + 5] 表7K 正面情感, + 5 表本非常正面的情感, + 1 表示没有正面情感. 类似地,[一5 ,一1 ] 表示负面情感,_5 表示非常负面的情感,一1 表示不存在任何负面情感. 在本文中, 针对每一个评论语句, 我们取该句子得分范围中绝对值较大的值作为句子的最后得分, 因为绝对值更大的值更能反映句子的实际情感. 另外, 由于负值可以更好地体现用户的意图, 当句子得分的正值和负值相等, 取负值作为整个句子得分, 从而避免漏掉相应的评论句子信息.值得注意的是, 由于用户评论中的表情符号, 极性词等也会影响用户的情感. 因此, 情感分析时我们无需将评论语句经过3 .1 节所述的数据预处理过程, 而是直接分析用户评论情感得分. 表2 展示了经过S en t i St r e n gt h 工具得到的3 个评论句子得分示例.表2基于Se n t i S丨r e ngt h 的评论得分评论句子 单词得分 句子得分u p l o adin g  pi ct u r es w i t h th ea p p i s s o an no y i n g !up lo ad i n g p i ct u r es w it h t h ea p p i s s o a n n o y i n g [—3 ] !  [1 p un c t u a t i o n e mp h a s i s ]{1 ,一3}l o v e lis te ning to  P an d o r a . . .  ha s ev e ry t hin gy o u co u l d  n ee d  a nd w an t .wo r k s g re at I p re fe r o ve rAm azo nm us ic ! !lo v e [ 3 ]l i s t en i n g t o P an d o ra [ p r o p er n o u n ] . . .[ s en t en ce:  3 ,_ 1 ] h a s ev e r y thin gy o u co u l d n e ed an d wa n t [ s en t en ce : 1 ,一 1 ] [ r e s u lt: ma x  an d -o f an y  s en t e n ce][ o v e ra l l r es u l t=l  as p o s〉一n eg ] }w o rk s g r eat [ 3 ]Ip r e fe r o v er  Amaz o n[ p r o p er  n o u n ]mu s i c! ! 匸1p u n c tu a tio ne mp h as is ] [ s e n te n ce : 4,一1 ][r e s ult : max a n d- o f  an y s e n te nce ] [  o ve r al l{4,-re su lt = 1 a s  po s〉一n eg]{3 ,-1}1}3 . 4. 2 评论情感分布用户在不同时间段内对a p p 情感会发生变化,假设用户在时间段T, 对a pp 给出了《条评论, 基于3 . 4 . 1 节, 得到i ?S ( s co re )= { R S,. 】, 尺S,. 2 ,…,为《条评论情感得分. 值得注意的是, 在固定的时间段内, 用户对同一个a pp 的评论数目并不固定.因此, 我们把:T, 时间段内用户整体对ap p 的平均情感得分A i? S G?r e ) 作为用户群体的情感倾向, 计算公式如式( 2 ) 所示:AR S ( s c o r e ) = —RS ^,nA—*( 2 )其中, 7^ ,…, U 表示一系列等长且不重复的时间间隔, 尺心表示为ap p 在:T, 时间段内的第7条评论情感得分, 〃表示在T, 时间段内的评论数目?图4 通过折线图展示了在不同时间段内用户对a pp 的情感得分分布, 这里我们选择了当下比较流行的应用F a c e bo o k 和U be r 分析, 可以看到用户情感展示多元化的变化趋势, 在不同的时间段内, 用户的情感会出现迅速上升或者下降的趋势, 从而出现诸如波峰和波谷等趋势, 也有出现一段时间内用户情感比较稳定的趋势. 这些情感波谷趋势是后续开发者进行ap p 维护和更新需要重点关注的地方.2 1 9 2 计算机学报 2 02 0年Faceb oo k20 1 8-1 2-1 9 2 0 1 8-1 2-2 7 20 1 9-0 1-0 4 20 1 9-0 1-1 2 20 1 9-0 1-2 0DateUber图4 不同时间段下用户评论情感趋势3 . 4 . 3 情感波谷识别我们根据用户的情感变化. 得到用户在使用a p p 中的情感分布曲线, 当用户的评论在波谷( 即负面情绪集中) 时, 我们认为此时用户所提出的评论反馈更能够反映用户意图. 识别用户情感波谷的主要思想是通过划分固定的时间段( 比如3 天、一周, 可根据需要动态调整) , 然后在该时间段内寻找情感波谷,用户情感波谷识别具体流程如算法2 所示.算法2 . 用户情感波谷识别.输人: D : t he  se t of  us er一rev i ew w hi c h ha s se n ti me nt一s cor ea n dd at e;e : t h e Th re s h o l do fD a ys^5 4: t ro ughJi is t \ t he l i s t of t r ou gh sP roc e d u r e :1.i n i t i a l i za t i on :u nk n ow n;2 .FO REACHd ^ DBO3 .I F=u nkn ownT H EN4.I F d. s en t i men t_s c o r e ^> d Jr \T H E N5.s t a t us— downh i l l;6.E N DIF7.E L SET HE N8 .st a t us — up hi  U?’9.E N DE LS E1 0 .E ND IF1 1 .I F d.. s ta t u s —=downh i l l T H E N1 2 .IF d. s en t i m en t_s cor e <i. se n t ime n t_s co r eT HE N1 3.I Fd . da t e  ̄t ro ugh_l i st\_ —\ ̄\ . da t e<i e T H E N1 4 .I F t ro ugh_l i st [—\ ̄\ . se n t ime n t_s co r e  ]>d . s en t i me n t_sc o r e TH E N1 5 .t r o ugh_l i st [ — 1] ^ *—d ;1 6 .E N DIF1 7 .E L SE T HE N :1 8 .a d ddt o t ro ugh_L i st;1 9 .E N DE LSE2 0 .E N DI F2 1.E N DI F2 2.E ND FO R2 3 . E N DIF2 4 . RE T UR N对3 . 5 评论优先级推荐对于开发者来说, 他们更希望有一种方法可以同时做到: ( 1 ) 很容易地获取到用户评论的有用信息“ 2 ) 正确地理解需要完成的维护任务; ( 3 ) ap p哪一个方面的内容是用户最关注且希望得到修复的. 因此, 我们需要找到一种合适的方式来对挖掘得到的用户评论信息推荐给开发者. 为了解决这个问题, 我们制定了一种评价用户评论优先级的机制, 从而为开发者推荐合理且高效的用户评论建议. 我们的机制同时考虑了5 个方面( Asp e c t ) 的因素:A S 1: 用户意图类别的重要性.一般来讲. 意图分类中最重要的是问题发现和特征请求这两个类别, 因为这更有可能是和ap p 维护相关的内容, 这对于开发者更加重要. 其次是信息提供和信息搜寻两个类别. 值得注意的是, 由于开发者只关心功能性的评论. 因此, 意图分类成其他类别的评论我们将其划分为最弱的优先级.A S 2: 用户情感. 如3 . 4 节所描述, 用户通常会及时通过评论来表达使用a pp 的实时体验, 这些评论信息可以反映用户真实的情感. 比如当a pp 出现隐私安全时, 用户的行为一般为抱怨, 此时表达的是负面的情绪; 当ap p 出现新功能时, 用户表达的情感一般为正面的, 此时的情感得分较高. 情感得分越低( 即情感趋势出现波谷时) , 此时更能反映用户的真实意图.A S3 : 用户评论的时间. 用户的评论的时间距离1 1 期 肖建茂等:一种基于用户评论自动分析的APP 维护和演化方法 2 1 9 3现在越近, 对开发者重要性越大.A S4 : 评论句子的长度. 评论句子的长度越长,通常越能表达用户的意图信息.A S 5 : 点赞数. 点赞数越多, 说明越多用户认可该评论观点, 推荐时占的权重越大.3 . 5 . 1 评论综合得分计算将每个聚类后簇中的各个句子的得分求和来获取获取综合得分, 在每个簇下, 我们为每一个簇分配一个综合的得分, 计算公式如式( 3 ) 所示:To ta l Sco re =( I ns r XS e n t im en t_ Sco re X/ = iTime_Sco r eiX Sen_I nfo riXHe l ps_ Sco rei') i 3 )其中, In sr , Sentiment一Scor e , Time^Scorei, Sen—Info n以及与我们的五个方面因素相对应,也就是A S 1? A S 5 . Toia Z Sc o re 是评论的综合得分,To ta ZSc o re 越大, 推荐的优先级越高.上述各个变量的取值范围都是( 〇, 1 ] , 乘积越大, 表示该簇的重要程度越大. 其中, 表示的是用户意图的重要性, 用户意图的分类可以清晰地表达开发者需要维护的任务. 我们根据用户意图的重要性给每个句子分配相应的权重, 其中问题发现和特征请求类别的权重设置为1 , 信息搜寻和信息查找类别设置的权重为〇.  5 , 其他类别设置为0 . 1 . 对于情感趋势得分( ) 计算, 我们将在波谷前后各一天的评论数据的权重设置为1, 其他时段的设置为〇. 5. 虽然用户意图和情感的权重也可以设置为其他相关的值, 但是对不同权重的影响进行系统的研究是我们未来议程的一部分.对于开发者来说, 如果某个问题被多个用户都提出, 说明该问题是个普适的问题, 应该得到开发者的重视. 在应用商店中, 允许用户对其他用户的评论点赞, 即如果用户认为有的评论表达出了自己想表达的内容, 他可以点赞该评论. 是点赞数得分. 用户评论被点赞数的得分计算公式如式( 4 )所示. 其中为当前评论的有帮助数,m ax/i e Z /) 为当前a p p 中评论中最大的点赞数.He l p_S co re=r . he lp fu l n umm ax h e l p( 4 )用户在应用商店中进行评论时, 会有时间属性,即用户是在何时进行评论的. 这些时间信息可以为我们提供诸多信息. 评论的时间离我们越远, 通常该评论越不具有时效性, 我们认为其价值较小. 本文用Time_Sc o r e 表示时间得分, 式( 5 ) 表示了时间得分的计算方法? 其中, rew'ewf zVwe 是评论的时间, wn'wi iw e是数据集中最早的评论时间, c wr re w? fme 是当前时间. 77 ;T z e_SC 〇re 值越大, 表示其距离现在越近, 其重要性越大.??rev i e wti me_m int im e + 1, 、Tim e_ Sco re=———( 5 )c ur r ent t im e_m i nt im e+ 1由于评论中句子的长度是不固定的, 并且随着句子长度的增加, 句子的信息量是增加的. 但是, 随着句子长度的越来越大, 其信息量的增加是有限的.我们设置一个阈值A 当超过该值时, 用户评论的信息量增加变慢. 信息量的计算公式如式( 6 ) 所示, 其中, J w/o r, 是指句子/ 的信息量得分,Z ew ( Sen kn ce ) 是指句子的长度.S en」nfo r i=—( 6 )1_j_^―<,  l Sen t e nc ei)3 . 5 . 2 评论综合推荐为了使开发者能够便捷地检索到用户评论中重要的信息, 同时正确的理解要完成的维护任务. 我们提供了一个可视化的在线原型系统向开发者展示挖掘得到的评论句子, 各个评论句子分别划分到不同的意图类别, 同时为了进一步保证ARI CA 方法推荐评论的可读性, 我们只选择综合评分( 也就是To to Z S c or e ) 前1 0 的评论句子进行展示. 特别的, 我们同时基于用户情感倾向和评论意图等将挖掘得到的评论划分为紧急需求( 或意见) 、核心需求以及其他需求三个等级, 其中情感倾向处于波谷附近的评论为用户的紧急需求( 紧急需求可能包含问题发现等) , 用户意图分类为问题发现和特征请求为核心需求, 属于其他这个类别的评论为其他需求.图5 展示了De ez e r 应用的用户评论意见推荐,我们根据用户意图分类分别展示各个分类下的推荐的评论. 其中每一条评论分别包含了评论时间, 情感分数以及相应的评论等级. 比如推荐的前3 条评论内容都是关于歌曲停止播放的问题, 情感分数不高, 且多个用户在同一个时间段都有提到. 因此,ARICA 会自动将它们划分为紧急需求, 因为这是a P P 出现歌曲播放的b u g , 而开发者可以直接根据A R ICA 推荐的评论建议进行直接的a pp 更新维护任务.2 1 9 4 计算机学报 2 0 2 0 年De ez e r M u s ic  P l a y e rD eezer  Mu sic PlayerP R OB L EMD I SC OVE RYFEA T URER EQU E S TI N FO R MA TI O NSE E K I N GI NF ORM AT IONGIVIN GOT H E R1 :  Ive  r e in s t al l ed t h e a pp l i cat io n t h r ee  t im es s o fa r b ec au s e i t s t o p sp l ay i ngso ng s a ndt h e n i h a ve  t o u ni ns t a l l  an d r ei ns ta l l  ag a in f o r  t he son g s t o  w o rk a n d I h av ep r emi u msoy ea h K in d ly f ix t h i s i ss ue日期: 2 0 1 8-0 7-0 8 悄感分数: 2【K S1 求12 : I t  say s  loa d i ng b u t t h e son g n e ve rpl ay s  a n d ye s  i ts  c on n ec t ed t o  t h ew if i .曰期? 2 0 1 8 - 0 7 -0 8 悄? 分& ?? 1【K S霈求]3 :  Exc ept  t h at  so m eti me s  a n d t hi s h as  sta rt ed h a p pe n in g r ec en t ly . t he  a p pl i c at i o n st o p spl a yi n gso n gs  wh e the r  t h ?y ar e d o wn l oa d ed  or n o t  ?日期2 0 1 8- 0 7- 0 8 情感分数: 2【S SS 求I图5 评论综合推荐示例4 实验设计我们使用自然语言处理相关的技术将用户评论进行意图分类、主题分类以及句子聚类, 并提出了综合多维信息对用户评论信息进行优先级划分的方法. 我们的目的在于对应用的开发者提供a pp 维护相关的建议, 以此来减少开发人员在获取用户反馈中的时间消耗, 使其能够从大量的评论信息中找到关键的信息. 我们的实验设计主要受以下四个问题指导:R Q 1: 和基于传统的关键词提取等意图分类相比, 我们的意图分类方法是否更加具有优势?R Q2 : 基于DB C A N 的聚类是否能达到将相似语义的评论语句聚类成一组?R Q 3 :  A RI CA 对用户评论的意见推荐是否能高效地为开发者进行a p p 的维护和更新提供真实参考?R Q 4 : 用户的情感对开发者建议推荐的影响如何?4. 1 数据准备本文提出的自动化评论分析方法涉及到的数据包括用户评论数据集以及a p p 的更新日志数据.4. 1 . 1 用户评论数据集为了回答我们的研究问题, 我们基于Go o g leP l ay 的应用评论来评估我们的方法. 在选择a p p时, 我们采用以下几个原则: ( 1 ) 这些a p p 是市场上流行的应用程序, 这意味着开发者会定期更新他们的应用程序以2 ) 包含不同类别的应用程序;( 3 ) 应用程序有大量的用户评论, 从而可以验证评论自动化分析的效果. 基于这些原则可以在某种程度上保证所提出方法的泛化性. 最后, 我们选择了5 个应用程序, 详细情况如表3 所示.表3 评论数据集Ap p 名字 类别 评论数 版本数T wit te r New s 8^Maga zi n es 3 5 5 9 8 6Ch rome Co mmu n i c at i o n 4 6 0 4 5 5G ma i l Co mmu ni c ati o n 2 2 3 6 3 4Ub e r Map sN a v i g a ti o n 1 3 0 5 3 7I n s t a g r am So c i a l 9 1 0 6 9 5在表3 中, 我们列出了应用程序的名称、类别、爬取的评论数以及评论集合中a p p 的版本数. 总体而言, 我们从4 个类别下5 个a p p 获得了2 0 8 1 2 8 条评论.4 . 1 .  2App 更新日志A p p 更新日志描述了最新版本的a pp 的主要修改内容, 以吸引用户安装和体验新版本.一般来说, 开发人员会在更新日志中记录与应用程序是否添加或删除功能相关的信息, 以及应用程序是否在某些设备上进行了改进, 还是针对特定的bu g 进行了修复.表 4展示了G oogl e Pl ay中Twi t t er2 0 1 9 .  1 1 . 1 1版本的更新日志详情.表4T w it t e r2 0 1 9 . 1 1 .  1 1更新日志版本2 0 1 9 . 1 1 . 1 1Wha t'sNew i n V 2 0 1 9 . 1 1 . 1 1 :fe w u pd a t es t o ma k e Tw it t er  b e tt e r !— We’r ema k i n g  i t e a si e r f o r y o u  t o s e e t h emo s t r el ev a n t a n di n t er e s ti n g  co n v er s ati o n s i n y o u r  tim el i n e.—N o w y o u c an  fo l l o w s p ec ifi ct o p i c s  t o s e e to p  Tw e et s a b o u t t h et h i n g s y o u l o v e.肖建茂等:一种基于用户评论自动分1 1 期 析 的 AP P 维护 和 演化方法 2 1 9 5如表4 所示, T w i t te r 的2 0 1 9.  1 1 .  1 1 版本给出了最近的一些更新, 如增加了“关注特定主题”和“ 查看热门推文” 的功能, 这些更改表现出了开发人员所关注的问题. 尽管更新日志可能不能覆盖对a pp 新版本发布的所有修改, 但是它们代表了 a pp 主要更新的内容. 因此, 对于验证所从用户评论中挖掘的用户意图是否对开发人员有帮助, a pp 更新日志是一个合理的选择.4 .2 分析方法为了回答问题1 和问题2 , 我们从数据集中随机选取了 1 9 5 5 条句子进行手工标记用户的意图?.然后, 我们使用机器学习和N LP 任务中常用的度量标准, 将分类的结果与手动标记的真值集进行比较.在下面的部分中, 我们将描述创建的真值集和使用的衡量标准.4 . 2 . 1 创建真值集合为了创建真值集合, 我们分别从各个a p p 中采用分层随机抽样策略选取评论, 在抽样的过程中,我们验证了每个应用中提取的句子的百分比与原始集合中每个应用中评论的百分比相同. 最后按照3 .  2 节中的用户评论意图分类进行标记. 当句子与任何预先确定的类别不匹配时, 我们就会将句子标记为其他类别, 值得注意的是真值集包含了训练集和测试集.在标注的过程中, 我们选取两名同学分别进行用户评论意图标记, 两名同学本科和硕士都就读于计算机软件专业, 他们有丰富的背景知识. 当两人标记的结果出现分歧时, 我们另找第三个同学进行标记. 本着少数服从多数的原则, 我们将句子分类为两个人共同分类的结果作为最后的意图分类.另一方面, 由于用户评论的意图并不是均衡分布的. 例如, 用户只是单纯地表达喜恶的较多, 特征请求较少. 所以, 我们随机标记的数据具有数据不均衡性. 对此我们采用过采样的方法来对数据进行处理, 即把数据少的类别进行多次采样来减缓对分类结果的影响, 相当于增加了类别少的分类错误的惩罚. 表5 展示了我们标注的数据真集的整体结果. 这个真集被用于为我们的意图分类算法生成训练集和测试集. 特别的, 我们随机选取其中8 0 % 为训练集,剩余的2 0 % 组成测试集.表S 意图分类标注结果类别A p p 占比I n s t a g r a m T wit t e r C h r ome G ma i l Ub e rN u m Ra ti o N u m R ati o N u m Ra tio N u m Ra ti o N u m Ra ti o信息给予 1 4 5 0 .1 9 1 0 6 0 . 2 6 4 8 0 . 1 7 3 0 0 .1 4 5 8 0 . 2 1信息搜寻 1 2 1 0 .1 6 5 6 0 .1 4 5 5 0 . 2 0 4 3 0 . 2 0 80 0 . 2 8特征请求 1 4 5 0 .1 9 5 6 0 .1 4 2 8 0 . 1 0 4 1 0 .1 9 5 8 0 .2 1问题发现 1 0 6 0 .1 4 6 1 0.1 5 4 5 0. 1 6 4 4 0 . 2 1 4 3 0 .  1 5其他 2 5 8 0.  3 3 1 3 0 0 . 3 2 1 0 1 0 . 3 6 5 5 0 . 2 6 4 2 0 .  1 5表6 统计了上述真值集中所有a p p 下各个用户意图类别下评论句子数据及比例. 其中其他类别是最常见的类别, 占训练集的2 9 . 9 % , 说明用户实际的评论很大一部分内容都是些和a p p 本身不是很相关的内容, 这也符合一般的真实情况, 比如我们经常可以看到用户的随意评论, 表情评论或评论语句非常短, 例如直接说“n i c e ap p !” 或“gooda p p”, 这些评论没有为开发者带来开发任务相关的信息. 信息提供和信息搜寻紧随其后分别为1 9 .8 % 和1 8 . 1 % , 而问题发现和特征请求分别只出现在1 6.8 % 和1 5 .2 %表6 评论句子标记结果类别 句子数 占比信息给予 38 7 0 .  1 9 7 9 5 4信息搜寻 35 5 0 ? 1 8 1 5 8 6特征请求 29 9 0 . 1 5 2 9 4 1问题发现 32 8 0 . 1 6 7 7 74其他 58 6 0 ?  29 97 4 4的句子中, 这说明用户评论中实际给出问题或特征请求相关的内容相对较少.4 . 2 .  2 衡量指标RQ 1 的衡量标准: 在我们的评估中, 我们将人工生成的真相集与自动生成的分类进行比较. 我们使用机器学习中常用的准确率/Vec bo n 、召回率■R e ca / Z 和F- me a s u r e 指标来评估结果. 他们的定义如式( 7 ) 所示:Pr ec i s io nTPT P+ FPR eca l l =TPT P+ FN( 7 )F- M ea su r e=2 Pr ed s i o n y^R e ca l lP rec i s i o n ̄\ ̄R eca l LTP ( T ni e Pos i t i v e ) 表示为将句子实际为正类①h t t ps : / / g i t h ub . com / x u an h u i 0 1 2 9 / ARICA /t r ee/ m ast er / cf at a2 1 9 6计算机学报2 0 2 0 年且分类为正类, FP ( Fa l S ePo s i t i v e ) 表示将句子实际为负类, 但分类为正类. 而实际为正类, 但分类的为负类的句子表示为FN ( Fa l s eN e ga t i ve s ) ? 另外, 考虑到本文评论意图分类是多分类问题, 因此我们取各个分类结果的整体平均值作为衡量指标, 即宏查准率( ^ ^ \^£';_〇/3/^ ), 宏查全率( ]^(2 ( : 厂0 尺6 <: ) 以及宏?'1值( Mwro Fl ), 它们的计算公式如式( 8 ) 所示:Ma cr o Pr e =I”= — 乏]Pre c i s i o n”^ i = iMa c r oR ec = Re ca l l^( 8 )Ma c ro FI =1v%— /, F- m ea s u r e ,723其中, w 表示分类的类别数, 本文中意图分类为5 种.即w = 5 .对于RQ 2 , 由于需要将句子语义相近的进行聚类, 但是我们事先并不知道需要聚类的簇数A 值,故像t m e a n s 需要指出聚类簇数的算法并不合适.DB SCA N 是基于密度的算法, 不需要指定聚类簇数, 并且可以处理非凸分布的数据集. 因此, 我们采用密度聚类方法DB SCA N 进行句子的聚类.DB S CA N 需要两个参数: 最小密度m i nP t s 及距离两点之间的最大距离£, 找到合适的mi np oi n t s 和半径是聚类效果的关键.为了回答R Q3 和RQ4 , 我们使用官方真实的更新日志来验证A R IC A 的效果, 同时比较加入情感分析和不加人情感分析的推荐结果去观察最后的用户评论意见推荐效果.5 结果分析R Q 1: 和基于传统的关键词提取等意图分类相比. 我们的意图分类方法是否更加具有优势?高效的意图分类是实现开发者准确获取用户建议的基础, 为了表达我们的意图分类算法的高效性,我们分别设计了不同的分类算法来进行比较. 在评论意图分类的过程中, 分别使用了经典的T F-ID F 、w or d 2 v e c 和BER T 词向量模型将评论句子进行向量化, 并作为分类算法的输人, 比较最后的意图分类效果. 为了展示本文B ER T 模型的高效性, 我们分另1J 使用Ra n domF or e s t 、s vm 、L o gi s t i cR eg r e s s i o n 、XG B C la s s i fi er 、T e xt CN N [1 9] 以及B E RT原生算法来进行比较.表7 展本了各个分类算法下M2 cro P;*e , MafraRe c以及AWmF l 的结果. 我们可以看到在不同的向量模型下, BE R T 模型均取得了最好的分类效果, 其中L og i s t i cR eg r e s s i o n 分类算法取得的效果最佳,Ma c roP re 为0 . 7 9 , Mu c roR ec 为 0 . 8 1 , Mci c roF li 为 0 . 8 1 .表7 不同分类方法的结果分类方法衡量指标TF-I DF Wo r d 2 v ec BE RTMa c roP re Ma c ro Rec Ma cro F l Ma c ro Pre Ma c roR ec Ma cro F l Ma c ro Pr e Ma c ro Rec Ma c roF lRa n d omF o r es t 0 . 6 9 0 . 6 9 0 . 6 9 0 . 6 6 0 . 6 6 0 . 6 6 0 . 7 1 0 . 7 1 0 . 7 0S v m 0 . 7 0 0 . 7 1 0 . 7 1 0 .  7 1 0 . 6 4 0 . 6 4 0 . 7 5 0 . 7 4 0 . 7 2L og i s t i cR e g r es s i o n 0. 7 1 0 . 6 7 0 . 6 9 0 . 7 1 0. 7 1 0 . 7 1 0 . 7 9 0 . 8 1 0 . 8 1X G BCl as s i f ie r 0 . 6 6 0 . 6 5 0 . 6 6 0 . 6 9 0 . 6 9 0 . 6 9 0 . 7 3 0 . 7 3 0 . 7 3F FN N ( B ER T 原生) 0 . 7 1 0 . 7 1 0 . 7 0 0 . 7 5 0 . 7 6 0 . 7 6 0 . 7 7 0 . 7 8 0 . 7 8除了与上述传统的分类方法比较外, 我们还与当下意图识别最好的工作之? ? T e xt CN N [ 1 9 ] 进行了比较, 我们将本文的测试数据集在T e xt CN N 方法上进行分类, 并对其超参数进行调整, 得到整体的Mu c r〇_F l 值为0 . 6 8 , 其混淆矩阵如图6 所示. 从表7中我们可以看出我们的基于B E RT 的意图分类算法均大幅度高于Te x t CN N 方法的0 ? 6 8 , 其中基于Lo gi s ti cRegr e s s ion分类的Ma c roF l提高了1 9 . 1 % .表 8展亦/ 基于BERT模型, Log i s t i c Regr e s s i on分类算法下各个用户意图类别的综合结果, 其中Ma f ro fVh Ma cmRe f 以及Ma c ro F l 的平均值分别达到0 ?  7 9 6 、0 . 8 0 2 和0 ? 8 3 2 5. 而信息搜寻类别的各个指标达到〇. 9 5 以上, 高效的用户意图分类可以为Tex t CNNFR丨GI SOtherPDTr u e la bel图6 基于T e xt C NN 分类混淆矩阵肖建茂等:一种基于用户评论自动分1 1 期 析的 APP 维护和 演化方法 2 1 9 7表8 基于BE R T 模型的评论意图分类结果类别 P rec is io n Re ca ll F I-s co re信息给予 0.  7 1 0 . 6 1 0 . 6 6信息搜寻 0.  9 5 0 . 97 0 . 9 6特征请求 0.  7 6 0 .8 0 0 . 7 8问题发现 0 . 7 7 0 . 8 2 0 . 7 9其他 0 .  79 0. 8 1 0 . 8 0平均 0 .  7 96 0 . 8 0 2 0. 8 3 2 5后续开发者推荐准确用户需求提供理论支持.RQ 2: 基于DBC A N 的聚类是否达能将相似语义的评论语句聚类成一组?评论句子聚类效果的好坏直接关系到最后为开发者进行用户意图推荐的有效性. 我们使用稠密型向量表示方法w 〇r d 2 v e c 对预处理后的评论数据进行词向量化表示. 在具体进行聚类时, 我们对评论句子分别求出各个词的向量, 并对词向量加权求和. 最后将词向量处理过后的句子用DBS C A N 算法进行聚类, 从而找到句子之间距离较短、相似度较高的句子聚类到一块.DB S CA N 算法涉及两个参数, 分别是最小密度mi n P o in t s 及距离两点之间的最大距离e . 不同的m i n P o in t s 和e 直接会影响最后的聚类效果. 本文由于我们要将多个的句子进行聚类, 因此, 我们将最小密度设置为2 , 而对于距离两点之间的最大距离e ,我们动态地去调整参数来获取分类效果最好的e 值.为了验证聚类算法的效果, 我们随机从I ns t a gr amap p 下选取1 〇〇条句子进行聚类分析. 同时让我们组两名同学分别将它们进行人工聚类分析, 将语义相似的句子聚类成一个类别, 对于有争议的句子, 我们通过进一步地讨论来决定句子所属的类别. 在实际的人工聚类的过程中, 发现有8 5 个句子未出现争议. 由于e 取值范围在0 和1 之间, 所以我们在进行调参时将其取值设置为n X O . 1. 通过设置不同的e ,然后比较聚类的结果, 我们得到最佳的e 值为〇. 5 ,此时. Ma c ro fVe 为0 .  7 8. 为了进一步获取更好的分类效果. 我们进一步对e 进行微调. 最后得到最佳e 值为0 . 5 5 , 此时iWa cro /Ve 为0 . 8 6 , 达到最好的效果.在确定好最佳的e 值后. 我们对In s t a gr a m 下面的1 0 0 5 0 个句子进行聚类分析, 得到的簇数目为1 3 0 4 , 极大减少了用户评论中的冗余信息. 表9 展示了我们聚类句子的一个示例, 我们可以从中看到, 在聚类类别1 4 0 中, 虽然用户表达所用的词语不同, 但是其语义却是相似的, 都是表达视频和音频的播放问题, 而类别1 3 6 表达的是用户喜欢这个社交媒体平台, 语义也非常相似. 这表明我们评论聚类效果可以很好支撑后续的开发者意见推荐.表9 基于D BS CA N 的句子聚类句子i d 评论句子 簇3 9 3 0s o m eti me sp l a yv i d e oe n da u d io k e epg o ex itc o m p l et e l y .1 4 03 2 5 4p r o b l e mr i g h t vi d e o  l oa d p l a y k ee p s c r o l l  vi d eok e ep  p l a y v id e o .1 4 01 1 1 1a l s o  s o me t im es  a ud io  st o p v i d eo  k ee p p l a y ba c k ?g r o u n d sc r o l l .1 4 048 90 p r o b l e mvid eo k ee p p l ay  so u n d sc r o l l p o st . 1 4 01 0 8 1 l o v eb e st  s o ci a lme d i u mp l a t fo r m . 1 3 61 6 4 1 o n eb e st s o ci a lme d i u mp l a t fo rm . 1 3 6为了更好地展示我们的聚类效果, 我们使用文献[3 9] 提出的一种有效的降维方式“t- SN E” 技术来可视化我们的聚类效果, 当数据维度高于2 维时, 聚类结果可以以二维的方式展示出来. 图7 可视化了I ns t ag r a m 下评论句子数目较多十个聚类簇. 可以发现, 我们的聚类算法可以很好地聚类语义相似的句子. 高效的聚类语义相关的句子可以提高为开发者推荐用户评论意见的准确性.图7 丨n st a g r am 评论句子聚类效果可视化R Q 3 : 我们对用户评论的意见推荐是否能高效地为开发者进行a p p 的维护和更新提供真实参考?我们分别从A RICA 有效性分析和讨论来评估我们的模型是否有助于开发人员分析用户反馈.( 1 ) 有效性分析本节我们通过Ap pa n n i e ( — 个包含对G o o g l eP l ay 以及Ap p l eA p pS to r e 中a pp 的数据分析平台) 中的应用程序的更新日志来验证我们对用户评论推荐的有效性. 特别的, 为了验证A RI C A 的可行性和高效性, 我们特意选取了和意图分类不同的其他a p p 的用户评论来进行验证分析. 值得注意的是,通过检查a pp 的更新日志发现, Go o gl e Pl a y 中a pp在更新时有的开发者不写更新日志, 或者只是粗略地描述a p p 的更新情况, 比如更新日志中只写了2 1 9 8 计算机学报 2 0 2 0 年“Bug fi xe sa n dp e r f orma nc ei mp rov em en t s”, 其中的bu g 和性能改进内容不够具体, 无法对A R ICA进行验证. 因此, 我们在检查这些应用程序的历史更新日志时, 手动删除以上没有具体修改信息的日志.最后, 我们选择了 Fr e eRi ng to ne s 和Dee z e r M u s i cP la y e r 2 个a p p 进行实证分析验证, a pp 详细信息如表1 0 所示?表1 0 更新日志数据集A p p 名字 类别 评论数 时间段 版本数D ee ze r Mus i cP l a y e rMu s i c S- A u d i o 1 3 8 3 42 0 1 8 . 0 3 .0 5 ?2 0 1 9 . 0 1 . 2 435F r e eR i n gt o n e s Mu s i c &- A u di o 8 8 1 32 0 1 4 . 0 2. 2 4 ?2 0 1 9 . 0 1 . 2 476表1 1 展示了F ree R in g ton e s版本7. 1.1和2 0 1 8 年8 月1 4 日, 7 .  2 . 0 版本修复了 a pp 的搜索功能以及增加了新的来电铃声( 表1 1 粗体部分的更新内容) . 这表示我们推荐的评论基本上都有被开发者所处理, 并在相应的下一个版本进行了更新.为了更好地量化我们推荐评论的整体效果, 我们使用如下自定义的衡量指标来验证A RI CA ? 衡量指标Prw Mo /v 表示推荐的准确性, 为推荐的前to p- 々条评论中有多少内容反映在更新日志中, F,,.vW 衡量了fVecho w (. 与7. 之间的平衡,值越高, 表明推荐的评论更精确地覆盖了更新日志, 并且更多的更新日志反映在推荐的t op- A 评论中. 它们计算公式如式( 9 ) 所示:n. .S ( C f] R )r rec t s t o ri c= ̄■ -,7 . 2 . 0 的更新时间及更新内容, 表1 2 为A RICA 推荐的前1 0 条评论句子. 我们手动检查每一个版本识别出的a pp 问题是否可以反映在下一个版本的变更日志中. 根据表1 2 , 我们可以看到用户群体在2 0 1 8 年7 月2 0 日反馈了搜索功能无法工作以及抱怨只有“ 工厂模式” 铃声( 表1 2 的粗体部分) 的评论. 而在表1 1Fre eRing to ne s 更新日志版本 时间 更新日志信息7. 1 . 1 2 0 1 8 . 7 . 0 3( 1)Fu n cti o n a l it y o f  t h e ap p imp r ov e d( 2 )N e w ringto nes p ac ka g e add e d7.  2.  0 20 1 8 . 8 . 1 4( 1 ) Sta bility a nd  reli ability o f t h ea p p impro ved( 2 )F i xed  a n i s su e w it h  t h e sea rch  func ti on.( 3 )N ew ri ng to nesc at e g o r y ad d e d-T h e b es to f 2 0 1 8 . Ch ec kit  o u t .表1 2ARICA 推荐的评论句子时间段推荐的评论句子, 【情感分】, 评论时间( 1 )I  d ow n l o ad ed  t his a p p lica tio n o n my n e wp h o n e so  I c an  h a ve  t h esa me r i n g t on e Id i d o nmy o l d p h o n e. 【一1 】,2 0 1 8 . 0 7 .2 0( 2 )I s aw a s n i p p e to f an o t h err e v ie w t h a tco mp l a i n e dt h a tt h i sa p p l i ca t i o no n l yh a s“fa ct o r y-l i k e”r i ngto nes . 【一2 】, 2 0 1 8 . 0 7 . 2 0( 3 )Mo s t o th er  ringto n e ap p s d o no t h av e an y thi n gIwo u ld e ve n con si d er  usi n g . 【一1 】, 2 01 8 . 0 7 . 20C 4 ) Co u l d n o t b e bo t h e r ed  to  tr y a n d  so r t i t o u tso  u ninst a l l e d it .V er s io n 7. 2 . 0 ,( 5 ) Sea rchfu nc ti on di dn o tw o r k . 【—1 】,即 20 1 8 .8 . 1 420 1 8 .0 7 . 0 8之前( 6 )T he h and f u l  o f t o n es  I  hea r d w er e a wf u l.( 7 ) T h i s  a pp l i c a ti o n i sa comp l et ew a st e〇£ti meju st  d elet e i ta n d  sa ve yo ur me mo r y  sp a c e !( 8 )T hi si s  a h orribl e ap p ,an yt hi ngmo r e o r l es sp o p u l a r ,  or c l as s i ca l , o r p re t t y mu ch  any t hi n gat a l l  yo u  t y p e i nt he s ea rch j u s t d o e s no t a p pe a rto  b e o n t hi s a p p . 【一4 】, 2 0 1 8. 0 7 . 2 0( 9 ) Gre a tq u a l i t y a nd a wi d e v a r i et y o f  st y l e s t ocho o s e fr om.( 1 0 )Ri ngt ones are av ai l ab l e i n“p ack s”t h at m ustb ed ownlo ad ed b ef ore k nowing w h at i si nth em.Rec u ll r=S C C OR )S ( R )( 9 )Fh ybr i d= 2 XPrec i s i o ri c XRe ca ll jPr e c i s io nc ̄\^ Re ca ll T其中, S ( C) 表示更新日志的记录数, S C R ) 为推荐的前t op j 条评论, S ( C H i? ) 为推荐的评论内容中有多少反映了a pp 更新日志中的更改信息. 我们基于上述衡量指标, 在a p p F r ee Ri n gt o n e s 上获得了P m: i s io ? 2 c=0 . 6 6 7 , J? eca "r=0 .4 , F,, y)r,w= 0 ? 6 3 1的效果. 这表明AR I CA 推荐用户评论建议的可行性和高效性.( 2 ) 有效性讨论由于在a pp 新的版本的更新日志可能不会覆盖所有的更改, 但叱代表了 ARI CA 性能的下界[ 2 S], 它不仅推荐了关于a pp 的出现的“s e a r chf un c ti o n”的b ug 评论, 同时也推荐了关于增加铃声包的功能, 至于更新日志中关于a p p 的稳定性和可靠性, 虽然用户一般不会使用类似的评论直接表达,但会通过如评论( 9 ) 所述的内容来间接反映ap p 的质量. 此外, 如表1 2 所示, A R ICA 除了可以识别关于ap p 更新日志的大多数内容, 同时也可以推荐关于信息给予类别的内容, 比如评论( 1 ) , ( 9 ) 和( 1 0 ) 是关于用户给出一些使用a pp 的体验信息, 这些信息对于开发者对用户使用a p p 体验有一个直观的了解, 但一般不会在更新日志中体现. 因此, 尽管我们的方法可能不能覆盖所有的更新内容, 但对于用户重点关注的问题, 都能够很好地检测出来并呈现给开发者.RQ4 : 用户的情感对开发者建议推荐的影响如何?用户的情感倾向直接反映了用户的评论意图,肖建茂等:一种基于用户评论自动分1 1 期 析的 APP 维护和 演化 方 法 2 1 9 9本文我们主要考虑的是情感波谷对评论综合推荐的影响, 表1 3 展示了比较考虑了情感因素和未考虑情感因素对评论推荐的影响. 从中可以看到. 加人了情感分析后, Pre cb / o wc ,■ 和^ 都相应地提高, 这说明用户的情感倾向对于提高评论推荐的准确性具有重要价值.表1 3 情感因素对推荐评论结果的影响衡量指标名字 P rec is io n c ,t o p-々=5Reca l lr ?to p-厶=5Fh yb ridt o p-々=5Pre ci s ion c ?t o p-々=1 0Reca l l r ?t o p- 是=1 0Fh ybri d?t o p- 是=1 0F r e eR i n g to n e s 0 . 6 6 7 0 . 6 0 .6 3 1 0.6 6 7 0 . 4 0 . 5F r e eR in g t o n e s ( 未考虑情感) 0. 6 6 7 0 . 4 0 . 6 3 1 0 . 6 6 7 0 .  3 0 . 4 1 4D eez e rMu s i c P la y e r 0 . 5 0 . 4 0 . 4 4 4 0 . 7 5 0.4 0 . 5 2 2De ezer Mus i c  Pl a y er ( 未考虑情感) 0 . 2 5 0. 2 0 . 2 2 0 . 5 0 . 4 0 . 4 4 4为了更细粒度地说明我们推荐的评论的高效性, 我们分别对推荐评论的前5 和前1 0 个评论计算他们准确度并进行比较, 其中可以发现JVe c■以〇? c变大, 这是因为推荐的评论越多, 越能覆盖a p p 主要的更新信息. 而相反, 可能变小, 比如考虑情感因素情况下, 当t o p- 々= 5 时, Fr e eR i n gt o n e s 的i? eca ZZ T= 〇. 6 , 而在t op- 是=1 0 时为0.4 . 鉴于此, 我们手动的对比分析更新日志和推荐的评论发现, 这是由于更新日志一般只是把当前a p p 版本的重要更新记录( 比如b ug 修复或者增加的新的功能) 展示出来, 给出的日志信息有限, 而我们推荐的评论除了问题发现和特征请求外, 同时包含了信息给予、信息搜寻和其他这3 个类别的评论信息, 这会在? 定程度上降低ap p 整体的但这3 个类别的用户反馈信息同样对开发者具有借鉴意义.图8 展示了A RI C A 为F r ee R i ng t on es 推荐的前t op-々评论对推荐结果的影响( 取前2 1 条) , 可以发现随着to p-々值增加, P rec i s io n(' 先保持0 ?6 6 7 不变, 当to p-々= 1 5 时,= 1, 这表明随着to p- 々增加, 基本能覆盖更新日志中提到的更改信息. 相反, ?Raa / G 则随着to p-々増加而减少, 这是因为A R ICA 推荐的评论不仅包含更新日志信息( 即a p p 主要的更改) , 同时也会包含用户关注的一些其他的内容,而表现出类似的趋势. 本文我们主要关注的是推荐的评论是否可以很好的覆盖ap p 的更新日志, 即所以将t op j 值设置为1 5 , 对于其他的t o p- 々值, 也可以根据开发者的需要动态设置.特别地, 图9 展示了De ez er 情感趋势图, 可以发现在不同的时间段De ez e r 会出现波谷情况, 此时的用户评论理论上更具有代表性. 比如2 0 1 8 . 0 7. 1 2波谷时, 我们检测A RICA 推荐评论的前5 条评论中发现有3 条都是在2 0 1 8 . 0 7 . 0 8 反馈的, 且都是关于a p p 不能播放歌曲的内容, 即用户反馈了 bu g , 这很好地解释了在用户情感波谷时用户的评论包含更重要的信息, 这对综合评论推荐具有重要意义.De ezerDa te图9De e ze r 情感趋势图波谷识别6 有效性挑战在我们的方法实施过程中对有效性存在威胁的因素主要体现在两个方面: 图8t op- 々值对结果影响2 2 0 0 计算机学报 2 0 2 0 年( 1 ) 内部影响因素对于真值集的构造, 我们依赖于容易出错的人工判断, 因为在决定一个句子是否属于某个特定类别时, 存在一定程度的主观性. 为了解决这个问题,我们根据两个注释者的判断建立了一个真值集. 此外, 每个标签类别的定义也被提出来进行了严格的讨论. 当分类出现分歧时, 由第三个人介人来确定句子最后意图分类, 这可以有效地缓解手工标注存在主观性的问题, 从而增加真值集的可信度.( 2 ) 外部影响因素用户评论情感分析是根据a p p 评论信息计算用户评论情感得分, 真实场景下用户的情感并不能完全正确地识别. 此外, 由于af> p 评论随机且大多为短文本, 对于a pp 评论情感分析更加困难, 为此我们使用了Se n t iSt r e ng t h 情感分析工具, 它针对短文本以及非正式语言具有很高的准确性, 这样可以减少情感分析不够准确带来的用户意见推荐影响, 从而提高推荐的效率. 同时, 为了保证我们方法的泛化性,我们选择不同类别下不同版本的用户评论数据进行分析, 在具体进行用户建议推荐时, 我们选择和训练集不同的a p p 用户评论数据进行分析, 以保证我们方法的可用性和泛化性.7 总结和下一步工作应用市场的用户群体评论可以被用来分析应用程序维护和演化的各个方面内容. 及时准确地理解用户意图对于开发人员( 或者a p p 提供商) 进行ap p更新和维护至关重要. A p p 评论提供了一个可以主动收集用户抱怨等反馈的机会, 开发者可以通过用户的反馈来修复对应的b ug 和改进或者增加特定的功能特征来及时改善用户体验.本文我们提出一种自动分析用户群体评论的方法A RI CA 来高效地为开发者提供软件维护和演化的建议. AR ICA 首先将根据用户评论信息进行评论意图分类, 然后根据每个评论意图类别实现评论句子级别的主题分类并聚类, 最后综合考虑聚类句子长度、评论被点赞数、时间维度信息、用户意图信息、情感变化趋势等多维度信息, 对评论进行优先级排序, 并为开发者直接提供更具参考价值的用户评论.在评论意图分类过程中, 分类准确度达到8 0 % , 评论句子聚类过程中获得8 6 % 准确率, 为后续开发者进行意见推荐提供有效支撑. 同时, 我们通过以谷歌官方的a p p 更新日志为落地数据, 实证分析了我们推荐的用户评论建议可以高效为开发者进行后续的a pp 维护和演化提供参考.下一步我们将结合多维度的用户反馈信息, 比如用户和开发者间的邮件记录, 用户在社交媒体评论的a{) p 数据等, 重点考虑用户与开发者之间的交互. 比如结合开发者对a pp 的is su e 或com mi t 等行为, 挖掘用户反馈的b u g 等是否可以在代码层面体现出来, 进而分析用户和开发者之间的潜在协同机制, 从而更好地为ap p 维护和演化提供社会码层面参考.参考文献[ 1 ]I n u k o l l u VN , K es h amo n i D D , K a n g T ,e tal . Fa c to r si nf l u e nci ngq u a lit yo f mo bil ea p p s :Ro l e o f mo b i l ea p pd e ve l o p me n tl i f e cy cl e . In t er n ati o na ! J o u rna l o f So ftwa r eEn gi n e er i n g A p p l i ca ti o ns * 2 0 1 4 ,  5 ( 5 ) : 1 5 - 3 4[ 2 ]G uz ma n E , Maa l ej W , et a l . Howd o  u s e r sl i k e t hi s f ea t u r e ?Afi n egra ined se nti me n ta nal y s i s of  ap p r ev i e ws/ /Pro ceed in gso ft h e 2 0 1 4 IEE EI n te r nati o na l Re q u i r ement sEng i n e eri n gC o n f er e n ce .Ka r l sk r o n a *  Sw e d en ,  2 0 1 4; 1 53 -1 6 2[ 3 ]Pa g a no D , Maa l ejW , e t a l .U se rf ee d b ac ki n t h e Ap pSt o r e :An emp ir i ca l st u d y / / P r o cee d i ng s of t h e 2 0 1 4I EEEI n t e r n a?ti o n al R eq u i r emen t sE ng i nee r i ng Co n fe r en c e. Ri o d e J a n e i r o ,Bras i U2 0 1 3 :  1 2 5-1 34[4 ]Wa n g  Zho n g- Y u a n , C h en g J i an- Pen g , Wa ng H a i- X u n , e t al .Sh o r t t e xt u nd e rs t a nding : A su rv e y . Jo u r n a l o f Co mp u t erResea rc hand  Dev el o pment , 2 0 1 6 , 5 3 ( 2 ) : 2 6 2-2 6 9 ( i n Ch inese )( 王仲远, 程健睹, 王海勋等. 短文本理解研究. 计算机研究与发展,2 0 1 6 ,  53 ( 2 ) :2 6 2 - 2 6 9 )[ 5 ]Yan g H , Li angP . Id en t i fi catio n an dcl a ssi fi c ati on  o freq ui r emen tsf ro m ap p u se r re vi ew s / / P r o ce edi ng s o f t h e 20 1 5  In te r n a ti on alC on fe r e n ceo n  Sof tw a r eEng i n ee ri n g .F i r e n z e , It a l y , 2 0 1 5 :7-1 2[6]Che nN , Li n J , Hoi SCH , et a i . AR-mi n er :Mi n i n g i n fo rmati ver ev i e ws fo rd ev e l o p e r sf r o mmo b i l e a p pm ar k et p l a ce //P r oc eedi n g s o f t h e 2 0 1 5 I n t e r n a tio n al  Co n fe r en ceo nSo f twa r eEn g i n e eri n g .H yd er a b a d ,I n d i a ,  20 1 4:7 6 7-7 78[ 7 ]Maa l ej  W , N ab i l H . Bu g r e po r t,f ea t u r e r eq u e st, o r  simp l yp r ai se ? On a u t oma t i cal l ycl a ssi f yin g ap p r ev i ews/ / Pr o ceed in gso f t he2 0 1 5I EE EI n t e r n atio na l Re q uirem en t s Eng in e erin gCo n fe r en ce. Ot ta w a , Ca nad a , 2 0 1 5 : 1 1 6-1 2 5[ 8 ]Pa n i c hel l aS ? Di  So r b o A , Gu z man E , e ta i. H o wca nii mp r o v e mya p p ?C l as s i fy i n gu s er re v i e ws fo r s o f twa r emai n t ena n ce a n d ev o l u ti o n / /Pro c ee d i n g s o f t h e2 0 1 5I EEEI n te r na ti o n alCo nf e re nce o nSo f tw ar eMai n te na nce an dEvo l u ti o n . Bre me n * G e rman y , 2 0 1 5 : 2 8 1 - 2 90[ 9]G uz man E ,El h a l a byM , Br u eg g eB , et a l .En s em b l emetho d sf or  ap p r ev i ewcl a s s if i ca ti on : An ap p r oach fo r so f twa r e肖建茂等:一种基于用户评论1 1 期 自动 分析 的 APP 维护和演化方法 22 0 1ev o l u ti on / / P ro ceedi ngso f t he 20 1 6 IEE E/ ACMI nt er na ti o na lCo nf er en ce o nA u t o ma t ed So ft wa reEngi n e eri n g.S i ng a po re,2 0 1 6 : 7 7 1- 7 7 6[ 1 0 ]Guz ma nE , Al y0 ?Br u egge B , e t al .Re t r i evi ngd i v ers eo p ini o ns f roma p p  r ev i e ws / / P ro ce ed in g so f t he 2 0 1 5 I nt erna -t i on a l Symp o si u m onEm p i ri ca lS oft wa r eEngi ne eringa ndMea s ure me nt .Be ij i ng * C hi na ,  2 0 1 5 : 1-1 0[ 1 1 ]la co b C , Ha rri so n R ? Fa il y S ? et al.On li nere vi ewsa sfi rstcl a ss a r t ifa ct s i nmo bil ea p p d e v eI opme nt / / Pr oc ee d i ngsof  the6t h  In t er nat io n al Con f er enceo nMob i l e Comp u ti ng * App li catio nsand Se r vi ces . Au st i n , USA , 2 0 1 4 :  4 7- 5 3[ 12 ]Mar ti n W ,Sa r r oF?J i aY , et a l . Asu rv e yo f a pp s to reana l ysi s f o rso f twa re en gi ne ering.IEEE Tr ansa ct i o ns o nSo ft wa re  Engi ne er in g *  2 0 1 7 , 4 3 ( 9 ) :  8 1 7- 8 4 7[ 1 3 ]D iS o rbo A ,Pa ni che l la S ? Al ex and ra CV , et a l .Wha two u ld u s ers ch ange in my  ap p ?Su mma riz i ng a pp r e v i ewsf o rre comme ndi ngs o ft war ec han g es/ /Pro ce ed i ng so f th e2 0 1 6ACM SI GSOFT In te rn a t io n a l S ymp o si um o n t he Fo un d at i o nso f So ft war eE ngi nee r i ng. Was hi ngt o n , U SA , 2 0 1 6 : 4 9 9 - 5 1 0[ 1 4 ]Di S o r bo A , P an ic he l l a S , A le xa nd ria C V ,e t al. SUR F :Su mma ri ze r 〇£ u se r re v i ew sfe ed b ac k/ / Pro c ee d i ngs o f t he2 0 1 7IEEE I nter nat i ona lCo nfe rence  on So ft wa reEi^i neer ing.B u e no sA ir es* Arge nti n a* 2 0 1 7 : 5 5-5 8[ 1 5 ]D ev l i n  J, Ch a ng M , Lee K , et a l . BER T : Pre-t r ai ning o fd e ep b i d i re ct i o n al t ra nsf or mersf o r l ang u age  u nd ers t and i n g//P r o ce ed i n gs o f t he 2 0 1 9Annua lCo nf e renc e o ft he No r thAme ri ca nCha p t e ro f th e A sso ci a ti o nfo rComp u t a ti o n alLi n g u i s ti c s. Mi nne so t a* USA ,  2 0 1 9 : 4 1 7 1- 4 1 8 6[ 1 6 ]H u a ngQi a o , Xi a X i n *L o D *et  al . Au toma ting i n t en t io nmi ni ng .I EEE T ran sac tio ns o n So ft ware En gi ne er in g *2 0 1 8.1 ( 1 ) : 1-2 2[ 1 7]Ant oni o l G* Ay a ri K ? Pen ta M D ,e t al. I s i t a b ugor anen ha ncem ent ? : At ext- b as eda p p ro ac ht ocl ass ifyc ha ngere qu est s/ /Pro c eed i n gso f t h e2 0 1 7 Co n f ere nce o f th eCe nt refo rAd v a nce d S t ud i e s o n Co l l a bo ra t i v eR e sea rch. R i chmo n dH i l l, Cana da, 2 0 0 8 : 3 0 4- 3 1 8[ 1 8 ]Bak i u E *  Gu zma n E. W h i ch f ea t u re i s u nu sa b l e ?De t ect in gu s a bi l i t y a ndu s ere xp e rie nce i ss u esf romu s err ev i ews/ /Pro ceed i ngs o f t h e2 0 1 7 I EEE 25 t h Int er na t io n al Req u i rementsEngi nee ri ng  Co nfe re nceWo r k s ho ps . Li sb o n ? P ortu g al , 2 0 1 7 :1 8 2- 18 7[ 1 9 ]Da b rows k i J ? Le t i erE * Perini  A, et al . Fi ndi i^and  analy zi n gap p  re vi ewsr el a t edt o  spec i fi c f ea tu res :Ar ese ar chp r ev ie w/ /Pro cee di ngs o f t he 2 0 1 9In t erna t i o nal Co nf ere nce onR e qui re?men t sEngi nee rin g : Fo u n d at i o n fo r So ft ware Qua l it y. Ess en ,G erma ny * 20 1 9 :1 8 3-1 8 9[ 2 0]Ci u rumel ea A,  Schauf el b iihl A * Panic hel la S ?  etaLAna lyz ingre vi e wsa nd cod e o f mobil e a p p sf o r b et t er rel ea se pla nning/ /Pr oc eed i ngso f t h e 20 1 7I EEE In te rnati ona l Confe renc eo nSoft wa r eAnaly s is*  Ev o l ut ion a ndRe engin eeri ng. Kl ag enf u rt,Au st ria,  2 0 1 7 :  9 1-1 0 2[ 2 1 ]Dhin akaran VT ? Pu l le R ,Ajmeri N ?eta l. Apprevie w analy s i sv i aa cti v el e a rni ng :R ed uci ngs u p er v isi on e f fo rtwit ho u tcomp r om i sing cl a ssi fi ca tio n ac cu r ac y/ / Pr o ceed i ngs of  t he 2 0 1 8IE EEI nt e rn at i o na lRe q ui rem ent sEngi n eer i ngCo nf ere nce .Ba nf f, Ca nad a* 20 1 8 : 1 7 0 -1 8 1[ 2 2 ]Mes s ao u d  MB ,  J enha ni I ? J e maa NB , et a l. Am u lti-l a b e lact iv e l earni ng a pp r oa ch fo r mobile a pp u serrev i ew  classi fi ca tio n// P roc eedi n g so fth e2 0 1 9 I nte rn a t io nal Co nf ere nc eonKno wle dge Sc i enc e , En gi n eeri ngand  Ma na ge me n t. A t h ens ,Gr e e ce ,  20 1 9 : 8 0 5 - 8 1 6[ 2 3]Kh al id H , Sh i hab E , Na g a p p an M , e t a l. Wha t d om o b il ea p p  u se rs comp l ai n a b o u t ? IE EES o ft wa r e , 2 0 1 4*3 2 ( 3 ) :7 0 -7 7[24 ]Li u Y, Li u L ?Li u  H ,e t al .  Anal yz in gre vi ews g u i d ed  b yap pd e sc ri pti o n sf ort heso ft ware deve l o pme nt a ndev o l u tion.Jo u r nal of So ft wa reMa i nt en an c ea ndEvo lu tio n , 20 1 8 ,3 0 ( 1 2 ) : e2 1 1 2 . l- e2 1 1 2 . 2 2[ 2 5]Sc al ab ri n o S *Ba v o ta G , R usso B *et a l .Li s te n i ng t ot hec rowdfo rt h e r e l ea se p l a nn i ngo fmo b i le ap ps .I EEET ra n sa cti o ns  o nS of t wa re  Engi ne er i ng , 2 0 1 7 ,  4 5 ( 1 ) :6 8 - 8 6[ 2 6 ]Gao C ?Z e ng J ? Ly u MR ,e ta l. On l i ne ap p re v i ew a n al ysi sf o ri den t i f y i n ge me rg i n gi ssu es // P ro ce ed i ng so f th e2 0 X8I EEEI nt e r n at io n a lCon fe r en ce o nSof t war eEng ine eri n g.Go t he n b u rg , S wed e n , 2 0 1 8 :  4 8-58[ 2 7 ]D al p i azF ? Pa re n te M.R E- SWOT :From u s er f eedb ac k tore q u i r em en tsv i a com p et i t o ra na l y si s/ / Pr o c ee d i ngso f t he2 0 1 9 I n t er n ati on a lW o r ki n gCo n f ere nce onR eq ui reme nt sEng i nee ri ng : Fou nd a t io n fo r  Sof tw a re Qu al ity .J eju I sl a nd ,So u t hK o re a,  2 0 1 9 : 5 5 - 7 0[ 2 8 ]D i So rb oA , Pa ni ch el l aS , Vi sa ggi o CA ,e t al. De v elo p men te mai l sco nt e n ta na l y z er : In te nt i o nmi nin gi nd e v e l o p erdi sc u ss ion s/ / Pro cee d i ngs o f t he 2 0 1 5IEEE/ ACM I nt er na?tiona lConf er e nce o nAu tom at edSof t ware Eng i nee ri ng.Li nc ol n . N eb ra sk a *  2 0 1 5 : 1 2 - 2 3[ 2 9 ]Gr a n o G * Merc al d o F ,M erca l d o F .  e t al . An dro i d  apps a ndu s er f eed ba c k:A d a t as et f o r so f twa re e vo l u ti o na nd q ua lit yimp r ov emen t/ / P ro ceed i ngs o f t he 2 0 1 7 ACMSI GSOFT I nt er?na t i ona lWo r k s ho p o n Ap pMa rke t An al y ti c s. W as hi n g t o n  ?US A , 2 0 1 7 :  8-1 1[ 3 0 ]K imY.Co n vo l u t io na l  n eu ra l  ne t wo r ksf o rs ent en ce cla s sifi-ca ti o n / / P r o cee d i ng s o ft h e 2 0 1 4Co nf e renc eo nEm pi ri ca lMe t ho d si n N at u r a lLa ngu a geP ro ce ssing.Do ha ,Qa t ar ,2 0 1 4 : 1 74 6-1 7 5 1[ 3 1 ]Ch ang C- C , Li nC-J.Li b SVM : Al i brar y fo r s u p port v ect o rma chi nes.ACMT ra ns ac ti o ns o nIn te l l i ge nt Sy st e msa ndT ec hnol o gy ,  20 1 1 ,  2 ( 3 ) : 1-2 7[ 3 2 ]Vu PM , Ng u y en TT ,Pha m HV * e t a l .Mi ni ng u se ropi nio n s i n mo b il e app rev ie ws : A ke ywo rd- b a se da p p roac h / /Pro ce edi ngs o f  th e2 0 1 5 I EEE / ACMI n t ern at i o na l Con f e re n ceonAu t oma t edSof twa re Eng i nee ri ng. Li ncol n ,N eb ra ska ?2 0 1 5 : 74 9- 7 5 92 2 0 2 计算机学报 2 0 2 0年[ 3 3 ]Bl ei D M , NgA Y , J o r d a nM I , e ta l . La t e n t Di ri c h l e tal l oc ati o n . J o u r na l o fMac h i ne Le a rn i ngRe s ea r c h , 20 0 3,( 3 ) : 9 9 3 -1 0 2 2[ 34 ]Mi k o l o v  T ? S u t sk e ve r I, Che n K , e t al . D is t rib u t ed  r ep r e?s en ta tio n s  o fw o r d s  a n d p h r a se s a n d th ei r , co m po s ition a l ity .A d va n ce s i n N e u ra l I n fo rma tio n P r o ces si n g S y st em s , 2 0 1 3 ,( 2 6 ) :3 1 1 1- 3 1 1 9[ 3 5 ]E s t erM , K r i eg e l H , Sa n d e rJ , et a l.A d e n si t y- b as edal g o r it h m fo r d i sc o ve r i n g cl u s te r si n l a r g es p a t i a ld a t ab a se swi t h n o i s e/ / P r o cee d i n g s  o f t h e 1 9 9 6 A CM SI G KD D I n t er n a?ti o n a l Co n f er e n ce o n K n o w l ed ge Di s c o v e r y a n d Da ta Mi n i n g .P o r tl a n d , O re g o n , 1 9 96 : 2 2 6 - 23 1[ 3 6 ]K uc u k t u n c ( ) ,C am ba zo g l u BB , Web er I ,et  a l .A l a rg e -s ca l es e n time n t a n a l y sis fo r Ya h o o! an s w er s / / P r o c eedin g so fX I AOJ i a n - Ma o . Ph .D.  ca nd i da t e.H i s ma i nre s ea rc hi n t e re st si nc l u des e rvi c ecom p u t i ng ,in t e l l ig e nt so f tw a ree ng i ne e ri n g.C HE NSh i- Zh a n,P h .D .,a ss oc i a t epr of e s s or .H i sr e se a rc h i n t e r e s t s i n cl ud e s e rvi c e c ompu t inga n d t he s e rvi c e -Ba c k gr ou ndT he r es e a r c hwo r kint hi s pa pe r i s a b o u t mo b ile a p pma i n t e n a nc e a n de volu t i o n.W eh a ve p ropo se da ne f f i c i e n ta u t oma t e d u s e r re vi e wmi n i n ga nd a na l ys i s me t h od , wh i c h i sof  g re a ts i g n i f i ca n c e fo r d e ve l op e rs to ma i n t a i n t he a pp .Th i sme t h od ca n e f f e c t i vel ym i ni n g th e r ev i e w ss u bm i t t e db yt h eu se r i nt h e a p ps t ore , a nd e x t ra c t t he u se f u l i nf o rma t i o n fr omt h er e vi e w sf o rt h ed e velope r .Mo repr a c t i c a l ,t h e me t h odc a n re c omme n dt h er e v i e wsr e l a t e dt ot he appma i nt e n a nc ea nd ve rs i on  upda t e t h a t t h e u s e r mo s t c on c e r n s a nd hope t h ede v el ope r  t op a ya t t e n t i o n t o.B yo u r me t ho d ? t h e la b o rc os tof ma n u a l r e a di ngre v i e ws c a n be g r e a t l yr e d u ce d .Th e p re v i o u sm et h o d o f m i ni ngus e rre v i ew s ist o c la ssif yu se r re v i e ws int od i f fe re nt c a t eg o r i es,a nd t h en co mb i n e wi t ht e xt an al ys i s, n a t ural la ngu a ge proc es sing a nd ot he rt e ch nolog i e st ore a liz e a p pre v i e wi nf or ma t i o nmi n i ng .H o we v e r, th ei n f or ma tio nmi n i n g fr omt he a p pre vi ewb yt he s e me t ho d sge n e ral l yc a n’t be d i r e c tl y f or  d e ve lo pe r s t oma ke  a c t i on a b let h e2 0 1 2 I n t er n a tio n a lCo n f er e nce o n We b Se ar c h a n d D a taMi n i n g . Wa sh i n g t o n , US A , 2 0 1 2 :6 33 - 6 4 2[ 3 7 ]T h el w a l l M , B u ck l eyK . Pa lt og l o uG ,et a l.S en ti me n ts t r en g t h  d et ec t i o ni ns h o rti nf o rma l te xt.J o u r n a l o ft h eA me r ic an So cie t yf o r  I n fo rma tio nScie n ce an d 丁ec h n o l o g y .20 1 0 ,  6 1 ( 1 2 ) : 25 4 4 - 2 5 5 8[ 3 8 ]Th el w a l l M ,B u ck le yK .P a lt ogl o uG ,e ta l.S en ti me n ts t re ng t h d et ec tio n  fo r t h es o ci al Web .Jo u rnal of t he As s o cia tio nfo rI n fo r m ati o n  Sci e n ce a n d Te ch n o l o g y , 2 0 1 2 , 6 3 ( 1 ): 16 3 -1 7 3[ 3 9]De r Ma a t en L V , H in t o n G E. Vi s u a l i z i n g d a t a u s i n g t -S N E.J o u r n a lo fM ac h i n eL ea r n i n g Res ea r c h ,2 0 0 8 ?9 ( 2 6 0 5 ) :25 7 9- 2 6 0 5o ri e n te d a rc h i t e c t u re.FEN GZ hi-Y o ng . P h. D. . pro fes sor. H i s res ea rc h i n te re st si n c l u de k n ow l e d gee n gin e e ri ng ,s e rv i c e co mpu t i n ga n dco mpu t e r c og n i t i on.LIU Pen g- Li ,M . S. c an di da t e .H i smai n res ea rc h i n te re st si n c l u de s e rv i ce c o mpu t i ng , s of t w a re e ngi n e e r i ng .XUE Xi a o . P h . D., pro f e s so r. H i s re se a r c hi n t e re s t si n cl u de s e rv ic ec o mpu t i n ga n d co mpu t a t i o n a le xpe r ime nt .t a sk sf or s u b se q ue nta p pma i nt e nan ce a nd e vol u t io n. Mo reo ve r,t h es e, me t h ods r a re l y p ro vi de  a n in t er a ct i v e t o o l fo rd e ve l op e rst oe a s yu n de r st a n dt h e u se r s’re a l i n t e nt io n .We  be li e ve t h a t o ur re s e a rc h me t ho ds c a n i mp ro v e t h ee f f i c i e n c yo fa u t oma t ed a na l ys i s o fu s e rre v i ew sa t t h et h eo r et i c al lev ela n di d e nt i f yt h e u se r s?r e ali n t e n t ion s. Att h epr a c t i cala pp li ca t i on le ve l , t hi sme t h o dc a np rov i dede v e l ope r s wi t hd i re c t a nd i n t e ra c t i v ea p pma i nt e n a nc e t a sk s,so a s to c o nt i n u o u s l y me e t t h e u s e r sJre a l requ i r eme n t sa n di mp r o v e u se r s a t i s f a c t i o n.Th i s w or kiss up po rt e db yt h e Na t i onalK e yR &- DP r og r amo fC h i na u nd e rG ra n tN o. 2 0 1 7 YFB 1 4 0 1 2 0 1 ,t h eN a t i o n al  Na t u r al Scie n c eFo u n d a t i ono f C h i n au n de rG ra n tN o. 6 1 5 7 2 3 5 0 . t h e Na t i o n al N a t u ral Sci en c e K e yF o u n da t i o nof  C h i n a u n de rG r a n t No . 6 1 8 3 2 0 1 4 a nd t he S he n z he nSc i e n c ea n dTe c h no l o g y Fo un d a t i o n ( J C YJ 2 0 1 7 0 8 1 6 0 9 3 9 4 3 1 9 7 ) .

[返回]
上一篇:一种用于图像检索的多层语义二值描述符_吴泽斌
下一篇:社区环境下基于节点交互和主题的影响力计算模型_王大刚