您好,欢迎来到汇意旅游网。
搜索
您的当前位置:首页一种基于位置社交网络融合多种情景信息的兴趣点推荐模型

一种基于位置社交网络融合多种情景信息的兴趣点推荐模型

来源:汇意旅游网
第34卷第10期 2017年10月 计算机应用研究 Application Research of Compute ̄ Vo1.34 No.1O 0ct.2017 一种基于位置社交网络融合多种 情景信息的兴趣点推荐模型术 陈志雄 ,曾诚 ,高榕 (1.湖北大学计算机与信息工程学院,武汉430062;2.武汉大学计算机学院,武汉430072) 摘要:针对现有位置社交网络兴趣点推荐的研究工作主要集中在挖掘兴趣点的情景信息:时间信息、地理位 置和评论信息,其中评论信息对用户偏好的影响尚未充分研究的情况,提出一个统一兴趣点推荐模型。其融合 了用户偏好模型和上述三种情景信息,对用户偏好建模采用基于签到次数的度量方法,同时对评论信息采用基 于潜在狄利克雷分配主题模型来挖掘用户偏好。实验结果表明,该模型在推荐准确率等多种评价指标上都取得 了更好的结果。 关键词:协同过滤;兴趣点推荐;位置社交网络;情景建模;主题分析 中图分类号:TP301 文献标志码:A 文章编号:1001—3695(2017)10—2978—06 doi:10.3969/i_issn.1001・3695.2017.10.022 UGTM:exploiting various types of contextual information for point—of—interest recommendation on location—based social networks Chen Zhixiong ,Zeng Cheng ,Gao Rong (1.School of Computer Science&Information Engineering,Hubei University,Wuhan 430062,China;2.School of Computer,Wuhan Universi- ty,Wuhan 430072,China) Abstract:Since the existing works of POI(point—of—interest)recommendation on location—based social networks(LBSN)focus on mining context information of POI,including the geographical information,comment information and the temporal informa— tion,which the comment information of user has not been systematically studied.This paper proposed a uniifed POI recom— mendation model,which fused user preference to a PO1 with temporal information,geographical influence and comment infor— mation of irser.The model studied the comment information of LBSN by exploiting the latent Dirichlet allocation(LDA)model and modeled the user preference based on the number of user check—in behaviors.Finally,experimental results in real world social network show that the proposed model outperforms state・・of-'the--art recommendation algorithms in terms of precision and rating error. Key words:collaborative ifltering;point—of-interest recommendation;location—based social networks;context modeling;topic modeling 因为LBSN中用户签到行为有着自己独特的特征,这些特征使 0引言 近年来,随着移动设备、无线网络和Web 2.0技术的飞速 发展,诸如Facebook和Foursquare等基于位置的社交网络(10一 cation—based social networks,LBSN)快速兴起” ,截止2015年 1月,在Foursquare上面已经有超过8千万人进行了至少15亿 LBSN中的用户签到行为建模有别于传统推荐领域的用户行 为建模。与传统的推荐系统相比,基于LBSN的兴趣点推荐系 统具有如下独特的主要属性: a)地理位置影响。地理 的第一个规定:“任何事物都是 相关的,但地理位置相近的事物更相关”。现实中通常访问一 个兴趣点后,往往偏好前往该兴趣点附近的兴趣点访问,即毗 邻的兴趣点比远距离的兴趣点具有更强的地理位置相关性。 次的签到。在LBSN中,用户通过签到这种行为,与好友建立 连接、上传照片,分享他们当前的地理位置和活动。大量的基 于LBSN的兴趣点推荐有效地帮助了那些新用户在LBSN海量 的签到信息中找到他们可能感兴趣的信息,从而使用户获得更 加丰富的社交体验。这一现象引起了学术界的广泛关注,逐渐 b)时序效应影响。时序效应在用户的签到行为中发挥着 重要影响,人们在不同时间点会有不同的兴趣。例如,人们在 工作日和周末通常访问不同的地方。文献[4]中指出,基于时 间信息变化对用户偏好进行建模,该模型相对其他模型在推荐 成为推荐领域研究的热点。 虽然推荐系统已经被学术界深入研究,并在电子商务系统 中得到了广泛应用,如Netlfix中的电影推荐和京东商城中的 效果方面获得了很大的提高。 C)评论内容影响。基于内容的推荐是推荐系统的基本方 法。通过分析用户对兴趣点的评论内容信息可以有效地挖掘 商品推荐等。但是,LBSN中兴趣点推荐系统近年才逐渐流行。 收稿日期:2016—07—15;修回日期:2016—09-07 (2012CB719905) 基金项目:国家自然科学基金青年基金资助项目(41201404);国家“973”计划资助项目 作者简介:陈志雄(1983-),男,湖北武iK/k.,实验师,硕士,主要研究方向为智能推荐、数据挖掘(czxpro@163.con);曾诚(1976 ),男,湖北武 汉人,教授,博士,主要研究方向为服务计算、智能推荐;高榕(1981一),男,湖北荆州人,讲师,博士研究生,主要研究方向为智能推荐、数据挖掘. 第10期 陈志雄,等:一种基于位置社交网络融合多种情景信息的兴趣点推荐模型 .2979. 用户偏好。相关研究工作 指出通过对评论内容的建模可以 目评分矩阵的不同方法,可以把协同过滤算法分为基于内存的 算法和基于模型的算法两大类 引。大多数关于提供兴趣点推 荐的研究工作主要是通过使用上述两种传统的协同过滤算法 技术,使用的数据基础主要基于用户签到数据瞻 -23]和GPS轨 迹数据。。 。然而,大多数上述算法并没有表现出较好的性 地理因素明显影响用户 能,主要原因是这些方法没有适当地考虑一些情景信息。 2)基于地理位置的兴趣点推荐基于兴趣点的签到行为。兴趣点地理因素的建模主要分为: 捕捉到用户兴趣相关的特征(如类别等语义信息),从而改善 推荐效果。 基于上述兴趣点推荐系统的独特属性,现有的兴趣点推荐 算法也都涵盖了上述主要属性的特征,用于扩展基于用户历史 签到的数据来了解用户兴趣的传统推荐算法 ],以便更好地 支持LBSN中的兴趣点推荐任务。例如,Ye等人n叫提出了一 种变异的user—based协同过滤兴趣点推荐算法,此兴趣点推荐 算法在user—based协同过滤框架中集成了用户偏好、地理位置 影响力和社交影响力。Zhang等人H 利用用户与兴趣点之间 a)只考虑用户当前的位置而过滤掉远离用户的兴趣点 引; b)应用地理位置潜在因素或主题模型来获取兴趣点的潜在地 理特征 。更复杂的方法是把签到兴趣点的地理相关性作 的地理位置影响、社交影响和评论内容信息相关性,提出了 ORec兴趣点推荐算法。 虽然近年来研究人员提出了一些兴趣点推荐算法,但是已 有的兴趣点推荐算法存在如下的问题:a)LBSN真实场景中, 用户显性的评分数据很难获得,导致依靠稀疏的评分数据很难 挖掘出用户真正的兴趣和偏好;b)在LBSN中,存在大量的情 为一个常见的距离分布对应于所有的用户,如多中心高斯分 布 、幂律分布 “ ],特别是近期作品 ,” 采用带有固定核 宽的核密度估计方法来为基于每个用户的经纬度坐标兴趣点 地理位置签到的分布建模。 3)基于评论内容信息的推荐大多数工作是基于用户对 兴趣点推荐评论的内容文本信息。文献[38]从兴趣点的标签 中为签到数据提取潜在主题以作出可解释的内容阐述,而文献 景信息(如地理位置、时间、情感偏好等),这些都属于隐性信 息,当进行兴趣点推荐时,如果忽视用户所在场景的这些隐性 信息,那么最终的推荐精准度将大打折扣;c)基于单维度情景 信息的位置推荐,主要是以时间、内容信息以及社会化网络为 主,但是时间因素因为受限于时间的动态变化往往难以建模而 易被忽略 ,基于内容信息的推荐又很容易将内容相似或者 相同的物品推荐给用户 J,另外,基于社会化网络的推荐也 [39]研究表明,可以把每个兴趣点作为一个在评论内容信息 中的词向量,并利用词向量来获得兴趣点之间的相似性,以此 作为签到数据中张量模型的正则化项。更复杂的是文献[13, 4O]中隐含狄利克雷分配(LDA)模型,该模型基于用户的帖子 或者兴趣点的标签来挖掘用户和兴趣点的主题属性,其中每个 主题也是词的分布,然后利用主题属性和词分布来确定用户对 于兴趣点的偏好分数。然而,这些研究工作没有考虑用户对于 兴趣点的情感偏好。根据笔者所知,只有文献[41]的研究中 存在着缺陷 ,即只有基于相同兴趣爱好而形成的社会网 络关系才会对预测用户的兴趣有比较大的帮助。 终上分析,用户的签到行为和时间信息、地理位置信息以 及评论内容信息是高度相关的。虽然一些相关工作对用户在 LBSN上签到行为作了分析,但是它们只涉及到了上面提到的 一提取了来自评论内容信息中用户的情感偏好,并利用它们基于 无监督学习的方法来确定评论内容信息的情感倾向。 4)基于时间信息的推荐 a)绝对时间因素。时间因子已经被广泛应用到了传统的 到两个情景信息,没有能够把上述所有的情景信息集成起来 研究它们的联合作用。而本文主要研究的问题就是如何通过 挖掘和利用时间信息、地理位置信息以及评论内容信息来改善 LBSN中的位置推荐效果,体现出各种情景信息对推荐结果产 生的影响,从而改善用户体验。因此,本文提出一个统一生成 模型,将上述各种情景信息考虑在内。本文的贡献主要包括以 下四个方面:a)提出一个新的融合地理影响、时间等多种情景 信息的统一生成模型,并采用梯度下降法给出了该模型的参数 和具体推导;b)提出一种基于复合度量的加权Jaccrad相似度 计算方法;c)基于LDA模型和吉布斯算法对用户的情感倾向 进行动态建模;d)在真实数据集上测试了该模型在准确率和 召回率等评价指标上的性能。实验结果表明,本文提出的推荐 模型明显优于其他主流推荐方法模型,有效地提高了推荐 性能。 推荐模型中(例如书籍、音乐和电影)。将用户历史评级数据 的时间和预测目标兴趣点签到时间之间的间隔作为一个衰减 因子来衡量评级数据H J。 b)连续时间因素。时间序列也被应用到为用户推荐下一 个兴趣点 的模型中。 c)时间相似关系。文献[43—45]则主要研究用户已经签 到兴趣点的时间和预测目标兴趣点时间之间的关系。 d)周期时间模式。文献[9,35,46]是基于这种时间建模 方式的建模。具体而言,它们将一天时间划分成若干个时间间 隙,例如24 h;继而根据时间间隙和用户签到时间这两个因素 将用户位置签到数据进行分类,并最终得到基于矩阵分解模型 的建模 J、基于用户协同过滤模型的建模 J,或者是基于图模 型的建模 。 总的来说,现有的研究中还没有针对用户同时融合用户签 到信息、时间信息、用户评论内容和地理位置这四大影响因素 的模型,而基于单个情景信息因素的位置推荐模型算法性能又 往往较低,因此,本文提出了一个统一生成的UGTM模型。该 模型的优势在于通过分析用户历史信息,在给定时间和位置的 条件下,通过分析用户的评论文本信息,从而综合推断用户当 前和未来最有可能去哪个兴趣点的位置。事实上,现实生活中 的用户行为本身就是一个受到各方面影响,最终作出最优选择 的动态过程,本文提出的模型实际上也更贴近于用户的真实行 为情景。 1 相关知识 随着社交网络的飞速发展,兴趣点推荐在各个社交网络中 迅速普及。本章主要回顾与本文研究内容相关的几种主要类 型的兴趣点推荐算法的最新进展。兴趣点推荐的大多数研究 工作都围绕着时间、用户签到信息、评论内容信息和地理位置 这四个方面。 1)基于协同过滤技术的推荐系统协同过滤(cF)Ⅲ 的方法已经在推荐系统的研究方面取得了巨大的成功,因为 CF的方法是领域的且只需要过去用户活动的历史(即用 户一项目评分矩阵)加以应用就能作出推荐。根据用户一项 ・2980・ 计算机应用研究 第34卷 2基于用户情景信息的建模 2.1 基于用户签到信息的建模 ㈩ 2.4基于用户情感倾向的建模 基于LBSN对评论的文本内容信息进行挖掘进而发现用 户潜在的情感倾向,这种方法是十分有效的。利用狄利克雷分 配模型,计算目标用户评论的潜在主题概率分布,从而得到用 是基于用户签到信息来计算 首先,用户U 、‰ U,其中U为用户的集合。兴趣点1 L,其中L表示兴趣点的集合。 用户u 对候选兴趣点 的签到可能性,基于协同过滤模 型 …,公式表示如下(用c =l表示用户 已经在兴趣点 签到,用c =0表示用户 没有在兴趣点Z 签过到): 2wl×Ci, j, = (1) “ 其中: 是用户“ 和用户“ 之间的相似度权重。Jaccard相 似度计算方法如式(2)所示。 n, 1 … 可 , 其中:,表示全部项目空间;, 表示用户u 签到过的地点集;, 表示用户u 签到过的兴趣点集;l, n, I表示用户 和用户 u 都签到相同兴趣点的个数;I u I表示用户“和用户 所有签到兴趣点的个数。 同时鉴于用户访问次数越多,评分越高,其对兴趣点的兴 趣度也越高的事实,引入用户签到次数这个概念,将签到次数 作为一个权值和式(2)进行结合,得到一种基于用户签到次数 的加权Jaccard相似度计算方法,如式(3)所示。 ,1 J— JI(卜— 、 ) J ∈, . … (3) 其中:R 、R…分别表示用户 、u 对于兴趣点 的签到次数; , :{i∈II{i∈,lR ≠ and R ≠ }}表示用户“ 、u 的共 同签到兴趣点的集合;R…表示用户对兴趣点签到的最多次 数;R 表示兴趣点 的被签到的最多次数。 2.2基于地理影响信息的建模 本文利用GPS地理坐标对来捕捉用户地理位置的影响, 公式如下: 其中 1。 l。 1.。 1.。是位置f 和l ,的GPS坐标对。 2.3基于时间影响的建模 时问的影响对于位置推荐来说十分重要,如同文献[4]研 究显示,人们的活动在时间上往往体现出很强的周期性,特别 是在一天中,例如人们在酒吧消遣的时间大多数是在晚上而不 是早晨。本文把时间的历史签到行为考虑进来,但不是所有时 问的历史签到行为。因此给定一个用户 ,在某一天的时间t, 对于未签到过兴趣点f推荐的计算公式为 ∑ 一 ,z (5) 其中: 称为用户“和用户 在时间t的签到行为相似度, c ,f=1表示用户 已经在地点 于时间t签到~C =0表示用 户 没有在地点l于时间t签到。因此,根据余弦相似度的计 算公式得到 的计算公式为 户的动态兴趣模型。给定一个有 篇文本的评论集合D,共 包含K个主题。,N个单词W。 a)对主题变量 进行Gibbs抽样,经过参数估计,间接得 到0和 。其中,对于每个文本d∈D,随机变量0服从狄利克 雷分配模型分布,得到文本d上主题的多项分布参数0,每个 文档用LDA生成的概率为 p( )=f p(口)(兀l Zp(z f )p( Izk))dO (7) b)M个文档集合D用LDA生成的概率为 p(D) lJ p( ( 17 ( 10m)p( mIzm^))dOm ( ) C)采用吉布斯采样算法,反复迭代,进行推导得到0和 的近似值0和 。 驴= (9) 趣 j= n 十』 (10) 其中:n 表示主题 包含词语 的个数;n 表示主题 包含所 有的次数;n 表示文档d中所有包含的词数;n 表示文档d 中分配给主题 的次数;OL=50/K。 令E={e ,e ,…,e }表示用户Ui评论集合,则该用户对主 题的情感倾向分布U 公式为 £= (11) c .p( ) (12) 其中:p(e,//,)表示用户U 对主题z 的情感倾向;由 个主题概 率组成的向量 ={S S ,…,S。 }表示评论e的主题概率分 布;e∈E为一条评论。 3统一框架 不失一般性,本文采用rain—max标准化对原始数据进行处 理,将评分值映射到[0,1]空间,min—max标准化公式如下: ) 其中对序列 。, :,…, 进行转换,则新序列Y ,Y2,…,Y [0,1]。因此,根据式(12)对 : 、; s ,,,、; 、 进行转 换,公式为 ,  ,120 axF c —c :。 =  ,, nlaxi, c f—c: f 。 ) max r c: tf—c t T = ,  ,, max ,r c .:一 c . 第10期 3.2统一模型 陈志雄,等:一种基于位置社交网络融合多种情景信息的兴趣点推荐模型 ・2981. 本文实验环境为:Windows7(64位)操作系统,4 GB DDR3 内存,Intel CPU i3 M350 2.27 GHz CPU,实验程序使用MATA. LAB 2014版本。 |fl z+ , 如上所述,本文提出一种线性统一生成框架来集成这四种 信息应用于推荐模型中,公式为 Cu,g,e,t,f=(1一p—y一 )c 4.2评价标准 (18) 卢c ,f y c . + c ,f a)为了验证推荐的性能,实验首先从算法的执行效率和 实际效果两方面评估。召回率用来评估推荐算法的执行效率, 体现的是用户所喜欢的推荐对象能被推荐的概率,计算公式为 上述三个权值参数卢、 分别表示了地理影响、时间信 息、情感诱因相对于用户偏好的重要性。 =1完全依赖于地 理影响的预测, =1完全依赖于时间信息的预测,or=l完全 1 依赖于情感倾向的预测。 recall@n=寺∑ /B (25) 3.3参数推导 其中: 表示推荐t叩列表中用户所喜欢的推荐对象的数量; 梯度下降法是求解无约束最优化问题一种最常用的方法。 曰 表示测试集中用户u所喜欢的推荐对象的数量。 通过梯度下降法,本文将式(18)基于多元线性回归进行如下 b)效果评估。推荐准确率反映了推荐效果与用户反馈的 转换,即 契合程度。对推荐结果的准确率作出如下定义: |I善( )=^ ( )= l I+ 2+Osx3+04 4 。 (19) 1 precision@N=寺∑ /L (26) J Ⅱ ‘ 其中: h( )=c cIf 其中:J7、 表示推荐t叩列表中用户所喜欢的推荐对象的数量; 01xl=(1一卢一’,一 )c ^f,f, 2=卢c ^fI2 表示推荐列表的长度。 03x3=’,c 叫.fl04x4 c Ie, MAE主要根据用户的预测评分和实际评分衡量评分预测 对于损失函数: 的准确性,其定义如下: (8)=,(0l,02,…,0 )=÷ (h日( “)一Y‘‘ )) (2o) MAE=∑I 一P I/Nt t (27) ‘ i 利用梯度下降法得到最优化参数: 其中:rl表示用户对项目i的实际评分;p 表示用户对项目i的 (1一卢一 一 )= 1一A 1善(^e( ‘“一y‘‘’)) (21) 预测评分; 表示测试集中的评分数量。 t3=02一^ f ( p( “ 一y“ )) (22) 4.3实验设计 本文选取四种主流算法与本文提出的算法作为对比。 03一^ (^ ( “ 一Y“ )) (23) 、 a)基于用户偏好的兴趣点推荐算法(u)。文献[48]提出 :04一A—m i:1L∑(^ x )一Y‘  ’)) {的基于用户签到数据和地理信息进行推荐,没有考虑任何其他 ’  ’ (24) 情景信息。 4实验结果与分析 b)基于用户偏好、社交关系的兴趣点推荐算法(US)。文 献[49]提出的基于社会朋友关系影响来进行兴趣点推荐。 4.1 实验数据集及实验环境 c)基于用户偏好、社交关系、地理影响的兴趣点推荐算法 实验中,本文使用两个真实的数据集,即Www数据集和 (USG)。文献[10]提出的基于地理影响信息融合用户偏好和 USA集。其中www数据集 是利用Twitter的API从Twitter 用社会关系来进行兴趣点推荐。 上抓取的2012年11月1日一2013年2月13 13的3 478 394 d)基于用户偏好、地理影响、时间信息的兴趣点推荐算法 条数据。这些数据来自于Foursquare的用户,将他们的账号与 (UGT)。文献[46]提出的基于时间信息,并且把时间信息定 他们的Twitter关联,当他们在Foursquare上签到时,包含地理 义在某一天,继而融合用户偏好、地理影响来进行兴趣点推荐。 位置的消息也会被推送到他们的Twitter上。USA数据集 实验1 不同特征向量维度下的算法结果 是Geotext数据集,这是一个公开的数据集。由卡内基梅隆大 如图1—4所示。实验首先比较了各种算法在不同的特征 学的研究人员发布,包含带有地理标记微博用户的评论消息, 向量维度下的结果。图中横轴Ⅳ表示推荐个数,纵轴pre@N 其中地理位置标志符来自美国地区的地理标志。 表示不同推荐个数时相应推荐算法的准确率,纵轴rec@N表 为了验证推荐算法的准确性,对于两个数据集本文都进行 示不同推荐个数时相应推荐算法的召回率。在实验中,分别设 预处理,仅保留了每天至少访问五个位置的活跃用户,同时将 定了特征向量维度N=5、10、15、20,算法的其他参数均设置为 各种数据分为训练集和测试集。训练集用来学习或训练推荐 使各算法最优时的相应值。本文给出了算法在不同特征向量 方法中的相关参数;测试集用来验证推荐的准确性。为了保证 维度下,准确率与召回率的比较结果。从实验结果可以看出: 在训练集和测试集中都有评分数据,本文也按一定的比例随机 a)随着Ⅳ的增大,算法性能都有一定的提高。但是需要 地将两个数据集分为训练集和测试集。本文实验中按8:2的 指出的是,Ⅳ的增大在一定程度上会增加模型的时间复杂度。 比例将数据随机地分为训练集和测试集。各种数据集包含的 b)US、USG、UGT、UGTM与U相比有了较大的提高,进一 详细内容如表1所示。表l中数据集都是经过了预处理的。 步说明各种环境信息和用户(产品)之间的关系信息对传统的 表I实验数据集 协同过滤算法性能的提高起着较大的作用。 c)US比U性能有所提高,这主要是US中显示的社交关 系比较稀疏造成的。与USG和UGT相比,us的结果则稍差 些,可以看出us对算法的提高起到的作用没有USG和UGT 那么明显。 ・2982・ 计算机应用研究 第34卷 d)USG并没有UGT和UGTM的性能高,这主要是由于 USG并没有考虑到时间信息,另外,USG并没有考虑用户的情 感倾向对最终性能的影响。 e)UGTM比UGT有了进一步的提高,说明本文提出的影 响关系可以有效地提高算法的性能。另外,由于UGT只需要 简单的时间信息,从信息的获取以及可应用范围来讲,UGT也 具有很强的优势。 : o 0 0 图1基于www数据集的 图2基于wWw数据集的 准确率实验对比结果 召回率实验对比结果 0 0 0 蕾。 莹0 o 0 图3基于USA数据集的 图4基于USA数据集的 准确率实验对比结果 召回率实验对比结果 实验结果表明,UGTM与传统的u相比有了较大的提高, 充分说明了本文提出的影响关系的合理性和有效性。相较于 USG、UGT以及U,本文算法虽然在性能上没有十分显著的提 高,但在实际的推荐系统中,USG和US所需要的社会网络关 系或标签信息往往较难获取或极其稀疏,UST只能比较容易地 获取时问信息,因此本文算法的实际应用场景更为广泛。对于 UGTM算法,由于需要采用梯度下降法进行参数估计,并且是 基于LDA模型对用户的情感建模,所以无论在准确率还是召 回率上,UGTM算法性iiii比其他几种推荐算法性能更好。 MAE是评价预测评分准确性的标准,它反映的是算法的 预测与用户实际的贴近程度。因此MAE的值越小,表示系统 的推荐效果越好。图5给出了MAE随推荐列表维度的变化情 况。可以看出,UGTM算法在不同的推荐列表长度下都能取得 较好的结果。 0.6 0.5 o.4 O.3 0.2 0.1 mark rate 图6基于WWW数据集的 准确率实验对比结果 mark rate mark rate 图8基于USA数据集的 图9基于USA数据集的 准确率实验对比结果 召回率实验对比结果 5结束语 本文利用用户在基于位置的社交网络上的签到数据,提出 了一种新的统一兴趣点生成推荐模型。采用LDA模型对用户 的情感进行建模,同时引入签到次数的概念,基于加权Jaccard 相似度计算用户偏好。通过对用户的多种情景信息的挖掘,解 决了融合多种情景信息进行兴趣点推荐的问题。实验结果表 明,本文提出的统一推荐生成模型有效地融合了多种情景信 息,能够提高推荐的准确度,且优于现有主流推荐方法。下一 步计划将更多的兴趣点相关信息如类别信息等融人到模型中, 进一步提高兴趣点推荐准确度。随着近几年深度神经网络 (即深度学习)被用于各种情景信息和文本内容的研究,深度 学习也相应地应用到了推荐问题中。因此,未来将深度学习技 术融人到推荐模型中也是一个非常有趣的研究方向。 参考文献: [1]罗军舟,吴文甲,杨明.移动互联网:终端、网络与服务[J].计算机 学报,2011,34(11):2029.2051. [2]孟祥武,胡勋,王立才,等.移动推荐系统及其应用[J].软件学报, 2013,24(1):91—108. [3]MillerH J.Tobler’sfirstlaw and spatial analysis[J].Annals ofthe Association 0{American Geographers,2004,94(2):284-289. [4]Koren Y.Collaborative iflteirng with temporal dynamics[C]//Proc of the 15th ACM SIGKDD International Conference on Knowledge Dis— covery and Data Mining.New York:ACM Press,2009:447 456. 【5]Gao Huiji,Tang Jiliang,Hu Xia,et a1.Content—aware point of inte— rest recommendation on location—based socila networks[C]//Proc of the 29th AAAI Conference on Artiifcial Intelligence.New York:ACM Press,2015:1721—1727. [6]Leung K W T,Lee D L,Lee W C.CLR:a collaborative location re— commendation framework based on co-clustering[C]//Proc of the 34th International ACM SIGIR Conference on Research and Develop一 ]nent in Information Retireva1.New York:ACM Press,201 1:305—314. [7]Liu Bin,Xiong Hui.Point-of-interest recommendation in location based social networks with topic and lcoation awareness[C]//Proc of the 10th SIAM International Conference on Data Mining.New York: ACM Press,2013:396—404. [8]Zheng V W,Zheng Yu,Xie Xing,et a1.Towards mobile intelli- gence:learning from GPS history data for collaborative recommenda- tion[J].ARificial Intelligence,2012,184—185(2):17—37. ・2996・ 计算机应用研究 第34卷 表3基于用户交互社交网络意见领袖的核心率 the diffusion of technological innovation:a social network approach [J].Technological Forecasting and Social Change,2012,79 (1):97—106. [2]Bai Wenjie,Zhou Tao,Wang Binghong.Immunization of susceptible— infected model on scale—free networks J].Physica A:Statistical 最后本文采取特征融合的方法对两种社交网络中节点的 Mechanics and Its Applications,2007,384(2):656—662. 四种统计量值进行融合,其使用的带权平均公式为 1 LYi — 3did  = [3] Kitsak M,Gallos L K,Havlin S,et a1.Identiifcation of influentila spreaders in complex networks[J].Nature Physics,2010,6(11): 888.893. 其中:d 是每种网络使用统计量计算节点的值;L为构建网络 [4]王珏,曾剑平,周葆华,等.基于聚类分析的网络论坛意见领袖发 方法的个数;6 表示每种网络对节点统计量值的权重。采取投 票表决的思想,当两种网络对QQ群意见领袖的影响都相等即 :6 =o.5时,融合后意见领袖的核心率提高很小。由表2 与3对比可知,基于应答关系网络对QQ群意见领袖的影响较 大,所以本文采用6,=0.75,6 =0.25进行特征融合。 使用上述特征融合的方法,得出融合后意见领袖的核心 率,如表4所示。两种方法融合后将准确率提升了11.5%左 现方法[J].计算机if-程,2011,37(5):44-46,49. [5]丁雪峰,胡勇,赵文,等.网络意见领袖特征研究[J].四川大 学学报:工程科学版,2010,42(2):145—149. [6]Bodendoff F,Kaiser C.Detecting opinion leaders and trends in online communities[C]//Proc of the 4th International Conference on Digital Society.Washington DC:IEEE Computer Society,2010:124-129. 【7]Song Xiaodan,Chi Yun,Hino K,et a1.Identifying opinion leaders in the bfogosphere[C]//Proc of the 16th ACM Conference on Information and Knowledge Management.New York:ACM Press,2007:971-974. 右。研究发现,在融合QQ群用户交互社交网络的节点重要性 特征后,能够达到更好的意见领袖发现效果。 表4融合用户交互网络后意见领袖的核心率 [8]Miao Qingliang,Zhang Shu,Meng Yao,et a1.Domain—sensitive opinion leader mining from online review communities[C]//Proc of the 22nd Intemational Conference on World Wide Web.New York:ACM Press. 2013:187—188. [9]WordNet[EB/OL].[2013-04—11].http://wordnet.princeton.edu/. [10]HowNet[EB/OL].[2013-08—11].http://www.keenage.con1. [11]哈工大社会计算与信息检索研究中心同义词词林扩展版[EB/ OL].[2012.07-02].http://www.datatang.corn/data/42306/. [12]NT-USD[EB/OL].[2013—08—02].http://www.datatang.com/da— ta/443 17/. 4结束语 本文综合使用了文本挖掘技术和社交网络分析方法,对一 种典型移动社交网络QQ群中的意见领袖进行了研究。本文 首先按照褒贬义构建了回应词词库,基于回应词词库对QQ群 数据进行话题分割,构建了用户间的应答关系网络;其次,对该 网络采用常用的四种节点重要性统计量进行分析,得出了意见 [13]Knuth D E,Moms J H,Pratt V R,Fast pattern matching in stirngs [J].SlAM Journal on Computer,1977,6(2):323—350. [14]BoyerR S,Moore J s.A Fast stirng searchingalgorithm[J].Commu- nications of the ACM.1977,20(10):762-772. [15]Kilpelainen P.Set matching and Aho—Corasick algorithm[J].Biose- quence Algorithms,2005(4):1—24. 领袖的核心率。鉴于单从回应词构建的社交网络不能涵盖用 户交互这一有用的信息,提出使用用户交互社交网络的中心性 特征进行分析;最后,使用带权平均法融合两种方法提供的不 同维度特征,从而能够达到更好的意见领袖发现效果。 参考文献: [1]Cho Y,Hwang J,Lee D.Identification of effective opinion leaders in (上接第2983页) [16]Fushimi T,Saito K,Kimura M,et a1.Finding relation between Page— Rank and Voter model[C]//Proc of the】1 th International Conference on Knowledge Management and Acquisition for Smart Systems and Services.2010:208—222. [17]Lyu Linyuan,Zhang Yicheng,Yeung C H,et a1.Leaders in social net— works,the delicious case[J].PLoS ONE,2011,6(6):e21202. puter Society.20l2:1038—1043. [39]Zhao Yiliang,Nie Liqiang,Wang Xiangyu,et a1.Personalized recom— mendations of locally interesting venues to tourists via cross—region 【45]Xue A Y,Zhang Rui,Zheng Yu,et a1.Destination prediction by sub— trajectory synthesis and privacy protection against such prediction  lC I//Proc of the 29th IEEE Intenmtional Conference on Data Engi. neering.20l3:254—265. community matching[J].ACM Trans on Intelligent Systems& Technology,2014,5(3):1—26. [40]高榕,李晶,杜博,等.一种融合情景和评论信息的位置社交网络 兴趣点推荐模型[J].计算机研究与发展,2016,53(4):752—763. [41]Yang Dingqi,Zhang Daqing,Yu Zhiyong,et a1.A sentiment—enhanced personalized location recommendation system r C]//Proc of the 24th ACM Conference on Hypertext and Social Media.New York:ACM Press,2013:119-128. [46]Yuan Quan,Cong Gao,Ma Zongyang,et a1.Time—aware point—of-into— rest recommendation『C]//Proc of the 36th International ACM SIGIR Conferenee on Research and Development in Information Retrieva1. New York:ACM Press.2013:363—372. [47]Yuan Qnan,Cong Gao,Zhao Kaiqi,et a1.Who,where,when,and what:a nonparametric bayesian approach to context—aware recommen— [42]Cheng Chen,Yang Haiqin,LⅦM R,et a1.Where you like to go next: successive point.of-interest recommendationfC]//Pmc of the 23id' Inter. national Joint Conference on Artificial Intelligence.2013:2605.2611. dation and search for Twitter users『J].ACM Trans on lnfom1ation Systerns,2015,33(1):l-33. [48]Liu Bin,Fu Yanjie,Yao Zijun,et a1.Learning geographical prefe— reDoes for point—of-interest recommendation I C 1//Proc of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press.2013:1043一l051. [43]Monreale A,Pinelli F,Trasarti R,et a1.WhereNext:a location predic— tor on tmjeetory pattern miningl C 1//Proc of the 15th ACM SIGKDD InternationaI Conference on Knowledge Discovery and Data Mining New York:ACM Press,2009:637.646. [49]Ying J J C,Kuo Wenning,Tseng V S,et a1.Mining user check-in be— havior with a random walk for urban point.of-interest recomnlendations [44]Noulas A,Scellato S,Lathia N,et a1.Mining user mobility features for next place prediction in location.based services『C]//Proc of the 12th International Conference on Data Mining.Washington DC:IEEE Corn. [J].ACM Trans on Intelligent Systems and Technology,2014,5 (3):l-26. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- hids.cn 版权所有 赣ICP备2024042780号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务