推荐算法（5）利用社交网络数据

2024-05-09 12:23:12

影响用户相信某个推荐结果的因素，90%的用户相信朋友对他们的推荐。基于社交网络的推荐可以很好的模拟现实社会。所以利用社交网络数据进行推荐可以增加用户对系统的信任度。另外利用用户在社交网络的数据可以解决冷启动问题。

1.社交网络数据来源：
1.电子邮件（联系人通信）
2.用户注册信息（公司信息，居住信息）
3.用户位置数据（网页IP和用户手机GPS；给定位置信息后，可以查表知道用户访问时的地址）

2.社交网络数据简介
图G(V,E,w)定义一个社交网络，V表示顶点集合，表示用户，E是边集合，表示两个用户是否有关系，w表示了边的权重。以Facebook为代表的需要双向确认的网络，可以用无向图表示；以Twitter为代表的社交网络只需要单方面关注，所以需要用有向图表示。

双向确认的社交网络数据：Facebook，用户A,B之间形成的h好有需双方确认。
单向关注的社交网络：微博，Twitter，用户单向关注。
社交网络数据：双向确认；单向关注；基于社区的社交网络数据（同一个公司的人）

3.基于社交网络的推荐
利用用户的社交网络数据进行推荐，主要是源于：
1.好友推荐可以增加推荐的信任度
2.社交网络可以解决冷启动问题

3.1基于领域的社会化推荐
（1）最简单的方法是给用户推荐好友喜欢的物品集合，用户u对物品i的兴趣pui可以通过如下公式计算：

其中out(u)是用户u的好友集合，如果用户v喜欢物品i，则rvi=1,否则为0

（2）当然，不同好友之间的熟悉度和兴趣相似度是不一样的，因此应该在推荐的时候把这个考虑在内：

这里的wuv由两部分相似度构成，一部分是用户u和用户v的熟悉程度，另一部分是用户u和用户v的兴趣相似度。
其中，用户u和用户v的熟悉程度由如下公式度量，即他们之间的共同好友比例：

而用户u和用户v的兴趣相似度由如下公式度量，即他们喜欢的物品重合度：

*Wuv = familirity(u,v)similarity(u,v)

3.2基于图的社会化推荐算法
用户的社交网络可以表示为为社交网络图，用户对物品的行为可以表示为用户物品二分图，而这两种图可以结合成一个图。如下图所示：

在定义完图中的顶点和边后，需要定义边的权重。其中用户和用户之间边的权重可以定义为用户之间相似度的α 倍（包括熟悉程度和兴趣相似度），而用户和物品之间的权重可以定义为用户对物品喜欢程度的β倍。
如果希望用户好友历史行为对推荐结果影响大，则选大的α
如果希望用户历史行为对推荐结果影响大，则选大的β

3.3信息流推荐：
每个用户都有一个信息墙，展示了用户的好友最近的言论。信息流的个性化推荐就是进一步帮助用户从信息墙中挑选有用的信息。目前最流行的信息流推荐算法时Facebook的EdgeRank。

4.给用户推荐好友
4.1基于内容的匹配
：常用内容属性包括，用户的人口统计学属性（年龄、职业、性别等）；用户的兴趣（喜欢的物品和发布过的言论）；用户的位置信息（用户住址、邮编、IP等）；

4.2基于共同兴趣的好友推荐：
利用UserCF的思想，如果两个用户喜欢相同的物品（比如微博），就说明他们具有相似的兴趣；此外，也可以根据用户在社交网络中的发言提取用户的兴趣标签，来计算用户的兴趣相似度。

4.3 基于社交网络图的好友推荐
这里主要介绍基于社交网络图的好友推荐，最简单的方法是给用户推荐好友的好友。主要用来给用户推荐他们在现实社会中互相熟悉，而在当前社交网络中没有联系的其他用户。

通过用户u和用户v的出度和入度，定义Wuv。根据相似度Wuv进行推荐
有下面几种方法计算相似度：
1.Wout(u,v) 越大表示u,v关注的用户集重合度越大

对于用户u和用户v，用共同好友比例计算相似度：

其中out(u)是在社交网络图中用户u指向的其他好友的集合。

2.Win(u,v)越大表示关注u,v的用户的集合重合度越大

也可以定义in(u)是在社交网络图中指向用户u的用户集合，此时可以定义另外一种相似度：

3.Wout,in(u,v) 越大表示u关注的用户中，有多大比例也关注用户v
这个是用户u关注的用户中，有多大比例也关注了用户v：（在该相似度下所有人都和名人有很大相似度）

.Wout,in(u,v)上面公式的一个缺点在于，所有人都和名人有很大的相似度。因此可以用如下方法改进：

视频号的分发机制是什么？视频号怎样才能上热门

说我做的额,做我说的.拒绝市面上所有套路回答,常规回答!分享自己时间出来的认知,绝对纯干货,没有任何保留!!先看一张图,如下: 只讲干货,不说费话.同意的点赞.双击屏幕一 .社交分发社交推荐想必都不陌 ...
视频号6大机会，是时候学习视频号创业了吗？

第一大机会视频号,点赞就是分享.任何人点赞你的视频,就会自动分享给自己的微信好友圈子,属于强关系传播,效果精准,容易变现. 视频号第一大机会第二大机会视频号,任何一个视频,都可以嵌入公众号链接. ...
不仅只有二手，闲置物品交易平台玩法多多

近年来,随着物质充裕和生活水平提高,人们手中出现了大量闲置物品,买卖二手物品成为了新的消费形式.据<2016分享经济发展报告>显示,2016年中国闲置市场规模保守预计已达 4000 亿,正 ...
微信视频号进化简史

从1月上线内测,迭代至今,视频号的内容和商业生态基本完成. 身为张小龙的"亲血脉",视频号从"出生"便备受关注.依靠着微信这个中国最大的社交平台,不到半年视频号 ...
微信视频号算法推荐逻辑 | 青瓜传媒

其实真正算法是怎么样的,平台是不会向咱们讲的,只能咱们自己去摸索和总结,这也是运营短视频必备的能力,当然,无论算法怎么样,咱们只要记住,内容为王就行了,做好内容为前提,然后运营才有用,否则,就是怎么运 ...
微信视频号机制和规则是什么?教你如何做爆视频号！

微信视频号出现已经有段时间了,无论是用户体验还是内容质量,微信视频号都算是一个优秀的产品, 可见,腾讯对微信视频号是寄予厚望的,它或许将是腾讯杀入短视频领域的"最后一搏". 腾讯虽 ...
视频号的推广机制是什么?微信视频号怎样引流?

随着微信视频号的功能越来越完善,对于互联网商家.企业和个人来说,要尽快运营微信视频号,抓住推广引流微信视频号的大好时机! 今天我就和大家分享一下微信视频号分发机制中的社交推荐和个性化算法推荐! 一.微 ...
让飞聊飞一会儿

飞聊的产品优势: 1.兴趣社交,解决了"聊什么"的问题 2.能"敞开聊",或许可以成功 3.兴趣社交+即时通讯形成了一个流畅的通路 4.头条号联动 5.开放打封 ...
推荐算法（3）：利用用户标签数据

第一种CB 第二种 UCF 第三种用户标签行为数据.就是人为的添加的标签,比如用户对看的一部电影打标签,写博客时作者给博客打的标签.标签分两种:一种是作者或者专家给商品打标签,一种是普通用户对商品打 ...
推荐算法（4）利用上下文信息

上下文信息包括: 时间的上下文.地点的上下文.心情的上下文- 一.时间的上下文 1.理论 1)时间上对用户的影响: 1.用户自己的兴趣变化(随年龄,时间的变化,兴趣也在变化) 2.物品有自己的生命周期 ...
北派倒爷：龙门阵10 如何利用抖音推荐算法,做到从零到万的粉丝?

靠抖音赚钱,走上人生巅峰已屡见不鲜! 有的人靠一条视频走红全网,之后在抖音接广告接到手软.有的人靠一个账号狂吸流量,之后在抖音橱窗带货,房.车,几天间都有了. 这两年,短视频发展迅速,抖音更是一家独大 ...
论文推荐|算法、数据、硬件和工具——一个完美风暴（KDD’18）

论文题目 Algorithms, Data, Hardware and Tools - a Perfect Storm 作者: Alex Smola 推荐理由: "Algorithms, D ...
Keras之DNN：利用DNN算法【Input(8)→12+8(relu)→O(sigmoid)】利用糖尿病数据集训练、评估模型(利用糖尿病数据集中的八个参数特征预测一个0或1结果)

Keras之DNN:利用DNN算法[Input(8)→12+8(relu)→O(sigmoid)]利用糖尿病数据集训练.评估模型(利用糖尿病数据集中的八个参数特征预测一个0或1结果) 输出结果设计思 ...
咖啡烘焙|如何利用烘焙数据更好的烘焙咖啡

只需几个温度探头和秒表,就可以在咖啡烘焙过程中收集大量数据,特别是使用能够实时执行高级计算的烘焙程序的情况下. 这些数据可以帮助您开发一致的.可控的和高质量的咖啡烘焙流程.但如果没有对您收集的数字的正 ...
蓝牙模块哪家好？推荐一款高速蓝牙数据传输模块

FSC-BT986是一款高性能,高度集成的蓝牙5.0双模数传模块,可以同时支持SPP, GATT, HID协议,UART主从一体串口透传,SPP速度可达80KB/s,用户可以通过AT命令配置模块参数, ...
双台财政所利用大数据对比开展农民负担监督工作

5月13号双台财政所利用精准扶贫大数据对比,周密部署,五项措施扎实抓好农民监督工作. 一是领导专班到位.成立监督检查工作领导小组及核查组,或两人一组或三人一组深入村户,摸底把脉,各司其职 ...
年轻人开始“反推荐算法”：算法不讲武德！

深燃(shenrancaijing)原创作者 | 王敏编辑 | 向小园 "算法不讲武德!"越来越多年轻人发觉,生活正在被算法控制. 从事互联网运营的卢锋,想要搜索某个科技产品的 ...

推荐算法（5）利用社交网络数据

相关推荐