抖音内部推荐机制内部详细分析
1、从观看抖音短视频的用户角度,抖音推荐一个短视频给一个人的算法是什么?
(1)每个观看短视频的人,对于观看内容的喜好,都是可以被打上标签的。
(2)每个条短视频,对于其内容,也是可以被打上标签的。
(3)抖音时时刻刻都在记录,人在观看短视频时候的各种互动(关注,点赞,评论,转发,等)和浏览行为(如:观看时长,暂停,跳出,等)
(4)随着记录的增加,每个观看短视频的人被打上了丰富的标签,而且每个标签都获得了一个喜好强烈程度的值。我们把标签换成“维度”,把喜好程度换成维度值,这就形成了一个人在抖音中的特性向量数据矩阵。
(5)每条短视频,通过机器学习的识别,通过人工标注的识别,通过视频相关的标题,描述,以及后续的评论中的分词和语义理解。每条短视频也被打上了丰富的标签。
(6)随着记录的增加,每条短视频上的每个标签也都获得了一个被观看者喜好强烈程度的值。我们把标签换成“维度”,把喜好程度换成维度值,这就形成了一条短视频在抖音中的特征向量数据矩阵。
(7)把一个人的多维特征向量数值矩阵,和一个短视频的多维特征向量数值矩阵进行匹配,一旦匹配成功,抖音就向这个人推荐这个视频,也就是在这个人观看短视频流的时候,抖音将会在她正在看视频的下面一条或者下面几条进行插入。
(8)这个人的不同维度的喜好,会根据他消费短视频的历史习惯,逐渐形成一个稳定的分布,我们称之为时序习惯分布。
(9)一个人也偶尔会有喜好变化的情况,这种喜好的变化,被抖音捕捉后,也会将喜好变化对应的短视频推荐给他。
(10)抖音也会将直指人性的普遍人群喜爱的某些高质量短视频推荐给所有人。这种比例也不小。
(11)抖音现在越来越倾向于社交,所以也越来越将关系链中的人创作的短视频推荐给你,这种比例正逐渐增多。
2、从抖音自己的视频库角度,他向一类人推荐一类短视频的算法是什么?
(1)因为抖音的短视频产出,是有明显的羊群现象的,而且同一个羊群现象会使用同一个音乐,有些没有音乐的,也会有范式,这种范式也比较容易通过机器学习识别,所以抖音的短视频库的标签,也就是代表这个短视频的结构化数据是比较清晰的。
(2)抖音有一个庞大的短视频库,其中的任何一条短视频都被打上标签,每个标签代表一个维度,每个维度都会有一个代表这个短视频被人们喜好程度的值,所有维度值,就形成这条短视频的特征向量数据矩阵。
(3)供需平衡算法,如果某类短视频太多,而对应的那类人,在日常浏览时长中,绝大部分消费不完,则差的短视频将永远不会被推荐。如果某类短视频太少,而对应的那类人在日常浏览时长中,都能够消费完,则差的短视频也会被推荐。
(4)排行榜算法,当短视频供应大于需求时,短视频将被按照某个标签维度上的喜好值,做成排行榜,按照从上到下,优先推荐给对应的人群。
(5)大锅饭算法,当短视频供应小于需求时,短视频不论好坏都会被平均推荐给对应的人群。
(6)新短视频样本空间算法,每一个短视频,都会给一个基础的播放量,用来收集互动和浏览数据以便完善标签。如果是同背景音乐或羊群现象类短视频,也就是结构化数据是比较清晰,已经形成特征向量数据矩阵的视频,样本空间会被直接丢到对应的人群中参与排行榜竞争。如果结构化数据很模糊,如完全原创的视频,就会被随机丢到抖音中位数人群中进行测试,不会参与排行榜竞争。
(7)老短视频样本空间算法,随着时间的推移,有生命力的高质量视频,对于人在观看短视频时候的各种互动(如:关注,点赞,评论,转发,等)和浏览行为(如:观看时长,暂停,跳出,等)数据会慢慢好起来。当这些代表抖音用户喜爱这个视频的数据达到某个标准时,将更换样本空间,基于老视频更多的曝光的机会。
3、从一条短视频本身的角度,这个短视频获得最大推荐的算法是什么?
(1)一条短视频,在上传发布后,抖音会先通过机器审核和机器识别,给予这个短视频原始的多维特征向量矩阵。
(2)在抖音的所有用户中,抖音会根据每个用户的多维特性向量矩阵的数值,筛选出一个中位数群体,这个群体没有十分明显的喜好偏向,我们可以把这个群体成为普通自然人。
(3)然后抖音会按照时序和均匀分布抽取中位数人群中的 200 个人,作为初始测试样本空间,然后将这条短视频推荐给这 200 个人观看。抖音将这 200 个人的所有观看各项参数进行记录,在跟进记录下的各项参数,给这个短视频原始的多维特征向量矩阵,丰富更多的维度,以及给每个特征向量赋值。
(4)这些赋值,主要来自于,抖音用户观看了这个短视频的各项互动参数,如滑屏停留百分比,平均播放时长,完播率,循环观看率,头像点关注率,爱心点赞率,评论留言率,转发推荐率(私信分享、社交分享、下载、收藏、其他互动等)。
(5)然后,抖音再把这个短视频的多维特征向量数值矩阵,与自己积累下来的庞大的短视频库中的其他所有视频进行数据对比。然后将这个短视频放入各个特征向量喜好数值高低的排行榜。
(6)如果这条短视频,在某个特征向量的排行榜中的名次是比较高的,也就是能够被大锅饭算法和排行榜算法所覆盖,则这条短视频就会被推荐到喜好这个特征向量的相应的人群分类中插入他们的视频流。然后再次跟踪统计新的互动数据,完善和修正特征向量数值。
(7)如果特征向量数值越来越好,则这条短视频就会被越来越多的推荐给更多的相关爱好更泛化后的人群,直到数值出现下降,则不再被推荐。
(9)如果抖音有新用户刚刚注册,这个短视频如果在排行榜头部,也会被推荐给新用户,如果是抖音的老用户,就不会被推荐了。
(10)如果这条短视频在中位数人群中,获得了非常好的数据,达到中位数人群喜爱特征向量矩阵排行榜的头部,则经过人工审核无误后,将会投放到全局视频流,对所有用户进行推荐。
(11)抖音的各种算法还在不断完善,按照目前抖音发展侧重点,一个短视频的各项参数中权重偏好依次为,针对社交拉新比较好,针对社交关系链建立比较好,针对社交互动比较好,针对观看评论比较好,针对观看爱心点赞比较好的视频,将会获得更多的推荐偏好。
4、从一个自媒体抖音号角度,这个抖音号的一系列短视频获得最大推荐的算法是什么?
(1)首先,抖音的核心推荐算法,是基于单个短视频和单个抖音用户的最佳匹配,所以,从一个抖音号的角度,支持抖音号中系列视频的正向加持的推进算法,权重并不高。但是,一个抖音用户看到一个优秀的短视频的时候,如果发现这个短视频是有系列性质和人设魅力性质的,他就会点击这个抖音号的头像,进入这个抖音号查看这个抖音号中的其它的短视频。所以一个抖音号中的所有短视频都存在相互带量的现象。
(2)当一个抖音号的某一个作品在获得大量曝光(几百万,甚至千万级)时,会带来巨量用户进入你的个人主页,去翻看你之前的作品。如果其他的作品,能够获得足够好的数据,就会激活抖音系统的推荐算法,向更多的相关人群进行推荐。所以会出现因为某一个视频的“火爆”,直接把其他几个优质视频“点燃”,形成多点开花,全盘爆炸引流的盛况。
(3)因为现在抖音越来越倾向于社交属性,所以一旦在抖音内部形成社交链接,抖音就会为抖音号中的所有视频,进行基于社交推荐算法的额外推荐,这跟微信中的社交推荐算法差不多。所以一个抖音号中的视频一直保持高质量,就会形成报酬递增率现象,也就是好的视频带来更多的社交链,更多的社交链,又会获得更多的主动社交发现和被动社交推荐的流量。
(4)在抖音中形成社交链接的强弱优先级依次为,双向关注好友关系,单项关注关系,参与评论关系,爱心点赞关系。这些社交链接关系会形成亲疏远近的辐射分布,一个抖音号的新的一条短视频就会按照这种辐射分布进行额外推荐。
(5)抖音也在扶持能够持续创作高质量的短视频的自媒体号,所以也会对抖音号进行打标签并形成抖音号的多维特征向量数值矩阵。当抖音通过数据的积累,判断出这个抖音号,是具备能够持续产出高质量短视频内容的时候,就会启动人工审核,以及引入MCN 机制,然后这个账号中的所有短视频就会获得更大的推荐力度。
(6)因为一个抖音号,积累的社交关系链会越来越多,则抖音用户主动沿着社交链进行发现和浏览的行为,也会给这个抖音号中的所有视频代理非推荐的流量。这种流量的积累,同样的也会改变这个抖音号中的各种短视频的特征向量矩阵数值的变化。这样高质量的视频,数据会越来越好,达到被推荐的标准后,就会获得新的推进。
(7)当抖音号中的系列短视频,拥有很强的类似电视连续剧性质,这个时候,就会形成非常强的,沿着抖音内部形成的社交关系链的,粉丝追剧的现象。这将对这个抖音号中的所有内容,带来大量往前,往后,翻看,的类追剧观看的增量流量。
(8)有些抖音号,还会定时发布精心制作的内容,而且每一个精心制作的内容,拥有基本相同的,刺激大脑多巴胺分泌,让浏览用户产生愉悦感的,视频范式。当经营一段时间后,这些抖音号的粉丝们,就会对这个抖音号产生致瘾性,会期待着下一条短视频的推出。这也是一种沉淀自我流量的方式。