信息流推荐的用户增长机制
编辑整理:王洪达
出品平台:DataFunTalk
01
关于用户增长
头部内容模式:一种比较'重'的模式,该类产品利用精准的内容采买,引入优质的头部内容创作者,利用头部内容的流量聚焦效应,迅速圈定大批用户,并形成内容APP特有的用户心智;但是由于内容头部化,个性化算法在其中发挥的空间和作用较小,产品模式趋于同质化。
下沉/激励模式:该类产品参考了网络游戏模式,从各个环节设计用户里程碑和激励,不断引导新用户一步步完成点击、下刷、完整阅读、分享、关注等目标里程碑,并给予虚拟货币和真实货币的激励,在短时间内可以获取大量下沉用户。
生态构建模式:该类产品构建了完善的内容生产和消费生态,旨在通过推荐系统同时刺激生产和消费,实现两端的同时增长。
用户状态建模:深度建模用户状态和行为,通过对于大数据集中分析,找到使用户从低阶状态到高阶状态转化的干预因子。也就是如何把新用户转化成低阶用户,然后从低阶用户转化到高阶用户,用户流失后如何召回,类似这样的用户状态转化。 个性化分发的升级:将用户行为建模后,在多个场景下将这些干预动作转化为个性化推荐和营销,满足用户的消费需求。
优质内容/时效性:内容的更新频率以及内容的质量是用户增长的关键。
个性化体验:千人千面,推荐的内容符合当下的需求。
多渠道获客:多渠道获客的能力也是增长的一个关键因素。
CPC vs LTV:维持CPC ( 按点击收费 ) 和LTV ( 用户对系统的长期价值 ) 的一个平衡。
算法如何助力增长呢?主要有以下几点:
精细化买量/外投;
提升留存;
衡量推荐这样Action的效用;
消除幸存者偏差。
劣质系统:只会推荐一些低俗 ( 只满足低层次需求 )、兴趣受窄、搬运内容 ( 无稀缺性 )、陈旧内容的信息。 良性系统:区别于劣质系统,在各个环节都会不断增加信息量 ( 多样性 ),不同层次的用户引入 ( 用户多样性 ),各类高质量内容的引入 ( 内容多样性 ),内容更具时效性 ( 提升媒体属性 ),探索出用户中长尾兴趣:当头部内容过期时从而更合理的承接。 问题在哪儿?主要存在以下问题:统计机器学习模型存在缺陷;长期的指标观测体系匮乏以及业务短视;缺乏合理的机制设计和产品视角。
衡量用户满意度的指标有很多,但主要集中在三大方面:内容相关性、内容质量和内容时效性,时效性一定程度上代表内容的稀缺性。 ctr代表什么:一定需要ctr吗?对内容无认知的用户需要衡量用户对列表页素材的满意度,对内容有认知的用户还需要衡量用户对内容本身的满意度。 用户对内容真正的认可是通过点赞、分享、评论这种互动的方式来表现的,目前很多产品注重对互动的引导。
提升用户留存、LTV 通过分发筛选出优质内容、优质生产者:在传统的认知中,喜欢什么就给什么;但是更新后的认知是创造需求和玩法,持续优质内容生产 构建内容生态:提高分发时效性;增加对upgc主的激励 ( 曝光、点击、粉丝、分成 );通过准入、扶持打压、激励这种机制维持一个好的生态和增长。只有通过用户和生态两端的同时增长,才能让产品得到一个飞轮效应,良性发展
03
核心增长机制
基于表征学习的排序技术,难以表达置信度;神经网络技术很难表达最重要的概念。 新内容冷启动技术选型业内有很多的方案:随机保量 ( 短期降效、对生态fairness问题相对友好、构建宝贵的无偏数据集,消偏应用 ) +Bandit类算法 ( 短程收敛性有一定劣势 ) +uncertainty预估 ( 个人推荐 ) 新用户冷启动的技术选型和新内容还是有很大差别的,其主要是通过强化学习、联邦学习这种人工智能的方式进行分析,而通过统计学,很难分析出人的偏好。
Rank = pRelevance(topic | user)^ cu * pCTR( item | topic)^ ci 一方面用主题到用户的相关性,另一方面用item到主题的统计值或者模型的估分,这里面会有两个置信的概念,一个是用户兴趣的置信度,一个是item本身的置信度;
新item冷启探索:ci低会提高cu,侧重主题到用户的相关性值以及预估稳定性;
新用户冷启/兴趣探索:cu低会提高ci,侧重item到主题的统计值以及预估稳定性;
纯利用:对于老人做老事,ci高,cu也高,推荐的短期效率指标是最高的,但是长期来看,如果只注重这种推荐的短期效率指标,不对新用户和新内容进行探索,那长期就很难发展下去。
推荐模型本身的样本就是有偏的,user和item偏同时存在,比如用户没看喜欢的部分没有参与到模型训练中。 对应到item,就是selection-bias和fairness问题。比较典型的案例是youtube net,user embedding average pooling本质上,依然是item-embased,后续诸多改进没有本质的解决消偏问题。这样就会导致后续推的东西比较类似,如果第一次推的好就会留下用户,推得不好用户就会很快流失。
构建反事实镜像人:利用无偏信息构建相似度量,构建低活user到高活user的匹配 ( Matching / Propensity Score / IPW,Causal Embedding ) 去除低活、沉默用户的leavecause,推荐高活镜像人的stay causes
① 状态里程碑表示法
状态跃迁效用衡量
找到使用户从低阶到高阶状态转化的干预因子:
· 内容变化:新内容上下架、热点事件的产生和消逝
· 捕捉兴趣的变化
· 分发幸存者偏差问题
推断后的数据统计到内容采买和生产
干预场的设计和页面组织
内容供给指导 ( 2b供应链 )
构建时间线上的的推荐系统来推断个性化排序机制
① 个性化排序机制
新用户首次满意消费和活动 ( 内容质量控制 ) 低活用户浏览深度和ctr ( 内容质量控制 ) 高活用户要增加新颖性和多样性
兴趣覆盖度、兴趣点下的内容质量、时效性、竞争激烈程度 内容供给知道(2B供应链->内容采买/生产/激励机制)
up主激励机制:
up主质量体系:关注量曲线、生产效率、生产质量,内容正负反馈
输入就是历史分发数据(曝光量、点击量、关注量、up主质量体系)
计算:
· 曝光量->爆款成功率
· 最大化效用:激励函数->内容质量和生产效率的拟合
输出就是一定时间内up主内容的保量、限量range->在线排序的调控约束机制
未来方向:
流量货币化 更多经济学、机制设计理论的引入 · 演化博弈论分析 · 竞对分析
今天的分享就到这里,谢谢大家。