一文读懂诸葛io的UTSE 数据采集模型?
诸葛君说:前面我们介绍了诸葛io的大致情况,一句话概括:诸葛io是基于用户全生命周期的一站式数据采集,分析和应用平台。
从这句话中,我们可以看到数据采集是后续分析与应用的基础,本文就介绍诸葛io基于用户全生命周期的数据采集模型-UTSE模型。
一、什么是UTSE数据采集模型
如上图所示:UTSE的命名来源于用户、触点、会话、事件四个英文单词首字母的缩写,它是基于用户行为数据构建用户模型/画像的四个核心要素,我们称之为“UTSE采集模型”。
在现实世界中,人与设备交互的场景非常丰富,一个真实的人有可能在手机,电脑,APP,小程序等不同的设备和场景下使用同一款产品。如何将用户整个过程数据化,并厘清从属关系实现用户精准识别,构建真实的以用户为中心的数据,UTSE模型解决的正是此问题。
1.User(用户)
人的判断是通过账户,也即user_id,这个id可以是手机号、邮箱或数字字母的组合,通常是用户注册成功后数据库中对用户的唯一标识。
在诸葛io用户行为分析系统中,未注册用户在登录前会被识别为匿名用户,并匹配诸葛id(zg_id),一旦用户注册,可通过调用诸葛identify接口,实现对用户的唯一识别,这一过程称之为实名。
2.Touchpoint(触点)
触点可以理解为设备,对应device_id,面对当前一账户多设备,一设备多账户的生活场景,设备与账号都需要进行区别标记并计算之间的关联关系,特别是一台设备上多账户登录,注册前后、登录前后产生的行为数据归属关系计算。
3.Session(会话)
session即会话,对应session_id,记录了用户的一次完整使用,是还原用户使用场景的关键数据。
如何判断会话开始和结束?对于PC端,用户打开到页面关闭或停留30min没有任何操作会判断为一次会话;对于安卓系统,打开是会话开始,屏熄、杀掉进程会判断会话结束;对于iOS,打开是会话开始,屏熄、Home键切到后台、杀掉进程均会判断会话结束。
会话次数直接反映的是用户使用次数,是衡量产品粘性非常重要的一个指标,一次会话的持续时间通常也会用来计算用户的使用时长等指标。
4.Event(事件)
event即事件,对应event_id,事件可定义为用户在产品上的行为,通过对前端程序的监听,当用户的行为触发某个程序的反馈时,即被记录为一个事件。如:用户A在某电商应用上查看了商品详情,则「查看商品详情」即可记为事件。
诸葛io提供的UTSE数据采集模型从四个维度去采集用户数据,进行完整的用户画像。
二、UTSE 模型解决了什么问题?
1. 登录前后用户的唯一识别
用户识别方面,每个设备我们都会记录三个id,设备id、用户id、诸葛id,进行登录前后用户的唯一识别,保证了用户数据的准确性,如新增用户、活跃用户统计。
2. 一个账户多台设备
一个实名用户在多台设备上登录,访问数据均会记录在该用户账户下。
3. 一个设备多个账户
当一台设备上有第二个用户登录,第一个用户退出后,第二个用户登录前产生的行为会记录在第一个用户,第二个用户登陆后产生的行为会记录在第二个用户。
总结:通过诸葛io提供的UTSE数据采集模型,我们得以更准确的构建用户全生命周期数据,基于这些数据,能够不断优化产品和运营策略,实现业务的快速增长。