数据猿专访 | 搜狗大数据研究院院长李刚:我们用5.21亿用户证明,什么才是布局大数据的正确姿势!

<数据猿导读>

从搜狗搜索引擎到搜狗输入法,再到搜狗浏览器,搜狗团队创造了一个又一个飞跃。2014年,搜狗又创建了搜狗大数据研究院,由李刚担任院长,深入探索大数据精准营销、竞价广告等领域

来源:数据猿 记者:春夏

初见李刚院长时,他热情又亲切。通过他直接、坦率的表达,数据猿记者了解到很多搜狗在发展过程中不为人知的故事。

搜狗公司原本是搜狐公司的一个项目组,现已独立,拥有2400多名员工,入驻在搜狐网络大厦。如今搜狗全线产品的月活用户超过5.21亿,是中国用户规模排名第二的互联网公司。李刚就是当年搜狗13个“种子军”团队成员,在搜狗13年的发展中,他亲历了搜狗飞速式发展的种种历程。从搜狗搜索引擎到搜狗输入法,再到搜狗浏览器,搜狗团队创造了一个又一个飞跃。同时,其营收增长迅速,目前已成为整个中国互联网公司营收排行榜中领先的企业。

越是优秀,越会勇往直前。2014年,搜狗又创建了搜狗大数据研究院,由李刚担任院长,深入探索大数据精准营销、竞价广告等领域。

李刚告诉数据猿记者,搜狗的发展目标是让产品更加智能化,为用户带来更好的体验,而大数据技术可以帮助搜狗做到这一点。

从“搜索引擎”到“大数据”

2003年,清华大学毕业的王小川加入搜狐公司,那时候,恰巧是搜狐要做搜索引擎项目的时候,王小川认为清华学生编程能力强,于是他从清华大学召集包括李刚在内的12个师弟,组成团队创办了第三代互动式中文搜索引擎——搜狗。

李刚初到搜狗工作时,负责搜狗网页搜索技术。2008年,搜狗搜索引擎逐步发展成熟之后,便开始转型,将搜索引擎商业化,接入广告业务,于是李刚开始转做广告产品。

回忆过去,李刚坦言:“从做搜索引擎到现在,搜狗搜索已经发展非常成熟,我很幸运能够与它一起成长”。

随着越来越多的积累和沉淀,搜狗开始向更高层次过渡。李刚透露,搜狗给自己的定位是做智能化产品。而通过大数据帮助搜狗提升用户体验,就是搜狗一直想探索的事情。因此,搜狗于2014年成立大数据研究院,并推出大数据产品——“搜狗大数据营销决策平台”,基于搜狗产品产生的海量数据,结合大数据处理技术,分析用户上网行为,最终辅助企业进行精准营销。

重视“智能化”的搜狗,也在2016年4月22日,宣布捐赠清华大学1.8亿元人民币,共同成立“天工智能计算研究院”,重点关注和开展人工智能领域的前沿技术研发,未来会陆续将研发成果应用于搜狗下一代产品中。

“数据”+“技术”是大数据企业发展的基础

如今,已开始在大数据领域进行探索的李刚,对如何做好大数据有一套自己的想法。在他看来,企业做大数据的首要基础是能够覆盖足够多的用户群,积累海量数据源,并做出相应产品。

在这一点上,李刚对搜狗很是自信。

近年来,搜狗不光做了搜索引擎、搜狗浏览器、搜狗输入法,还做了儿童智能手表这样的硬件产品。

可以说,在搜狗13年的发展历程中,已积累、沉淀了大量用户,以及海量数据。

目前,搜狗用户规模已达5.21亿,用户在使用搜狗各种产品的同时,表达着自己的关注点和兴趣爱好。此外,搜狗还拥有QQ、微信、知乎的独家合作,以及明医、英文等垂直频道的优质内容,这意味着其能够覆盖和影响更多优质用户群体。

“作为大数据企业,只有数据源还远远不够,必须具备足够强大的技术支撑才会发展的更好。目前来看,其实很多企业并不具备大数据处理技术,如果没有足够强大的技术能力,就无法发挥海量数据的价值。”李刚坦言。

今天,搜狗公司所有的员工当中,工程技术人员已超百分之八十,还拥有两万台服务器提供技术支持。客观来说,搜狗已经拥有了行业领先的大数据平台,同时还在跨屏收集+联动能力、覆盖率、技术上形成了独有的优势。

然而,李刚却并不满足于此,他表示,搜狗的工程师们依旧致力于升级与优化数据的处理能力。

大数据让产品变得更加“智能”

企业拥有数据源和大数据技术的目的是为企业和用户提供更好的服务。李刚强调,无论是做哪种大数据应用,关键是要让大数据概念落地,并产生实际应用价值。

他说:“这也是搜狗大数据研究院要做的事情。我们利用大数据技术,对搜狗搜索引擎、搜狗输入法以及广告等产品产生了很大价值,这是已经验证过的事情。”李刚对此颇为自豪。

以搜狗的广告业务为例,利用大数据技术,便可达到精准营销目的。在搜狗所接的广告业务中,搜狗要求客户投放的所有广告都不能随意跳出,所推送广告都要最大程度契合用户需求,这样才能让用户不但不反感广告,还会认可广告,最终实现广告投放的有效性。

为此,搜狗利用大数据技术,以多屏采集的数据层为基础,从人口属性、兴趣属性以及商业属性给用户群打标签,从而建立精准人群竞价系统、网民人群流量切分系统。

李刚称:“我们通过分析用户行为和技术手段,已为5.21亿人群打上标签,一级标签包括几十个一级分类、上千个二级分类、数十万个三级分类。此外,我们为用户打标签的准确率已达90%以上,这样就能够实现精准营销。”

如今,搜狗利用大数据技术已经做到:不同用户在搜狗搜索同一个关键词时,其搜索结果和广告展示结果都不一样。搜狗拥有上亿广告库,系统会根据用户的性别、年龄、学历、个人爱好等标签属性,自动判断为其推送哪些广告。如果用户经常忽略推送的广告,那么展示在其面前的广告就会越来越少。

除了广告业务得到提升以外,大数据挖掘技术也让搜狗搜索引擎变得更加智能化。

李刚称,以前用户搜索关键词时,系统只会显示与其最直接相关的结果。而现在如果搜索“刘德华的妻子的爸爸是谁”等复杂问题时,系统会直接显示其推理以后的结果,也就是会直接告诉用户结果——朱金城。这样就不仅仅只能搜索一个简单的语义,还可以通过逻辑关联,挖掘出用户搜索查询背后的思想,直接告诉用户最终结果。

“这是搜狗搜索引擎从第三代到第四代最大的变化,也是搜狗未来推出的产品向‘智能化’迈进的战略。”在李刚的设想中,未来的搜狗搜索引擎就是一个自动问答系统,用户向系统提问,系统直接告诉用户答案,而不只是传统的简单文字检索。

大数据让搜狗的产品功能变得更加“聪明”的同时,也帮助搜狗广告提升了变现能力,其中很大一部分是搜狗大数据所做出的贡献,这也使李刚更加坚定在大数据领域发展的信念。

“对内+对外”布局大数据

然而,李刚并不想局限于利用大数据帮助搜狗“赚快钱”。李刚透露,搜狗当时创建搜狗大数据研究院有两个目的:一是帮助搜狗提升产品和用户体验,二是希望搜狗大数据能够“走出去”,与业内有更多互动,推动中国大数据产业的发展。

为了让搜狗大数据能够更快“走出去”,李刚已经开始带领他的团队进行新一轮探索。

李刚说:“我们的大数据精准营销模式正在向多元化方向发展。现在搜索广告是按照关键词维度售卖,其实还可以按照人群行为维度进行售卖。以化妆品广告为例,可以利用不同的女性用户行为标签,将不同化妆品广告推送到对应的用户中,比如将A化妆品广告投放到18-25岁女性中,而将B化妆品投放到25-30岁白领女性中。”

同时,李刚对搜狗大数据研究院未来的发展方向也做了详细规划:

首先,会带领团队将搜狗大数据技术提升一个台阶,将大数据与智能相结合,利用海量数据和标签体系,提高搜狗标签的准确性和精准度。

其次,不仅要将大数据从PC端到移动终端的用户行为打通,引入更多数据和信息,使整个广告展示更加智能化,提升用户体验,还要让搜狗大数据为搜狗输入法、搜狗地图等其他产品带来更多价值。

最后,李刚坦言,搜狗大数据研究院是一个开放的平台,凭借其丰富的数据资源与强大的数据处理技术,可以与更多企业进行广泛合作,共同探索大数据的价值。

注:更多行业新闻、人物采访请联系数据猿记者春夏(微信:1101862984)。

来源:数据猿

(0)

相关推荐