[腾讯]结合蒸馏和多任务学习的召回模型

2024-05-02 05:10:56

1、背景

2、DMTL介绍

DMTL模型的整体结构如下图所示：

可以看到，左侧的teacher网络采用多任务学习结构，右侧的的student网络仍然采用双塔结构，下面分别对其进行介绍。

2.1 Teacher网络

Teacher网络采用多任务学习的方式，其中两个任务分别用于建模CTR和阅读时长（阅读时长即图中的CVR），特别地，对于阅读时长任务来讲，其训练样本的正样本为时长大于50s（这里是依据平均时长来设定的阈值）的样本，而负样本为阅读时长小于等于50s的样本（因此这里并不是直接预测阅读时长，而是根据阅读时长将样本切分为正负样本）。为了解决选择性偏差和样本稀疏的问题，采用了ESMM的架构，并使用MMoE来提升最终的效果。预估值计算如下：

loss总共包含两部分，即ctr的loss和ctcvr的loss：

2.2 Student网络

Student网络采用召回阶段最常用的双塔模型，得到用户塔和item塔的embedding之后，其输出计算如下：

为了使召回阶段模型能够有效的预测阅读时长，希望双塔模型的输出能够与具有更高精度的多任务学习模型（teacher网络）输出接近，因此student网络的损失如下：

这样，线上仅需要部署双塔模型即student网络即可。

3、实验结果及分析

最后来看一下实验结果，离线的AUC以及线上的阅读时长都得到了一定的提升：

好了，论文就介绍到这里，下期见～～

什么是元学习算法？

第一次听到元学习的预述时,是一个极其兴奋的过程:建立不仅能够进行学习,还能学会如何进行学习的机器项目.元学习试图开发出可以根据性能信号做出响应,从而对结构基础层次以及参数空间进行修改的算法,这些算法在 ...
WenLan-10亿参数！别只玩GPT，来看看人大&中科院联手打造第一个大规模多模态中文预训练模型BriVL

▊ 写在前面近年来,多模态预训练模型在视觉和语言之间架起了桥梁.然而,大多数研究都是通过假设文本和图像对之间存在很强的语义关联来对图像-文本对之间的跨模态交互进行显式建模.由于这种强假设在现实场景中 ...
英语词汇的来龙去脉3：a student teacher？

英语词汇的来龙去脉3:你知道a student teacher是什么意思?
CVPR 2019 | 微软亚研院提出用于语义分割的结构化知识蒸馏

作者信息: 作者分别来自澳大利亚阿德莱德大学.微软亚洲研究院.北航.Keep公司.三星中国研究院,该文为第一作者Yifan Liu在微软亚洲研究院实习期间的工作. 该文研究了在语义分割模型的知识蒸馏中 ...
ECCV 2020 | 自监督任务辅助的知识蒸馏

本文介绍了一种利用自监督任务辅助知识蒸馏的方法:Knowledge Distillation Meets Self-Supervision [1]. 这篇文章(以下简称SSKD)来自香港中文大学和南洋 ...
推理怎么又快又稳？且看我FastBERT

0. 背景题目: FastBERT: a Self-distilling BERT with Adaptive Inference Time 机构:北大.腾讯.北师大作者:Weijie Liu, ...
时隔6年，“三巨头”再度联手，发布万字长文：深度学习将通往何方？

继2015年在Nature上发表"Deep Learning"一文以来,近期,2018年图灵奖获得者."深度学习三巨头 "Yoshua Bengio.Yann ...
ICCV2019 | 北大、华为联合提出无需数据集的Student Networks

Data-Free Learning of Student Networks 论文地址:https://arxiv.org/pdf/1904.01186 开源地址:https://github.com ...
一文'看透'多任务学习

作者丨十方来源丨炼丹笔记编辑丨极市平台极市导读如何判定是不是多任务学习?为什么多任务学习会有效?本文围绕多任务学习这一主题进行了详细的阐述. >>加入极市CV技术交流群,走在计算机 ...
多任务学习-Multitask Learning概述

多任务学习-Multitask Learning概述
掌上证讯—投资理财我们该如何学习？

你不理财,财不理你.很多人都知道这句话,很多人也会说,理财太深奥,我不懂,也不知道如何理财.理财说得很简单,并不像你想的那么复杂.这方面的投资相对复杂,但也没有人们想象的那么复杂. 首先讲理财.理财是 ...
敢问多任务学习优化算法路在何方？｜附代码

祝读者朋友们新春快乐!! 上一篇收藏|2021年浅谈多任务学习文章对"多任务学习"(Multi-Task Learning,以下简称MTL)的概念.优势.改进方向进行了全面的介绍, ...
2021年浅谈多任务学习

浅谈多任务学习全文约1w字,阅读时间约23分钟. 写此文的动机: 最近接触到的几个大厂推荐系统排序模型都无一例外的在使用多任务学习,比如腾讯PCG在推荐系统顶会RecSys 2020的最佳长文: P ...
Multi-Task 多任务学习，那些你不知道的事

设为 "星标",重磅干货,第一时间送达! 作者 | 三和厂妹来源 | https://zhuanlan.zhihu.com/p/113544049 概念当在一个任务中要优化多于 ...
斯坦福大学#深度多任务学习与元学习#视频及讲义下载

#Stanford CS330 2019秋# #多任务学习# #元学习# CS 330: Deep Multi-Task and Meta Learning 深度学习在图像分类.语音识别.游戏等监督学 ...
效果好，速度快！大连海事大学提出基于增强多任务学习的单图像去雨算法MENET

Multi-Task Learning Enhanced Single Image De-Raining基于增强的多任务学习的单图像去雨作者单位:大连海事大学本文使用多任务学习改进图像去雨,使用多任 ...
理解多任务学习中的信息迁移

今天来看一篇多任务学习中比较基础的研究,参考文献[1]通过构建多种任务以及不同的设置,得到了一些很实用的结论. 参考文献[1]是ICLR 2020的论文. 在多任务学习中,有的时候,两种数据组合能达到 ...