衣服配型算法

2024-04-01 10:26:28

Context-Aware Visual Compatibility Prediction

本文主要解决，根据两种衣服的上下文来判定两种衣服是否适配的问题，和以前网络不同的是，文中所用的网络为图网络（一般输入数据满足图结构的网络成为图网络）。

例如左边的是以往模型的风格匹配，右边的是本文中图结构的风格匹配。

网络结构

最初使用的方法是，直接使用卷积抽取嵌入向量进行举例匹配，之后有人使用孪生网络进行改进，再后来使用triple Loss来进行运算，最近的改进主要是基于有文本条件的嵌入。本文主要的图网络结构如下

两种图输入，然后使用encoder生成向量，然后在使用decoder计算分数。

具体方法

本文使用的图网络是图自动编码网络GAE，编码器会针对图的每个节点生成嵌入向量，解码器会根据这些嵌入向量预测图中丢失的边界。

假设输入是一个N节点的无环图，同种每一个节点都使用F维度的代表向量，那么图就可以使用一个N X F维度的矩阵X代表，再定义一个链接N x N矩阵当i 和j两个节点是有链接的那么A（i,j）=1 否则就等于0。

其中编码器可以抽象成H = f_enc( X, A) 解码器可以抽象为A = f_dec(H)经过编码器将X变成N x F1矩阵H，对于解码器来说他就是重构链接矩阵A，f_dec(Hi, Hj) 给出两点之间的概率值。

Encoder部分

初始化的向量矩阵X，主要是通过卷积网络对图片提取特征。然后在选取目标节点i中紧邻节点

那么节点encoder计算如下

网络使用的是GCN 含有多个隐藏层，对于单个隐藏层有如下公式

其中Z表示输入输出。

多层的表示公式如下

其中初始化的z就是X，

其中对角矩阵D

在文中S表示连接的深度，也就是几次连接到大目标点。本文所有的我试验都是选择s = 1

Decoder

Decoder部分主要是对物体匹配的度量，文中提到了相似性和匹配性是两种完全不同的问题，所以不建议将相似性和匹配性一起处理。

训练

模型训练过程中，可以对数据移除一些链接，生成新的无环矩阵A1，然后通过网络计算Loss, loss为较差熵。

试验结果，当关联深度约高，准确率越高。

赞 (0)

图解GPT-2（完整版）！

Datawhale干货译者:张贤, 哈尔滨工程大学,Datawhale原创作者干货长文,建议收藏阅读,收藏等于看完. 审稿人:Jepson, Datawhale成员, 毕业于中国科学院,目前在腾讯 ...
【干货】深入理解变分自编码器

[导读]自编码器是一种非常直观的无监督神经网络方法,由编码器和解码器两部分构成,自编码器近年来很受研究人员的欢迎.本文是机器学习工程师Jeremy撰写的一篇非常棒的博文,介绍了变分自编码器理论基础和工 ...
NLP实操手册: 基于Transformer的深度学习架构的应用指南(综述)

人工智能算法与Python大数据致力于提供深度学习.机器学习.人工智能干货文章,为AI人员提供学习路线以及前沿资讯 23篇原创内容公众号点上方人工智能算法与Python大数据获取更多干货在右上 ...
【学术论文】基于Transformer模型的中文文本自动校对研究

摘要 : 提出将Transformer模型应用于中文文本自动校对领域.Transformer模型与传统的基于概率.统计.规则或引入BiLSTM的Seq2Seq模型不同,该深度学习模型通过对Se ...
赠书 | 知识图谱上的图神经网络

文中有数据派THU福利哦几乎所有早期的知识图谱嵌入的经典方法都是在对每个三元组打分,在实体和关系的表示中并没有完全考虑到整幅图的结构. 早期,图神经网络的方法在知识图谱嵌入中并没有被重视,主要由于: ...
【Transformer】从零详细解读

本文是对B站视频"transformer从零详细解读"的笔记,视频:https://www.bilibili.com/video/BV1Di4y1c7Zm?p=1 一.概述 TRM ...
用于代码生成的基于树的Transformer结构

介绍: 代码生成是一个重要的人工智能问题,有可能显着提高程序员的生产力.给定以自然语言编写的规范,代码生成系统会将规范转换为可执行程序.例如,如果 python 程序员给出指令"初始化字典 ...
ACL 2019论文| 为知识图谱添加注意力机制

注意力机制(Attention)是近些年来提出的一种改进神经网络的方法,在图像识别.自然语言处理和图网络表示等领域都取得了很好的效果,可以说注意力机制的加入极大地丰富了神经网络的表示能力. 论文原文: ...
谷歌提出最新时序框架--Deep Transformer

kaggle竞赛宝典干货作者:杰少 Deep Transformer Models for TSF 简介 Transformer技术在诸多问题,例如翻译,文本分类,搜索推荐问题中都取得了巨大的成功 ...
完全图解GPT-2：看完这篇就够了（一）

设为 "星标",重磅干货,第一时间送达! 选自github.io,作者:Jay Alammar 机器之心编译今年涌现出了许多机器学习的精彩应用,令人目不暇接,OpenAI 的 G ...
(12条消息) 一文读懂BERT(原理篇)

一文读懂BERT(原理篇) 2018年的10月11日,Google发布的论文<Pre-training of Deep Bidirectional Transformers for Langua ...
【深度学习】Transformer长大了，它的兄弟姐妹们呢？（含Transformers超细节知识点...

最近复旦放出了一篇各种Transformer的变体的综述(重心放在对Transformer结构(模块级别和架构级别)改良模型的介绍),打算在空闲时间把这篇文章梳理一下: 知乎:https://zhua ...
Paper：2017年的Google机器翻译团队《Transformer：Attention Is All You Need》翻译并解读

Paper:2017年的Google机器翻译团队<Transformer:Attention Is All You Need>翻译并解读论文评价 2017年,Google机器翻译团队发表 ...