Beyond the Deep Metric Learning 论文笔记

Beyond the Deep Metric Learning: Enhance the Cross-Modal Matching with Adversarial Discriminative Domain Regularization

该论文提出了一个ADDR的结构来为数据的特征获得域不变性,进而为获得更好的跨模态检索性能。

Beyond the Deep Metric Learning 论文笔记
与一般的域不变性辨别器相比,该论文认为不同的数据对可能会在域空间上有重叠的部分,使用一个单一的辨别器可能没办法取得最好的效果,所以对于每一个数据对,训练时都会生成一个对应的辨别器(一个简单的前馈网络),然后使用一个正则化项Lreg来增加辨别器对于不同数据对的距离,进而分离特征空间。原文是这样说的:

Since Ladv introduced above identically construct labeling functions in hypothesis class space instead of real category labels, it is essential to constrain the searching process of fp in order for them to estimate the discriminative class spaces. In other words, assuming we have a matching pair (Ip, Sp) and an exclusive matching pair (Iq, Sq), the class labeling space in the domain p and q may not be fully disjoint during the training. The triplet loss indeed provides some discriminative learning signals to feature generators, but only at the feature level. At the domain level, the fp and fq might still send confusing learning signals, and it may fail to capture the discriminative information between the distribution of samples.

训练的话是在单个minbatch中先训练辨别器,损失函数是正则化项+自适应项,再训练正常的crossmodel模型,损失函数是rankingloss+自适应项,最终结果比使用DANN之类的方法要稍微好一点。

值得吐槽的是,这篇论文提到使用单个辨别器来分辨一对数据的地方就一次,这应该算是和其他方法有比较大区别的,只是模糊的提到一次非常影响理解,甚至是看到实验的部分还觉得很震惊,居然会有13w个辨别器的方法。。。此外该论文非常拗口,其最强性能地方也没有PFAN好,PFAN那么早就出了论文也没有对比上去,反而找了几个2020年中不太出名的方法来对比和添加。。。强烈怀疑是浪费了很长时间看一篇水论文

上一篇:jsp简介


下一篇:FSL-GNN代码解读