https://zhuanlan.zhihu.com/p/392699791
CVer计算机视觉 微信公众号:CVer前言
ICCV 2021 刚刚公布获奖结果!先恭喜各位论文被收录的同学。ICCV 2021 最终收录1617篇论文,录取率是25.9%。
Amusi 第一时间整理了 10多篇 ICCV 2021论文,这里对已公开github链接的论文进行盘点(有链接,不一定有代码哈)。
ICCV 2021 合集链接如下,也欢迎大家提交issue,分享你的ICCV 2021论文或者开源工作。
ICCV2021-Papers-with-Codegithub.com/amusi/ICCV2021-Papers-with-CodeICCV 2021 代码和开源项目目录
- 视觉Transformer
- GAN
- 目标检测
- 实例分割
- Few-shot Segmentation
- 超分辨率
- 行人重识别
- 异常检测
- 其他
Visual Transformer
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions
- Paper(Oral): https://arxiv.org/abs/2102.12122
- Code: https://github.com/whai362/PVT
本文提出第一个用于不同像素级密集预测任务的视觉Transformer网络!无需卷积!在图像分类、目标检测、实例/语义分割等任务上涨点明显,参数更少,性能更强!
GAN
EigenGAN: Layer-Wise Eigen-Learning for GANs
目标检测
DetCo: Unsupervised Contrastive Learning for Object Detection
表现SOTA!性能优于MoCov2、SwAV等网络,其在分割、姿态估计等任务上也涨点明显!
实例分割
Instances as Queries
基于查询的端到端实例分割新网络,表现SOTA!性能和速度均优于SOLO V2、CondInst和HTC等网络,代码已开源!
Crossover Learning for Fast Online Video Instance Segmentation
Few-shot Segmentation
Mining Latent Classes for Few-shot Segmentation
- Paper(Oral): https://arxiv.org/abs/2103.15402
- Code: https://github.com/LiheYoung/MiningFSS
超分辨率
Learning for Scale-Arbitrary Super-Resolution from Scale-Specific Networks
本文提出了一个用于SR网络的插件模块来实现任意尺度的SR,包括多尺度感知特征适应模块和一个尺度感知上采样层,还提出一种尺度感知知识迁移范式,代码即将开源!
行人重识别
TransReID: Transformer-based Object Re-Identification
使用纯Transformer进行ReID研究的工作(其中提出ViT-BoT强劲的baseline),TransReID在行人和车辆重识别任务上均表现SOTA!
异常检测(Anomaly Detection)
Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude Learning