Swin Transformer简述(图像分类篇)

文章是对博主视频讲解的一些总结。
博主链接:https://blog.csdn.net/qq_37541097?spm=1001.2014.3001.5509
原论文链接:https://arxiv.org/abs/2103.14030

1.预言

Swin Transformer来自2021年,出自微软团队之手。就是牛,屠榜的存在。
Swin Transformer简述(图像分类篇)

2.分析

2.1 Patch Merging

Swin Transformer简述(图像分类篇)

2.2 W-MSA

  • 目的:减少计算量
  • 缺点:窗口之间无法进行信息交互

Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)

要是加入降维的结构(减少参数量)
Swin Transformer简述(图像分类篇)

2.3 Shifted Window

实现不同Window之间的 信息交互
Swin Transformer简述(图像分类篇)

Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)

2.4 Relative position bias

Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)

3.网络结构介绍

Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)
Swin Transformer简述(图像分类篇)

上一篇:js判断x,y的坐标


下一篇:WebVR开发教程——标准入门