Awesome-Visual-Captioning

2023-10-05 21:08:40

Paper Roadmap

Video Captioning

Hierarchical Context-aware Network for Dense Video Event Captioning
Video Paragraph Captioning as a Text Summarization Task
O2NA: An Object-Oriented Non-Autoregressive Approach for Controllable Video Captioning paper

Video Captioning

Video Captioning

Non-Autoregressive Coarse-to-Fine Video Captioning. [paper]
Semantic Grouping Network for Video Captioning. [paper] [code]
Augmented Partial Mutual Learning with Frame Masking for Video Captioning. [paper]

Prophet Attention: Predicting Attention with Future Attention for Improved Image Captioning. [paper]
RATT: Recurrent Attention to Transient Tasks for Continual Image Captioning. [paper]
Diverse Image Captioning with Context-Object Split Latent Spaces. [paper]

Learning Modality Interaction for Temporal Sentence Localization and Event Captioning in Videos. Spotlight [paper] [code]
Character Grounding and Re-Identification in Story of Videos and Text Descriptions. Spotlight [paper] [code]
Identity-Aware Multi-Sentence Video Description. [paper]

Video Captioning

Object Relational Graph With Teacher-Recommended Learning for Video Captioning [paper]
Ziqi Zhang, Yaya Shi, Chunfeng Yuan, Bing Li, Peijin Wang, Weiming Hu, Zheng-Jun Zha
Spatio-Temporal Graph for Video Captioning With Knowledge Distillation [paper] [code]
Boxiao Pan, Haoye Cai, De-An Huang, Kuan-Hui Lee, Adrien Gaidon, Ehsan Adeli, Juan Carlos Niebles
Better Captioning With Sequence-Level Exploration [paper]
Jia Chen, Qin Jin
Syntax-Aware Action Targeting for Video Captioning [code]
Qi Zheng, Chaoyue Wang, Dacheng Tao

Video Captioning

MART: Memory-Augmented Recurrent Transformer for Coherent Video Paragraph Captioning [paper] [code]
Jie Lei, Liwei Wang, Yelong Shen, Dong Yu, Tamara Berg and Mohit Bansal

Video Captioning

An Efficient Framework for Dense Video Captioning
Maitreya Suin (Indian Institute of Technology Madras)*; Rajagopalan Ambasamudram (Indian Institute of Technology Madras)