Computer Vision › Processing ›

Video Understanding

1592 directly classified papers

Papers per year

Papers

Beyond Short-Term Snippet: Video Relation Detection With Spatio-Temporal Global Context CVPR 2020

Disentangling Physical Dynamics From Unknown Factors for Unsupervised Video Prediction CVPR 2020

Clean-Label Backdoor Attacks on Video Recognition Models CVPR 2020

Learning Video Object Segmentation From Unlabeled Videos CVPR 2020

TubeTK: Adopting Tubes to Track Multi-Object in a One-Step Training Model CVPR 2020

Video Playback Rate Perception for Self-Supervised Spatio-Temporal Representation Learning CVPR 2020

Every Frame Counts: Joint Learning of Video Segmentation and Optical Flow AAAI 2020

Pyramid Constrained Self-Attention Network for Fast Video Salient Object Detection AAAI 2020

Context-Aware and Scale-Insensitive Temporal Repetition Counting CVPR 2020

Intra- and Inter-Action Understanding via Temporal Action Parsing CVPR 2020

BiST: Bi-directional Spatio-Temporal Reasoning for Video-Grounded Dialogues EMNLP 2020

Learning Fast and Robust Target Models for Video Object Segmentation CVPR 2020

ZSTAD: Zero-Shot Temporal Activity Detection CVPR 2020

Divide and Conquer: Question-Guided Spatio-Temporal Contextual Attention for Video Question Answering AAAI 2020

Action Modifiers: Learning From Adverbs in Instructional Videos CVPR 2020

Exploring Spatial-Temporal Multi-Frequency Analysis for High-Fidelity and Temporal-Consistency Video Prediction CVPR 2020

A Multigrid Method for Efficiently Training Video Models CVPR 2020

Self-supervised Co-Training for Video Representation Learning NIPS 2020

Multi-Scale Spatial-Temporal Integration Convolutional Tube for Human Action Recognition IJCAI 2020

Representing Objects in Video as Space-Time Volumes by Combining Top-Down and Bottom-Up Processes WACV 2020

Deep Position-Aware Hashing for Semantic Continuous Image Retrieval WACV 2020

Actor Conditioned Attention Maps for Video Action Detection WACV 2020

Transferring Cross-Domain Knowledge for Video Sign Language Recognition CVPR 2020

Action Segmentation With Joint Self-Supervised Temporal Domain Adaptation CVPR 2020

UniPose: Unified Human Pose Estimation in Single Images and Videos CVPR 2020