conftrace_

Artificial Intelligence › Core AI ›

Multimodal Learning

13,057 papers

Papers per year

Papers

Glimpse-Attend-and-Explore: Self-Attention for Active Visual Exploration ICCV 2021

Exploiting Multi-Object Relationships for Detecting Adversarial Attacks in Complex Scenes ICCV 2021

Panoptic Narrative Grounding ICCV 2021

Nerfies: Deformable Neural Radiance Fields ICCV 2021

Interpretable Visual Reasoning via Induced Symbolic Space ICCV 2021

Multimodal Co-Attention Transformer for Survival Prediction in Gigapixel Whole Slide Images ICCV 2021

Neural Photofit: Gaze-Based Mental Image Reconstruction ICCV 2021

Disentangled Lifespan Face Synthesis ICCV 2021

Interaction Compass: Multi-Label Zero-Shot Learning of Human-Object Interactions via Spatial Relations ICCV 2021

Towards Vivid and Diverse Image Colorization With Generative Color Prior ICCV 2021

Unified Graph Structured Models for Video Understanding ICCV 2021

D2-Net: Weakly-Supervised Action Localization via Discriminative Embeddings and Denoised Activations ICCV 2021

EgoRenderer: Rendering Human Avatars From Egocentric Camera Images ICCV 2021

Auto-Parsing Network for Image Captioning and Visual Question Answering ICCV 2021

AESOP: Abstract Encoding of Stories, Objects, and Pictures ICCV 2021

InstanceRefer: Cooperative Holistic Understanding for Visual Grounding on Point Clouds Through Instance Multi-Level Contextual Referring ICCV 2021

Adaptive Hierarchical Graph Reasoning With Semantic Coherence for Video-and-Language Inference ICCV 2021

WB-DETR: Transformer-Based Detector Without Backbone ICCV 2021

In Defense of Scene Graphs for Image Captioning ICCV 2021

Synthesis of Compositional Animations From Textual Descriptions ICCV 2021

TransVG: End-to-End Visual Grounding With Transformers ICCV 2021

Airbert: In-Domain Pretraining for Vision-and-Language Navigation ICCV 2021

Z-GCNETs: Time Zigzags at Graph Convolutional Networks for Time Series Forecasting ICML 2021

Unifying Vision-and-Language Tasks via Text Generation ICML 2021

Grounding Language to Entities and Dynamics for Generalization in Reinforcement Learning ICML 2021