Research Explorer

Expressing Objects Just Like Words: Recurrent Visual Embedding for Image-Text Matching

Tianlang Chen, Jiebo Luo

2020 AAAI

Interactive Visualizations of Word Embeddings for K-12 Students

Saptarashmi Bandyopadhyay, Jason Xu, Neel Pawar et al.

2022 AAAI

Seeing the advantage: visually grounding word embeddings to better capture human semantic knowledge

Danny Merkx, Stefan Frank, Mirjam Ernestus

2022 ACL

PoliTo at SemEval-2023 Task 1: CLIP-based Visual-Word Sense Disambiguation Based on Back-Translation

Lorenzo Vaiani, Luca Cagliero, Paolo Garza

2023 ACL

Learning Zero-Shot Multifaceted Visually Grounded Word Embeddings via Multi-Task Training

Hassan Shahmohammadi, Hendrik P. A. Lensch, R. Harald Baayen

2021 CONLL

Learning Zero-Shot Multifaceted Visually Grounded Word Embeddings via Multi-Task Training

Hassan Shahmohammadi, Hendrik P. A. Lensch, R. Harald Baayen

2021 EMNLP

Audio-Visual Wake Word Spotting in MISP2021 Challenge: Dataset Release and Deep Analysis

Hengshun Zhou, Jun Du, Gongzhen Zou et al.

2022 INTERSPEECH

A Multiple-Teacher Pruning Based Self-Distillation (MT-PSD) Approach to Model Compression for Audio-Visual Wake Word Spotting

Haotian Wang, Jun Du, Hengshun Zhou et al.

2023 INTERSPEECH

PoliTo at SemEval-2023 Task 1: CLIP-based Visual-Word Sense Disambiguation Based on Back-Translation

Lorenzo Vaiani, Luca Cagliero, Paolo Garza

2023 SEMEVAL

Seeing Words Differently: Visual Embeddings for Robust English-Arabic Machine Translation

Mahdi Alshaikh Saleh, Irfan Ahmad

2026 EACL

Obtaining referential word meanings from visual and distributional information: Experiments on object naming

Sina Zarrieß, David Schlangen

2017 ACL

Generating Pedagogically Meaningful Visuals for Math Word Problems: A New Benchmark and Analysis of Text-to-Image Models

Junling Wang, Anna Rutkiewicz, April Wang et al.

2025 ACL

Enriching Language Models with Visually-grounded Word Vectors and the Lancaster Sensorimotor Norms

Casey Kennington

2021 CONLL

From Words to Structured Visuals: A Benchmark and Framework for Text-to-Diagram Generation and Editing

Jingxuan Wei, Cheng Tan, Qi Chen et al.

2025 CVPR

Enriching Language Models with Visually-grounded Word Vectors and the Lancaster Sensorimotor Norms

Casey Kennington

2021 EMNLP

ViCo: Word Embeddings From Visual Co-Occurrences

Tanmay Gupta, Alexander Schwing, Derek Hoiem

2019 ICCV

Word Discovery in Visually Grounded, Self-Supervised Speech Models

Puyuan Peng, David Harwath

2022 INTERSPEECH

Quantifying the Visual Concreteness of Words and Topics in Multimodal Datasets

Jack Hessel, David Mimno, Lillian Lee

2018 NAACL

Wikipedia2Vec: An Efficient Toolkit for Learning and Visualizing the Embeddings of Words and Entities from Wikipedia

Ikuya Yamada, Akari Asai, Jin Sakuma et al.

2020 EMNLP

Waffling Around for Performance: Visual Classification with Random Words and Broad Concepts

Karsten Roth, Jae Myung Kim, A. Sophia Koepke et al.

2023 ICCV

VCWE: Visual Character-Enhanced Word Embeddings

Chi Sun, Xipeng Qiu, Xuanjing Huang

2019 NAACL

Visual Grounding Helps Learn Word Meanings in Low-Data Regimes

Chengxu Zhuang, Evelina Fedorenko, Jacob Andreas

2024 NAACL

Unsupervised Learning of Visual Sense Models for Polysemous Words

Kate Saenko, Trevor Darrell

2008 NIPS

Sub-Word Level Lip Reading With Visual Attention

K R Prajwal, Triantafyllos Afouras, Andrew Zisserman

2022 CVPR

More Than Words: In-the-Wild Visually-Driven Prosody for Text-to-Speech

Michael Hassid, Michelle Tadmor Ramanovich, Brendan Shillingford et al.

2022 CVPR

Papers