Research Explorer

Large Language Models and Multimodal Retrieval for Visual Word Sense Disambiguation

Anastasia Kritharoula, Maria Lymperaiou, Giorgos Stamou

2023 EMNLP

GenieBlue: Integrating both Linguistic and Multimodal Capabilities for Large Language Models on Mobile Devices

Xudong Lu, Yinghao Chen, Renshou Wu et al.

2025 ICCV

Enhancing Few-Shot Vision-Language Classification with Large Multimodal Model Features

Chancharik Mitra, Brandon Huang, Tianning Chai et al.

2025 ICCV

Direct Preference Optimization of Video Large Multimodal Models from Language Model Reward

Ruohong Zhang, Liangke Gui, Zhiqing Sun et al.

2025 NAACL

Detecting Latin in Historical Books with Large Language Models: A Multimodal Benchmark

Yu Wu, Ke Shu, Jonas Fischer et al.

2026 EACL

Subspace-Aware Graph Construction and Contrastive Alignment for Multimodal Recommendation with Large Language Models

Haodong Li, Lianyong Qi, Weiming Liu et al.

2026 AAAI

From Dialogue to Destination: Geography-Aware Large Language Models with Multimodal Fusion for Conversational Recommendation

Yeming Li, Chenxi Liu, Jie Zou et al.

2026 AAAI

HotelMatch-LLM: Joint Multi-Task Training of Small and Large Language Models for Efficient Multimodal Hotel Retrieval

Arian Askari, Emmanouil Stergiadis, Ilya Gusev et al.

2025 ACL

Zhoumou at SemEval-2025 Task 1: Leveraging Multimodal Data Augmentation and Large Language Models for Enhanced Idiom Understanding

Yingzhou Zhao, Bowen Guan, Liang Yang et al.

2025 ACL

JNLP at SemEval-2025 Task 1: Multimodal Idiomaticity Representation with Large Language Models

Blake Matheny, Phuong Minh Nguyen, Minh Le Nguyen

2025 ACL

Beneath the Surface: Unveiling Harmful Memes with Multimodal Reasoning Distilled from Large Language Models

Hongzhan Lin, Ziyang Luo, Jing Ma et al.

2023 EMNLP

Player-Centric Multimodal Prompt Generation for Large Language Model Based Identity-Aware Basketball Video Captioning

Zeyu Xi, Haoying Sun, Yaofei Wu et al.

2025 ICCV

Chain-of-Action: Faithful and Multimodal Question Answering through Large Language Models

Zhenyu Pan, Haozheng Luo, Manling Li et al.

2025 ICLR

Zhoumou at SemEval-2025 Task 1: Leveraging Multimodal Data Augmentation and Large Language Models for Enhanced Idiom Understanding

Yingzhou Zhao, Bowen Guan, Liang Yang et al.

2025 SEMEVAL

JNLP at SemEval-2025 Task 1: Multimodal Idiomaticity Representation with Large Language Models

Blake Matheny, Phuong Minh Nguyen, Minh Le Nguyen

2025 SEMEVAL

AlignMMBench: Evaluating Chinese Multimodal Alignment in Large Vision-Language Models

Yuhang Wu, Wenmeng Yu, Yean Cheng et al.

2025 ACL

PerVL-Bench: Benchmarking Multimodal Personalization for Large Vision-Language Models

Minsung Kim

2026 WACV

M3Exam: A Multilingual, Multimodal, Multilevel Benchmark for Examining Large Language Models

Wenxuan Zhang, Mahani Aljunied, Chang Gao et al.

2023 NIPS

MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation

Zhongwei Wan, Che Liu, Xin Wang et al.

2025 ACL

MM-ChatAlign: A Novel Multimodal Reasoning Framework based on Large Language Models for Entity Alignment

Xuhui Jiang, Yinghan Shen, Zhichao Shi et al.

2024 EMNLP

Synergizing Multimodal Temporal Knowledge Graphs and Large Language Models for Social Relation Recognition

Haorui Wang, Zheng Wang, Yuxuan Zhang et al.

2025 EMNLP

Beyond Guardrails: Advanced Safety for Large Language Models — Monolingual, Multilingual and Multimodal Frontiers

Somnath Banerjee, Rima Hazra, Animesh Mukherjee

2025 IJCNLP

WangLab at MEDIQA-M3G 2024: Multimodal Medical Answer Generation using Large Language Models

Ronald Xie, Steven Palayew, Augustin Toma et al.

2024 NAACL

Beyond Guardrails: Advanced Safety for Large Language Models — Monolingual, Multilingual and Multimodal Frontiers

Somnath Banerjee, Rima Hazra, Animesh Mukherjee

2025 AACL

Investigating and Mitigating the Multimodal Hallucination Snowballing in Large Vision-Language Models

Weihong Zhong, Xiaocheng Feng, Liang Zhao et al.

2024 ACL

Papers