Research Explorer

ChartInsights: Evaluating Multimodal Large Language Models for Low-Level Chart Question Answering

Yifan Wu, Lutao Yan, Leixian Shen et al.

2024 EMNLP

Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective

Meiqi Chen, Yixin Cao, Yan Zhang et al.

2024 EMNLP

A Multimodal Large Language Model “Foresees” Objects Based on Verb Information but Not Gender

Shuqi Wang, Xufeng Duan, Zhenguang Cai

2024 EMNLP

RAGAR, Your Falsehood Radar: RAG-Augmented Reasoning for Political Fact-Checking using Multimodal Large Language Models

Mohammed Abdul Khaliq, Paul Yu-Chun Chang, Mingyang Ma et al.

2024 EMNLP

Automating Steering for Safe Multimodal Large Language Models

Lyucheng Wu, Mengru Wang, Ziwen Xu et al.

2025 EMNLP

Think in Safety: Unveiling and Mitigating Safety Alignment Collapse in Multimodal Large Reasoning Model

Xinyue Lou, You Li, Jinan Xu et al.

2025 EMNLP

VisCRA: A Visual Chain Reasoning Attack for Jailbreaking Multimodal Large Language Models

Bingrui Sima, Linhua Cong, Wenxuan Wang et al.

2025 EMNLP

LEO-MINI: An Efficient Multimodal Large Language Model using Conditional Token Reduction and Mixture of Multi-Modal Experts

Yimu Wang, Mozhgan Nasr Azadani, Sean Sedwards et al.

2025 EMNLP

SURE: Safety Understanding and Reasoning Enhancement for Multimodal Large Language Models

Yuxin Gou, Xiaoning Dong, Qin Li et al.

2025 EMNLP

HVGuard: Utilizing Multimodal Large Language Models for Hateful Video Detection

Yiheng Jing, Mingming Zhang, Yong Zhuang et al.

2025 EMNLP

SUA: Stealthy Multimodal Large Language Model Unlearning Attack

Xianren Zhang, Hui Liu, Delvin Ce Zhang et al.

2025 EMNLP

Unmasking Deceptive Visuals: Benchmarking Multimodal Large Language Models on Misleading Chart Question Answering

Zixin Chen, Sicheng Song, KaShun Shum et al.

2025 EMNLP

MUCAR: Benchmarking Multilingual Cross-Modal Ambiguity Resolution for Multimodal Large Language Models

Xiaolong Wang, Zhaolu Kang, Wangyuxuan Zhai et al.

2025 EMNLP

MemeArena: Automating Context-Aware Unbiased Evaluation of Harmfulness Understanding for Multimodal Large Language Models

Zixin Chen, Hongzhan Lin, Kaixin Li et al.

2025 EMNLP

Pointing to a Llama and Call it a Camel: On the Sycophancy of Multimodal Large Language Models

Renjie Pi, Kehao Miao, Li Peihang et al.

2025 EMNLP

Robust Adaptation of Large Multimodal Models for Retrieval Augmented Hateful Meme Detection

Jingbiao Mei, Jinghong Chen, Guangyu Yang et al.

2025 EMNLP

QG-CoC: Question-Guided Chain-of-Captions for Large Multimodal Models

Kuei-Chun Kao, Hsu Tzu-Yin, Yunqi Hong et al.

2025 EMNLP

M2Edit: Locate and Edit Multi-Granularity Knowledge in Multimodal Large Language Model

Yang Zhou, Pengfei Cao, Yubo Chen et al.

2025 EMNLP

UniEDU: Toward Unified and Efficient Large Multimodal Models for Educational Tasks

Zhendong Chu, Jian Xie, Shen Wang et al.

2025 EMNLP

Reasoning-Enhanced Domain-Adaptive Pretraining of Multimodal Large Language Models for Short Video Content Governance

Zixuan Wang, Yu Sun, Hongwei Wang et al.

2025 EMNLP

On Domain-Adaptive Post-Training for Multimodal Large Language Models

Daixuan Cheng, Shaohan Huang, Ziyu Zhu et al.

2025 EMNLP

FairCoT: Enhancing Fairness in Text-to-Image Generation via Chain of Thought Reasoning with Multimodal Large Language Models

Zahraa Al Sahili, Ioannis Patras, Matthew Purver

2025 EMNLP

Self-Improvement in Multimodal Large Language Models: A Survey

Shijian Deng, Kai Wang, Tianyu Yang et al.

2025 EMNLP

Beyond Spurious Signals: Debiasing Multimodal Large Language Models via Counterfactual Inference and Adaptive Expert Routing

Zichen Wu, Hsiu-Yuan Huang, Yunfang Wu

2025 EMNLP

AdaptMerge: Inference Time Adaptive Visual and Language-Guided Token Merging for Efficient Large Multimodal Models

Zahidul Islam, Mrigank Rochan

2025 EMNLP

Papers