Research Explorer

SGoT-R1: Social Graph of Thought Reasoning-Enhanced Multimodal Large Language Model for Harmful Meme Detection

Xiuxian Wang, Yuting Su, Wenhui Li et al.

2026 AAAI

Adaptive Hallucination Alleviation in Multimodal Large Language Models: From Strategic Data Selection to Severity-Guided Training

Yuanyi Xu, Xiangru Zhu, Sihang Jiang et al.

2026 AAAI

GeM-VG: Towards Generalized Multi-image Visual Grounding with Multimodal Large Language Models

Shurong Zheng, Yousong Zhu, Hongyin Zhao et al.

2026 AAAI

MDK12-Bench: A Multi-Discipline Benchmark for Evaluating Reasoning in Multimodal Large Language Models

Pengfei Zhou, Xiaopeng Peng, Fanrui Zhang et al.

2026 AAAI

MoHoBench: Assessing Honesty of Multimodal Large Language Models via Unanswerable Visual Questions

Yanxu Zhu, Shitong Duan, Xiangxu Zhang et al.

2026 AAAI

Res-Bench: Benchmarking the Robustness of Multimodal Large Language Models to Dynamic Resolution Input

Chenxu Li, Zhicai Wang, Yuan Sheng et al.

2026 AAAI

SDEval: Safety Dynamic Evaluation for Multimodal Large Language Models

Hanqing Wang, Yuan Tian, Mingyu Liu et al.

2026 AAAI

A Rolling Stone Gathers No Moss: Adaptive Policy Optimization for Stable Self-Evaluation in Large Multimodal Models

Wenkai Wang, Hongcan Guo, Zheqi Lv et al.

2026 AAAI

MedMKEB: A Comprehensive Knowledge Editing Benchmark for Medical Multimodal Large Language Models

Dexuan Xu, Jieyi Wang, Zhongyan Chai et al.

2026 AAAI

SpeakerLM: End-to-End Versatile Speaker Diarization and Recognition with Multimodal Large Language Models

Han Yin, Yafeng Chen, Chong Deng et al.

2026 AAAI

When Safe Unimodal Inputs Collide: Optimizing Reasoning Chains for Cross-Modal Safety in Multimodal Large Language Models

Wei Cai, Shujuan Liu, Jian Zhao et al.

2026 AAAI

PurMM: Attention-Guided Test-Time Backdoor Purification in Multimodal Large Language Models

Wenzheng Jiang, Ke Liang, Xuankun Rong et al.

2026 AAAI

Cross-Modal Unlearning via Influential Neuron Path Editing in Multimodal Large Language Models

Kunhao Li, Wenhao Li, Di Wu et al.

2026 AAAI

Probing Semantic Insensitivity for Inference-Time Backdoor Defense in Multimodal Large Language Model

Xuankun Rong, Wenke Huang, Wenzheng Jiang et al.

2026 AAAI

The Emotional Baby Is Truly Deadly: Does Your Multimodal Large Reasoning Model Have Emotional Flattery Towards Humans?

Yuan Xun, Xiaojun Jia, Xinwei Liu et al.

2026 AAAI

CyPortQA: Benchmarking Multimodal Large Language Models for Cyclone Preparedness in Port Operation

Chenchen Kuai, Chenhao Wu, Yang Zhou et al.

2026 AAAI

Unlocking the Power of Large Multimodal Models for Robot Learning: Robustness, Generalization, and Opportunities

Mingyu Ding

2026 AAAI

FinTral: A Family of GPT-4 Level Multimodal Financial Large Language Models

Gagan Bhatia, El Moatez Billah Nagoudi, Hasan Cavusoglu et al.

2024 ACL

UMUTeam at SemEval-2025 Task 1: Leveraging Multimodal and Large Language Model for Identifying and Ranking Idiomatic Expressions

Ronghao Pan, Tomás Bernal - Beltrán, José Antonio García - Díaz et al.

2025 ACL

OmniVec2 - A Novel Transformer based Network for Large Scale Multimodal and Multitask Learning

Siddharth Srivastava, Gaurav Sharma

2024 CVPR

LMM4LMM: Benchmarking and Evaluating Large-multimodal Image Generation with LMMs

Jiarui Wang, Huiyu Duan, Yu Zhao et al.

2025 ICCV

Jointly Training Large Autoregressive Multimodal Models

Emanuele Aiello, LILI YU, Yixin Nie et al.

2024 ICLR

UMUTeam at SemEval-2025 Task 1: Leveraging Multimodal and Large Language Model for Identifying and Ranking Idiomatic Expressions

Ronghao Pan, Tomás Bernal - Beltrán, José Antonio García - Díaz et al.

2025 SEMEVAL

Parameter-efficient Tuning of Large-scale Multimodal Foundation Model

Haixin Wang, Xinlong Yang, Jianlong Chang et al.

2023 NIPS

AircraftVerse: A Large-Scale Multimodal Dataset of Aerial Vehicle Designs

Adam Cobb, Anirban Roy, Daniel Elenius et al.

2023 NIPS

Papers