Research Explorer

mHumanEval - A Multilingual Benchmark to Evaluate Large Language Models for Code Generation

Nishat Raihan, Antonios Anastasopoulos, Marcos Zampieri

2025 NAACL

MICE for CATs: Model-Internal Confidence Estimation for Calibrating Agents with Tools

Nishant Subramani, Jason Eisner, Justin Svegliato et al.

2025 NAACL

MiCEval: Unveiling Multimodal Chain of Thought’s Quality via Image Description and Reasoning Steps

Xiongtao Zhou, Jie He, Lanyu Chen et al.

2025 NAACL

MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU

Yan Li, So-Eon Kim, Seong-Bae Park et al.

2025 NAACL

M-IFEval: Multilingual Instruction-Following Evaluation

Antoine Dussolle, Andrea Cardeña Díaz, Shota Sato et al.

2025 NAACL

MiLoRA: Harnessing Minor Singular Components for Parameter-Efficient LLM Finetuning

Hanqing Wang, Yixia Li, Shuo Wang et al.

2025 NAACL

MILU: A Multi-task Indic Language Understanding Benchmark

Sshubam Verma, Mohammed Safi Ur Rahman Khan, Vishwajeet Kumar et al.

2025 NAACL

Mimicking How Humans Interpret Out-of-Context Sentences Through Controlled Toxicity Decoding

Maria Mihaela Trusca, Liesbeth Allein

2025 NAACL

Minimal Evidence Group Identification for Claim Verification

Xiangci Li, Sihao Chen, Rajvi Kapadia et al.

2025 NAACL

Mining Social Media for Barriers to Opioid Recovery with LLMs

Vinu Ekanayake, Md Sultan Al Nahian, Ramakanth Kavuluru

2025 NAACL

Mining the Past: A Comparative Study of Classical and Neural Topic Models on Historical Newspaper Archives

Keerthana Murugaraj, Salima Lamsiyah, Marten During et al.

2025 NAACL

MIRAGE: A Metric-Intensive Benchmark for Retrieval-Augmented Generation Evaluation

Chanhee Park, Hyeonseok Moon, Chanjun Park et al.

2025 NAACL

MIRAGE-Bench: Automatic Multilingual Benchmark Arena for Retrieval-Augmented Generation Systems

Nandan Thakur, Suleman Kazi, Ge Luo et al.

2025 NAACL

Misogynistic Meme Detection in Dravidian Languages Using Kolmogorov Arnold-based Networks

Manasha Arunachalam, Navneet Krishna Chukka, Harish Vijay V et al.

2025 NAACL

Mitigating Biases of Large Language Models in Stance Detection with Counterfactual Augmented Calibration

Ang Li, Jingqian Zhao, Bin Liang et al.

2025 NAACL

Mitigating Bias in Item Retrieval for Enhancing Exam Assembly in Vocational Education Services

Alonso Palomino, Andreas Fischer, David Buschhüter et al.

2025 NAACL

Mitigating Hallucinated Translations in Large Language Models with Hallucination-focused Preference Optimization

Zilu Tang, Rajen Chatterjee, Sarthak Garg

2025 NAACL

Mitigating Hallucinations in Large Vision-Language Models via Summary-Guided Decoding

Kyungmin Min, Minbeom Kim, Kang-il Lee et al.

2025 NAACL

Mitigating Hallucinations in Multi-modal Large Language Models via Image Token Attention-Guided Decoding

Xinhao Xu, Hui Chen, Mengyao Lyu et al.

2025 NAACL

Mitigating Hallucinations in Multimodal Spatial Relations through Constraint-Aware Prompting

Jiarui Wu, Zhuo Liu, Hangfeng He

2025 NAACL

Mitigating Heterogeneity among Factor Tensors via Lie Group Manifolds for Tensor Decomposition Based Temporal Knowledge Graph Embedding

Jiang Li, Xiangdong Su, Guanglai Gao

2025 NAACL

Mitigating Tail Narrowing in LLM Self-Improvement via Socratic-Guided Sampling

Yiwen Ding, Zhiheng Xi, Wei He et al.

2025 NAACL

MITRA-zh-eval: Using a Buddhist Chinese Language Evaluation Dataset to Assess Machine Translation and Evaluation Metrics

Sebastian Nehrdich, Avery Chen, Marcus Bingenheimer et al.

2025 NAACL

MixLLM: Dynamic Routing in Mixed Large Language Models

Xinyuan Wang, Yanchi Liu, Wei Cheng et al.

2025 NAACL

MixRevDetect: Towards Detecting AI-Generated Content in Hybrid Peer Reviews.

Sandeep Kumar, Samarth Garg, Sagnik Sengupta et al.

2025 NAACL

Papers