Research Explorer

Measuring the Effect of Disfluency in Multilingual Knowledge Probing Benchmarks

Kirill Semenov, Rico Sennrich

2025 EMNLP

MEBench: Benchmarking Large Language Models for Cross-Document Multi-Entity Question Answering

Teng Lin, Yuyu Luo, Honglin Zhang et al.

2025 EMNLP

Mechanisms vs. Outcomes: Probing for Syntax Fails to Explain Performance on Targeted Syntactic Evaluations

Ananth Agarwal, Jasper Jian, Christopher D Manning et al.

2025 EMNLP

Mechanistic Fine-tuning for In-context Learning

Hakaze Cho, Peng Luo, Mariko Kato et al.

2025 EMNLP

Mechanistic Understanding and Mitigation of Language Confusion in English-Centric Large Language Models

Ercong Nie, Helmut Schmid, Hinrich Schuetze

2025 EMNLP

MedCOD: Enhancing English-to-Spanish Medical Translation of Large Language Models Using Enriched Chain-of-Dictionary Framework

Md Shahidul Salim, Lian Fu, Arav Adikesh Ramakrishnan et al.

2025 EMNLP

MedEBench: Diagnosing Reliability in Text-Guided Medical Image Editing

Minghao Liu, Zhitao He, Zhiyuan Fan et al.

2025 EMNLP

MedFact: A Large-scale Chinese Dataset for Evidence-based Medical Fact-checking of LLM Responses

Tong Chen, Zimu Wang, Yiyi Miao et al.

2025 EMNLP

MedHallu: A Comprehensive Benchmark for Detecting Medical Hallucinations in Large Language Models

Shrey Pandit, Jiawei Xu, Junyuan Hong et al.

2025 EMNLP

Media Source Matters More Than Content: Unveiling Political Bias in LLM-Generated Citations

Sunhao Dai, Zhanshuo Cao, Wenjie Wang et al.

2025 EMNLP

Medical Text Simplification From Jargon Detection to Jargon-Aware Prompting

Taiki Papandreou, Jan Bakker, Jaap Kamps

2025 EMNLP

MediVLM: A Vision Language Model for Radiology Report Generation from Medical Images

Debanjan Goswami, Ronast Subedi, Shayok Chakraborty

2025 EMNLP

MedLinkDE – MedDRA Entity Linking for German with Guided Chain of Thought Reasoning

Roman Christof, Farnaz Zeidi, Manuela Messelhäußer et al.

2025 EMNLP

Med-PRM: Medical Reasoning Models with Stepwise, Guideline-verified Process Rewards

Jaehoon Yun, Jiwoong Sohn, Jungwoo Park et al.

2025 EMNLP

MedTutor: A Retrieval-Augmented LLM System for Case-Based Medical Education

Dongsuk Jang, Ziyao Shangguan, Kyle Tegtmeyer et al.

2025 EMNLP

Med-VRAgent: A Framework for Medical Visual Reasoning-Enhanced Agents

Guangfu Guo, Xiaoqian Lu, Yue Feng

2025 EMNLP

MEETING DELEGATE: Benchmarking LLMs on Attending Meetings on Our Behalf

Lingxiang Hu, Shurun Yuan, Xiaoting Qin et al.

2025 EMNLP

Membership and Memorization in LLM Knowledge Distillation

Ziqi Zhang, Ali Shahin Shamsabadi, Hanxiao Lu et al.

2025 EMNLP

MemeArena: Automating Context-Aware Unbiased Evaluation of Harmfulness Understanding for Multimodal Large Language Models

Zixin Chen, Hongzhan Lin, Kaixin Li et al.

2025 EMNLP

MemeIntel: Explainable Detection of Propagandistic and Hateful Memes

Mohamed Bayan Kmainasi, Abul Hasnat, Md Arid Hasan et al.

2025 EMNLP

MemeInterpret: Towards an All-in-One Dataset for Meme Understanding

Jeongsik Park, Khoi P. N. Nguyen, Jihyung Park et al.

2025 EMNLP

MemeReaCon: Probing Contextual Meme Understanding in Large Vision-Language Models

Zhengyi Zhao, Shubo Zhang, Yuxi Zhang et al.

2025 EMNLP

MemInsight: Autonomous Memory Augmentation for LLM Agents

Rana Salama, Jason Cai, Michelle Yuan et al.

2025 EMNLP

Memorization or Reasoning? Exploring the Idiom Understanding of LLMs

Jisu Kim, Youngwoo Shin, Uiji Hwang et al.

2025 EMNLP

Memorization ≠ Understanding: Do Large Language Models Have the Ability of Scenario Cognition?

Boxiang Ma, Ru Li, Wang Yuanlong et al.

2025 EMNLP

Papers