Research Explorer

Curse of Knowledge: Your Guidance and Provided Knowledge are biasing LLM Judges in Complex Evaluation

Weiyuan Li, Xintao Wang, Siyu Yuan et al.

2025 EMNLP

Neutral Is Not Unbiased: Evaluating Implicit and Intersectional Identity Bias in LLMs Through Structured Narrative Scenarios

Saba Ghanbari Haez, Mauro Dragoni

2025 EMNLP

Can LLMs Be Efficient Predictors of Conversational Derailment?

Kaustubh Olpadkar, Vikram Sunil Bajaj, Leslie Barrett

2025 EMNLP

Factuality Beyond Coherence: Evaluating LLM Watermarking Methods for Medical Texts

Rochana Prih Hastuti, Rian Adam Rajagede, Mansour Al Ghanim et al.

2025 EMNLP

Dropping Experts, Recombining Neurons: Retraining-Free Pruning for Sparse Mixture-of-Experts LLMs

Yixiao Zhou, Ziyu Zhao, Dongzhou Cheng et al.

2025 EMNLP

LLMs Can Compensate for Deficiencies in Visual Representations

Sho Takishita, Jay Gala, Abdelrahman Mohamed et al.

2025 EMNLP

Exploring Paraphrasing Strategies for CEFR A1-Level Constraints in LLMs

Eugenio Marzona, Maria Goikhman, Alessio Palmero Aprosio et al.

2025 EMNLP

Efficient Layer-wise LLM Fine-tuning for Revision Intention Prediction

Zhexiong Liu, Diane Litman

2025 EMNLP

ConText-LE: Cross-Distribution Generalization for Longitudinal Experiential Data via Narrative-Based LLM Representations

Ahatsham Hayat, Bilal Khan, Mohammad Rashedul Hasan

2025 EMNLP

ULTRABENCH: Benchmarking LLMs under Extreme Fine-grained Text Generation

Longfei Yun, Letian Peng, Jingbo Shang

2025 EMNLP

The Price of Format: Diversity Collapse in LLMs

Longfei Yun, Chenyang An, Zilong Wang et al.

2025 EMNLP

LLMs for Bayesian Optimization in Scientific Domains: Are We There Yet?

Rushil Gupta, Jason Hartford, Bang Liu

2025 EMNLP

Can Multiple Responses from an LLM Reveal the Sources of Its Uncertainty?

Yang Nan, Pengfei He, Ravi Tandon et al.

2025 EMNLP

Not Lost After All: How Cross-Encoder Attribution Challenges Position Bias Assumptions in LLM Summarization

Elahe Rahimi, Hassan Sajjad, Domenic Rosati et al.

2025 EMNLP

MFTCXplain: A Multilingual Benchmark Dataset for Evaluating the Moral Reasoning of LLMs through Multi-hop Hate Speech Explanation

Jackson Trager, Francielle Vargas, Diego Alves et al.

2025 EMNLP

Fine-tuning LLMs with Cross-Attention-based Weight Decay for Bias Mitigation

Farsheed Haque, Zhe Fu, Depeng Xu et al.

2025 EMNLP

Profiling LLM’s Copyright Infringement Risks under Adversarial Persuasive Prompting

Jikai Long, Ming Liu, Xiusi Chen et al.

2025 EMNLP

Post-hoc Study of Climate Microtargeting on Social Media Ads with LLMs: Thematic Insights and Fairness Evaluation

Tunazzina Islam, Dan Goldwasser

2025 EMNLP

HetGCoT: Heterogeneous Graph-Enhanced Chain-of-Thought LLM Reasoning for Academic Question Answering

Runsong Jia, Mengjia Wu, Ying Ding et al.

2025 EMNLP

FSTs vs ICL: Generalisation in LLMs for an under-resourced language

Ximena Gutierrez, Mikel Segura Elizalde, Victor Mijangos

2025 EMNLP

Benchmarking and Improving LLM Robustness for Personalized Generation

Chimaobi Okite, Naihao Deng, Kiran Bodipati et al.

2025 EMNLP

Hallucination Detection in Structured Query Generation via LLM Self-Debating

Miaoran Li, Jiangning Chen, Minghua Xu et al.

2025 EMNLP

Bridging the Creativity Understanding Gap: Small-Scale Human Alignment Enables Expert-Level Humor Ranking in LLMs

Kuan Lok Zhou, Jiayi Chen, Siddharth Suresh et al.

2025 EMNLP

DrKGC: Dynamic Subgraph Retrieval-Augmented LLMs for Knowledge Graph Completion across General and Biomedical Domains

Yongkang Xiao, Sinian Zhang, Yi Dai et al.

2025 EMNLP

When Instructions Multiply: Measuring and Estimating LLM Capabilities of Multiple Instructions Following

Keno Harada, Yudai Yamazaki, Masachika Taniguchi et al.

2025 EMNLP

Papers