Research Explorer

WebNovelBench: Placing LLM Novelists on the Web Novel Distribution

Liangtao Lin, Jun Zheng, Haidong Wang

2026 EACL

WebRollback: Enhancing Web Agents with Explicit Rollback Mechanisms

Zhisong Zhang, Tianqing Fang, Kaixin Ma et al.

2026 EACL

What Breaks Knowledge Graph based RAG? Benchmarking and Empirical Insights into Reasoning under Incomplete Knowledge

Dongzhuoran Zhou, Yuqicheng Zhu, Xiaxia Wang et al.

2026 EACL

What Does Infect Mean to Cardio? Investigating the Role of Clinical Specialty Data in Medical LLMs

Xinlan Yan, Di Wu, Yibin Lei et al.

2026 EACL

What does Surprisal have to do with Information Status?

Andrew Thomas Dyer

2026 EACL

What Makes a Good Query? Measuring the Impact of Human-Confusing Linguistic Features on LLM Performance

William Watson, Nicole Cho, Sumitra Ganesh et al.

2026 EACL

What Matters to an LLM? Behavioral and Computational Evidences from Summarization

Yongxin Zhou, Changshun Wu, Philippe Mulhem et al.

2026 EACL

What NLP Gets Wrong About Contact: Implications for Field Linguistic Evidence

Manodyna K H

2026 EACL

What Really Matters for Table LLMs? A Meta-Evaluation of Model and Data Effects

Naihao Deng, Sheng Zhang, Henghui Zhu et al.

2026 EACL

What’s Missing in Vision-Language Models? Probing Their Struggles with Causal Order Reasoning

Zhaotian Weng, Haoxuan Li, Xin Eric Wang et al.

2026 EACL

What the Router Sees Matters: Funnel Pooling for Fast, Content Driven Expert Routing

Josef Pichlmeier, Sebastian Nicolas Mueller, Jakob Sturm et al.

2026 EACL

When Benchmarks Age: Temporal Misalignment through Large Language Model Factuality Evaluation

Xunyi Jiang, Dingyi Chang, Julian McAuley et al.

2026 EACL

When Can We Trust LLMs in Mental Health? Large-Scale Benchmarks for Reliable LLM Evaluation

Abeer Badawi, Elahe Rahimi, Md Tahmid Rahman Laskar et al.

2026 EACL

When Does Auxiliary Modality Matter in Solving Geometric Problems? A Comprehensive Study of Textual, Formal, and Visual Modalities

Hyuk Namgoong, Jeesu Jung, Yerim Han et al.

2026 EACL

When Do Language Models Endorse Limitations on Human Rights Principles?

Keenan Samway, Miu Nicole Takagi, Rada Mihalcea et al.

2026 EACL

When Flores Bloomz Wrong: Cross-Direction Contamination in Machine Translation Evaluation

David Tan, Pinzhen Chen, Josef Van Genabith et al.

2026 EACL

When LLMs Annotate: Reliability Challenges in Low-Resource NLI

Solmaz Panahi, John Kelleher, Vasudevan Nedumpozhimana

2026 EACL

When Meanings Meet: Investigating the Emergence and Quality of Shared Concept Spaces during Multilingual Language Model Training

Felicia Körner, Max Müller-Eberstein, Anna Korhonen et al.

2026 EACL

When Multilingual Evaluation Assumptions Fail: Tokenization Effects Across Scripts

Manodyna K H, Luc De Nardi

2026 EACL

When Prompt Optimization Becomes Jailbreaking: Adaptive Red-Teaming of Large Language Models

Zafir Shamsi, Nikhil Chekuru, Zachary Guzman et al.

2026 EACL

When Semantic Overlap Is Not Enough: Cross-Lingual Euphemism Transfer Between Turkish and English

Hasan Can Biyik, Libby Barak, Jing Peng et al.

2026 EACL

When Speed Meets Intelligence: Scalable Conversational NER in an Ever-evolving World

Karim Ghonim, Antonio Roberto, Davide Bernardi

2026 EACL

When the Model Said ‘No Comment’, We Knew Helpfulness Was Dead, Honesty Was Alive, and Safety Was Terrified

Gautam Siddharth Kashyap, Mark Dras, Usman Naseem

2026 EACL

When Words Wear Masks: Detecting Malicious Intents and Hostile Impacts of Online Hate Speech

Priyansh Singhal, Piyush Joshi

2026 EACL

Where Are We at with Automatic Speech Recognition for the Bambara Language?

Seydou Diallo, Yacouba Diarra, Panga Azazia Kamaté et al.

2026 EACL

Papers