Research Explorer

ESF: Efficient Sensitive Fingerprinting for Black-Box Tamper Detection of Large Language Models

Xiaofan Bai, Pingyi Hu, Xiaojing Ma et al.

2025 ACL

EssayJudge: A Multi-Granular Benchmark for Assessing Automated Essay Scoring Capabilities of Multimodal Large Language Models

Jiamin Su, Yibo Yan, Fangteng Fu et al.

2025 ACL

Establishing Trustworthy LLM Evaluation via Shortcut Neuron Analysis

Kejian Zhu, Shangqing Tu, Zhuoran Jin et al.

2025 ACL

Estimating Privacy Leakage of Augmented Contextual Knowledge in Language Models

James Flemings, Bo Jiang, Wanrong Zhang et al.

2025 ACL

Estimation of Text Difficulty in the Context of Language Learning

Anisia Katinskaia, Anh-Duc Vu, Jue Hou et al.

2025 ACL

Eta-WavLM: Efficient Speaker Identity Removal in Self-Supervised Speech Representations Using a Simple Linear Equation

Giuseppe Ruggiero, Matteo Testa, Jurgen Van De Walle et al.

2025 ACL

ETF: An Entity Tracing Framework for Hallucination Detection in Code Summaries

Kishan Maharaj, Vitobha Munigala, Srikanth G. Tamilselvam et al.

2025 ACL

EtiCor++: Towards Understanding Etiquettical Bias in LLMs

Ashutosh Dwivedi, Siddhant Shivdutt Singh, Ashutosh Modi

2025 ACL

ETRQA: A Comprehensive Benchmark for Evaluating Event Temporal Reasoning Abilities of Large Language Models

Sigang Luo, Yinan Liu, Dongying Lin et al.

2025 ACL

EuroVerdict: A Multilingual Dataset for Verdict Generation Against Misinformation

Daniel Russo, Fariba Sadeghi, Stefano Menini et al.

2025 ACL

Evading Toxicity Detection with ASCII-art: A Benchmark of Spatial Attacks on Moderation Systems

Sergey Berezin, Reza Farahbakhsh, Noel Crespi

2025 ACL

Evaluating Credibility and Political Bias in LLMs for News Outlets in Bangladesh

Tabia Tanzin Prama, Md. Saiful Islam

2025 ACL

Evaluating Design Decisions for Dual Encoder-based Entity Disambiguation

Susanna Rücker, Alan Akbik

2025 ACL

Evaluating Implicit Bias in Large Language Models by Attacking From a Psychometric Perspective

Yuchen Wen, Keping Bi, Wei Chen et al.

2025 ACL

Evaluating Instructively Generated Statement by Large Language Models for Directional Event Causality Identification

Wei Xiang, Chuanhong Zhan, Qing Zhang et al.

2025 ACL

Evaluating Intermediate Reasoning of Code-Assisted Large Language Models for Mathematics

Zena Al-Khalili, Nick Howell, Dietrich Klakow

2025 ACL

Evaluating Language Models as Synthetic Data Generators

Seungone Kim, Juyoung Suk, Xiang Yue et al.

2025 ACL

Evaluating Large Language Models for Confidence-based Check Set Selection

Jane Arleth dela Cruz, Iris Hendrickx, Martha Larson

2025 ACL

Evaluating Lexical Proficiency in Neural Language Models

Cristiano Ciaccio, Alessio Miaschi, Felice Dell’Orletta

2025 ACL

Evaluating LLMs’ Assessment of Mixed-Context Hallucination Through the Lens of Summarization

Siya Qi, Rui Cao, Yulan He et al.

2025 ACL

Evaluating LLMs for Portuguese Sentence Simplification with Linguistic Insights

Arthur Mariano Rocha De Azevedo Scalercio, Elvis A. De Souza, Maria José Bocorny Finatto et al.

2025 ACL

Evaluating LLMs’ Mathematical and Coding Competency through Ontology-guided Interventions

Pengfei Hong, Navonil Majumder, Deepanway Ghosal et al.

2025 ACL

Evaluating LLMs with Multiple Problems at once

Zhengxiang Wang, Jordan Kodner, Owen Rambow

2025 ACL

Evaluating Multimodal Language Models as Visual Assistants for Visually Impaired Users

Antonia Karamolegkou, Malvina Nikandrou, Georgios Pantazopoulos et al.

2025 ACL

Evaluating Multimodal Large Language Models on Video Captioning via Monte Carlo Tree Search

Linhao Yu, Xingguang Ji, Yahui Liu et al.

2025 ACL

Papers