Research Explorer

Building Japanese Creativity Benchmarks and Applying them to Enhance LLM Creativity

So Fukuda, Hayato Ogawa, Kaito Horio et al.

2025 ACL

BUINUS at IWSLT: Evaluating the Impact of Data Augmentation and QLoRA-based Fine-Tuning for Maltese to English Speech Translation

Filbert Aurelian Tjiaranata, Vallerie Alexandra Putra, Eryawan Presma Yulianrifat et al.

2025 ACL

Burn After Reading: Do Multimodal Large Language Models Truly Capture Order of Events in Image Sequences?

Yingjin Song, Yupei Du, Denis Paperno et al.

2025 ACL

Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient

Yuan Gao, Zujing Liu, Weizhong Zhang et al.

2025 ACL

Bypassing LLM Guardrails: An Empirical Analysis of Evasion Attacks against Prompt Injection and Jailbreak Detection Systems

William Hackett, Lewis Birch, Stefan Trawicki et al.

2025 ACL

Byte Latent Transformer: Patches Scale Better Than Tokens

Artidoro Pagnoni, Ramakanth Pasunuru, Pedro Rodriguez et al.

2025 ACL

C2KD: Cross-layer and Cross-head Knowledge Distillation for Small Language Model-based Recommendation

Xiao Chen, Changyi Ma, Wenqi Fan et al.

2025 ACL

C2LEVA: Toward Comprehensive and Contamination-Free Language Model Evaluation

Yanyang Li, Wong Tin Long, Cheung To Hung et al.

2025 ACL

C²RBench: A Chinese Complex Reasoning Benchmark for Large Language Models

Junru Wu, Tianhao Shen, Linxi Su et al.

2025 ACL

CADReview: Automatically Reviewing CAD Programs with Error Detection and Correction

Jiali Chen, Xusen Hei, HongFei Liu et al.

2025 ACL

CA-GAR: Context-Aware Alignment of LLM Generation for Document Retrieval

Heng Yu, Junfeng Kang, Rui Li et al.

2025 ACL

CAIDAS at SemEval-2025 Task 7: Enriching Sparse Datasets with LLM-Generated Content for Improved Information Retrieval

Dominik Benchert, Severin Meßlinger, Sven Goller et al.

2025 ACL

CAISA at SemEval-2025 Task 7: Multilingual and Cross-lingual Fact-Checked Claim Retrieval

Muqaddas Haroon, Shaina Ashraf, Ipek Baris et al.

2025 ACL

CalibraEval: Calibrating Prediction Distribution to Mitigate Selection Bias in LLMs-as-Judges

Haitao Li, Junjie Chen, Qingyao Ai et al.

2025 ACL

Call for Rigor in Reporting Quality of Instruction Tuning Data

Hyeonseok Moon, Jaehyung Seo, Heuiseok Lim

2025 ACL

CaLMQA: Exploring culturally specific long-form question answering across 23 languages

Shane Arora, Marzena Karpinska, Hung-Ting Chen et al.

2025 ACL

CAMI: A Counselor Agent Supporting Motivational Interviewing through State Inference and Topic Exploration

Yizhe Yang, Palakorn Achananuparp, Heyan Huang et al.

2025 ACL

CAMPHOR: Collaborative Agents for Multi-input Planning and High-Order Reasoning On Device

Yicheng Fu, Raviteja Anantha, Jianpeng Cheng

2025 ACL

Can a Large Language Model Keep My Secrets? A Study on LLM-Controlled Agents

Niklas Hemken, Sai Koneru, Florian Jacob et al.

2025 ACL

Can a Single Model Master Both Multi-turn Conversations and Tool Use? CoALM: A Unified Conversational Agentic Language Model

Emre Can Acikgoz, Jeremiah Greer, Akul Datta et al.

2025 ACL

Can Community Notes Replace Professional Fact-Checkers?

Nadav Borenstein, Greta Warren, Desmond Elliott et al.

2025 ACL

Can Explicit Gender Information Improve Zero-Shot Machine Translation?

Van-Hien Tran, Huy Hien Vu, Hideki Tanaka et al.

2025 ACL

Can External Validation Tools Improve Annotation Quality for LLM-as-a-Judge?

Arduin Findeis, Floris Weers, Guoli Yin et al.

2025 ACL

Can GPTZero’s AI Vocabulary Distinguish Between LLM-Generated and Student-Written Essays?

Veronica Schmalz, Anaïs Tack

2025 ACL

Can Graph Descriptive Order Affect Solving Graph Problems with LLMs?

Yuyao Ge, Shenghua Liu, Baolong Bi et al.

2025 ACL

Papers