Research Explorer

Reasoning Aware Self-Consistency: Leveraging Reasoning Paths for Efficient LLM Sampling

Guangya Wan, Yuqi Wu, Jie Chen et al.

2025 NAACL

CRMArena: Understanding the Capacity of LLM Agents to Perform Professional CRM Tasks in Realistic Environments

Kung-Hsiang Huang, Akshara Prabhakar, Sidharth Dhawan et al.

2025 NAACL

An Efficient Gloss-Free Sign Language Translation Using Spatial Configurations and Motion Dynamics with LLMs

Eui Jun Hwang, Sukmin Cho, Junmyeong Lee et al.

2025 NAACL

Communication Makes Perfect: Persuasion Dataset Construction via Multi-LLM Communication

Weicheng Ma, Hefan Zhang, Ivory Yang et al.

2025 NAACL

LLM4DistReconfig: A Fine-tuned Large Language Model for Power Distribution Network Reconfiguration

Panayiotis Christou, Md. Zahidul Islam, Yuzhang Lin et al.

2025 NAACL

The Good, The Bad, and The Greedy: Evaluation of LLMs Should Not Ignore Non-Determinism

Yifan Song, Guoyin Wang, Sujian Li et al.

2025 NAACL

ToolFlow: Boosting LLM Tool-Calling Through Natural and Coherent Dialogue Synthesis

Zezhong Wang, Xingshan Zeng, Weiwen Liu et al.

2025 NAACL

SVD-LLM V2: Optimizing Singular Value Truncation for Large Language Model Compression

Xin Wang, Samiul Alam, Zhongwei Wan et al.

2025 NAACL

SLIM: Let LLM Learn More and Forget Less with Soft LoRA and Identity Mixture

Jiayi Han, Liang Du, Hongwei Du et al.

2025 NAACL

MiLoRA: Harnessing Minor Singular Components for Parameter-Efficient LLM Finetuning

Hanqing Wang, Yixia Li, Shuo Wang et al.

2025 NAACL

MLLM-Bench: Evaluating Multimodal LLMs with Per-sample Criteria

Wentao Ge, Shunian Chen, Hardy Chen et al.

2025 NAACL

MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling

Yakun Zhu, Shaohang Wei, Xu Wang et al.

2025 NAACL

Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering

Yu Zhao, Alessio Devoto, Giwon Hong et al.

2025 NAACL

DIRAS: Efficient LLM Annotation of Document Relevance for Retrieval Augmented Generation

Jingwei Ni, Tobias Schimanski, Meihong Lin et al.

2025 NAACL

My LLM might Mimic AAE - But When Should It?

Sandra Camille Sandoval, Christabel Acquaye, Kwesi Adu Cobbina et al.

2025 NAACL

CSEval: Towards Automated, Multi-Dimensional, and Reference-Free Counterspeech Evaluation using Auto-Calibrated LLMs

Amey Hengle, Aswini Kumar Padhi, Anil Bandhakavi et al.

2025 NAACL

RAG LLMs are Not Safer: A Safety Analysis of Retrieval-Augmented Generation for Large Language Models

Bang An, Shiyue Zhang, Mark Dredze

2025 NAACL

Arabic Dataset for LLM Safeguard Evaluation

Yasser Ashraf, Yuxia Wang, Bin Gu et al.

2025 NAACL

Elevating Legal LLM Responses: Harnessing Trainable Logical Structures and Semantic Knowledge with Legal Reasoning

Rujing Yao, Yang Wu, Chenghao Wang et al.

2025 NAACL

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Daniil Moskovskiy, Nikita Sushko, Sergey Pletenev et al.

2025 NAACL

Iterative Self-Tuning LLMs for Enhanced Jailbreaking Capabilities

Chung-En Sun, Xiaodong Liu, Weiwei Yang et al.

2025 NAACL

AEGIS2.0: A Diverse AI Safety Dataset and Risks Taxonomy for Alignment of LLM Guardrails

Shaona Ghosh, Prasoon Varshney, Makesh Narsimhan Sreedhar et al.

2025 NAACL

Rethinking the Role of LLMs for Document-level Relation Extraction: a Refiner with Task Distribution and Probability Fusion

Fu Zhang, Xinlong Jin, Jingwei Cheng et al.

2025 NAACL

Model Surgery: Modulating LLM’s Behavior Via Simple Parameter Editing

Huanqian Wang, Yang Yue, Rui Lu et al.

2025 NAACL

CharacterBox: Evaluating the Role-Playing Capabilities of LLMs in Text-Based Virtual Worlds

Lei Wang, Jianxun Lian, Yi Huang et al.

2025 NAACL

Papers