Research Explorer

LLM Agents Can Be Choice-Supportive Biased Evaluators: An Empirical Study

Nan Zhuang, Boyu Cao, Yi Yang et al.

2025 AAAI

Enhancing Decision-Making for LLM Agents via Step-Level Q-Value Models

Yuanzhao Zhai, Tingkai Yang, Kele Xu et al.

2025 AAAI

Trial and Error: Exploration-Based Trajectory Optimization of LLM Agents

Yifan Song, Da Yin, Xiang Yue et al.

2024 ACL

BadAgent: Inserting and Activating Backdoor Attacks in LLM Agents

Yifei Wang, Dizhan Xue, Shengjie Zhang et al.

2024 ACL

Evaluating Very Long-Term Conversational Memory of LLM Agents

Adyasha Maharana, Dong-Ho Lee, Sergey Tulyakov et al.

2024 ACL

PsychoGAT: A Novel Psychological Measurement Paradigm through Interactive Fiction Games with LLM Agents

Qisen Yang, Zekun Wang, Honghui Chen et al.

2024 ACL

Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View

Jintian Zhang, Xin Xu, Ningyu Zhang et al.

2024 ACL

Boosting LLM Agents with Recursive Contemplation for Effective Deception Handling

Shenzhi Wang, Chang Liu, Zilong Zheng et al.

2024 ACL

LegalAgentBench: Evaluating LLM Agents in Legal Domain

Haitao Li, Junjie Chen, Jingli Yang et al.

2025 ACL

MultiAgentBench : Evaluating the Collaboration and Competition of LLM agents

Kunlun Zhu, Hongyi Du, Zhaochen Hong et al.

2025 ACL

LocAgent: Graph-Guided LLM Agents for Code Localization

Zhaoling Chen, Robert Tang, Gangda Deng et al.

2025 ACL

NexusSum: Hierarchical LLM Agents for Long-Form Narrative Summarization

Hyuntak Kim, Byung-Hak Kim

2025 ACL

GuideBench: Benchmarking Domain-Oriented Guideline Following for LLM Agents

Lingxiao Diao, Xinyue Xu, Wanxuan Sun et al.

2025 ACL

Enhancing Interpretable Image Classification Through LLM Agents and Conditional Concept Bottleneck Models

Yiwen Jiang, Deval Mehta, Wei Feng et al.

2025 ACL

Caution for the Environment: Multimodal LLM Agents are Susceptible to Environmental Distractions

Xinbei Ma, Yiting Wang, Yao Yao et al.

2025 ACL

Multiple LLM Agents Debate for Equitable Cultural Alignment

Dayeon Ki, Rachel Rudinger, Tianyi Zhou et al.

2025 ACL

LLM Agents Making Agent Tools

Georg Wölflein, Dyke Ferber, Daniel Truhn et al.

2025 ACL

The Task Shield: Enforcing Task Alignment to Defend Against Indirect Prompt Injection in LLM Agents

Feiran Jia, Tong Wu, Xin Qin et al.

2025 ACL

LEAP & LEAN: Look-ahead Planning and Agile Navigation for LLM Agents

Nikhil Verma, Manasa Bharadwaj

2025 ACL

A Parallelized Framework for Simulating Large-Scale LLM Agents with Realistic Environments and Interactions

Jun Zhang, Yuwei Yan, Junbo Yan et al.

2025 ACL

Exploring Multi-Modal Data with Tool-Augmented LLM Agents for Precise Causal Discovery

ChengAo Shen, Zhengzhang Chen, Dongsheng Luo et al.

2025 ACL

Nuclear Deployed!: Analyzing Catastrophic Risks in Decision-making of Autonomous LLM Agents

Rongwu Xu, Xiaojian Li, Shuo Chen et al.

2025 ACL

Beyond Numeric Rewards: In-Context Dueling Bandits with LLM Agents

Fanzeng Xia, Hao Liu, Yisong Yue et al.

2025 ACL

LLM Agents for Coordinating Multi-User Information Gathering

Harsh Jhamtani, Jacob Andreas, Benjamin Van Durme

2025 ACL

A Joint Optimization Framework for Enhancing Efficiency of Tool Utilization in LLM Agents

Bin Wu, Edgar Meij, Emine Yilmaz

2025 ACL

Papers