Papers

5,479 papers found

AgentQuest: A Modular Benchmark Framework to Measure Progress and Improve LLM Agents

Luca Gioacchini, Giuseppe Siracusano, Davide Sanvito et al.

2024 NAACL

Exploring Inherent Biases in LLMs within Korean Social Context: A Comparative Analysis of ChatGPT and GPT-4

Seungyoon Lee, Dongjun Kim, Dahyun Jung et al.

2024 NAACL

Distilling Text Style Transfer With Self-Explanation From LLMs

Chiyu Zhang, Honglong Cai, Yuezhang Li et al.

2024 NAACL

Human-AI Interaction in the Age of LLMs

Diyi Yang, Sherry Tongshuang Wu, Marti A. Hearst

2024 NAACL

Efficiently Distilling LLMs for Edge Applications

Achintya Kundu, Yu Chin Fabian Lim, Aaron Chew et al.

2024 NAACL

Optimizing LLM Based Retrieval Augmented Generation Pipelines in the Financial Domain

Yiyun Zhao, Prateek Singh, Hanoz Bhathena et al.

2024 NAACL

Leveraging LLMs for Dialogue Quality Measurement

Jinghan Jia, Abi Komma, Timothy Leffel et al.

2024 NAACL

EIVEN: Efficient Implicit Attribute Value Extraction using Multimodal LLM

Henry Peng Zou, Gavin Heqing Yu, Ziwei Fan et al.

2024 NAACL

DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text

Wenting Zhao, Ye Liu, Tong Niu et al.

2024 NAACL

Reverse Chain: A Generic-Rule for LLMs to Master Multi-API Planning

Yinger Zhang, Hui Cai, Xierui Song et al.

2024 NAACL

Comparing Two Model Designs for Clinical Note Generation; Is an LLM a Useful Evaluator of Consistency?

Nathan Brake, Thomas Schaaf

2024 NAACL

DivTOD: Unleashing the Power of LLMs for Diversifying Task-Oriented Dialogue Representations

Weihao Zeng, Dayuan Fu, Keqing He et al.

2024 NAACL

Chart-based Reasoning: Transferring Capabilities from LLMs to VLMs

Victor Carbune, Hassan Mansoor, Fangyu Liu et al.

2024 NAACL

What Makes Math Word Problems Challenging for LLMs?

Kv Aditya Srivatsa, Ekaterina Kochmar

2024 NAACL

Pruning as a Domain-specific LLM Extractor

Nan Zhang, Yanchi Liu, Xujiang Zhao et al.

2024 NAACL

LLMRefine: Pinpointing and Refining Large Language Models via Fine-Grained Actionable Feedback

Wenda Xu, Daniel Deutsch, Mara Finkelstein et al.

2024 NAACL

More Samples or More Prompts? Exploring Effective Few-Shot In-Context Learning for LLMs with In-Context Sampling

Bingsheng Yao, Guiming Chen, Ruishi Zou et al.

2024 NAACL

Enhancing Perception: Refining Explanations of News Claims with LLM Conversations

Yi-Li Hsu, Jui-Ning Chen, Yang Fan Chiang et al.

2024 NAACL

Rethinking Machine Ethics – Can LLMs Perform Moral Reasoning through the Lens of Moral Theories?

Jingyan Zhou, Minda Hu, Junan Li et al.

2024 NAACL

Unleashing the Power of LLMs in Court View Generation by Stimulating Internal Knowledge and Incorporating External Knowledge

Yifei Liu, Yiquan Wu, Ang Li et al.

2024 NAACL

Enhancing the General Agent Capabilities of Low-Paramter LLMs through Tuning and Multi-Branch Reasoning

Qinhao Zhou, Zihan Zhang, Xiang Xiang et al.

2024 NAACL

BotChat: Evaluating LLMs’ Capabilities of Having Multi-Turn Dialogues

Haodong Duan, Jueqi Wei, Chonghua Wang et al.

2024 NAACL

WebWISE: Unlocking Web Interface Control for LLMs via Sequential Exploration

Heyi Tao, Sethuraman T V, Michal Shlapentokh-Rothman et al.

2024 NAACL

Tokenizer Choice For LLM Training: Negligible or Crucial?

Mehdi Ali, Michael Fromm, Klaudia Thellmann et al.

2024 NAACL

On Evaluating the Integration of Reasoning and Action in LLM Agents with Database Question Answering

Linyong Nan, Ellen Zhang, Weijin Zou et al.

2024 NAACL