Research Explorer

Improving Automatic Evaluation of Large Language Models (LLMs) in Biomedical Relation Extraction via LLMs-as-the-Judge

Md Tahmid Rahman Laskar, Israt Jahan, Elham Dolatabadi et al.

2025 ACL

DOGE: LLMs-Enhanced Hyper-Knowledge Graph Recommender for Multimodal Recommendation

Fanshen Meng, Zhenhua Meng, Ru Jin et al.

2025 AAAI

Hide and Seek in Noise Labels: Noise-Robust Collaborative Active Learning with LLMs-Powered Assistance

Bo Yuan, Yulin Chen, Yin Zhang et al.

2024 ACL

From Model-centered to Human-Centered: Revision Distance as a Metric for Text Evaluation in LLMs-based Applications

Yongqiang Ma, Lizhi Qing, Jiawei Liu et al.

2024 ACL

On LLMs-Driven Synthetic Data Generation, Curation, and Evaluation: A Survey

Lin Long, Rui Wang, Ruixuan Xiao et al.

2024 ACL

CalibraEval: Calibrating Prediction Distribution to Mitigate Selection Bias in LLMs-as-Judges

Haitao Li, Junjie Chen, Qingyao Ai et al.

2025 ACL

Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges

Aman Singh Thakur, Kartik Choudhary, Venkat Srinik Ramayapally et al.

2025 ACL

Submodular-based In-context Example Selection for LLMs-based Machine Translation

Baijun Ji, Xiangyu Duan, Zhenyu Qiu et al.

2024 COLING

Towards Boosting LLMs-driven Relevance Modeling with Progressive Retrieved Behavior-augmented Prompting

Zeyuan Chen, Haiyan Wu, Kaixin Wu et al.

2025 COLING

LLMsAgainstHate@NLU of Devanagari Script Languages 2025: Hate Speech Detection and Target Identification in Devanagari Languages via Parameter Efficient Fine-Tuning of LLMs

Rushendra Sidibomma, Pransh Patwa, Parth Patwa et al.

2025 COLING

LTGC: Long-tail Recognition via Leveraging LLMs-driven Generated Content

Qihao Zhao, Yalun Dai, Hao Li et al.

2024 CVPR

A Survey on Detection of LLMs-Generated Content

Xianjun Yang, Liangming Pan, Xuandong Zhao et al.

2024 EMNLP

LLMs-as-Instructors: Learning from Errors Toward Automating Model Improvement

Jiahao Ying, Mingbao Lin, Yixin Cao et al.

2024 EMNLP

CondenseLM: LLMs-driven Text Dataset Condensation via Reward Matching

Cheng Shen, Yew-Soon Ong, Joey Tianyi Zhou

2025 EMNLP

Benchmarking the Detection of LLMs-Generated Modern Chinese Poetry

Shanshan Wang, Junchao Wu, Fengying Ye et al.

2025 EMNLP

Reference-Guided Verdict: LLMs-as-Judges in Automatic Evaluation of Free-Form QA

Sher Badshah, Hassan Sajjad

2025 EMNLP

CLLMRec: Contrastive Learning with LLMs-based View Augmentation for Sequential Recommendation

Fan Lu, Xiaolong Xu, Haolong Xiang et al.

2025 IJCAI

Uncovering Latent Arguments in Social Media Messaging by Employing LLMs-in-the-Loop Strategy

Tunazzina Islam, Dan Goldwasser

2025 NAACL

Evaluation of LLMs-based Hidden States as Author Representations for Psychological Human-Centered NLP Tasks

Nikita Soni, Pranav Chitale, Khushboo Singh et al.

2025 NAACL

Can LLMs Help Uncover Insights about LLMs? A Large-Scale, Evolving Literature Analysis of Frontier LLMs

Jungsoo Park, Junmo Kang, Gabriel Stanovsky et al.

2025 ACL

On scalable oversight with weak LLMs judging strong LLMs

Zachary Kenton, Noah Y. Siegel, János Kramár et al.

2024 NIPS

LLM Stinger: Jailbreaking LLMs Using RL Fine-Tuned LLMs (Student Abstract)

Piyush Jha, Arnav Arora, Vijay Ganesh

2025 AAAI

Can LLMs Learn from Previous Mistakes? Investigating LLMs’ Errors to Boost for Reasoning

Yongqi Tong, Dawei Li, Sizhe Wang et al.

2024 ACL

Can LLMs Reason with Rules? Logic Scaffolding for Stress-Testing and Improving LLMs

Siyuan Wang, Zhongyu Wei, Yejin Choi et al.

2024 ACL

How Johnny Can Persuade LLMs to Jailbreak Them: Rethinking Persuasion to Challenge AI Safety by Humanizing LLMs

Yi Zeng, Hongpeng Lin, Jingwen Zhang et al.

2024 ACL

Papers