Research Explorer

Can Graph Neural Networks Learn Language with Extremely Weak Text Supervision?

Zihao Li, Lecheng Zheng, Bowen Jin et al.

2025 ACL

Can Hallucination Correction Improve Video-Language Alignment?

Lingjun Zhao, Mingyang Xie, Paola Cascante-Bonilla et al.

2025 ACL

Can Indirect Prompt Injection Attacks Be Detected and Removed?

Yulin Chen, Haoran Li, Yuan Sui et al.

2025 ACL

Can information theory unravel the subtext in a Chekhovian short story?

J. Nathanael Philipp, Olav Mueller-Reichau, Matthias Irmer et al.

2025 ACL

Can Input Attributions Explain Inductive Reasoning in In-Context Learning?

Mengyu Ye, Tatsuki Kuribayashi, Goro Kobayashi et al.

2025 ACL

Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study Over Open-ended Question Answering

Yuan Sui, Yufei He, Zifeng Ding et al.

2025 ACL

Can Language Models Capture Human Writing Preferences for Domain-Specific Text Summarization?

Jingbao Luo, Ming Liu, Ran Liu et al.

2025 ACL

Can Language Models Reason about Individualistic Human Values and Preferences?

Liwei Jiang, Taylor Sorensen, Sydney Levine et al.

2025 ACL

Can Language Models Replace Programmers for Coding? REPOCOD Says ‘Not Yet’

Shanchao Liang, Nan Jiang, Yiran Hu et al.

2025 ACL

Can Language Models Serve as Analogy Annotators?

Xiaojing Zhang, Bochen Lyu

2025 ACL

Can Large Language Models Accurately Generate Answer Keys for Health-related Questions?

Davis Bartels, Deepak Gupta, Dina Demner-Fushman

2025 ACL

Can Large Language Models Address Open-Target Stance Detection?

Abu Ubaida Akash, Ahmed Fahmy, Amine Trabelsi

2025 ACL

Can Large Language Models Classify and Generate Antimicrobial Resistance Genes?

Hyunwoo Yoo, Haebin Shin, Gail Rosen

2025 ACL

Can Large Language Models Detect Errors in Long Chain-of-Thought Reasoning?

Yancheng He, Shilong Li, Jiaheng Liu et al.

2025 ACL

Can Large Language Models Understand Argument Schemes?

Elfia Bezou-Vrakatseli, Oana Cocarascu, Sanjay Modgil

2025 ACL

Can Large Language Models Understand Internet Buzzwords Through User-Generated Content

Chen Huang, Junkai Luo, Xinzuo Wang et al.

2025 ACL

Can LLMs Deceive CLIP? Benchmarking Adversarial Compositionality of Pre-trained Multimodal Representation via Text Updates

Jaewoo Ahn, Heeseung Yun, Dayoon Ko et al.

2025 ACL

Can LLMs Detect Intrinsic Hallucinations in Paraphrasing and Machine Translation?

Evangelia Gogoulou, Shorouq Zahra, Liane Guillou et al.

2025 ACL

Can LLMs Effectively Simulate Human Learners? Teachers’ Insights from Tutoring LLM Students

Daria Martynova, Jakub Macina, Nico Daheim et al.

2025 ACL

Can LLMs Evaluate Complex Attribution in QA? Automatic Benchmarking using Knowledge Graphs

Nan Hu, Jiaoyan Chen, Yike Wu et al.

2025 ACL

Can LLMs Generate High-Quality Test Cases for Algorithm Problems? TestCase-Eval: A Systematic Evaluation of Fault Coverage and Exposure

Zheyuan Yang, Zexi Kuang, Xue Xia et al.

2025 ACL

Can LLMs Ground when they (Don’t) Know: A Study on Direct and Loaded Political Questions

Clara Lachenmaier, Judith Sieker, Sina Zarrieß

2025 ACL

Can LLMs Help Uncover Insights about LLMs? A Large-Scale, Evolving Literature Analysis of Frontier LLMs

Jungsoo Park, Junmo Kang, Gabriel Stanovsky et al.

2025 ACL

Can LLMs Identify Critical Limitations within Scientific Research? A Systematic Evaluation on AI Research Papers

Zhijian Xu, Yilun Zhao, Manasi Patwardhan et al.

2025 ACL

Can LLMs Interpret and Leverage Structured Linguistic Representations? A Case Study with AMRs

Ankush Raut, Xiaofeng Zhu, Maria Leonor Pacheco

2025 ACL