Papers - Conftrace

RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework

Kunlun Zhu, Yifan Luo, Dingling Xu et al.

2025 ACL

RaggedyFive at SemEval-2025 Task 3: Hallucination Span Detection Using Unverifiable Answer Detection

Wessel Heerema, Collin Krooneman, Simon Van Loon et al.

2025 ACL

RAG-RewardBench: Benchmarking Reward Models in Retrieval Augmented Generation for Preference Alignment

Zhuoran Jin, Hongbang Yuan, Tianyi Men et al.

2025 ACL

RAGthoven at SemEval 2025 - Task 2: Enhancing Entity-Aware Machine Translation with Large Language Models, Retrieval Augmented Generation and Function Calling

Demetris Skottis, Gregor Karetka, Marek Suppa

2025 ACL

RainCityNLP at BioLaySumm2025: Extract then Summarize at Home

Jen Wilson, Michael Pollack, Rachel Edwards et al.

2025 ACL

Random Splitting Negatively Impacts NER Evaluation: Quantifying and Eliminating the Overestimation of NER Performance

Florian Babl, Moritz Hennen, Jakob Murauer et al.

2025 ACL

Rank, Chunk and Expand: Lineage-Oriented Reasoning for Taxonomy Expansion

Sahil Mishra, Kumar Arjun, Tanmoy Chakraborty

2025 ACL

RankCoT: Refining Knowledge for Retrieval-Augmented Generation through Ranking Chain-of-Thoughts

Mingyan Wu, Zhenghao Liu, Yukun Yan et al.

2025 ACL

Ranked Voting based Self-Consistency of Large Language Models

Weiqin Wang, Yile Wang, Hui Huang

2025 ACL

Ranking Unraveled: Recipes for LLM Rankings in Head-to-Head AI Combat

Roland Daynauth, Christopher Clarke, Krisztian Flautner et al.

2025 ACL

RAPID: Efficient Retrieval-Augmented Long Text Generation with Writing Planning and Information Discovery

Hongchao Gu, Dexun Li, Kuicai Dong et al.

2025 ACL

RARE: Retrieval-Augmented Reasoning Enhancement for Large Language Models

Hieu Tran, Zonghai Yao, Zhichao Yang et al.

2025 ACL

RASD: Retrieval-Augmented Speculative Decoding

Guofeng Quan, Wenfeng Feng, Chuzhan Hao et al.

2025 ACL

RASPberry: Retrieval-Augmented Monte Carlo Tree Self-Play with Reasoning Consistency for Multi-Hop Question Answering

Baixuan Li, Yunlong Fan, Tianyi Ma et al.

2025 ACL

RATE-Nav: Region-Aware Termination Enhancement for Zero-shot Object Navigation with Vision-Language Models

Junjie Li, Nan Zhang, Xiaoyang Qu et al.

2025 ACL

Rationales Are Not Silver Bullets: Measuring the Impact of Rationales on Model Performance and Reliability

Chiwei Zhu, Benfeng Xu, An Yang et al.

2025 ACL

Rationalize and Align: Enhancing Writing Assistance with Rationale via Self-Training for Improved Alignment

Hannan Cao, Hai Ye, Hwee Tou Ng

2025 ACL

RATIONALYST: Pre-training Process-Supervision for Improving Reasoning

Dongwei Jiang, Guoxuan Wang, Yining Lu et al.

2025 ACL

RAVEN: Robust Advertisement Video Violation Temporal Grounding via Reinforcement Reasoning

Deyi Ji, Yuekui Yang, Haiyang Wu et al.

2025 ACL

razreshili at ArchEHR-QA 2025: Contrastive Fine-Tuning for Retrieval-Augmented Biomedical QA

Arina Zemchyk

2025 ACL

Re3Syn: A Dependency-Based Data Synthesis Framework for Long-Context Post-training

Zhiyang Zhang, Ziqiang Liu, Huiming Wang et al.

2025 ACL

Read it in Two Steps: Translating Extremely Low-Resource Languages with Code-Augmented Grammar Books

Chen Zhang, Jiuheng Lin, Xiao Liu et al.

2025 ACL

READoc: A Unified Benchmark for Realistic Document Structured Extraction

Zichao Li, Aizier Abulaiti, Yaojie Lu et al.

2025 ACL

RealHarm: A Collection of Real-World Language Model Application Failures

Pierre Le Jeune, Jiaen Liu, Luca Rossi et al.

2025 ACL

RealHiTBench: A Comprehensive Realistic Hierarchical Table Benchmark for Evaluating LLM-Based Table Analysis

Pengzuo Wu, Yuhang Yang, Guangcheng Zhu et al.

2025 ACL