Research Explorer

SCORE: Systematic COnsistency and Robustness Evaluation for Large Language Models

Grigor Nalbandyan, Rima Shahbazyan, Evelina Bakhturina

2025 NAACL

ScratchEval: Are GPT-4o Smarter than My Child? Evaluating Large Multimodal Models with Visual Programming Challenges

Rao Fu, Ziyang Luo, Hongzhan Lin et al.

2025 NAACL

ScreenQA: Large-Scale Question-Answer Pairs Over Mobile App Screenshots

Yu-Chung Hsiao, Fedir Zubach, Gilles Baechler et al.

2025 NAACL

Script-Agnosticism and its Impact on Language Identification for Dravidian Languages

Milind Agarwal, Joshua Otten, Antonios Anastasopoulos

2025 NAACL

SeaExam and SeaBench: Benchmarking LLMs with Local Multilingual Questions in Southeast Asia

Chaoqun Liu, Wenxuan Zhang, Jiahao Ying et al.

2025 NAACL

SeaLLMs 3: Open Foundation and Chat Multilingual Large Language Models for Southeast Asian Languages

Wenxuan Zhang, Hou Pong Chan, Yiran Zhao et al.

2025 NAACL

Search Query Embeddings via User-behavior-driven Contrastive Learning

Sosuke Nishikawa, Jun Hirako, Nobuhiro Kaji et al.

2025 NAACL

Seeds of Discourse: A Multilingual Corpus of Direct Quotations from African Media on Agricultural Biotechnologies

Patricia Chiril, Trevor Spreadbury, Joeva Sean Rock et al.

2025 NAACL

See-Saw Modality Balance: See Gradient, and Sew Impaired Vision-Language Balance to Mitigate Dominant Modality Bias

Junehyoung Kwon, MiHyeon Kim, Eunju Lee et al.

2025 NAACL

SEEval: Advancing LLM Text Evaluation Efficiency and Accuracy through Self-Explanation Prompting

Meng-Chen Wu, Md Mosharaf Hossain, Tess Wood et al.

2025 NAACL

Selective Self-to-Supervised Fine-Tuning for Generalization in Large Language Models

Sonam Gupta, Yatin Nandwani, Asaf Yehudai et al.

2025 NAACL

Self-calibration for Language Model Quantization and Pruning

Miles Williams, George Chrysostomou, Nikolaos Aletras

2025 NAACL

Self-DC: When to Reason and When to Act? Self Divide-and-Conquer for Compositional Unknown Questions

Hongru Wang, Boyang Xue, Baohang Zhou et al.

2025 NAACL

Self-Debiasing Large Language Models: Zero-Shot Recognition and Reduction of Stereotypes

Isabel O. Gallegos, Ryan Aponte, Ryan A. Rossi et al.

2025 NAACL

Self-Generated Critiques Boost Reward Modeling for Language Models

Yue Yu, Zhengxing Chen, Aston Zhang et al.

2025 NAACL

SELFGOAL: Your Language Agents Already Know How to Achieve High-level Goals

Ruihan Yang, Jiangjie Chen, Yikai Zhang et al.

2025 NAACL

Self-Harmonized Chain of Thought

Ziqi Jin, Wei Lu

2025 NAACL

Self Knowledge-Tracing for Tool Use (SKT-Tool): Helping LLM Agents Understand Their Capabilities in Tool Use

Joshua Vigel, Renpei Cai, Eleanor Chen et al.

2025 NAACL

Self-Pluralising Culture Alignment for Large Language Models

Shaoyang Xu, Yongqi Leng, Linhao Yu et al.

2025 NAACL

Self-State Evidence Extraction and Well-Being Prediction from Social Media Timelines

Suchandra Chakraborty, Sudeshna Jana, Manjira Sinha et al.

2025 NAACL

Self-Training Large Language Models for Tool-Use Without Demonstrations

Ne Luo, Aryo Pradipta Gema, Xuanli He et al.

2025 NAACL

Self-Training Meets Consistency: Improving LLMs’ Reasoning with Consistency-Driven Rationale Evaluation

Jaehyeok Lee, Keisuke Sakaguchi, JinYeong Bak

2025 NAACL

Self-Vocabularizing Training for Neural Machine Translation

Pin-Jie Lin, Ernie Chang, Yangyang Shi et al.

2025 NAACL

Semantic Consistency-Based Uncertainty Quantification for Factuality in Radiology Report Generation

Chenyu Wang, Weichao Zhou, Shantanu Ghosh et al.

2025 NAACL

SemanticCuetSync@DravidianLangTech 2025: Multimodal Fusion for Hate Speech Detection - A Transformer Based Approach with Cross-Modal Attention

Md. Sajjad Hossain, Symom Hossain Shohan, Ashraful Islam Paran et al.

2025 NAACL

Papers