Research Explorer

Diversify-verify-adapt: Efficient and Robust Retrieval-Augmented Ambiguous Question Answering

Yeonjun In, Sungchul Kim, Ryan A. Rossi et al.

2025 NAACL

Diversity Helps Jailbreak Large Language Models

Weiliang Zhao, Daniel Ben-Levi, Wei Hao et al.

2025 NAACL

DiVISe: Direct Visual-Input Speech Synthesis Preserving Speaker Characteristics And Intelligibility

Yifan Liu, Yu Fang, Zhouhan Lin

2025 NAACL

Dll5143@DravidianLangTech 2025: Majority Voting-Based Framework for Misogyny Meme Detection in Tamil and Malayalam

Sarbajeet Pattanaik, Ashok Yadav, Vrijendra Singh

2025 NAACL

DLRG@DravidianLangTech 2025: Multimodal Hate Speech Detection in Dravidian Languages

Ratnavel Rajalakshmi, Ramesh Kannan, Meetesh Saini et al.

2025 NAACL

DLTCNITPY@DravidianLangTech 2025 Abusive Code-mixed Text Detection System Targeting Women for Tamil and Malayalam Languages using Deep Learning Technique

Habiba A, Aghila G

2025 NAACL

Do Audio-Language Models Understand Linguistic Variations?

Ramaneswaran Selvakumar, Sonal Kumar, Hemant Kumar Giri et al.

2025 NAACL

DocBench: A Benchmark for Evaluating LLM-based Document Reading Systems

Anni Zou, Wenhao Yu, Hongming Zhang et al.

2025 NAACL

Does a code-switching dialogue system help users learn conversational fluency in Choctaw?

Jacqueline Brixey, David Traum

2025 NAACL

Does Data Contamination Detection Work (Well) for LLMs? A Survey and Evaluation on Detection Assumptions

Yujuan Fu, Ozlem Uzuner, Meliha Yetisgen et al.

2025 NAACL

Does Generative AI speak Nigerian-Pidgin?: Issues about Representativeness and Bias for Multilingualism in LLMs

David Ifeoluwa Adelani, A. Seza Doğruöz, Iyanuoluwa Shode et al.

2025 NAACL

Does Liking Yellow Imply Driving a School Bus? Semantic Leakage in Language Models

Hila Gonen, Terra Blevins, Alisa Liu et al.

2025 NAACL

Does Mapo Tofu Contain Coffee? Probing LLMs for Food-related Cultural Knowledge

Li Zhou, Taelin Karidi, Wanlong Liu et al.

2025 NAACL

Does Self-Attention Need Separate Weights in Transformers?

Md Kowsher, Nusrat Jahan Prottasha, Chun-Nam Yu et al.

2025 NAACL

Does Training on Synthetic Data Make Models Less Robust?

Lingze Zhang, Ellie Pavlick

2025 NAACL

Do Large Language Models Align with Core Mental Health Counseling Competencies?

Viet Cuong Nguyen, Mohammad Taher, Dongwan Hong et al.

2025 NAACL

DOLFIN - Document-Level Financial Test-Set for Machine Translation

Mariam Nakhle, Marco Dinarelli, Raheel Qader et al.

2025 NAACL

Do LLMs Have Distinct and Consistent Personality? TRAIT: Personality Testset designed for LLMs with Psychometrics

Seungbeen Lee, Seungwon Lim, Seungju Han et al.

2025 NAACL

DomainSum: A Hierarchical Benchmark for Fine-Grained Domain Shift in Abstractive Text Summarization

Haohan Yuan, Haopeng Zhang

2025 NAACL

Do Not Design, Learn: A Trainable Scoring Function for Uncertainty Estimation in Generative LLMs

Duygu Nur Yaldiz, Yavuz Faruk Bakman, Baturalp Buyukates et al.

2025 NAACL

Don’t stop pretraining! Efficiently building specialised language models in resource-constrained settings.

Sven Najem-Meyer, Frédéric Kaplan, Matteo Romanello

2025 NAACL

Don’t Touch My Diacritics

Kyle Gorman, Yuval Pinter

2025 NAACL

Do Prevalent Bias Metrics Capture Allocational Harms from LLMs?

Hannah Cyberey, Yangfeng Ji, David Evans

2025 NAACL

Do RAG Systems Cover What Matters? Evaluating and Optimizing Responses with Sub-Question Coverage

Kaige Xie, Philippe Laban, Prafulla Kumar Choubey et al.

2025 NAACL

Do Video Language Models really understand the video contexts?

Jeongwan Shin, Jinhyeong Lim, Hyeyoung Park

2025 NAACL

Papers