conftrace_

Nandan Thakur

9 papers · 2021–2026 · 4 conferences · across top CS/AI conferences

Achievements

Jump to papers ↓

+4 more ↓

🐝 Cross-Pollinator (15) 🐣 Hot Topic Early Bird 🌍 Conference Polyglot (4) 🌈 Renaissance Researcher (6) 🌉 Interdisciplinary Bridge

🗺️ Taxonomy Completionist (19) 🧭 Keyword Pioneer 👥 Mega-Team (82) 🔥 Unstoppable (5)

Conferences

NAACL (4) ACL (2) EMNLP (2) ICLR (1)

Top co-authors

Jimmy Lin (6) Crystina Zhang (4) Nils Reimers (2) David Alfonso-hermelo (2) Iryna Gurevych (2) Mehdi Rezagholizadeh (2) Xueguang Ma (2) Ehsan Kamalloo (2) Odunayo Ogundepo (2) Ashwin Mathur (1)

Keywords

information retrieval (4) retrieval-augmented generation (3) domain adaptation (2) multilingual nlp (2) query generation (2) dense retrieval (2) knowledge retrieval (2) large language model (2) evaluation benchmark (1) semantic embedding (1) multilingual retrieval (1) language model robustness (1) llm evaluation (1) data augmentation (1) synthetic training datum (1) pseudo labeling (1) robustness evaluation (1) training datum (1) multilingual evaluation (1) hallucination rate (1)

Papers

BrowseComp-Plus: A Fair and Disentangled Evaluation Benchmark for Deep Search Agents ACL 2026 Hard Negatives, Hard Lessons: Revisiting Training Data Quality for Robust Information Retrieval with LLMs EMNLP 2025 MMTEB: Massive Multilingual Text Embedding Benchmark ICLR 2025 MIRAGE-Bench: Automatic Multilingual Benchmark Arena for Retrieval-Augmented Generation Systems NAACL 2025 Leveraging LLMs for Synthesizing Training Data Across Many Languages in Multilingual Dense Retrieval NAACL 2024 “Knowing When You Don’t Know”: A Multilingual Relevance Assessment Dataset for Robust Retrieval-Augmented Generation EMNLP 2024 Evaluating Embedding APIs for Information Retrieval ACL 2023 GPL: Generative Pseudo Labeling for Unsupervised Domain Adaptation of Dense Retrieval NAACL 2022 Augmented SBERT: Data Augmentation Method for Improving Bi-Encoders for Pairwise Sentence Scoring Tasks NAACL 2021