Marta Villegas

20 papers · 2019–2026 · 7 conferences · across top CS/AI conferences

Achievements

+9 more ↓

🌈 Renaissance Researcher (7) 🐝 Cross-Pollinator (12) 🏃 Academic Marathon (6) 🌍 Conference Polyglot (6) 🌉 Interdisciplinary Bridge

🏃 Academic Marathon (6) 🌈 Renaissance Researcher (7) 🤝 Dynamic Duo (16) 🔬 Deep Specialist (11) 🗃️ Keyword Collector (92) 💎 Century Club (18) ⚡ Prolific Year (7) ❓ The Questioner (3) 🔥 Unstoppable (5)

Conferences

COLING (6) EMNLP (4) ACL (3) EACL (3) IJCNLP (2) AACL (1) NAACL (1)

Top co-authors

Aitor Gonzalez-Agirre (18) Javier Aula-Blasco (5) Marc Pàmies (4) Jordi Armengol-Estapé (4) Irene Baucells (4) Carme Armentano-Oller (4) Casimiro Pio Carrino (4) Joan Llop (4) Júlia Falcão (3) Montserrat Marimon (3)

Research topics

Privacy (1)

Keywords

named entity recognition (5) low-resource language (4) large language model (4) benchmark evaluation (3) clinical text (2) text classification (2) image-induced fidelity loss (2) multilingual benchmark (2) language resource (2) model merging (2) visual language model (2) multilingual alignment (2) question answering (1) clinical named entity recognition (1) multilingual nlp (1) natural language inference (1) sequence labeling (1) few-shot learning (1) knowledge editing (1) privacy preservation (1)

Papers

Vinclat: Evaluating Reasoning, Cognition and Culture in One Game EACL 2026 Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization AACL 2025 VeritasQA: A Truthfulness Benchmark Aimed at Multilingual Transferability COLING 2025 IberoBench: A Benchmark for LLM Evaluation in Iberian Languages COLING 2025 Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization IJCNLP 2025 Multi-LMentry: Can Multilingual LLMs Solve Elementary Tasks Across Languages? EMNLP 2025 Extending Off-the-shelf NER Systems to Personal Information Detection in Dialogues with a Virtual Agent: Findings from a Real-Life Use Case EACL 2024 Mass-Editing Memory with Attention in Transformers: A cross-lingual exploration of knowledge ACL 2024 A CURATEd CATalog: Rethinking the Extraction of Pretraining Corpora for Mid-Resourced Languages COLING 2024 Becoming a High-Resource Language in Speech: The Catalan Case in the Common Voice Corpus COLING 2024 Building a Data Infrastructure for a Mid-Resource Language: The Case of Catalan COLING 2024 FLOR: On the Effectiveness of Language Adaptation COLING 2024 Community OSCAR: A Community Effort for Multilingual Web Data EMNLP 2024 A weakly supervised textual entailment approach to zero-shot text classification EACL 2023 Pretrained Biomedical Language Models for Clinical NLP in Spanish ACL 2022 Assessing the Limits of Straightforward Models for Nested Named Entity Recognition in Spanish Clinical Narratives EMNLP 2022 Are Multilingual Models the Best Choice for Moderately Under-resourced Languages? A Comprehensive Assessment for Catalan ACL 2021 Are Multilingual Models the Best Choice for Moderately Under-resourced Languages? A Comprehensive Assessment for Catalan IJCNLP 2021 Medical Word Embeddings for Spanish: Development and Evaluation NAACL 2019 PharmaCoNER: Pharmacological Substances, Compounds and proteins Named Entity Recognition track EMNLP 2019