Papers - Conftrace

Error Span Annotation: A Balanced Approach for Human Evaluation of Machine Translation

Tom Kocmi, Vilém Zouhar, Eleftherios Avramidis et al.

2024 EMNLP

ERVQA: A Dataset to Benchmark the Readiness of Large Vision Language Models in Hospital Environments

Sourjyadip Ray, Kushal Gupta, Soumi Kundu et al.

2024 EMNLP

ESC: Efficient Speech Coding with Cross-Scale Residual Vector Quantized Transformers

Yuzhe Gu, Enmao Diao

2024 EMNLP

ESC-Eval: Evaluating Emotion Support Conversations in Large Language Models

Haiquan Zhao, Lingyu Li, Shisong Chen et al.

2024 EMNLP

ESG-Kor: A Korean Dataset for ESG-related Information Extraction and Practical Use Cases

Jaeyoung Lee, Geonyeong Son, Misuk Kim

2024 EMNLP

Estimating Knowledge in Large Language Models Without Generating a Single Token

Daniela Gottesman, Mor Geva

2024 EMNLP

EU DisinfoTest: a Benchmark for Evaluating Language Models’ Ability to Detect Disinformation Narratives

Witold Sosnowski, Arkadiusz Modzelewski, Kinga Skorupska et al.

2024 EMNLP

Evaluating and Training Long-Context Large Language Models for Question Answering on Scientific Papers

Lukas Hilgert, Danni Liu, Jan Niehues

2024 EMNLP

Evaluating Automatic Metrics with Incremental Machine Translation Systems

Guojun Wu, Shay B Cohen, Rico Sennrich

2024 EMNLP

Evaluating Biases in Context-Dependent Sexual and Reproductive Health Questions

Sharon Levy, Tahilin Sanchez Karver, William Adler et al.

2024 EMNLP

Evaluating Character Understanding of Large Language Models via Character Profiling from Fictional Works

Xinfeng Yuan, Siyu Yuan, Yuhan Cui et al.

2024 EMNLP

Evaluating Computational Representations of Character: An Austen Character Similarity Benchmark

Funing Yang, Carolyn Jane Anderson

2024 EMNLP

Evaluating Concurrent Robustness of Language Models Across Diverse Challenge Sets

Vatsal Gupta, Pranshu Pandya, Tushar Kataria et al.

2024 EMNLP

Evaluating Differentially Private Synthetic Data Generation in High-Stakes Domains

Krithika Ramesh, Nupoor Gandhi, Pulkit Madaan et al.

2024 EMNLP

Evaluating Diversity in Automatic Poetry Generation

Yanran Chen, Hannes Gröner, Sina Zarrieß et al.

2024 EMNLP

Evaluating D-MERIT of Partial-annotation on Information Retrieval

Royi Rassin, Yaron Fairstein, Oren Kalinsky et al.

2024 EMNLP

Evaluating Gender Bias of LLMs in Making Morality Judgements

Divij Bajaj, Yuanyuan Lei, Jonathan Tong et al.

2024 EMNLP

Evaluating Language Model Character Traits

Francis Rhys Ward, Zejia Yang, Alex Jackson et al.

2024 EMNLP

Evaluating Language Models in Location Referring Expression Extraction from Early Modern and Contemporary Japanese Texts

Ayuki Katayama, Yusuke Sakai, Shohei Higashiyama et al.

2024 EMNLP

Evaluating Large Language Models along Dimensions of Language Variation: A Systematik Invesdigatiom uv Cross-lingual Generalization

Niyati Bafna, Kenton Murray, David Yarowsky

2024 EMNLP

Evaluating Large Language Models on Time Series Feature Understanding: A Comprehensive Taxonomy and Benchmark

Elizabeth Fons, Rachneet Kaur, Soham Palande et al.

2024 EMNLP

Evaluating Large Language Models via Linguistic Profiling

Alessio Miaschi, Felice Dell’Orletta, Giulia Venturi

2024 EMNLP

Evaluating LLM Performance in Character Analysis: A Study of Artificial Beings in Recent Korean Science Fiction

Woori Jang, Seohyon Jung

2024 EMNLP

Evaluating LLMs for Targeted Concept Simplification for Domain-Specific Texts

Sumit Asthana, Hannah Rashkin, Elizabeth Clark et al.

2024 EMNLP

Evaluating Moral Beliefs across LLMs through a Pluralistic Framework

Xuelin Liu, Yanfei Zhu, Shucheng Zhu et al.

2024 EMNLP