Papers - Conftrace

Establishing Trustworthiness: Rethinking Tasks and Model Evaluation

Robert Litschko, Max Müller-Eberstein, Rob van der Goot et al.

2023 EMNLP

Estimating Large Language Model Capabilities without Labeled Test Data

Harvey Fu, Qinyuan Ye, Albert Xu et al.

2023 EMNLP

e-THERAPIST: I suggest you to cultivate a mindset of positivity and nurture uplifting thoughts

Kshitij Mishra, Priyanshu Priya, Manisha Burja et al.

2023 EMNLP

Ethical Reasoning over Moral Alignment: A Case and Framework for In-Context Ethical Policies in LLMs

Abhinav Rao, Aditi Khandelwal, Kumar Tanmay et al.

2023 EMNLP

EtiCor: Corpus for Analyzing LLMs for Etiquettes

Ashutosh Dwivedi, Pradhyumna Lavania, Ashutosh Modi

2023 EMNLP

Euphemistic Abuse – A New Dataset and Classification Experiments for Implicitly Abusive Language

Michael Wiegand, Jana Kampfmeier, Elisabeth Eder et al.

2023 EMNLP

Evaluating and Enhancing the Robustness of Code Pre-trained Models through Structure-Aware Adversarial Samples Generation

Nuo Chen, Qiushi Sun, Jianing Wang et al.

2023 EMNLP

Evaluating and Modeling Attribution for Cross-Lingual Question Answering

Benjamin Muller, John Wieting, Jonathan H. Clark et al.

2023 EMNLP

Evaluating Bias and Fairness in Gender-Neutral Pretrained Vision-and-Language Models

Laura Cabello, Emanuele Bugliarello, Stephanie Brandl et al.

2023 EMNLP

Evaluating ChatGPT and Bard AI on Arabic Sentiment Analysis

Abdulmohsen Al-Thubaity, Sakhar Alkhereyf, Hanan Murayshid et al.

2023 EMNLP

Evaluating Cross-Domain Text-to-SQL Models and Benchmarks

Mohammadreza Pourreza, Davood Rafiei

2023 EMNLP

Evaluating Dependencies in Fact Editing for Language Models: Specificity and Implication Awareness

Zichao Li, Ines Arous, Siva Reddy et al.

2023 EMNLP

Evaluating Emotion Arcs Across Languages: Bridging the Global Divide in Sentiment Analysis

Daniela Teodorescu, Saif Mohammad

2023 EMNLP

Evaluating Evaluation Metrics: A Framework for Analyzing NLG Evaluation Metrics using Measurement Theory

Ziang Xiao, Susu Zhang, Vivian Lai et al.

2023 EMNLP

Evaluating Large Language Models on Controlled Generation Tasks

Jiao Sun, Yufei Tian, Wangchunshu Zhou et al.

2023 EMNLP

Evaluating Metrics for Document-context Evaluation in Machine Translation

Vikas Raunak, Tom Kocmi, Matt Post

2023 EMNLP

Evaluating Neural Language Models as Cognitive Models of Language Acquisition

Héctor Javier Vázquez Martínez, Annika Heuser, Charles Yang et al.

2023 EMNLP

Evaluating Object Hallucination in Large Vision-Language Models

Yifan Li, Yifan Du, Kun Zhou et al.

2023 EMNLP

Evaluating Parameter-Efficient Finetuning Approaches for Pre-trained Models on the Financial Domain

Isabella Olariu, Cedric Lothritz, Jacques Klein et al.

2023 EMNLP

Evaluating Subjective Cognitive Appraisals of Emotions from Large Language Models

Hongli Zhan, Desmond C. Ong, Junyi Jessy Li

2023 EMNLP

Evaluating the Knowledge Base Completion Potential of GPT

Blerta Veseli, Simon Razniewski, Jan-Christoph Kalo et al.

2023 EMNLP

Evaluating the Rationale Understanding of Critical Reasoning in Logical Reading Comprehension

Akira Kawabata, Saku Sugawara

2023 EMNLP

Evaluating Transformer’s Ability to Learn Mildly Context-Sensitive Languages

Shunjie Wang, Shane Steinert-Threlkeld

2023 EMNLP

Evaluating Verifiability in Generative Search Engines

Nelson Liu, Tianyi Zhang, Percy Liang

2023 EMNLP

Evaluation Metrics in the Era of GPT-4: Reliably Evaluating Large Language Models on Sequence to Sequence Tasks

Andrea Sottana, Bin Liang, Kai Zou et al.

2023 EMNLP