natural language generation

782 papers

Explore in graph

Also known as

NL BART NLG NLG OR NULL LLM

Co-occurring keywords

text generation (2903) large language model (12755) language model (4573) dialogue system (1657) human evaluation (375) text summarization (889) machine translation (2472) evaluation metric (415) image captioning (728) question answering (2904)

Papers

HumT DumT: Measuring and controlling human-like language in LLMs ACL 2025

Contextual Metric Meta-Evaluation by Measuring Local Metric Accuracy NAACL 2025

SEEval: Advancing LLM Text Evaluation Efficiency and Accuracy through Self-Explanation Prompting NAACL 2025

On A Scale From 1 to 5: Quantifying Hallucination in Faithfulness Evaluation NAACL 2025

DHP Benchmark: Are LLMs Good NLG Evaluators? NAACL 2025

Towards Enhanced Immersion and Agency for LLM-based Interactive Drama ACL 2025

NLP for Counterspeech against Hate and Misinformation (CSHAM) ACL 2025

ExDDI: Explaining Drug-Drug Interaction Predictions with Natural Language AAAI 2025

D.Va: Validate Your Demonstration First Before You Use It ACL 2025

EduCSW: Building a Mandarin-English Code-Switched Generation Pipeline for Computer Science Learning ACL 2025

Theme-Explanation Structure for Table Summarization using Large Language Models: A Case Study on Korean Tabular Data ACL 2025

A Dual-Perspective NLG Meta-Evaluation Framework with Automatic Benchmark and Better Interpretability ACL 2025

NLP@IIMAS-CLTL at Multilingual Counterspeech Generation: Combating Hate Speech Using Contextualized Knowledge Graph Representations and LLMs COLING 2025

It’s Not Bragging If You Can Back It Up: Can LLMs Understand Braggings? ACL 2025

ETF: An Entity Tracing Framework for Hallucination Detection in Code Summaries ACL 2025

ProofTeller: Exposing recency bias in LLM reasoning and its side effects on communication IJCNLP 2025

CODEOFCONDUCT at Multilingual Counterspeech Generation: A Context-Aware Model for Robust Counterspeech Generation in Low-Resource Languages COLING 2025

ReproHum #0744-02: A Reproduction of the Human Evaluation of Meaning Preservation in “Factorising Meaning and Form for Intent-Preserving Paraphrasing” ACL 2025

MilaNLP@Multilingual Counterspeech Generation: Evaluating Translation and Background Knowledge Filtering COLING 2025

Analyzing Uncertainty of LLM-as-a-Judge: Interval Evaluations with Conformal Prediction EMNLP 2025

ReproHum #0031-01: Reproducing the Human Evaluation of Readability from “It is AI’s Turn to Ask Humans a Question” ACL 2025

Can LLMs Narrate Tabular Data? An Evaluation Framework for Natural Language Representations of Text-to-SQL System Outputs EMNLP 2025

TRACE-CS: A Synergistic Approach to Explainable Course Scheduling Using LLMs and Logic AAAI 2025

Non-Emotion-Centric Empathetic Dialogue Generation COLING 2025

Long-Form Information Alignment Evaluation Beyond Atomic Facts EMNLP 2025