reinforcement learning

4122 papers

Explore in graph

Also known as

RLVR HARL GRPO RL PPO REINFORCE RFT DRL RL NULL LQR RLHF

Co-occurring keywords

large language model (12755) policy learning (699) markov decision process (788) policy gradient (518) policy optimization (630) deep reinforcement learning (903) multi-agent system (1743) imitation learning (741) regret bound (1918) language model (4573)

Papers

KAMA-NNs: Low-dimensional Rotation Based Neural Networks AISTATS 2019

Risk-Sensitive Generative Adversarial Imitation Learning AISTATS 2019

Answers Unite! Unsupervised Metrics for Reinforced Summarization Models IJCNLP 2019

Collaborative Policy Learning for Open Knowledge Graph Reasoning EMNLP 2019

Unsupervised Basis Function Adaptation for Reinforcement Learning JMLR 2019

Knowledge Base Question Answering with Topic Units IJCAI 2019

Multi-scale Information Diffusion Prediction with Reinforced Recurrent Networks IJCAI 2019

Learning Interpretable Negation Rules via Weak Supervision at Document Level: A Reinforcement Learning Approach NAACL 2019

Rethinking Action Spaces for Reinforcement Learning in End-to-end Dialog Agents with Latent Variable Models NAACL 2019

Early Rumour Detection NAACL 2019

Unsupervised Dialog Structure Learning NAACL 2019

Reinforcement Learning based Curriculum Optimization for Neural Machine Translation NAACL 2019

Beyond task success: A closer look at jointly learning to see, ask, and GuessWhat NAACL 2019

Learning to Navigate Unseen Environments: Back Translation with Environmental Dropout NAACL 2019

Accelerated Reinforcement Learning for Sentence Generation by Vocabulary Prediction NAACL 2019

Complexity-Weighted Loss and Diverse Reranking for Sentence Simplification NAACL 2019

Reinforcement Learning Based Text Style Transfer without Parallel Training Corpus NAACL 2019

Exploiting Noisy Data in Distant Supervision Relation Classification NAACL 2019

Multi-Modal Generative Adversarial Network for Short Product Title Generation in Mobile E-Commerce NAACL 2019

Jumper: Learning When to Make Classification Decision in Reading IJCAI 2018

Joint Modeling for Query Expansion and Information Extraction with Reinforcement Learning EMNLP 2018

AirDialogue: An Environment for Goal-Oriented Dialogue Research EMNLP 2018

Learning End-to-End Goal-Oriented Dialog with Multiple Answers EMNLP 2018

A Teacher-Student Framework for Maintainable Dialog Manager EMNLP 2018

A Study of Reinforcement Learning for Neural Machine Translation EMNLP 2018