Reinforcement Learning › Methods ›

Policy Learning

2068 directly classified papers

Papers per year

Papers

Off-Policy Average Reward Actor-Critic with Deterministic Policy Search ICML 2023

Spotlight News Driven Quantitative Trading Based on Trajectory Optimization IJCAI 2023

ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data Format EMNLP 2023

Model Predictive Control via On-Policy Imitation Learning L4DC 2023

Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning EMNLP 2023

InitLight: Initial Model Generation for Traffic Signal Control Using Adversarial Inverse Reinforcement Learning IJCAI 2023

Posterior Sampling for Deep Reinforcement Learning ICML 2023

Revisiting Bellman Errors for Offline Model Selection ICML 2023

On the Occupancy Measure of Non-Markovian Policies in Continuous MDPs ICML 2023

Policy Regularization with Dataset Constraint for Offline Reinforcement Learning ICML 2023

Towards Hierarchical Policy Learning for Conversational Recommendation with Hypergraph-based Reinforcement Learning IJCAI 2023

Learning Compiler Pass Orders using Coreset and Normalized Value Prediction ICML 2023

Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision Processes ICML 2023

A Pragmatic Look at Deep Imitation Learning ACML 2023

Logarithmic regret in communicating MDPs: Leveraging known dynamics with bandits ACML 2023

Beyond Reward: Offline Preference-guided Policy Optimization ICML 2023

Sample Efficient Model-free Reinforcement Learning from LTL Specifications with Optimality Guarantees IJCAI 2023

Modified Policy Iteration for Exponential Cost Risk Sensitive MDPs L4DC 2023

A Reinforcement Learning Look at Risk-Sensitive Linear Quadratic Gaussian Control L4DC 2023

Practical Critic Gradient based Actor Critic for On-Policy Reinforcement Learning L4DC 2023

Provable Hierarchy-Based Meta-Reinforcement Learning AISTATS 2023

Reinforcement Learning with Stepwise Fairness Constraints AISTATS 2023

Continuous Versatile Jumping Using Learned Action Residuals L4DC 2023

Hierarchical State Abstraction based on Structural Information Principles IJCAI 2023

On The Convergence Of Policy Iteration-Based Reinforcement Learning With Monte Carlo Policy Evaluation AISTATS 2023