policy evaluation

115 papers

Explore in graph

Also known as

OPE

Co-occurring keywords

reinforcement learning (4122) temporal difference learning (149) value function (294) offline reinforcement learning (492) causal inference (1619) function approximation (319) off-policy learning (227) markov decision process (788) temporal-difference learning (42) linear function approximation (101)

Papers

Adaptive Temporal-Difference Learning for Policy Evaluation with Per-State Uncertainty Estimates NIPS 2019

Distributional reinforcement learning with linear function approximation AISTATS 2019

Finite-Time Analysis of Distributed TD(0) with Linear Function Approximation on Multi-Agent Reinforcement Learning ICML 2019

Variance Reduced Policy Evaluation with Smooth Function Approximation NIPS 2019

Policy Evaluation with Latent Confounders via Optimal Balance NIPS 2019

Neural Temporal-Difference Learning Converges to Global Optima NIPS 2019

Planning with Expectation Models IJCAI 2019

CAB: Continuous Adaptive Blending for Policy Evaluation and Learning ICML 2019

Balanced Policy Evaluation and Learning NIPS 2018

Multi-Agent Reinforcement Learning via Double Averaging Primal-Dual Optimization NIPS 2018

A Unified Approach for Multi-step Temporal-Difference Learning with Eligibility Traces in Reinforcement Learning IJCAI 2018

Policy Evaluation and Optimization with Continuous Treatments AISTATS 2018

Sparse Gaussian Process Temporal Difference Learning for Marine Robot Navigation CORL 2018

Finite Sample Analysis of LSTD with Random Projections and Eligibility Traces IJCAI 2018

Exploration by Distributional Reinforcement Learning IJCAI 2018

Least-Squares Temporal Difference Learning for the Linear Quadratic Regulator ICML 2018

Stochastic Variance Reduction Methods for Policy Evaluation ICML 2017

Finite Sample Analysis of the GTD Policy Evaluation Algorithms in Markov Setting NIPS 2017

Data-Efficient Policy Evaluation Through Behavior Policy Search ICML 2017

Learning Sparse Representations in Reinforcement Learning with Sparse Coding IJCAI 2017

Efficient Reinforcement Learning with Hierarchies of Machines by Leveraging Internal Transitions IJCAI 2017

Safe and Efficient Off-Policy Reinforcement Learning NIPS 2016

Long-term Causal Effects via Behavioral Game Theory NIPS 2016

Differentially Private Policy Evaluation ICML 2016

Off-policy Model-based Learning under Unknown Factored Dynamics ICML 2015