off-policy evaluation

144 papers

Explore in graph

Also known as

OPE

Co-occurring keywords

reinforcement learning (4122) importance sampling (316) contextual bandit (379) causal inference (1619) markov decision process (788) variance reduction (520) doubly robust estimator (37) offline reinforcement learning (492) confidence interval (145) doubly robust (32)

Papers

Intrinsically Efficient, Stable, and Bounded Off-Policy Evaluation for Reinforcement Learning NIPS 2019

More Efficient Off-Policy Evaluation through Regularized Targeted Learning ICML 2019

Dynamic Measurement Scheduling for Event Forecasting using Deep RL ICML 2019

Semi-Parametric Efficient Policy Learning with Continuous Actions NIPS 2019

Off-Policy Evaluation via Off-Policy Classification NIPS 2019

DualDICE: Behavior-Agnostic Estimation of Discounted Stationary Distribution Corrections NIPS 2019

On the Design of Estimators for Bandit Off-Policy Evaluation ICML 2019

More Robust Doubly Robust Off-policy Evaluation ICML 2018

Importance Sampling for Fair Policy Selection IJCAI 2018

Optimal and Adaptive Off-policy Evaluation in Contextual Bandits ICML 2017

Data-Efficient Policy Evaluation Through Behavior Policy Search ICML 2017

Off-policy evaluation for slate recommendation NIPS 2017

Consistent On-Line Off-Policy Evaluation ICML 2017

Using Options and Covariance Testing for Long Horizon Off-Policy Policy Evaluation NIPS 2017

Bounded Off-Policy Evaluation with Missing Data for Course Recommendation and Curriculum Design ICML 2016

Doubly Robust Off-policy Value Evaluation for Reinforcement Learning ICML 2016

Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning ICML 2016

Toward Minimax Off-policy Value Estimation AISTATS 2015

Model-Free Monte Carlo-like Policy Evaluation AISTATS 2010