off-policy evaluation

144 papers

Explore in graph

Also known as

OPE

Co-occurring keywords

reinforcement learning (4122) importance sampling (316) contextual bandit (379) causal inference (1619) markov decision process (788) variance reduction (520) doubly robust estimator (37) offline reinforcement learning (492) confidence interval (145) doubly robust (32)

Papers

Cross-Validated Off-Policy Evaluation AAAI 2025

Efficient Multi-Policy Evaluation for Reinforcement Learning AAAI 2025

Distributional Off-Policy Evaluation for Slate Recommendations AAAI 2024

RoME: A Robust Mixed-Effects Bandit Algorithm for Optimizing Mobile Health Interventions NIPS 2024

Off-Policy Selection for Initiating Human-Centric Experimental Design NIPS 2024

Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement Learning NIPS 2024

Off-policy estimation with adaptively collected data: the power of online learning NIPS 2024

RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation NIPS 2024

On the Curses of Future and History in Future-dependent Value Functions for Off-policy Evaluation NIPS 2024

Data-Efficient Policy Evaluation Through Behavior Policy Search JMLR 2024

Logarithmic Smoothing for Pessimistic Off-Policy Evaluation, Selection and Learning NIPS 2024

PoRank: A Practical Framework for Learning to Rank Policies IJCAI 2024

Efficient and Sharp Off-Policy Evaluation in Robust Markov Decision Processes NIPS 2024

Get a Head Start: On-Demand Pedagogical Policy Selection in Intelligent Tutoring AAAI 2024

EpiCare: A Reinforcement Learning Benchmark for Dynamic Treatment Regimes NIPS 2024

Abstract Reward Processes: Leveraging State Abstraction for Consistent Off-Policy Evaluation NIPS 2024

Robust Offline Reinforcement Learning with Heavy-Tailed Rewards AISTATS 2024

Hyperparameter Optimization Can Even Be Harmful in Off-Policy Learning and How to Deal with It IJCAI 2024

Policy Evaluation for Reinforcement Learning from Human Feedback: A Sample Complexity Analysis AISTATS 2024

Multiply Robust Off-policy Evaluation and Learning under Truncation by Death ICML 2023

Multiple-policy High-confidence Policy Evaluation AISTATS 2023

Scaling Marginalized Importance Sampling to High-Dimensional State-Spaces via State Abstraction AAAI 2023

Off-Policy Evaluation for Large Action Spaces via Conjunct Effect Modeling ICML 2023

Counterfactual Learning with General Data-Generating Policies AAAI 2023

Policy-Adaptive Estimator Selection for Off-Policy Evaluation AAAI 2023