conftrace_

← Learning Types

Machine Learning › Learning Types ›

Reinforcement Learning

2,932 papers

Papers per year

Papers

State-Wise Adaptive Discounting from Experience (SADE): A Novel Discounting Scheme for Reinforcement Learning (Student Abstract) AAAI 2021

ACAT-G: An Interactive Learning Framework for Assisted Response Generation AAAI 2021

A DQN-based Approach to Finding Precise Evidences for Fact Verification ACL 2021

Mitigating Bias in Session-based Cyberbullying Detection: A Non-Compromising Approach ACL 2021

[RETRACTED] WeaSuL: Weakly Supervised Dialogue Policy Learning: Reward Estimation for Multi-turn Dialogue ACL 2021

A Proposal: Interactively Learning to Summarise Timelines by Reinforcement Learning ACL 2021

Hybrid Summarization with Semantic Weighting Reward and Latent Structure Detector ACML 2021

Regularized Policies are Reward Robust AISTATS 2021

Online Sparse Reinforcement Learning AISTATS 2021

Adaptive Approximate Policy Iteration AISTATS 2021

Confident Off-Policy Evaluation and Selection through Self-Normalized Importance Weighting AISTATS 2021

Sample Complexity Bounds for Two Timescale Value-based Reinforcement Learning Algorithms AISTATS 2021

Optimizing Percentile Criterion using Robust MDPs AISTATS 2021

When Will Generative Adversarial Imitation Learning Algorithms Attain Global Convergence AISTATS 2021

Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning AISTATS 2021

Q-learning with Logarithmic Regret AISTATS 2021

Minimax Model Learning AISTATS 2021

Reinforcement Learning in Parametric MDPs with Exponential Families AISTATS 2021

Approximately Solving Mean Field Games via Entropy-Regularized Deep Reinforcement Learning AISTATS 2021

Off-policy Evaluation in Infinite-Horizon Reinforcement Learning with Latent Confounders AISTATS 2021

On the Linear Convergence of Policy Gradient Methods for Finite MDPs AISTATS 2021

Non-Stationary Off-Policy Optimization AISTATS 2021

Provably Eﬃcient Actor-Critic for Risk-Sensitive and Robust Adversarial RL: A Linear-Quadratic Case AISTATS 2021

Finite-Sample Regret Bound for Distributionally Robust Offline Tabular Reinforcement Learning AISTATS 2021

Online Model Selection for Reinforcement Learning with Function Approximation AISTATS 2021