conftrace_

offline reinforcement learning

492 papers

Explore in graph

Also known as

OFFLINE RL ORL RL

Co-occurring keywords

policy optimization (630) policy learning (699) model-based reinforcement learning (415) value function (294) sample complexity (1158) deep reinforcement learning (903) imitation learning (741) distribution shift (711) markov decision process (788) reinforcement learning (4122)

Papers

A Finite-State Controller Based Offline Solver for Deterministic POMDPs IJCAI 2025

Decision SpikeFormer: Spike-Driven Transformer for Decision Making CVPR 2025

State Revisit and Re-explore: Bridging Sim-to-Real Gaps in Offline-and-Online Reinforcement Learning with An Imperfect Simulator IJCAI 2025

GOODLIAR: A Reinforcement Learning-Based Deceptive Agent for Disrupting LLM Beliefs on Foundational Principles ACL 2025

Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework AAAI 2025

Simulation-Free Hierarchical Latent Policy Planning for Proactive Dialogues AAAI 2025

Evaluation of Active Feature Acquisition Methods for Time-varying Feature Settings JMLR 2025

Offline Multi-Agent Reinforcement Learning via In-Sample Sequential Policy Optimization AAAI 2025

Selective Uncertainty Propagation in Offline RL AAAI 2025

Are Expressive Models Truly Necessary for Offline RL? AAAI 2025

Dynamic Uncertainty Estimation for Offline Reinforcement Learning AAAI 2025

In-Dataset Trajectory Return Regularization for Offline Preference-based Reinforcement Learning AAAI 2025

Foundations of Multi-Agent Learning in Dynamic Environments: Where Reinforcement Learning Meets Strategic Decision-Making AAAI 2025

Enhancing Online Reinforcement Learning with Meta-Learned Objective from Offline Data AAAI 2025

Cache-Efficient Posterior Sampling for Reinforcement Learning with LLM-Derived Priors Across Discrete and Continuous Domains EMNLP 2025

Imagination-Limited Q-Learning for Offline Reinforcement Learning IJCAI 2025

Beyond the Known: Decision Making with Counterfactual Reasoning Decision Transformer IJCAI 2025

Constraint-Adaptive Policy Switching for Offline Safe Reinforcement Learning AAAI 2025

Unearthing Gems from Stones: Policy Optimization with Negative Sample Augmentation for LLM Reasoning EMNLP 2025

SORREL: Suboptimal-Demonstration-Guided Reinforcement Learning for Learning to Branch AAAI 2025

MGDA: Model-based Goal Data Augmentation for Offline Goal-conditioned Weighted Supervised Learning AAAI 2025

Active Reinforcement Learning Strategies for Offline Policy Improvement AAAI 2025

Behaviour Preference Regression for Offline Reinforcement Learning AAAI 2025

Offline Safe Reinforcement Learning Using Trajectory Classification AAAI 2025

Improving Generalization in Offline Reinforcement Learning via Latent Distribution Representation Learning AAAI 2025