conftrace_

reinforcement learning

4352 papers

Explore in graph

Also known as

RL REINFORCE

Co-occurring keywords

large language model (13587) policy learning (702) markov decision process (790) policy optimization (657) policy gradient (520) deep reinforcement learning (903) multi-agent system (1819) imitation learning (744) regret bound (1926) language model (4599)

Papers

Mitigating Partial Observability in Sequential Decision Processes via the Lambda Discrepancy NIPS 2024

ODRL: A Benchmark for Off-Dynamics Reinforcement Learning NIPS 2024

Diffusion for World Modeling: Visual Details Matter in Atari NIPS 2024

Rethinking Exploration in Reinforcement Learning with Effective Metric-Based Exploration Bonus NIPS 2024

Diversity Is Not All You Need: Training A Robust Cooperative Agent Needs Specialist Partners NIPS 2024

Pre-Trained Multi-Goal Transformers with Prompt Optimization for Efficient Online Adaptation NIPS 2024

Expectation Alignment: Handling Reward Misspecification in the Presence of Expectation Mismatch NIPS 2024

Variational Delayed Policy Optimization NIPS 2024

Diffusion-based Reinforcement Learning via Q-weighted Variational Policy Optimization NIPS 2024

Personalizing Reinforcement Learning from Human Feedback with Variational Preference Learning NIPS 2024

REBEL: Reinforcement Learning via Regressing Relative Rewards NIPS 2024

Sampling-based Safe Reinforcement Learning for Nonlinear Dynamical Systems AISTATS 2024

Recursive Introspection: Teaching Language Model Agents How to Self-Improve NIPS 2024

Predicting Future Actions of Reinforcement Learning Agents NIPS 2024

Learning Successor Features the Simple Way NIPS 2024

Discovering Creative Behaviors through DUPLEX: Diverse Universal Features for Policy Exploration NIPS 2024

Safe & Accurate at Speed with Tendons: A Robot Arm for Exploring Dynamic Motion RSS 2024

Design and Control of a Bipedal Robotic Character RSS 2024

Online Control with Adversarial Disturbance for Continuous-time Linear Systems NIPS 2024

Policy Mirror Descent with Lookahead NIPS 2024

Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion RSS 2024

Do's and Don'ts: Learning Desirable Skills with Instruction Videos NIPS 2024

ZSC-Eval: An Evaluation Toolkit and Benchmark for Multi-agent Zero-shot Coordination NIPS 2024

Continual Reinforcement Learning for Controlled Text Generation COLING 2024

Goal Conditioned Reinforcement Learning for Photo Finishing Tuning NIPS 2024