sample efficiency

469 papers

Explore in graph

Co-occurring keywords

reinforcement learning (4122) deep reinforcement learning (903) model-based reinforcement learning (415) representation learning (6174) policy gradient (518) policy optimization (630) continuous control (246) off-policy learning (227) value function (294) imitation learning (741)

Papers

Novelty-Guided Data Reuse for Efficient and Diversified Multi-Agent Reinforcement Learning AAAI 2025

Scalable Acceleration for Classification-Based Derivative-Free Optimization AAAI 2025

Reward Adaptation via Q-Manipulation: Provably Beneficial Reward Function Transfer in Reinforcement Learning IJCAI 2025

Self-Consistent Model-based Adaptation for Visual Reinforcement Learning IJCAI 2025

TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making EMNLP 2025

A Formal Theory of Optimal Learning with Experimental Results IJCAI 2025

ModernBERT or DeBERTaV3? Examining Architecture and Data Influence on Transformer Encoder Models Performance IJCNLP 2025

Stabilizing and Accelerating Autofocus with Expert Trajectory Regularized Deep Reinforcement Learning CVPR 2025

VLMs-Guided Representation Distillation for Efficient Vision-Based Reinforcement Learning CVPR 2025

CTD4 – a Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics AAAI 2025

Efficient Diversity-based Experience Replay for Deep Reinforcement Learning IJCAI 2025

Sample-Efficient Behavior Cloning Using General Domain Knowledge IJCAI 2025

EDGE: Efficient Data Selection for LLM Agents via Guideline Effectiveness IJCAI 2025

Single-Loop Federated Actor-Critic across Heterogeneous Environments AAAI 2025

ERCI: An Explainable Experience Replay Approach with Causal Inference for Deep Reinforcement Learning AAAI 2025

Enhancing Question Generation through Diversity-Seeking Reinforcement Learning with Bilevel Policy Decomposition AAAI 2025

Unearthing Gems from Stones: Policy Optimization with Negative Sample Augmentation for LLM Reasoning EMNLP 2025

Domain Randomization is Sample Efficient for Linear Quadratic Control L4DC 2025

Unlocking the Planning Capabilities of Large Language Models with Maximum Diversity Fine-tuning NAACL 2025

To Label or Not to Label: PALM - A Predictive Model for Evaluating Sample Efficiency in Active Learning Models ICCV 2025

Beyond Repetition: Text Simplification and Curriculum Learning for Data-Constrained Pretraining EMNLP 2025

Kernel Learning for Sample Constrained Black-Box Optimization AAAI 2025

Task-driven Layerwise Additive Activation Intervention NAACL 2025

Contrastive Representation for Interactive Recommendation AAAI 2025

One Encoder to Rule them All: Representation Learning for Model-free Visual Reinforcement Learning using Fourier Neural Operators ICCV 2025