conftrace_

reinforcement learning

4122 papers

Explore in graph

Also known as

RL REINFORCE

Co-occurring keywords

large language model (12755) policy learning (699) markov decision process (788) policy gradient (518) policy optimization (630) deep reinforcement learning (903) multi-agent system (1743) imitation learning (741) regret bound (1918) language model (4573)

Papers

MedGR2: Breaking the Data Barrier for Medical Reasoning via Generative Reward Learning AAAI 2026

ArchetypeTrader: Reinforcement Learning for Selecting and Refining Learnable Strategic Archetypes in Quantitative Trading AAAI 2026

ASKD: Reinforcement Learning-Style Knowledge Distillation with Quality-Adaptive Skewness AAAI 2026

Elite Pattern Reinforcement for Vehicle Routing Problems AAAI 2026

STELAR-VISION: Self-Topology-Aware Efficient Learning for Aligned Reasoning in Vision AAAI 2026

CycleChemist: A Dual-Pronged Machine Learning Framework for Organic Photovoltaic Discovery AAAI 2026

DDIN: Reinforcement Learning with Asymmetric GNNs for Dismantling Directed Interdependent Networks (Student Abstract) AAAI 2026

OR-R1: Automating Modeling and Solving of Operations Research Optimization Problem via Test-Time Reinforcement Learning AAAI 2026

FinRpt: Dataset, Evaluation System and LLM-based Multi-agent Framework for Equity Research Report Generation AAAI 2026

Guided Distillation and Risk Adaptive Evolution for Multi-Robot Navigation AAAI 2026

Attention to Threat-Relevant Objects: Reasoning Detection in Autonomous Driving via Multimodal Large Language Models AAAI 2026

Relation-R1: Progressively Cognitive Chain-of-Thought Guided Reinforcement Learning for Unified Relation Comprehension AAAI 2026

From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation AAAI 2026

Ground What You See: Hallucination-Resistant MLLMs via Caption Feedback, Diversity-Aware Sampling, and Conflict Regularization AAAI 2026

UniMo: Unified Motion Generation and Understanding with Chain of Thought AAAI 2026

Affordance-R1: Reinforcement Learning for Generalizable Affordance Reasoning in Multimodal Large Language Models AAAI 2026

MedReasoner: Reinforcement Learning Drives Reasoning Grounding from Clinical Thought to Pixel-Level Precision AAAI 2026

RemoteReasoner: Towards Unifying Geospatial Reasoning Workflow AAAI 2026

LENS: Learning to Segment Anything with Unified Reinforced Reasoning AAAI 2026

LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation AAAI 2026

Think Wise, Collaborate Effectively: A Rationale-Aware LLM-Based Recommender with Reinforcement Learning from Collaborative Signals AAAI 2026

UI-R1: Enhancing Efficient Action Prediction of GUI Agents by Reinforcement Learning AAAI 2026

AdaCuRL: Adaptive Curriculum Reinforcement Learning with Invalid Sample Mitigation and Historical Revisiting AAAI 2026

SHADOW: Dynamic-Aware Credit Assignment Against Long-Horizon Tasks AAAI 2026

RESTL: Reinforcement Learning Guided by Multi-Aspect Rewards for Signal Temporal Logic Transformation AAAI 2026