preference learning

411 papers

Explore in graph

Also known as

DPO PL

Co-occurring keywords

large language model (12755) reinforcement learning (4122) direct preference optimization (317) reinforcement learning from human feedback (261) language model alignment (142) reward model (251) human feedback (161) reward modeling (159) model alignment (219) human preference (120)

Papers

LLaVA-Critic: Learning to Evaluate Multimodal Models CVPR 2025

STeCa: Step-level Trajectory Calibration for LLM Agent Learning ACL 2025

Modeling the One-to-Many Property in Open-Domain Dialogue with LLMs ACL 2025

Regularized Best-of-N Sampling with Minimum Bayes Risk Objective for Language Model Alignment NAACL 2025

LLM-based Conversational Recommendation Agents with Collaborative Verbalized Experience EMNLP 2025

High-Dimension Human Value Representation in Large Language Models NAACL 2025

Verifiable by Design: Aligning Language Models to Quote from Pre-Training Data NAACL 2025

Code-Optimise: Self-Generated Preference Data for Correctness and Efficiency NAACL 2025

When Personalization Meets Reality: A Multi-Faceted Analysis of Personalized Preference Learning EMNLP 2025

A Survey on Bandit Learning in Matching Markets IJCAI 2025

Towards Reward Fairness in RLHF: From a Resource Allocation Perspective ACL 2025

M-RewardBench: Evaluating Reward Models in Multilingual Settings ACL 2025

GAPO: Learning Preferential Prompt through Generative Adversarial Policy Optimization ACL 2025

ACECODER: Acing Coder RL via Automated Test-Case Synthesis ACL 2025

HSCR: Hierarchical Self-Contrastive Rewarding for Aligning Medical Vision Language Models ACL 2025

World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning ACL 2025

IndoPref: A Multi-Domain Pairwise Preference Dataset for Indonesian AACL 2025

p²-TQA: A Process-based Preference Learning Framework for Self-Improving Table Question Answering Models AACL 2025

Binary Classifier Optimization for Large Language Model Alignment ACL 2025

Aligner: Efficient Alignment by Learning to Correct NIPS 2024

Automatic Pair Construction for Contrastive Post-training NAACL 2024

Rating-Based Reinforcement Learning AAAI 2024

Embedding Learning for Preference-based Speech Quality Assessment INTERSPEECH 2024

Online Learning of Capacity-Based Preference Models IJCAI 2024

Online Iterative Reinforcement Learning from Human Feedback with General Preference Model NIPS 2024