Research Explorer

Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model

Junshu Pan, Wei Shen, Shulin Huang et al.

2026 AAAI

LLMdoctor: Token-Level Flow-Guided Preference Optimization for Efficient Test-Time Alignment of Large Language Models

Tiesunlong Shen, Rui Mao, Jin Wang et al.

2026 AAAI

Multi-level Style Preference Optimization: An Adaptive Detection Framework for Human-Machine Hybrid Text

Zehao Wang, Lianwei Wu, Wenbo An et al.

2026 AAAI

AP2O-Coder: Adaptively Progressive Preference Optimization for Reducing Compilation and Runtime Errors in LLM-Generated Code

Jianqing Zhang, Wei Xia, Hande Dong et al.

2026 AAAI

MetaGDPO: Alleviating Catastrophic Forgetting with Metacognitive Knowledge Through Group Direct Preference Optimization

Lanxue Zhang, Yuqiang Xie, Fang Fang et al.

2026 AAAI

Preference Optimization via Contrastive Divergence: Your Policy Is Secretly an NLL Estimator

Zhuotong Chen, Fang Liu, Xuan Zhu et al.

2026 AAAI

AMaPO: Adaptive Margin-attached Preference Optimization for Language Model Alignment

Ruibo Deng, Duanyu Feng, Wenqiang Lei

2026 AAAI

DETONATE – A Benchmark for Text-to-Image Alignment and Kernelized Direct Preference Optimization

Renjith Prasad Kaippilly Mana, Abhilekh Borah, Hasnat Md Abdullah et al.

2026 AAAI

Bi-Level Preference Optimization for Retrieval-Augmented Generation (Student Abstract)

Sizhong Cao

2026 AAAI

Adaptive KL Control for Direct Preference Optimization in Instruction-Following LLMs

Yi Khuen Chai

2026 AAAI

NHK Submission to WAT 2025: Leveraging Preference Optimization for Article-level Japanese–English News Translation

Hideya Mino, Rei Endo, Yoshihiko Kawai

2025 AACL

High-Dimensional Dueling Optimization with Preference Embedding

Yangwenhui Zhang, Hong Qian, Xiang Shu et al.

2023 AAAI

Preference Ranking Optimization for Human Alignment

Feifan Song, Bowen Yu, Minghao Li et al.

2024 AAAI

FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema

Junru Lu, Siyu An, Min Zhang et al.

2025 COLING

Relation-Augmented Dueling Bayesian Optimization via Preference Propagation

Xiang Xia, Xiang Shu, Shuo Liu et al.

2025 IJCAI

Gradient-Based Optimization for Bayesian Preference Elicitation

Ivan Vendrov, Tyler Lu, Qingqing Huang et al.

2020 AAAI

Multi-Objective Bayesian Optimization with Active Preference Learning

Ryota Ozaki, Kazuki Ishikawa, Youhei Kanzaki et al.

2024 AAAI

DreamAlign: Dynamic Text-to-3D Optimization with Human Preference Alignment

Gaofeng Liu, Zhiyuan Ma, Tao Fang

2025 AAAI

Multi-attribute Bayesian optimization with interactive preference learning

Raul Astudillo, Peter Frazier

2020 AISTATS

DORM: Preference Data Weights Optimization for Reward Modeling in LLM Alignment

Rongzhi Zhang, Chenwei Zhang, Xinyang Zhang et al.

2025 EMNLP

Multimodal Large Language Model-Guided ISP Hyperparameter Optimization with Dynamic Preference Learning

Xinyu Sun, Zhikun Zhao, Congyan Lang et al.

2025 ICCV

Targeted Hyperparameter Optimization with Lexicographic Preferences Over Multiple Objectives

Shaokun Zhang, Feiran Jia, Chi Wang et al.

2023 ICLR

Suit the Remedy to the Retriever: Interpretable Query Optimization with Retriever Preference Alignment for Vision-Language Retrieval

GuangHao Meng, Jinpeng Wang, Jieming Zhu et al.

2026 AAAI

Token-level Preference Self-Alignment Optimization for Multi-style Outline Controllable Generation

Zihao Li, Xuekong Xu, Ziyao Chen et al.

2025 ACL

MWPO: Enhancing LLMs Performance through Multi-Weight Preference Strength and Length Optimization

Shiyue Xu, Fu Zhang, Jingwei Cheng et al.

2025 ACL

Papers