Papers

261 papers found

Understanding Reference Policies in Direct Preference Optimization

Yixin Liu, Pengfei Liu, Arman Cohan

2025 NAACL

2D-DPO: Scaling Direct Preference Optimization with 2-Dimensional Supervision

Shilong Li, Yancheng He, Hui Huang et al.

2025 NAACL

Team NP_PROBLEM at SemEval-2024 Task 7: Numerical Reasoning in Headline Generation with Preference Optimization

Pawan Rajpoot, Nut Chukamphaeng

2024 SEMEVAL

Sakura at SemEval-2025 Task 2: Enhancing Named Entity Translation with Fine-Tuning and Preference Optimization

Alberto Poncelas, Ohnmar Htun

2025 SEMEVAL

Dataground at SemEval-2025 Task 8: Small LLMs and Preference Optimization for Tabular QA

Giuseppe Attardi, Andrea Nelson Mauro, Daniele Sartiano

2025 SEMEVAL

Atyaephyra at SemEval-2025 Task 4: Low-Rank Negative Preference Optimization

Jan Bronec, Jindřich Helcl

2025 SEMEVAL

Align Video Diffusion Model with Online Video-Centric Preference Optimization

Jiacheng Zhang, Jie Wu, Weifeng Chen et al.

2026 WACV

Offline Preference Optimization via Maximum Marginal Likelihood Estimation

Saeed Najafi, Alona Fyshe

2026 EACL

Joint Multimodal Preference Optimization for Fine-Grained Visual-Textual Alignment

Jiwon Kim, Hyunsoo Yoon

2026 EACL

Causal Direct Preference Optimization for Language Model Alignment

Uyen Le, Thin Nguyen, Toan Nguyen et al.

2026 EACL

Attribute-Controlled Translation with Preference Optimization

Inigo Jauregi Unanue, Najmeh Sadoughi, Vimal Bhat et al.

2026 EACL

Benchmarking Direct Preference Optimization for Medical Large Vision–Language Models

Dain Kim, Jiwoo Lee, Jaehoon Yun et al.

2026 EACL

IRPO: Implicit Policy Regularized Preference Optimization

Youngsoo Jang, Yu Jin Kim, Geon-Hyeong Kim et al.

2026 EACL

EPO: Diverse and Realistic Protein Ensemble Generation via Energy Preference Optimization

Yuancheng Sun, Yuxuan Ren, Zhaoming Chen et al.

2026 AAAI

Margin-Aware Preference Optimization for Aligning Diffusion Models Without Reference

Jiwoo Hong, Sayak Paul, Noah Lee et al.

2026 AAAI

FocusDPO: Dynamic Preference Optimization for Multi-Subject Personalized Image Generation via Adaptive Focus

Qiaoqiao Jin, Siming Fu, Dong She et al.

2026 AAAI

Rethinking Direct Preference Optimization in Diffusion Models

Junyong Kang, Seohyun Lim, Kyungjune Baek et al.

2026 AAAI

Test-Time Preference Optimization for Image Restoration

Bingchen Li, Xin Li, Jiaqi Xu et al.

2026 AAAI

FantasyTalking2: Timestep-Layer Adaptive Preference Optimization for Audio-Driven Portrait Animation

Mengchao Wang, Wang Qiang, Fan Jiang et al.

2026 AAAI

Diffusion Distillation with Direct Preference Optimization for Efficient 3D LiDAR Scene Completion

An Zhao, Shengyuan Zhang, Zejian Li et al.

2026 AAAI

OmniDPO: A Preference Optimization Framework to Address Omni-Modal Hallucination

Junzhe Chen, Tianshu Zhang, Shiyu Huang et al.

2026 AAAI

DEPO: Dual-Efficiency Preference Optimization for LLM Agents

Sirui Chen, Mengshi Zhao, Lei Xu et al.

2026 AAAI

LifeAlign: Lifelong Alignment for Large Language Models with Memory-Augmented Focalized Preference Optimization

Junsong Li, Jie Zhou, Bihao Zhan et al.

2026 AAAI

Query-Routed Activation Editing with Truth-hierarchical Preference Optimization

Kewei Liao, Tianbo Wang, Yuqing Ma et al.

2026 AAAI

Textual Self-Attention Network: Test-Time Preference Optimization Through Textual Gradient-Based Attention

Shibing Mo, Haoyang Ruan, Kai Wu et al.

2026 AAAI