Papers

261 papers found

Margin Matching Preference Optimization: Enhanced Model Alignment with Granular Feedback

Kyuyoung Kim, Ah Jeong Seo, Hao Liu et al.

2024 EMNLP

On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization

Yong Lin, Skyler Seto, Maartje Ter Hoeve et al.

2024 EMNLP

Direct Judgement Preference Optimization

PeiFeng Wang, Austin Xu, Yilun Zhou et al.

2025 EMNLP

Re-Align: Aligning Vision Language Models via Retrieval-Augmented Direct Preference Optimization

Shuo Xing, Peiran Li, Yuping Wang et al.

2025 EMNLP

Co-Evolving LLMs and Embedding Models via Density-Guided Preference Optimization for Text Clustering

Zetong Li, Qinliang Su, Minhua Huang et al.

2025 EMNLP

Selective Preference Optimization via Token-Level Reward Function Estimation

Kailai Yang, Zhiwei Liu, Qianqian Xie et al.

2025 EMNLP

TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making

Kechen Jiao, Zhirui Fang, Jiahao Liu et al.

2025 EMNLP

Structured Preference Optimization for Vision-Language Long-Horizon Task Planning

Xiwen Liang, Min Lin, Weiqi Ruan et al.

2025 EMNLP

Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization

Jiulong Wu, Zhengliang Shi, Shuaiqiang Wang et al.

2025 EMNLP

Weights-Rotated Preference Optimization for Large Language Models

Chenxu Yang, Ruipeng Jia, Mingyu Zheng et al.

2025 EMNLP

Refining Text Generation for Realistic Conversational Recommendation via Direct Preference Optimization

Manato Tajiri, Michimasa Inaba

2025 EMNLP

Image Difference Captioning via Adversarial Preference Optimization

Zihan Huang, Junda Wu, Rohan Surana et al.

2025 EMNLP

Learning to Translate Ambiguous Terminology by Preference Optimization on Post-Edits

Nathaniel Berger, Johannes Eschbach-Dymanus, Miriam Exel et al.

2025 EMNLP

Auto-Weighted Group Relative Preference Optimization for Multi-Objective Text Generation Tasks

Yuki Ichihara, Yuu Jinnai

2025 EMNLP

DCRM: A Heuristic to Measure Response Pair Quality in Preference Optimization

Chengyu Huang, Tanya Goyal

2025 EMNLP

SPO: Self Preference Optimization with Self Regularization

Yuhao Sun, Yifan Zhang, Quandong Wang et al.

2025 EMNLP

Creative Preference Optimization

Mete Ismayilzada, Antonio Laverghetta Jr., Simone A. Luchini et al.

2025 EMNLP

ReCUT: Balancing Reasoning Length and Accuracy in LLMs via Stepwise Trails and Preference Optimization

Zhensheng Jin, Xinze Li, Yifan Ji et al.

2025 EMNLP

Captioning for Text-Video Retrieval via Dual-Group Direct Preference Optimization

Ji Soo Lee, Byungoh Ko, Jaewon Cho et al.

2025 EMNLP

SeaPO: Strategic Error Amplification for Robust Preference Optimization of Large Language Models

Jun Rao, Yunjie Liao, Xuebo Liu et al.

2025 EMNLP

MidPO: Dual Preference Optimization for Safety and Helpfulness in Large Language Models via a Mixture of Experts Framework

Yupeng Qi, Ziyu Lyu, Min Yang et al.

2025 EMNLP

Adaptive Preference Optimization with Uncertainty-aware Utility Anchor

Xiaobo Wang, Zixia Jia, Jiaqi Li et al.

2025 EMNLP

Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation

Jihao Gu, Yingyao Wang, Meng Cao et al.

2025 EMNLP

CoTD-PO: Chain-of-Thought Distillation with Preference Optimization

Lujie Niu, Haochen Sun, Fangkun Zhao et al.

2025 EMNLP

DecoupledESC: Enhancing Emotional Support Generation via Strategy-Response Decoupled Preference Optimization

Chao Zhang, Xin Shi, Xueqiao Zhang et al.

2025 EMNLP