Papers

5,479 papers found

DialogXpert: Driving Intelligent and Emotion-Aware Conversations Through Online Value-Based Reinforcement Learning with LLM Priors

Tazeek Bin Abdur Rakib, Ambuj Mehrish, Lay-Ki Soon et al.

2026 AAAI

Where Norms and References Collide: Evaluating LLMs on Normative Reasoning

Mitchell Abrams, Kaveh Eskandari Miandoab, Felix Gervits et al.

2026 AAAI

Beyond Next Token Probabilities: Learnable, Fast Detection of Hallucinations and Data Contamination on LLM Output Distributions

Guy Bar-Shalom, Fabrizio Frasca, Derek Lim et al.

2026 AAAI

Do LLMs Really Struggle at NL-FOL Translation? Revealing Their Strengths via a Novel Benchmarking Strategy

Andrea Brunello, Luca Geatti, Michele Mignani et al.

2026 AAAI

RaCoT: Plug-and-Play Contrastive Example Generation Mechanism for Enhanced LLM Reasoning Reliability

Kaitong Cai, Jusheng Zhang, Yijia Fan et al.

2026 AAAI

Does Question Really Matter? The Attribution of Answer Bias in LLM Evaluation

Boxi Cao, Ruotong Pan, Hongyu Lin et al.

2026 AAAI

Can Editing LLMs Inject Harm?

Canyu Chen, Baixiang Huang, Zekun Li et al.

2026 AAAI

DEPO: Dual-Efficiency Preference Optimization for LLM Agents

Sirui Chen, Mengshi Zhao, Lei Xu et al.

2026 AAAI

Activations as Features: Probing LLMs for Generalizable Essay Scoring Representations

Jinwei Chi, Ke Wang, Yu Chen et al.

2026 AAAI

HanjaBridge: Resolving Semantic Ambiguity in Korean LLMs via Hanja-Augmented Pre-Training

Seungho Choi, Sihyun Park, Minsang Kim et al.

2026 AAAI

Persistent Backdoor Attacks Under Continual Fine-Tuning of LLMs

Jing Cui, Yufei Han, Jianbin Jiao et al.

2026 AAAI

When Smiley Turns Hostile: Interpreting How Emojis Trigger LLMs’ Toxicity

Shiyao Cui, Xijia Feng, Yingkang Wang et al.

2026 AAAI

HLPD: Aligning LLMs to Human Language Preference for Machine-Revised Text Detection

Fangqi Dai, Xingjian Jiang, Zizhuang Deng

2026 AAAI

Measuring the Unmeasurable: Unveiling Latent Cognitive Capabilities of LLM

Cui Danxin, Sihang Jiang, Keyi Wang et al.

2026 AAAI

Guess or Recall? Training CNNs to Classify and Localize Memorization in LLMs

Jérémie Dentan, Davide Buscaldi, Sonia Vanier

2026 AAAI

MemGuide: Intent-Driven Memory Selection for Goal-Oriented Multi-Session LLM Agents

Yiming Du, Bingbing Wang, Yang He et al.

2026 AAAI

Graph of Verification: Structured Verification of LLM Reasoning with Directed Acyclic Graphs

Jiwei Fang, Bin Zhang, Changwei Wang et al.

2026 AAAI

Toward Better EHR Reasoning in LLMs: Reinforcement Learning with Expert Attention Guidance

Yue Fang, Yuxin Guo, Jiaran Gao et al.

2026 AAAI

FinMathBench: A Formula-Driven Benchmark for Evaluating LLMs’ Math Reasoning Capabilities in Finance

Yi He, Ping Wang, Shiqiang Xiong et al.

2026 AAAI

Format Matters: The Robustness of Multimodal LLMs in Reviewing Evidence from Tables and Charts

Xanh Ho, Yun-Ang Wu, Sunisth Kumar et al.

2026 AAAI

Benchmarking LLMs’ Mathematical Reasoning with Unseen Random Variables Questions

Zijin Hong, Hao Wu, Su Dong et al.

2026 AAAI

SPA: Achieving Consensus in LLM Alignment via Self-Priority Optimization

Yue Huang, Xiangqi Wang, Xiangliang Zhang

2026 AAAI

Bootstrapping LLMs via Preference-Based Policy Optimization

Chen Jia

2026 AAAI

LiteLong: Resource-Efficient Long-Context Data Synthesis for LLMs

Junlong Jia, Xing Wu, Chaochen Gao et al.

2026 AAAI

Importance-Aware Data Selection for Efficient LLM Instruction Tuning

Tingyu Jiang, Shen Li, Yiyao Song et al.

2026 AAAI