conftrace_

Papers

17,973 papers found · 2,658 more without abstracts hidden Show all

Rust-doctor: Enhanced Feature for Rust Ownership and Lifetime Repair with Balanced Training Data Generation

Wenzhang Yang, Xiaoning Ren, Cuifeng Gao et al.

2025 EMNLP

s1: Simple test-time scaling

Niklas Muennighoff, Zitong Yang, Weijia Shi et al.

2025 EMNLP

S2LPP: Small-to-Large Prompt Prediction across LLMs

Liang Cheng, Tianyi Li, Zhaowei Wang et al.

2025 EMNLP

s3: You Don’t Need That Much Data to Train a Search Agent via RL

Pengcheng Jiang, Xueqiang Xu, Jiacheng Lin et al.

2025 EMNLP

SABER: Uncovering Vulnerabilities in Safety Alignment via Cross-Layer Residual Connection

Maithili Joshi, Palash Nandi, Tanmoy Chakraborty

2025 EMNLP

SaCa: A Highly Compatible Reinforcing Framework for Knowledge Graph Embedding via Structural Pattern Contrast

Jiashi Lin, Changhong Jiang, Yixiao Wang et al.

2025 EMNLP

SA-CLIP: Language Guided Image Spatial and Action Feature Learning

Guanlin Li, Wenhao Shao, Praboda Rajapaksha et al.

2025 EMNLP

SACL: Understanding and Combating Textual Bias in Code Retrieval with Semantic-Augmented Reranking and Localization

Dhruv Gupta, Gayathri Ganesh Lakshmy, Yiqing Xie

2025 EMNLP

SAEs Are Good for Steering – If You Select the Right Features

Dana Arad, Aaron Mueller, Yonatan Belinkov

2025 EMNLP

SAE-SSV: Supervised Steering in Sparse Representation Spaces for Reliable Control of Language Models

Zirui He, Mingyu Jin, Bo Shen et al.

2025 EMNLP

SAFE: A Sparse Autoencoder-Based Framework for Robust Query Enrichment and Hallucination Mitigation in LLMs

Samir Abdaljalil, Filippo Pallucchini, Andrea Seveso et al.

2025 EMNLP

SafeConf: A Confidence-Calibrated Safety Self-Evaluation Method for Large Language Models

Bo Zhang, Cong Gao, Linkang Yang et al.

2025 EMNLP

Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging

Hua Farn, Hsuan Su, Shachi H. Kumar et al.

2025 EMNLP

Safeguarding Privacy of Retrieval Data against Membership Inference Attacks: Is This Query Too Close to Home?

Yujin Choi, Youngjoo Park, Junyoung Byun et al.

2025 EMNLP

SafeInt: Shielding Large Language Models from Jailbreak Attacks via Safety-Aware Representation Intervention

Jiaqi Wu, Chen Chen, Chunyan Hou et al.

2025 EMNLP

SafeKey: Amplifying Aha-Moment Insights for Safety Reasoning

Kaiwen Zhou, Xuandong Zhao, Jayanth Srinivasa et al.

2025 EMNLP

SAFENUDGE: Safeguarding Large Language Models in Real-time with Tunable Safety-Performance Trade-offs

Joao Fonseca, Andrew Bell, Julia Stoyanovich

2025 EMNLP

SAFE: Schema-Driven Approximate Distance Join for Efficient Knowledge Graph Querying

Sangoh Lee, Sungho Park, Wook-Shin Han

2025 EMNLP

SafeScientist: Enhancing AI Scientist Safety for Risk-Aware Scientific Discovery

Kunlun Zhu, Jiaxun Zhang, Ziheng Qi et al.

2025 EMNLP

SAFE-SQL: Self-Augmented In-Context Learning with Fine-grained Example Selection for Text-to-SQL

Jimin Lee, Ingeol Baek, Byeongjeong Kim et al.

2025 EMNLP

SafeSwitch: Steering Unsafe LLM Behavior via Internal Activation Signals

Peixuan Han, Cheng Qian, Xiusi Chen et al.

2025 EMNLP

SafeToolBench: Pioneering a Prospective Benchmark to Evaluating Tool Utilization Safety in LLMs

Hongfei Xia, Hongru Wang, Zeming Liu et al.

2025 EMNLP

Safety in Large Reasoning Models: A Survey

Cheng Wang, Yue Liu, Baolong Bi et al.

2025 EMNLP

Safety Through Reasoning: An Empirical Study of Reasoning Guardrail Models

Makesh Narsimhan Sreedhar, Traian Rebedea, Christopher Parisien

2025 EMNLP

SAGE: A Generic Framework for LLM Safety Evaluation

Madhur Jindal, Hari Shrawgi, Parag Agrawal et al.

2025 EMNLP