conftrace_

Zixuan Weng

3 papers · 2025–2026 · 3 conferences · across top CS/AI conferences

Achievements

Jump to papers ↓

🌍 Conference Polyglot (2) 🌉 Interdisciplinary Bridge 🐝 Cross-Pollinator (15)

Conferences

ACL (1) EMNLP (1) ICCV (1)

Top co-authors

Xiangyu Zhang (2) Xiaolong Jin (2) Jinyuan Jia (1) Hanxi Guo (1) Peiran Wang (1) Chenlong Yin (1) Jinghuai Zhang (1) Kunlin Cai (1) Yuan Tian (1) Guangyu Shen (1)

Keywords

jailbreak attack (2) safety alignment (1) adversarial attack (1) diffusion model (1) mixture of expert (1) multi-turn interaction (1) safety evaluation (1) adversarial prompt (1) safety benchmark (1) representation steering (1) inference-time steering (1) toxic response (1) language model alignment (1) large language model (1)

Papers

FineSteer: A Unified Framework for Fine-Grained Inference-Time Steering in Large Language Models ACL 2026 Foot-In-The-Door: A Multi-turn Jailbreak for LLMs EMNLP 2025 JailbreakDiffBench: A Comprehensive Benchmark for Jailbreaking Diffusion Models ICCV 2025