Papers

5,479 papers found

Soft Prompt Threats: Attacking Safety Alignment and Unlearning in Open-Source LLMs through the Embedding Space

Leo Schwinn, David Dobre, Sophie Xhonneux et al.

2024 NIPS

LoFiT: Localized Fine-tuning on LLM Representations

Fangcong Yin, Xi Ye, Greg Durrett

2024 NIPS

PrivAuditor: Benchmarking Data Protection Vulnerabilities in LLM Adaptation Techniques

Derui Zhu, Dingfan Chen, Xiongfei Wu et al.

2024 NIPS

Stacking Your Transformers: A Closer Look at Model Growth for Efficient LLM Pre-Training

Wenyu Du, Tongxu Luo, Zihan Qiu et al.

2024 NIPS

PertEval: Unveiling Real Knowledge Capacity of LLMs with Knowledge-Invariant Perturbations

Jiatong Li, Renjun Hu, Kunzhe Huang et al.

2024 NIPS

Kangaroo: Lossless Self-Speculative Decoding for Accelerating LLMs via Double Early Exiting

Fangcheng Liu, Yehui Tang, Zhenhua Liu et al.

2024 NIPS

UniTox: Leveraging LLMs to Curate a Unified Dataset of Drug-Induced Toxicity from FDA Labels

Jake Silberg, Kyle Swanson, Elana Simon et al.

2024 NIPS

Reversing the Forget-Retain Objectives: An Efficient LLM Unlearning Framework from Logit Difference

Jiabao Ji, Yujian Liu, Yang Zhang et al.

2024 NIPS

$\texttt{Model-GLUE}$: Democratized LLM Scaling for A Large Model Zoo in the Wild

Xinyu Zhao, Guoheng Sun, Ruisi Cai et al.

2024 NIPS

Alignment at Pre-training! Towards Native Alignment for Arabic LLMs

Juhao Liang, Zhenyang Cai, Jianqing Zhu et al.

2024 NIPS

Benchmarking LLMs via Uncertainty Quantification

Fanghua Ye, Mingming Yang, Jianhui Pang et al.

2024 NIPS

Coevolving with the Other You: Fine-Tuning LLM with Sequential Cooperative Multi-Agent Reinforcement Learning

Hao Ma, Tianyi Hu, Zhiqiang Pu et al.

2024 NIPS

HYSYNTH: Context-Free LLM Approximation for Guiding Program Synthesis

Shraddha Barke, Emmanuel Anaya Gonzalez, Saketh Ram Kasibatla et al.

2024 NIPS

Enhancing Multiple Dimensions of Trustworthiness in LLMs via Sparse Activation Control

Yuxin Xiao, Chaoqun Wan, Yonggang Zhang et al.

2024 NIPS

DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection

Xiao Yu, Yuang Qi, Kejiang Chen et al.

2024 NIPS

SpecExec: Massively Parallel Speculative Decoding For Interactive LLM Inference on Consumer Devices

Ruslan Svirschevski, Avner May, Zhuoming Chen et al.

2024 NIPS

Ad Auctions for LLMs via Retrieval Augmented Generation

MohammadTaghi Hajiaghayi, Sébastien Lahaie, Keivan Rezaei et al.

2024 NIPS

WaterMax: breaking the LLM watermark detectability-robustness-quality trade-off

Eva Giboulot, Teddy Furon

2024 NIPS

Metacognitive Capabilities of LLMs: An Exploration in Mathematical Problem Solving

Aniket Didolkar, Anirudh Goyal, Nan Rosemary Ke et al.

2024 NIPS

Active Learning with LLMs for Partially Observed and Cost-Aware Scenarios

Nicolás Astorga, Tennison Liu, Nabeel Seedat et al.

2024 NIPS

Efficient multi-prompt evaluation of LLMs

Felipe Maia Polo, Ronald Xu, Lucas Weber et al.

2024 NIPS

SnapKV: LLM Knows What You are Looking for Before Generation

Yuhong Li, Yingbing Huang, Bowen Yang et al.

2024 NIPS

Efficient LLM Jailbreak via Adaptive Dense-to-sparse Constrained Optimization

Kai Hu, Weichen Yu, Yining Li et al.

2024 NIPS

Be like a Goldfish, Don't Memorize! Mitigating Memorization in Generative LLMs

Abhimanyu Hans, Yuxin Wen, Neel Jain et al.

2024 NIPS

SIRIUS : Contexual Sparisty with Correction for Efficient LLMs

Yang Zhou, Zhuoming Chen, Zhaozhuo Xu et al.

2024 NIPS