Papers - Conftrace

Provably Efficient CVaR RL in Low-rank MDPs

Yulai Zhao, Wenhao Zhan, Xiaoyan Hu et al.

2024 ICLR

Provably Efficient Iterated CVaR Reinforcement Learning with Function Approximation and Human Feedback

Yu Chen, Yihan Du, Pihe Hu et al.

2024 ICLR

Provably Efficient UCB-type Algorithms For Learning Predictive State Representations

Ruiquan Huang, Yingbin Liang, Jing Yang

2024 ICLR

Provably Robust Conformal Prediction with Improved Efficiency

Ge Yan, Yaniv Romano, Tsui-Wei Weng

2024 ICLR

Proving Test Set Contamination in Black-Box Language Models

Yonatan Oren, Nicole Meister, Niladri S. Chatterji et al.

2024 ICLR

Proximal Policy Gradient Arborescence for Quality Diversity Reinforcement Learning

Sumeet Batra, Bryon Tjanaka, Matthew Christopher Fontaine et al.

2024 ICLR

Pseudo-Generalized Dynamic View Synthesis from a Video

Xiaoming Zhao, R Alex Colburn, Fangchang Ma et al.

2024 ICLR

PTaRL: Prototype-based Tabular Representation Learning via Space Calibration

Hangting Ye, Wei Fan, Xiaozhuang Song et al.

2024 ICLR

PubDef: Defending Against Transfer Attacks From Public Models

Chawin Sitawarin, Jaewon Chang, David Huang et al.

2024 ICLR

Pushing Boundaries: Mixup's Influence on Neural Collapse

Quinn LeBlanc Fisher, Haoming Meng, Vardan Papyan

2024 ICLR

Pushing Mixture of Experts to the Limit: Extremely Parameter Efficient MoE for Instruction Tuning

Ted Zadouri, Ahmet Üstün, Arash Ahmadian et al.

2024 ICLR

QA-LoRA: Quantization-Aware Low-Rank Adaptation of Large Language Models

Yuhui Xu, Lingxi Xie, Xiaotao Gu et al.

2024 ICLR

Q-Bench: A Benchmark for General-Purpose Foundation Models on Low-level Vision

Haoning Wu, Zicheng Zhang, Erli Zhang et al.

2024 ICLR

QLLM: Accurate and Efficient Low-Bitwidth Quantization for Large Language Models

Jing Liu, Ruihao Gong, Xiuying Wei et al.

2024 ICLR

Quadratic models for understanding catapult dynamics of neural networks

Libin Zhu, Chaoyue Liu, Adityanarayanan Radhakrishnan et al.

2024 ICLR

Quality-Diversity through AI Feedback

Herbie Bradley, Andrew Dai, Hannah Benita Teufel et al.

2024 ICLR

Quantifying and Enhancing Multi-modal Robustness with Modality Preference

Zequn Yang, Yake Wei, Ce Liang et al.

2024 ICLR

Quantifying Language Models' Sensitivity to Spurious Features in Prompt Design or: How I learned to start worrying about prompt formatting

Melanie Sclar, Yejin Choi, Yulia Tsvetkov et al.

2024 ICLR

Quantifying the Plausibility of Context Reliance in Neural Machine Translation

Gabriele Sarti, Grzegorz Chrupała, Malvina Nissim et al.

2024 ICLR

Quantifying the Sensitivity of Inverse Reinforcement Learning to Misspecification

Joar Max Viktor Skalse, Alessandro Abate

2024 ICLR

Quasi-Monte Carlo for 3D Sliced Wasserstein

Khai Nguyen, Nicola Bariletto, Nhat Ho

2024 ICLR

Query-Dependent Prompt Evaluation and Optimization with Offline Inverse RL

Hao Sun, Alihan Hüyük, Mihaela van der Schaar

2024 ICLR

Querying Easily Flip-flopped Samples for Deep Active Learning

Seong Jin Cho, Gwangsu Kim, Junghyun Lee et al.

2024 ICLR

Query-Policy Misalignment in Preference-Based Reinforcement Learning

Xiao Hu, Jianxiong Li, Xianyuan Zhan et al.

2024 ICLR

Quick-Tune: Quickly Learning Which Pretrained Model to Finetune and How

Sebastian Pineda Arango, Fabio Ferreira, Arlind Kadra et al.

2024 ICLR