Papers - Conftrace

When is Multicalibration Post-Processing Necessary?

Dutch Hansen, Siddartha Devic, Preetum Nakkiran et al.

2024 NIPS

When LLM Meets DRL: Advancing Jailbreaking Efficiency via DRL-guided Search

Xuan Chen, Yuzhou Nie, Wenbo Guo et al.

2024 NIPS

When LLMs Meet Cunning Texts: A Fallacy Understanding Benchmark for Large Language Models

Yinghui Li, Qingyu Zhou, Yuanzhen Luo et al.

2024 NIPS

When to Act and When to Ask: Policy Learning With Deferral Under Hidden Confounding

Marah Ghoummaid, Uri Shalit

2024 NIPS

When to Sense and Control? A Time-adaptive Approach for Continuous-Time RL

Lenart Treven, Bhavya Sukhija, Yarden As et al.

2024 NIPS

When Your AIs Deceive You: Challenges of Partial Observability in Reinforcement Learning from Human Feedback

Leon Lang, Davis Foote, Stuart Russell et al.

2024 NIPS

Where does In-context Learning Happen in Large Language Models?

Suzanna Sia, David Mueller, Kevin Duh

2024 NIPS

Where Do Large Learning Rates Lead Us?

Ildus Sadrtdinov, Maxim Kodryan, Eduard Pokonechny et al.

2024 NIPS

Where's Waldo: Diffusion Features For Personalized Segmentation and Retrieval

Dvir Samuel, Rami Ben-Ari, Matan Levy et al.

2024 NIPS

WhodunitBench: Evaluating Large Multimodal Agents via Murder Mystery Games

Junlin Xie, Ruifei Zhang, Zhihong Chen et al.

2024 NIPS

Who Evaluates the Evaluations? Objectively Scoring Text-to-Image Prompt Coherence Metrics with T2IScoreScore (TS2)

Michael Saxon, Fatima Jahara, Mahsa Khoshnoodi et al.

2024 NIPS

Who's asking? User personas and the mechanics of latent misalignment

Asma Ghandeharioun, Ann Yuan, Marius Guerard et al.

2024 NIPS

Who’s Gaming the System? A Causally-Motivated Approach for Detecting Strategic Adaptation

Trenton Chang, Lindsay Warrenburg, Sae-Hwan Park et al.

2024 NIPS

Why are Visually-Grounded Language Models Bad at Image Classification?

Yuhui Zhang, Alyssa Unell, Xiaohan Wang et al.

2024 NIPS

Why Do We Need Weight Decay in Modern Deep Learning?

Francesco D'Angelo, Maksym Andriushchenko, Aditya Varre et al.

2024 NIPS

Why Go Full? Elevating Federated Learning Through Partial Network Updates

Haolin Wang, Xuefeng Liu, Jianwei Niu et al.

2024 NIPS

Why the Metric Backbone Preserves Community Structure

Maximilien Dreveton, Charbel Chucri, Matthias Grossglauser et al.

2024 NIPS

Why Transformers Need Adam: A Hessian Perspective

Yushun Zhang, Congliang Chen, Tian Ding et al.

2024 NIPS

Why Warmup the Learning Rate? Underlying Mechanisms and Improvements

Dayal Singh Kalra, Maissam Barkeshli

2024 NIPS

Wide Two-Layer Networks can Learn from Adversarial Perturbations

Soichiro Kumano, Hiroshi Kera, Toshihiko Yamasaki

2024 NIPS

WikiContradict: A Benchmark for Evaluating LLMs on Real-World Knowledge Conflicts from Wikipedia

Yufang Hou, Alessandra Pascale, Javier Carnerero-Cano et al.

2024 NIPS

WikiDBs: A Large-Scale Corpus Of Relational Databases From Wikidata

Liane Vogel, Jan-Micha Bodensohn, Carsten Binnig

2024 NIPS

WikiDO: A New Benchmark Evaluating Cross-Modal Retrieval for Vision-Language Models

T Pavan Kalyan, Piyush Singh Pasi, Sahil Nilesh Dharod et al.

2024 NIPS

WildGaussians: 3D Gaussian Splatting In the Wild

Jonas Kulhanek, Songyou Peng, Zuzana Kukelova et al.

2024 NIPS

Wild-GS: Real-Time Novel View Synthesis from Unconstrained Photo Collections

Jiacong Xu, Yiqun Mei, Vishal M. Patel

2024 NIPS