online learning

1770 papers

Explore in graph

Also known as

OLO OL

Co-occurring keywords

regret bound (1918) multi-armed bandit (1091) stochastic optimization (1060) regret minimization (315) contextual bandit (379) reinforcement learning (4122) online algorithm (444) convex optimization (1320) adversarial learning (1592) continual learning (1164)

Papers

Diffusion-based Reinforcement Learning via Q-weighted Variational Policy Optimization NIPS 2024

Nature-Inspired Local Propagation NIPS 2024

When Is Inductive Inference Possible? NIPS 2024

Regret Analysis of Repeated Delegated Choice AAAI 2024

Near-Optimal Dynamic Regret for Adversarial Linear Mixture MDPs NIPS 2024

MoML: Online Meta Adaptation for 3D Human Motion Prediction CVPR 2024

On the price of exact truthfulness in incentive-compatible online learning with bandit feedback: a regret lower bound for WSU-UX AISTATS 2024

Molecule Design by Latent Prompt Transformer NIPS 2024

The Choice of Noninformative Priors for Thompson Sampling in Multiparameter Bandit Models AAAI 2024

Dynamic Regret of Adversarial MDPs with Unknown Transition and Linear Function Approximation AAAI 2024

A Near-optimal Algorithm for Learning Margin Halfspaces with Massart Noise NIPS 2024

Unify Named Entity Recognition Scenarios via Contrastive Real-Time Updating Prototype AAAI 2024

A Closer Look at Curriculum Adversarial Training: From an Online Perspective AAAI 2024

No Internal Regret with Non-convex Loss Functions AAAI 2024

Open Problem: Optimal Rates for Stochastic Decision-Theoretic Online Learning Under Differentially Privacy COLT 2024

Stealthy Adversarial Attacks on Stochastic Multi-Armed Bandits AAAI 2024

Oracle-Efficient Hybrid Online Learning with Unknown Distribution COLT 2024

Apple Tasting: Combinatorial Dimensions and Minimax Rates COLT 2024

Protected Test-Time Adaptation via Online Entropy Matching: A Betting Approach NIPS 2024

Learning to Mitigate Externalities: the Coase Theorem with Hindsight Rationality NIPS 2024

PRODuctive bandits: Importance Weighting No More NIPS 2024

Warm-up Free Policy Optimization: Improved Regret in Linear Markov Decision Processes NIPS 2024

Learning from Snapshots of Discrete and Continuous Data Streams NIPS 2024

Optimal Multiclass U-Calibration Error and Beyond NIPS 2024

Achieving $\tilde{O}(1/\epsilon)$ Sample Complexity for Constrained Markov Decision Process NIPS 2024