adversarial learning

1592 papers

Explore in graph

Also known as

DAL ADAL ALI ASA GAN AGR AL ADC AAL

Co-occurring keywords

domain adaptation (4578) generative adversarial network (1939) adversarial training (1261) backdoor attack (377) neural network (6616) representation learning (6174) adversarial attack (1599) large language model (12755) adversarial robustness (1335) text classification (6776)

Papers

Reasoning-Augmented Conversation for Multi-Turn Jailbreak Attacks on Large Language Models EMNLP 2025

Revisiting Backdoor Attacks against Large Vision-Language Models from Domain Shift CVPR 2025

Battling Misinformation: An Empirical Study on Adversarial Factuality in Open-Source Large Language Models NAACL 2025

Adversarial Propensity Weighting for Debiasing in Collaborative Filtering IJCAI 2025

Temporal Unlearnable Examples: Preventing Personal Video Data from Unauthorized Exploitation by Object Tracking ICCV 2025

Toward Improving Robustness and Accuracy in Unsupervised Domain Adaptation AAAI 2025

CASUAL: Conditional Support Alignment for Domain Adaptation with Label Shift AAAI 2025

FLEX: A Benchmark for Evaluating Robustness of Fairness in Large Language Models NAACL 2025

Claim-Guided Textual Backdoor Attack for Practical Applications NAACL 2025

Improving Generalization in Offline Reinforcement Learning via Latent Distribution Representation Learning AAAI 2025

Obliviate: Neutralizing Task-agnostic Backdoors within the Parameter-efficient Fine-tuning Paradigm NAACL 2025

Vulnerability of Large Language Models to Output Prefix Jailbreaks: Impact of Positions on Safety NAACL 2025

Same Question, Different Words: A Latent Adversarial Framework for Prompt Robustness EMNLP 2025

Turning Logic Against Itself: Probing Model Defenses Through Contrastive Questions EMNLP 2025

DAMAGE: Detecting Adversarially Modified AI Generated Text COLING 2025

Adversarial Distribution Matching for Diffusion Distillation Towards Efficient Image and Video Synthesis ICCV 2025

Differential Alignment for Domain Adaptive Object Detection AAAI 2025

PoolAtnRes: Towards Generalisable Differential Morphing Attack Detection WACV 2025

AIR: Unifying Individual and Collective Exploration in Cooperative Multi-Agent Reinforcement Learning AAAI 2025

Two Sides of the Same Coin: Learning the Backdoor to Remove the Backdoor AAAI 2025

Reasoning-to-Defend: Safety-Aware Reasoning Can Defend Large Language Models from Jailbreaking EMNLP 2025

CoSDA: Enhancing the Robustness of Inversion-based Generative Image Watermarking Framework AAAI 2025

Bridge 2D-3D: Uncertainty-aware Hierarchical Registration Network with Domain Alignment AAAI 2025

AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy WACV 2025

Watching the AI Watchdogs: A Fairness and Robustness Analysis of AI Safety Moderation Classifiers NAACL 2025