adversarial learning

1592 papers

Explore in graph

Also known as

DAL ADAL ALI ASA GAN AGR AL ADC AAL

Co-occurring keywords

domain adaptation (4578) generative adversarial network (1939) adversarial training (1261) backdoor attack (377) neural network (6616) representation learning (6174) adversarial attack (1599) large language model (12755) adversarial robustness (1335) text classification (6776)

Papers

Battling Misinformation: An Empirical Study on Adversarial Factuality in Open-Source Large Language Models NAACL 2025

CAARMA: Class Augmentation with Adversarial Mixup Regularization EMNLP 2025

Can't Slow Me Down: Learning Robust and Hardware-Adaptive Object Detectors against Latency Attacks for Edge Devices CVPR 2025

Watching the AI Watchdogs: A Fairness and Robustness Analysis of AI Safety Moderation Classifiers NAACL 2025

DAMAGE: Detecting Adversarially Modified AI Generated Text COLING 2025

DIFFER: Disentangling Identity Features via Semantic Cues for Clothes-Changing Person Re-ID CVPR 2025

UCOD-DPL: Unsupervised Camouflaged Object Detection via Dynamic Pseudo-label Learning CVPR 2025

Vulnerability of Large Language Models to Output Prefix Jailbreaks: Impact of Positions on Safety NAACL 2025

Building Safe GenAI Applications: An End-to-End Overview of Red Teaming for Large Language Models NAACL 2025

Obliviate: Neutralizing Task-agnostic Backdoors within the Parameter-efficient Fine-tuning Paradigm NAACL 2025

FLEX: A Benchmark for Evaluating Robustness of Fairness in Large Language Models NAACL 2025

Silent Branding Attack: Trigger-free Data Poisoning Attack on Text-to-Image Diffusion Models CVPR 2025

Adversarial Domain Prompt Tuning and Generation for Single Domain Generalization CVPR 2025

Anti-Diffusion: Preventing Abuse of Modifications of Diffusion-Based Models AAAI 2025

When Witnesses Defend: A Witness Graph Topological Layer for Adversarial Graph Learning AAAI 2025

SABER: Uncovering Vulnerabilities in Safety Alignment via Cross-Layer Residual Connection EMNLP 2025

MADAWSD: Multi-Agent Debate Framework for Adversarial Word Sense Disambiguation EMNLP 2025

Electromyography-Informed Facial Expression Reconstruction for Physiological-Based Synthesis and Analysis CVPR 2025

AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing CVPR 2025

Label-Free Backdoor Attacks in Vertical Federated Learning AAAI 2025

SPD: Shallow Backdoor Protecting Deep Backdoor Against Backdoor Detection ICCV 2025

Why Safeguarded Ships Run Aground? Aligned Large Language Models’ Safety Mechanisms Tend to Be Anchored in The Template Region ACL 2025

CAVGAN: Unifying Jailbreak and Defense of LLMs via Generative Adversarial Attacks on their Internal Representations ACL 2025

DEAL: Data-Efficient Adversarial Learning for High-Quality Infrared Imaging CVPR 2025

MUSE: MCTS-Driven Red Teaming Framework for Enhanced Multi-Turn Dialogue Safety in Large Language Models EMNLP 2025