speech separation

166 papers

Explore in graph

Also known as

SS

Co-occurring keywords

source separation (132) neural network (6616) speech enhancement (581) deep neural network (1801) speaker separation (59) permutation invariant training (27) automatic speech recognition (1764) speaker embedding (350) speaker extraction (32) deep learning (2111)

Papers

SepPrune: Structured Pruning for Efficient Deep Speech Separation AAAI 2026

SepALM: Audio Language Models Are Error Correctors for Robust Speech Separation IJCAI 2025

Proactive Hearing Assistants that Isolate Egocentric Conversations EMNLP 2025

PARIS: Pseudo-AutoRegressIve Siamese Training for Online Speech Separation INTERSPEECH 2024

Empowering Whisper as a Joint Multi-Talker and Target-Talker Speech Recognition System INTERSPEECH 2024

Noise-robust Speech Separation with Fast Generative Correction INTERSPEECH 2024

Unified Audio Visual Cues for Target Speaker Extraction INTERSPEECH 2024

TalTech-IRIT-LIS Speaker and Language Diarization Systems for DISPLACE 2024 INTERSPEECH 2024

Target Speaker Extraction with Curriculum Learning INTERSPEECH 2024

Enhanced Deep Speech Separation in Clustered Ad Hoc Distributed Microphone Environments INTERSPEECH 2024

LibriheavyMix: A 20,000-Hour Dataset for Single-Channel Reverberant Multi-Talker Speech Separation, ASR and Speaker Diarization INTERSPEECH 2024

Serialized Output Training by Learned Dominance INTERSPEECH 2024

Multi-Channel Multi-Speaker ASR Using Target Speaker’s Solo Segment INTERSPEECH 2024

Improving Generalization of Speech Separation in Real-World Scenarios: Strategies in Simulation, Optimization, and Evaluation INTERSPEECH 2024

Transcription-Free Fine-Tuning of Speech Separation Models for Noisy and Reverberant Multi-Speaker Automatic Speech Recognition INTERSPEECH 2024

Multimodal Representation Loss Between Timed Text and Audio for Regularized Speech Separation INTERSPEECH 2024

Separate and Reconstruct: Asymmetric Encoder-Decoder for Speech Separation NIPS 2024

Self-Supervised Disentangled Representation Learning for Robust Target Speech Extraction AAAI 2024

Towards Audio Codec-based Speech Separation INTERSPEECH 2024

Text-aware Speech Separation for Multi-talker Keyword Spotting INTERSPEECH 2024

Does the Lombard Effect Matter in Speech Separation? Introducing the Lombard-GRID-2mix Dataset INTERSPEECH 2024

Joint Speaker Features Learning for Audio-visual Multichannel Speech Separation and Recognition INTERSPEECH 2024

SDNet: Stream-attention and Dual-feature Learning Network for Ad-hoc Array Speech Separation INTERSPEECH 2023

A Neural State-Space Modeling Approach to Efficient Speech Separation INTERSPEECH 2023

TokenSplit: Using Discrete Speech Representations for Direct, Refined, and Transcript-Conditioned Speech Separation and Recognition INTERSPEECH 2023