Papers - Conftrace

Far-Field Speaker Localization and Adaptive GLMB Tracking

Shoufeng Lin, Zhaojie Luo

2021 INTERSPEECH

FastICARL: Fast Incremental Classifier and Representation Learning with Efficient Budget Allocation in Audio Sensing Applications

Young D. Kwon, Jagmohan Chauhan, Cecilia Mascolo

2021 INTERSPEECH

FastPitchFormant: Source-Filter Based Decomposed Modeling for Speech Synthesis

Taejun Bak, Jae-Sung Bae, Hanbin Bae et al.

2021 INTERSPEECH

Fast Text-Only Domain Adaptation of RNN-Transducer Prediction Network

Janne Pylkkönen, Antti Ukkonen, Juho Kilpikoski et al.

2021 INTERSPEECH

Fearless Steps Challenge Phase-3 (FSC P3): Advancing SLT for Unseen Channel and Mission Data Across NASA Apollo Audio

Aditya Joglekar, Seyed Omid Sadjadi, Meena Chandra-Shekar et al.

2021 INTERSPEECH

Feature Fusion by Attention Networks for Robust DOA Estimation

Rongliang Liu, Nengheng Zheng, Xi Chen

2021 INTERSPEECH

Federated Learning with Dynamic Transformer for Text to Speech

Zhenhou Hong, Jianzong Wang, Xiaoyang Qu et al.

2021 INTERSPEECH

Few-Shot Keyword Spotting in Any Language

Mark Mazumder, Colby Banbury, Josh Meyer et al.

2021 INTERSPEECH

Few-Shot Learning of New Sound Classes for Target Sound Extraction

Marc Delcroix, Jorge Bennasar Vázquez, Tsubasa Ochiai et al.

2021 INTERSPEECH

Fine-Grained Prosody Modeling in Neural Speech Synthesis Using ToBI Representation

Yuxiang Zou, Shichao Liu, Xiang Yin et al.

2021 INTERSPEECH

Fine-Grained Style Modeling, Transfer and Prediction in Text-to-Speech Synthesis via Phone-Level Content-Style Disentanglement

Daxin Tan, Tan Lee

2021 INTERSPEECH

Fine-Tuning Pre-Trained Voice Conversion Model for Adding New Target Speakers with Limited Data

Takeshi Koshizuka, Hidefumi Ohmura, Kouichi Katsurada

2021 INTERSPEECH

Flexi-Transducer: Optimizing Latency, Accuracy and Compute for Multi-Domain On-Device Scenarios

Jay Mahadeokar, Yangyang Shi, Yuan Shangguan et al.

2021 INTERSPEECH

Forty Years of Speech and Language Processing: From Bayes Decision Rule to Deep Learning

Hermann Ney

2021 INTERSPEECH

Fre-GAN: Adversarial Frequency-Consistent Audio Synthesis

Ji-Hoon Kim, Sang-Hoon Lee, Ji-Hyun Lee et al.

2021 INTERSPEECH

Fricative Phoneme Detection Using Deep Neural Networks and its Comparison to Traditional Methods

Metehan Yurt, Pavan Kantharaju, Sascha Disch et al.

2021 INTERSPEECH

FRILL: A Non-Semantic Speech Embedding for Mobile Devices

Jacob Peplinski, Joel Shor, Sachin Joglekar et al.

2021 INTERSPEECH

FSR: Accelerating the Inference Process of Transducer-Based Models by Applying Fast-Skip Regularization

Zhengkun Tian, Jiangyan Yi, Ye Bai et al.

2021 INTERSPEECH

F-T-LSTM Based Complex Network for Joint Acoustic Echo Cancellation and Speech Enhancement

Shimin Zhang, Yuxiang Kong, Shubo Lv et al.

2021 INTERSPEECH

Funnel Deep Complex U-Net for Phase-Aware Speech Enhancement

Yuhang Sun, Linju Yang, Huifeng Zhu et al.

2021 INTERSPEECH

Fusion-Net: Time-Frequency Information Fusion Y-Network for Speech Enhancement

Santhan Kumar Reddy Nareddula, Subrahmanyam Gorthi, Rama Krishna Sai S. Gorthi

2021 INTERSPEECH

Fusion of Embeddings Networks for Robust Combination of Text Dependent and Independent Speaker Recognition

Ruirui Li, Chelsea J.-T. Ju, Zeya Chen et al.

2021 INTERSPEECH

GANSpeech: Adversarial Training for High-Fidelity Multi-Speaker Speech Synthesis

Jinhyeok Yang, Jae-Sung Bae, Taejun Bak et al.

2021 INTERSPEECH

GAN Vocoder: Multi-Resolution Discriminator Is All You Need

Jaeseong You, Dalhyun Kim, Gyuhyeon Nam et al.

2021 INTERSPEECH

Generalized Dilated CNN Models for Depression Detection Using Inverted Vocal Tract Variables

Nadee Seneviratne, Carol Espy-Wilson

2021 INTERSPEECH