Research Explorer

Creating New Voices using Normalizing Flows

Piotr Bilinski, Thomas Merritt, Abdelhamid Ezzerg et al.

2022 INTERSPEECH

Cross-Age Speaker Verification: Learning Age-Invariant Speaker Embeddings

Xiaoyi Qin, Na Li, Weng Chao et al.

2022 INTERSPEECH

Cross-Cultural Comparison of Gradient Emotion Perception: Human vs. Alexa TTS Voices

Iona Gessinger, Michelle Cohn, Georgia Zellou et al.

2022 INTERSPEECH

Cross-dialect lexicon optimisation for an endangered language ASR system: the case of Irish

Liam Lonergan, Mengjie Qian, Neasa Ní Chiaráin et al.

2022 INTERSPEECH

Jiaming Cheng, Ruiyu Liang, Yue Xie et al.

2022 INTERSPEECH

Cross-lingual articulatory feature information transfer for speech recognition using recurrent progressive neural networks

Mahir Morshed, Mark Hasegawa-Johnson

2022 INTERSPEECH

Cross-lingual Self-Supervised Speech Representations for Improved Dysarthric Speech Recognition

Abner Hernandez, Paula Andrea Pérez-Toro, Elmar Noeth et al.

2022 INTERSPEECH

Cross-lingual Style Transfer with Conditional Prior VAE and Style Loss

Dino Rattcliffe, You Wang, Alex Mansbridge et al.

2022 INTERSPEECH

Cross-Lingual Transfer Learning Approach to Phoneme Error Detection via Latent Phonetic Representation

Jovan M. Dalhouse, Katunobu Itou

2022 INTERSPEECH

Cross-Modal Decision Regularization for Simultaneous Speech Translation

Mohd Abbas Zaidi, Beomseok Lee, Sangha Kim et al.

2022 INTERSPEECH

Cross-modal Transfer Learning via Multi-grained Alignment for End-to-End Spoken Language Understanding

Yi Zhu, Zexun Wang, Hang Liu et al.

2022 INTERSPEECH

Cross-Scale Vector Quantization for Scalable Neural Speech Coding

Xue Jiang, Xiulian Peng, Huaying Xue et al.

2022 INTERSPEECH

Cross-speaker Emotion Transfer Based On Prosody Compensation for End-to-End Speech Synthesis

Tao Li, Xinsheng Wang, Qicong Xie et al.

2022 INTERSPEECH

Cross-Speaker Emotion Transfer for Low-Resource Text-to-Speech Using Non-Parallel Voice Conversion with Pitch-Shift Data Augmentation

Ryo Terashima, Ryuichi Yamamoto, Eunwoo Song et al.

2022 INTERSPEECH

CS-CTCSCONV1D: Small footprint speaker verification with channel split time-channel-time separable 1-dimensional convolution

Linjun Cai, Yuhong Yang, Xufeng Chen et al.

2022 INTERSPEECH

CTA-RNN: Channel and Temporal-wise Attention RNN leveraging Pre-trained ASR Embeddings for Speech Emotion Recognition

Chengxin Chen, Pengyuan Zhang

2022 INTERSPEECH

CTC Variations Through New WFST Topologies

Aleksandr Laptev, Somshubra Majumdar, Boris Ginsburg

2022 INTERSPEECH

CTFALite: Lightweight Channel-specific Temporal and Frequency Attention Mechanism for Enhancing the Speaker Embedding Extractor

Yuheng Wei, Junzhao Du, Hui Liu et al.

2022 INTERSPEECH

CTRL: Continual Representation Learning to Transfer Information of Pre-trained for WAV2VEC 2.0

Jae-Hong Lee, Chae-Won Lee, Jin-Seong Choi et al.

2022 INTERSPEECH

CT-SAT: Contextual Transformer for Sequential Audio Tagging

Yuanbo Hou, Zhaoyi Liu, Bo Kang et al.

2022 INTERSPEECH

CUSIDE: Chunking, Simulating Future Context and Decoding for Streaming ASR

Keyu An, Huahuan Zheng, Zhijian Ou et al.

2022 INTERSPEECH

CycleGAN-based Unpaired Speech Dereverberation

Hannah Muckenhirn, Aleksandr Safin, Hakan Erdogan et al.

2022 INTERSPEECH

CyclicAugment: Speech Data Random Augmentation with Cosine Annealing Scheduler for Automatic Speech Recognition

Zhihan Wang, Feng Hou, Yuanhang Qiu et al.

2022 INTERSPEECH

Daft-Exprt: Cross-Speaker Prosody Transfer on Any Text for Expressive Speech Synthesis

Julian Zaïdi, Hugo Seuté, Benjamin van Niekerk et al.

2022 INTERSPEECH

Data Augmentation for Dementia Detection in Spoken Language.

Dominika Woszczyk, Anna Hlédiková, Alican Akman et al.

2022 INTERSPEECH

Papers