Papers - Conftrace

GigaSpeech: An Evolving, Multi-Domain ASR Corpus with 10,000 Hours of Transcribed Audio

Guoguo Chen, Shuzhou Chai, Guan-Bo Wang et al.

2021 INTERSPEECH

GlobalPhone Mix-To-Separate Out of 2: A Multilingual 2000 Speakers Mixtures Database for Speech Separation

Marvin Borsdorf, Chenglin Xu, Haizhou Li et al.

2021 INTERSPEECH

Glottal Sounds in Korebaju

Jenifer Vega Rodriguez, Nathalie Vallée

2021 INTERSPEECH

Glottal Stops in Upper Sorbian: A Data-Driven Approach

Ivan Kraljevski, Maria Paola Bissiri, Frank Duckhorn et al.

2021 INTERSPEECH

Glow-WaveGAN: Learning Speech Representations from GAN-Based Variational Auto-Encoder for High Fidelity Flow-Based Speech Synthesis

Jian Cong, Shan Yang, Lei Xie et al.

2021 INTERSPEECH

Golos: Russian Dataset for Speech Research

Nikolay Karpov, Alexander Denisenko, Fedor Minkin

2021 INTERSPEECH

Gradient Regularization for Noise-Robust Speaker Verification

Jianchen Li, Jiqing Han, Hongwei Song

2021 INTERSPEECH

Graph Attention Networks for Anti-Spoofing

Hemlata Tak, Jee-weon Jung, Jose Patino et al.

2021 INTERSPEECH

Graph-Based Label Propagation for Semi-Supervised Speaker Identification

Long Chen, Venkatesh Ravichandran, Andreas Stolcke

2021 INTERSPEECH

Graph Isomorphism Network for Speech Emotion Recognition

Jiawang Liu, Haoxiang Wang

2021 INTERSPEECH

Graph-PIT: Generalized Permutation Invariant Training for Continuous Separation of Arbitrary Numbers of Speakers

Thilo von Neumann, Keisuke Kinoshita, Christoph Boeddeker et al.

2021 INTERSPEECH

Group Delay Based Re-Weighted Sparse Recovery Algorithms for Robust and High-Resolution Source Separation in DOA Framework

Murtiza Ali, Ashwani Koul, Karan Nathwani

2021 INTERSPEECH

Half-Truth: A Partially Fake Audio Detection Dataset

Jiangyan Yi, Ye Bai, Jianhua Tao et al.

2021 INTERSPEECH

Handling Acoustic Variation in Dysarthric Speech Recognition Systems Through Model Combination

Enno Hermann, Mathew Magimai-Doss

2021 INTERSPEECH

Harmonic WaveGAN: GAN-Based Speech Waveform Generation Model with Harmonic Structure Discriminator

Kazuki Mizuta, Tomoki Koriyama, Hiroshi Saruwatari

2021 INTERSPEECH

Hierarchical Context-Aware Transformers for Non-Autoregressive Text to Speech

Jae-Sung Bae, Taejun Bak, Young-Sun Joo et al.

2021 INTERSPEECH

Hierarchical Phone Recognition with Compositional Phonetics

Xinjian Li, Juncheng Li, Florian Metze et al.

2021 INTERSPEECH

Hi-Fi Multi-Speaker English TTS Dataset

Evelina Bakhturina, Vitaly Lavrukhin, Boris Ginsburg et al.

2021 INTERSPEECH

High-Fidelity and Low-Latency Universal Neural Vocoder Based on Multiband WaveRNN with Data-Driven Linear Prediction for Discrete Waveform Modeling

Patrick Lumban Tobing, Tomoki Toda

2021 INTERSPEECH

High-Fidelity Parallel WaveGAN with Multi-Band Harmonic-Plus-Noise Model

Min-Jae Hwang, Ryuichi Yamamoto, Eunwoo Song et al.

2021 INTERSPEECH

HMM-Free Encoder Pre-Training for Streaming RNN Transducer

Lu Huang, Jingyu Sun, Yufeng Tang et al.

2021 INTERSPEECH

How f0 and Phrase Position Affect Papuan Malay Word Identification

Constantijn Kaland, Matthew Gordon

2021 INTERSPEECH

How Reliable Are Phonetic Data Collected Remotely? Comparison of Recording Devices and Environments on Acoustic Measurements

Chunyu Ge, Yixuan Xiong, Peggy Mok

2021 INTERSPEECH

Human-in-the-Loop Efficiency Analysis for Binary Classification in Edyson

Per Fallgren, Jens Edlund

2021 INTERSPEECH

Human Listening and Live Captioning: Multi-Task Training for Speech Enhancement

Sefik Emre Eskimez, Xiaofei Wang, Min Tang et al.

2021 INTERSPEECH