Research Explorer

Joint Speech Translation and Named Entity Recognition

Marco Gaido, Sara Papi, Matteo Negri et al.

2023 INTERSPEECH

Joint Time and Frequency Transformer for Chinese Opera Classification

Qiang Li, Beibei Hu

2023 INTERSPEECH

J-ToneNet: A Transformer-based Encoding Network for Improving Tone Classification in Continuous Speech via F0 Sequences

Yi-Fen Liu, Xiang-Li Lu

2023 INTERSPEECH

Knowledge Distillation Approach for Efficient Internal Language Model Estimation

Zhipeng Chen, Haihua Xu, Yerbolat Khassanov et al.

2023 INTERSPEECH

Knowledge Distillation for Neural Transducer-based Target-Speaker ASR: Exploiting Parallel Mixture/Single-Talker Speech Data

Takafumi Moriya, Hiroshi Sato, Tsubasa Ochiai et al.

2023 INTERSPEECH

Knowledge Distillation from Non-streaming to Streaming ASR Encoder using Auxiliary Non-streaming Layer

Kyuhong Shim, Jinkyu Lee, Simyoung Chang et al.

2023 INTERSPEECH

Knowledge Distillation on Joint Task End-to-End Speech Translation

Khandokar Md. Nayem, Ran Xue, Ching-Yun Chang et al.

2023 INTERSPEECH

Knowledge-Retrieval Task-Oriented Dialog Systems with Semi-Supervision

Yucheng Cai, Hong Liu, Zhijian Ou et al.

2023 INTERSPEECH

Knowledge Transfer from Pre-trained Language Models to Cif-based Speech Recognizers via Hierarchical Distillation

Minglun Han, Feilong Chen, Jing Shi et al.

2023 INTERSPEECH

L2-Mandarin regional accent variability during Mandarin tone-word training facilitates English listeners’ subsequent tone categorizations

Yanping Li, Michael D. Tyler, Denis Burnham et al.

2023 INTERSPEECH

Label Aware Speech Representation Learning For Language Identification

Shikhar Vashishth, Shikhar Bharadwaj, Sriram Ganapathy et al.

2023 INTERSPEECH

LABERT: A Combination of Local Aggregation and Self-Supervised Speech Representation Learning for Detecting Informative Hidden Units in Low-Resource ASR Systems

Kavan Fatehi, Ayse Kucukyilmaz

2023 INTERSPEECH

LAMASSU: A Streaming Language-Agnostic Multilingual Speech Recognition and Translation Model Using Neural Transducers

Peidong Wang, Eric Sun, Jian Xue et al.

2023 INTERSPEECH

Language Agnostic Data-Driven Inverse Text Normalization

Szu-Jui Chen, Debjyoti Paul, Yutong Pang et al.

2023 INTERSPEECH

Language Identification Networks for Multilingual Everyday Recordings

Kiran Praveen, Balaji Radhakrishnan, Kamini Sabu et al.

2023 INTERSPEECH

Language Model Personalization for Improved Touchscreen Typing

Jiban Adhikary, Keith Vertanen

2023 INTERSPEECH

Language-Routing Mixture of Experts for Multilingual and Code-Switching Speech Recognition

Wenxuan Wang, Guodong Ma, Yuke Li et al.

2023 INTERSPEECH

Language-specific Boundary Learning for Improving Mandarin-English Code-switching Speech Recognition

Zhiyun Fan, Linhao Dong, Chen Shen et al.

2023 INTERSPEECH

Language-universal Phonetic Encoder for Low-resource Speech Recognition

Siyuan Feng, Ming Tu, Rui Xia et al.

2023 INTERSPEECH

Language-Universal Phonetic Representation in Multilingual Speech Pretraining for Low-Resource Speech Recognition

Siyuan Feng, Ming Tu, Rui Xia et al.

2023 INTERSPEECH

LanSER: Language-Model Supported Speech Emotion Recognition

Taesik Gong, Josh Belanich, Krishna Somandepalli et al.

2023 INTERSPEECH

Large Dataset Generation of Synchronized Music Audio and Lyrics at Scale using Teacher-Student Paradigm

Cristian Chivriga, Rinita Roy

2023 INTERSPEECH

Large-Scale Automatic Audiobook Creation

Brendan Walsh, Mark Hamilton, Greg Newby et al.

2023 INTERSPEECH

Latent Phrase Matching for Dysarthric Speech

Dianna Yee, Colin Lea, Jaya Narain et al.

2023 INTERSPEECH

Laughter in task-based settings: whom we talk to affects how, when, and how often we laugh

Catarina Branco, Isabel Trancoso, Paulo Infante et al.

2023 INTERSPEECH

Papers