Research Explorer

Laughter Synthesis using Pseudo Phonetic Tokens with a Large-scale In-the-wild Laughter Corpus

Detai Xin, Shinnosuke Takamichi, Ai Morimatsu et al.

2023 INTERSPEECH

Learning A Self-Supervised Domain-Invariant Feature Representation for Generalized Audio Deepfake Detection

Yuankun Xie, Haonan Cheng, Yutian Wang et al.

2023 INTERSPEECH

Learning Cross-lingual Mappings for Data Augmentation to Improve Low-Resource Speech Recognition

Muhammad Umar Farooq, Thomas Hain

2023 INTERSPEECH

Learning Emotional Representations from Imbalanced Speech Data for Speech Emotion Recognition and Emotional Text-to-Speech

Shijun Wang, Jón Guðnason, Damian Borth

2023 INTERSPEECH

Learning Local to Global Feature Aggregation for Speech Emotion Recognition

Cheng Lu, Hailun Lian, Wenming Zheng et al.

2023 INTERSPEECH

Learning to Compute the Articulatory Representations of Speech with the MIRRORNET

Yashish M Siriwardena, Carol Espy-Wilson, Shihab Shamma

2023 INTERSPEECH

Learning When to Speak: Latency and Quality Trade-offs for Simultaneous Speech-to-Speech Translation with Offline Models

Liam Dugan, Anshul Wadhawan, Kyle Spence et al.

2023 INTERSPEECH

Learning When to Trust Which Teacher for Weakly Supervised ASR

Aakriti Agrawal, Milind Rao, Anit Kumar Sahu et al.

2023 INTERSPEECH

Let's Give a Voice to Conversational Agents in Virtual Reality

Michele Yin, Gabriel Roccabruna, Abhinav Azad et al.

2023 INTERSPEECH

Leveraging Cross-Utterance Context For ASR Decoding

Robert Flynn, Anton Ragni

2023 INTERSPEECH

Leveraging Label Information for Multimodal Emotion Recognition

Peiying Wang, Sunlu Zeng, Junqing Chen et al.

2023 INTERSPEECH

Leveraging Pretrained ASR Encoders for Effective and Efficient End-to-End Speech Intent Classification and Slot Filling

He Huang, Jagadeesh Balam, Boris Ginsburg

2023 INTERSPEECH

Leveraging Semantic Information for Efficient Self-Supervised Emotion Recognition with Audio-Textual Distilled Models

Danilo de Oliveira, Navin Raj Prabhu, Timo Gerkmann

2023 INTERSPEECH

Lexical Speaker Error Correction: Leveraging Language Models for Speaker Diarization Error Correction

Rohit Paturi, Sundararajan Srinivasan, Xiang Li

2023 INTERSPEECH

Lexical Stress and Velar Palatalization in Italian: A spatio-temporal Interaction

Bowei Shao, Philipp Buech, Anne Hermes et al.

2023 INTERSPEECH

LibriTTS-R: A Restored Multi-Speaker Text-to-Speech Corpus

Yuma Koizumi, Heiga Zen, Shigeki Karita et al.

2023 INTERSPEECH

LightClone: Speaker-guided Parallel Subnet Selection for Few-shot Voice Cloning

Jie Wu, Jian Luan, Yujun Wang

2023 INTERSPEECH

LightVoc: An Upsampling-Free GAN Vocoder Based On Conformer And Inverse Short-time Fourier Transform

Dinh Son Dang, Tung Lam Nguyen, Bao Thang Ta et al.

2023 INTERSPEECH

Lightweight and Efficient Spoken Language Identification of Long-form Audio

Winstead Zhu, Md Iftekhar Tanveer, Yang Janet Liu et al.

2023 INTERSPEECH

Listener sensitivity to deviating obstruents in WaveNet

Ayushi Pandey, Jens Edlund, Sébastien Le Maguer et al.

2023 INTERSPEECH

Listening To Silences In Contact Center Conversations Using Textual Cues

Digvijay Anil Ingle, Ayush Kumar, Jithendra Vepa

2023 INTERSPEECH

Locate and Beamform: Two-dimensional Locating All-neural Beamformer for Multi-channel Speech Separation

Yanjie Fu, Meng Ge, Honglong Wang et al.

2023 INTERSPEECH

Lossless 4-bit Quantization of Architecture Compressed Conformer ASR Systems on the 300-hr Switchboard Corpus

Zhaoqing Li, Tianzi Wang, Jiajun Deng et al.

2023 INTERSPEECH

Low-complexity Broadband Beampattern Synthesis using Array Response Control

Jiayi Xu, Jian Li, Weixin Meng et al.

2023 INTERSPEECH

Low-Resource Cross-Lingual Adaptive Training for Nigerian Pidgin

Pin-Jie Lin, Muhammed Saeed, Ernie Chang et al.

2023 INTERSPEECH

Papers