Research Explorer

Multimodal Segmentation for Vocal Tract Modeling

Rishi Jain, Bohan Yu, Peter Wu et al.

2024 INTERSPEECH

MultiPA: A Multi-task Speech Pronunciation Assessment Model for Open Response Scenarios

Yu-Wen Chen, Zhou Yu, Julia Hirschberg

2024 INTERSPEECH

Multi-speaker and multi-dialectal Catalan TTS models for video gaming

Alex Peiró-Lilja, José Giraldo, Martí Llopart-Font et al.

2024 INTERSPEECH

MultiStage Speech Bandwidth Extension with Flexible Sampling Rate Control

Ye-Xin Lu, Yang Ai, Zheng-Yan Sheng et al.

2024 INTERSPEECH

MultiTalk: Enhancing 3D Talking Head Generation Across Languages with Multilingual Video Dataset

Kim Sung-Bin, Lee Chae-Yeon, Gihun Son et al.

2024 INTERSPEECH

MUSE: Flexible Voiceprint Receptive Fields and Multi-Path Fusion Enhanced Taylor Transformer for U-Net-based Speech Enhancement

Zizhen Lin, Xiaoting Chen, Junyu Wang

2024 INTERSPEECH

Nasal Air Flow During Speech Production In Korebaju

Jenifer Vega Rodriguez, Nathalie Vallée, Christophe Savariaux et al.

2024 INTERSPEECH

NAST: Noise Aware Speech Tokenization for Speech Language Models

Shoval Messica, Yossi Adi

2024 INTERSPEECH

Navigating the Minefield of MT Beam Search in Cascaded Streaming Speech Translation

Rastislav Rabatin, Frank Seide, Ernie Chang

2024 INTERSPEECH

Neural ATSM: Fully Neural Network-based Adaptive Time-Scale Modification Using Sentence-Specific Dynamic Control

Jaeuk Lee, Sohee Jang, Joon-Hyuk Chang

2024 INTERSPEECH

Neural Blind Source Separation and Diarization for Distant Speech Recognition

Yoshiaki Bando, Tomohiko Nakamura, Shinji Watanabe

2024 INTERSPEECH

Neural Codec-based Adversarial Sample Detection for Speaker Verification

Xuanjun Chen, Jiawei Du, Haibin Wu et al.

2024 INTERSPEECH

Neural Codec Language Models for Disentangled and Textless Voice Conversion

Alan Baade, Puyuan Peng, David Harwath

2024 INTERSPEECH

Neural Compression Augmentation for Contrastive Audio Representation Learning

Zhaoyu Wang, Haohe Liu, Harry Coppock et al.

2024 INTERSPEECH

Neural Network Augmented Kalman Filter for Robust Acoustic Howling Suppression

Yixuan Zhang, Hao Zhang, Meng Yu et al.

2024 INTERSPEECH

NeuRO: an application for code-switched autism detection in children

Mohd Mujtaba Akhtar, Girish, Orchid Chetia Phukan et al.

2024 INTERSPEECH

Neurocomputational model of speech recognition for pathological speech detection: a case study on Parkinson's disease speech detection

Sevada Hovsepyan, Mathew Magimai.-Doss

2024 INTERSPEECH

Neuromorphic Keyword Spotting with Pulse Density Modulation MEMS Microphones

Sidi Yaya Arnaud Yarga, Sean U N Wood

2024 INTERSPEECH

Noise-aware Speech Enhancement using Diffusion Probabilistic Model

Yuchen Hu, Chen Chen, Ruizhe Li et al.

2024 INTERSPEECH

Noise-robust Speech Separation with Fast Generative Correction

Helin Wang, Jesús Villalba, Laureano Moro-Velazquez et al.

2024 INTERSPEECH

Noise-Robust Voice Conversion by Conditional Denoising Training Using Latent Variables of Recording Quality and Environment

Takuto Igarashi, Yuki Saito, Kentaro Seki et al.

2024 INTERSPEECH

Non-Intrusive Speech Intelligibility Prediction for Hearing Aids using Whisper and Metadata

Ryandhimas E. Zezario, Fei Chen, Chiou-Shann Fuh et al.

2024 INTERSPEECH

Non-Linear Inference Time Intervention: Improving LLM Truthfulness

Jakub Hoscilowicz, Adam Wiacek, Jan Chojnacki et al.

2024 INTERSPEECH

No-Reference Speech Intelligibility Prediction Leveraging a Noisy-Speech ASR Pre-Trained Model

Haolan Wang, Amin Edraki, Wai-Yip Chan et al.

2024 INTERSPEECH

NOTSOFAR-1 Challenge: New Datasets, Baseline, and Tasks for Distant Meeting Transcription

Alon Vinnikov, Amir Ivry, Aviv Hurvitz et al.

2024 INTERSPEECH

Papers