Research Explorer

Malafide: a novel adversarial convolutive noise attack against deepfake and spoofing detection systems

Michele Panariello, Wanying Ge, Hemlata Tak et al.

2023 INTERSPEECH

Mandarin Electrolaryngeal Speech Voice Conversion using Cross-domain Features

Hsin-Hao Chen, Yung-Lun Chien, Ming-Chi Yen et al.

2023 INTERSPEECH

Mapping Phonemes to Acoustic Symbols and Codes Using Synchrony in Speech Modulation Vectors Estimated by the Travellingwave Filter Bank

Ashwin Rao

2023 INTERSPEECH

Masked Audio Modeling with CLAP and Multi-Objective Learning

Yifei Xin, Xiulian Peng, Yan Lu

2023 INTERSPEECH

Masked Modeling Duo for Speech: Specializing General-Purpose Audio Representation to Speech using Denoising Distillation

Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi et al.

2023 INTERSPEECH

MaskedSpeech: Context-aware Speech Synthesis with Masking Strategy

Ya-Jie Zhang, Wei Song, Yanghao Yue et al.

2023 INTERSPEECH

Masking Kernel for Learning Energy-Efficient Representations for Speaker Recognition and Mobile Health

Apiwat Ditthapron, Emmanuel O. Agu, Adam C. Lammert

2023 INTERSPEECH

Matching Acoustic and Perceptual Measures of Phonation Assessment in Disordered Speech - A Case Study

Melanie Jouaiti, Pippa Kirby, Ravi Vaidyanathan

2023 INTERSPEECH

Matching Latent Encoding for Audio-Text based Keyword Spotting

Kumari Nishu, Minsik Cho, Devang Naik

2023 INTERSPEECH

MAVD: The First Open Large-Scale Mandarin Audio-Visual Dataset with Depth Information

Jianrong Wang, Yuchen Huo, Li Liu et al.

2023 INTERSPEECH

MCR-Data2vec 2.0: Improving Self-supervised Speech Pre-training via Model-level Consistency Regularization

Ji Won Yoon, Seok Min Kim, Nam Soo Kim

2023 INTERSPEECH

MC-SpEx: Towards Effective Speaker Extraction with Multi-Scale Interfusion and Conditional Speaker Modulation

Jun Chen, Wei Rao, Zilin Wang et al.

2023 INTERSPEECH

MD3: The Multi-Dialect Dataset of Dialogues

Jacob Eisenstein, Vinodkumar Prabhakaran, Clara Rivera et al.

2023 INTERSPEECH

mdctGAN: Taming transformer-based GAN for speech super-resolution with Modified DCT spectra

Chenhao Shuai, Chaohua Shi, Lu Gan et al.

2023 INTERSPEECH

Measuring Language Development From Child-centered Recordings

Yaya Sy, William N. Havard, Marvin Lavechin et al.

2023 INTERSPEECH

Measuring Phonological Precision in Children with Cleft Lip and Palate

Tomás Arias-Vergara, Elizabeth Londoño-Mora, Paula A. Pérez-Toro et al.

2023 INTERSPEECH

Measuring prosody in child speech using SoapBox Fluency API

Mauro Nicolao, Brenda McGuirk, Declan Moore et al.

2023 INTERSPEECH

MEG Encoding using Word Context Semantics in Listening Stories

Subba Reddy Oota, Nathan Trouvain, Frederic Alexandre et al.

2023 INTERSPEECH

Memory-augmented conformer for improved end-to-end long-form ASR

Carlos Carvalho, Alberto Abad

2023 INTERSPEECH

Memory Augmented Lookup Dictionary Based Language Modeling for Automatic Speech Recognition

Yukun Feng, Ming Tu, Rui Xia et al.

2023 INTERSPEECH

Memory Network-Based End-To-End Neural ES-KMeans for Improved Word Segmentation

Yu Iwamoto, Takahiro Shinozaki

2023 INTERSPEECH

MERLIon CCS Challenge: A English-Mandarin code-switching child-directed speech corpus for language identification and diarization

Victoria Y. H. Chua, Hexin Liu, Leibny Paola Garcia et al.

2023 INTERSPEECH

Meta-domain Adversarial Contrastive Learning for Alleviating Individual Bias in Self-sentiment Predictions

Zhi Li, Ryu Takeda, Takahiro Hara

2023 INTERSPEECH

MetricAug: A Distortion Metric-Lead Augmentation Strategy for Training Noise-Robust Speech Emotion Recognizer

Ya-Tse Wu, Chi-Chun Lee

2023 INTERSPEECH

MF-PAM: Accurate Pitch Estimation through Periodicity Analysis and Multi-level Feature Fusion

Woo-Jin Chung, Doyeon Kim, Soo-Whan Chung et al.

2023 INTERSPEECH

Papers