Autor der Publikation

Singing-Tacotron: Global Duration Control Attention and Dynamic Filter for End-to-end Singing Voice Synthesis.

, , , , und . DDAM@MM, Seite 53-59. ACM, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Emotion Selectable End-to-End Text-based Speech Editing., , , , , und . CoRR, (2022)Deep Attention Fusion Feature for Speech Separation with End-to-End Post-filter Method., , , , , und . CoRR, (2020)Rnn-transducer with language bias for end-to-end Mandarin-English code-switching speech recognition., , , , und . CoRR, (2020)Decoupling Pronunciation and Language for End-to-end Code-switching Automatic Speech Recognition., , , , , und . CoRR, (2020)Detection of Cross-Dataset Fake Audio Based on Prosodic and Pronunciation Features., , , , , und . CoRR, (2023)Gated Recurrent Fusion with Joint Training Framework for Robust End-to-End Speech Recognition., , , , , und . CoRR, (2020)SceneFake: An Initial Dataset and Benchmarks for Scene Fake Audio Detection., , , , , , und . CoRR, (2022)EmoFake: An Initial Dataset for Emotion Fake Audio Detection., , , , , , und . CoRR, (2022)One In A Hundred: Selecting the Best Predicted Sequence from Numerous Candidates for Speech Recognition., , , , , und . APSIPA ASC, Seite 454-459. IEEE, (2021)CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing., , , , und . IEEE ACM Trans. Audio Speech Lang. Process., (2022)