Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Adafactor: Adaptive Learning Rates with Sublinear Memory Cost., und . ICML, Volume 80 von Proceedings of Machine Learning Research, Seite 4603-4611. PMLR, (2018)Mesh-tensorflow: Deep learning for supercomputers, , , , , , , , , und 1 andere Autor(en). Advances in Neural Information Processing Systems, Seite 10435--10444. (2018)GSPMD: General and Scalable Parallelization for ML Computation Graphs., , , , , , , , , und 6 andere Autor(en). CoRR, (2021)Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer, , , , , , , , und . (Oktober 2019)cite arxiv:1910.10683.Searching for Efficient Transformers for Language Modeling., , , , , und . NeurIPS, Seite 6010-6022. (2021)Blockwise Parallel Decoding for Deep Autoregressive Models., , und . NeurIPS, Seite 10107-10116. (2018)Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer., , , , , , , , und . J. Mach. Learn. Res., (2020)Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity., , und . J. Mach. Learn. Res., (2022)Music Transformer: Generating Music with Long-Term Structure, , , , , , , , , und . 7th International Conference on Learning Representations, ICLR 2019, New Orleans, LA, USA, May 6-9, 2019, OpenReview.net, (2019)GShard: Scaling Giant Models with Conditional Computation and Automatic Sharding., , , , , , , , und . ICLR, OpenReview.net, (2021)