Autor der Publikation

Leveraging Continuous Time to Understand Momentum When Training Diagonal Linear Networks.

, , und . AISTATS, Volume 238 von Proceedings of Machine Learning Research, Seite 3556-3564. PMLR, (2024)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Penalising the biases in norm regularisation enforces sparsity., und . CoRR, (2023)Transferable Adversarial Robustness for Categorical Data via Universal Robust Embeddings., , , und . CoRR, (2023)Implicit Bias of SGD for Diagonal Linear Networks: a Provable Benefit of Stochasticity., , und . NeurIPS, Seite 29218-29230. (2021)A Modern Look at the Relationship between Sharpness and Generalization., , , , und . ICML, Volume 202 von Proceedings of Machine Learning Research, Seite 840-902. PMLR, (2023)An Efficient Sampling Algorithm for Non-smooth Composite Potentials., , , und . CoRR, (2019)Long Is More for Alignment: A Simple but Tough-to-Beat Baseline for Instruction Fine-Tuning., , , und . CoRR, (2024)Quantum Channel Certification with Incoherent Strategies., , , und . CoRR, (2023)ARIA: Adversarially Robust Image Attribution for Content Provenance., , , , , , und . CVPR Workshops, Seite 33-43. IEEE, (2022)Linearization Algorithms for Fully Composite Optimization., , , und . COLT, Volume 195 von Proceedings of Machine Learning Research, Seite 3669-3695. PMLR, (2023)Last iterate convergence of SGD for Least-Squares in the Interpolation regime., , und . NeurIPS, Seite 21581-21591. (2021)