Autor der Publikation

VinVL: Revisiting Visual Representations in Vision-Language Models.

, , , , , , , und . CVPR, Seite 5579-5588. Computer Vision Foundation / IEEE, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Object-Centric Image Generation from Layouts., , , , und . CoRR, (2020)On the Discrimination-Generalization Tradeoff in GANs., , , , und . ICLR (Poster), OpenReview.net, (2018)Out-of-distribution Prediction with Invariant Risk Minimization: The Limitation and An Effective Fix., , , und . CoRR, (2021)DIME-FM : DIstilling Multimodal and Efficient Foundation Models., , , , , und . ICCV, Seite 15475-15487. IEEE, (2023)An Empirical Study of Training End-to-End Vision-and-Language Transformers., , , , , , , , , und 2 andere Autor(en). CVPR, Seite 18145-18155. IEEE, (2022)VinVL: Making Visual Representations Matter in Vision-Language Models., , , , , , , und . CoRR, (2021)VinVL: Revisiting Visual Representations in Vision-Language Models., , , , , , , und . CVPR, Seite 5579-5588. Computer Vision Foundation / IEEE, (2021)Object-Driven Text-To-Image Synthesis via Adversarial Training., , , , , , und . CVPR, Seite 12174-12182. Computer Vision Foundation / IEEE, (2019)Focal Attention for Long-Range Interactions in Vision Transformers., , , , , , und . NeurIPS, Seite 30008-30022. (2021)An Empirical Study of Training End-to-End Vision-and-Language Transformers., , , , , , , , , und 2 andere Autor(en). CoRR, (2021)