Autor der Publikation

Cross-Modality Time-Variant Relation Learning for Generating Dynamic Scene Graphs.

, , , und . ICRA, Seite 8231-8238. IEEE, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Video-Text as Game Players: Hierarchical Banzhaf Interaction for Cross-Modal Representation Learning., , , , , , , und . CVPR, Seite 2472-2482. IEEE, (2023)MagicTime: Time-lapse Video Generation Models as Metamorphic Simulators., , , , , , , , und . CoRR, (2024)LLMBind: A Unified Modality-Task Integration Framework., , , , , , , , , und 2 andere Autor(en). CoRR, (2024)Expectation-Maximization Contrastive Learning for Compact Video-and-Language Representations., , , , , , , und . CoRR, (2022)GPT-4V(ision) as A Social Media Analysis Engine., , , , , , , , und . CoRR, (2023)Weakly-Supervised 3D Spatial Reasoning for Text-Based Visual Question Answering., , , , , und . IEEE Trans. Image Process., (2023)Improving Scene Graph Generation with Superpixel-Based Interaction Learning., , , , und . ACM Multimedia, Seite 1809-1820. ACM, (2023)Cross-Modality Time-Variant Relation Learning for Generating Dynamic Scene Graphs., , , und . ICRA, Seite 8231-8238. IEEE, (2023)Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering., , , , , und . CoRR, (2022)Text-Video Retrieval with Disentangled Conceptualization and Set-to-Set Alignment., , , , , , , und . IJCAI, Seite 938-946. ijcai.org, (2023)