Autor der Publikation

You Only Group Once: Efficient Point-Cloud Processing with Token Representation and Relation Inference Module.

, , , , , , , und . IROS, Seite 4589-4596. IEEE, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

HallE-Switch: Rethinking and Controlling Object Existence Hallucinations in Large Vision Language Models for Detailed Caption., , , , , , , , , und . CoRR, (2023)Image2Point: 3D Point-Cloud Understanding with 2D Image Pretrained Models., , , , , , , , , und . ECCV (37), Volume 13697 von Lecture Notes in Computer Science, Seite 638-656. Springer, (2022)Image2Point: 3D Point-Cloud Understanding with Pretrained 2D ConvNets., , , , , , , , und . CoRR, (2021)InfiMM-HD: A Leap Forward in High-Resolution Multimodal Understanding., , , , , , , , , und . CoRR, (2024)COCO is ÄLL" You Need for Visual Instruction Fine-tuning., , , , und . CoRR, (2024)Exploring the Reasoning Abilities of Multimodal Large Language Models (MLLMs): A Comprehensive Survey on Emerging Trends in Multimodal Reasoning., , , , , , , , , und . CoRR, (2024)Integer-Only Zero-Shot Quantization for Efficient Speech Recognition., , , , , , , , , und . ICASSP, Seite 4288-4292. IEEE, (2022)Q-ASR: Integer-only Zero-shot Quantization for Efficient Speech Recognition., , , , , , , und . CoRR, (2021)Multitask Vision-Language Prompt Tuning., , , , , , und . WACV, Seite 5644-5655. IEEE, (2024)CORE-MM: Complex Open-Ended Reasoning Evaluation For Multi-Modal Large Language Models., , , , , , , , , und 2 andere Autor(en). CoRR, (2023)