Peihao Chen at South China University of Technology

University	South China University of Technology
Position	Ph.D. candidate
Citations(all)	1062
Citations(since 2020)	1062
Cited By	163
hIndex(all)	10
hIndex(since 2020)	10
i10Index(all)	10
i10Index(since 2020)	10
Email	Access Email
University Profile Page	South China University of Technology
Google Scholar	View Google Scholar Profile

3D-VLA: A 3D Vision-Language-Action Generative World Model

arXiv preprint arXiv:2403.09631

2024/3/14

Peihao Chen

H-Index: 7

Jincheng Yang

H-Index: 4

Xin Yan

H-Index: 7

Yilun Du

H-Index: 7

Chuang Gan

H-Index: 37

Vesper: A compact and effective pretrained model for speech emotion recognition

IEEE Transactions on Affective Computing

2024/2/26

Peihao Chen

H-Index: 7

Xiangmin Xu

H-Index: 22

FGPrompt: Fine-grained Goal Prompting for Image-goal Navigation

Advances in Neural Information Processing Systems

2024/2/13

Peihao Chen

H-Index: 7

Jian Chen

H-Index: 6

Mingkui Tan

H-Index: 31

MultiPLY: A Multisensory Object-Centric Embodied Large Language Model in 3D World

arXiv preprint arXiv:2401.08577

2024/1/16

Peihao Chen

H-Index: 7

Junyan Li

H-Index: 8

Chuang Gan

H-Index: 37

3d-llm: Injecting the 3d world into large language models

Advances in Neural Information Processing Systems

2023/12/15

Peihao Chen

H-Index: 7

Shuhong Zheng

H-Index: 7

Yilun Du

H-Index: 7

Chuang Gan

H-Index: 37

A Simple Knowledge Distillation Framework for Open-world Object Detection

arXiv preprint arXiv:2312.08653

2023/12/14

Ying Wei

H-Index: 16

Peihao Chen

H-Index: 7

DCIR: Dynamic Consistency Intrinsic Reward for Multi-Agent Reinforcement Learning

arXiv preprint arXiv:2312.05783

2023/12/10

Yufeng Wang

H-Index: 8

Peihao Chen

H-Index: 7

Runhao Zeng

H-Index: 5

Siyuan Zhou

H-Index: 6

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

CoVLM: Composing Visual Entities and Relationships in Large Language Models Via Communicative Decoding

arXiv preprint arXiv:2311.03354

2023/11/6

Junyan Li

H-Index: 8

Peihao Chen

H-Index: 7

Yikang Shen

H-Index: 8

Chuang Gan

H-Index: 37

Nav: Action-Aware Zero-Shot Robot Navigation by Exploiting Vision-and-Language Ability of Foundation Models

arXiv preprint arXiv:2308.07997

2023/8/15

Peihao Chen

H-Index: 7

Runhao Zeng

H-Index: 5

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

Detecting the open-world objects with the help of the Brain

arXiv preprint arXiv:2303.11623

2023/3/21

Ying Wei

H-Index: 16

Peihao Chen

H-Index: 7

Learning vision-and-language navigation from youtube videos

2023

Peihao Chen

H-Index: 7

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

Masked motion encoding for self-supervised video representation learning

2023

Peihao Chen

H-Index: 7

Changhao Li

H-Index: 1

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language Navigation

2022/10/14

Peihao Chen

H-Index: 7

Runhao Zeng

H-Index: 5

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

Learning Active Camera for Multi-Object Navigation

2022/10/14

Peihao Chen

H-Index: 7

Wenbing Huang

H-Index: 21

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

RSPNet: Relative Speed Perception for Unsupervised Video Representation Learning

Proceedings of the AAAI Conference on Artificial Intelligence

2021/5/18

Peihao Chen

H-Index: 7

Deng Huang

H-Index: 4

Runhao Zeng

H-Index: 5

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

Generating visually aligned sound from videos

IEEE Transactions on Image Processing

2020/7/28

Peihao Chen

H-Index: 7

Yang Zhang

H-Index: 3

Mingkui Tan

H-Index: 31

Deng Huang

H-Index: 4

Chuang Gan

H-Index: 37

Location-aware graph convolutional networks for video question answering

Proceedings of the AAAI Conference on Artificial Intelligence

2020/4/3

Deng Huang

H-Index: 4

Peihao Chen

H-Index: 7

Runhao Zeng

H-Index: 5

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

Dense regression network for video grounding

2020

Runhao Zeng

H-Index: 5

Wenbing Huang

H-Index: 21

Peihao Chen

H-Index: 7

Mingkui Tan

H-Index: 31

Chuang Gan

H-Index: 37

Foley music: Learning to generate music from videos

2020

Chuang Gan

H-Index: 37

Deng Huang

H-Index: 4

Peihao Chen

H-Index: 7

Antonio Torralba

H-Index: 15

Peihao Chen

South China University of Technology

About Peihao Chen

Peihao Chen Information

Peihao Chen Skills & Research Interests

Top articles of Peihao Chen

3D-VLA: A 3D Vision-Language-Action Generative World Model

Peihao Chen

Jincheng Yang

Xin Yan

Yilun Du

Chuang Gan

Vesper: A compact and effective pretrained model for speech emotion recognition

Peihao Chen

Xiangmin Xu

FGPrompt: Fine-grained Goal Prompting for Image-goal Navigation

Peihao Chen

Jian Chen

Mingkui Tan

MultiPLY: A Multisensory Object-Centric Embodied Large Language Model in 3D World

Peihao Chen

Junyan Li

Chuang Gan

3d-llm: Injecting the 3d world into large language models

Peihao Chen

Shuhong Zheng

Yilun Du

Chuang Gan

A Simple Knowledge Distillation Framework for Open-world Object Detection

Ying Wei

Peihao Chen

DCIR: Dynamic Consistency Intrinsic Reward for Multi-Agent Reinforcement Learning

Yufeng Wang

Peihao Chen

Runhao Zeng

Siyuan Zhou

Mingkui Tan

Chuang Gan

CoVLM: Composing Visual Entities and Relationships in Large Language Models Via Communicative Decoding

Junyan Li

Peihao Chen

Yikang Shen

Chuang Gan

Nav: Action-Aware Zero-Shot Robot Navigation by Exploiting Vision-and-Language Ability of Foundation Models

Peihao Chen

Runhao Zeng

Mingkui Tan

Chuang Gan

Detecting the open-world objects with the help of the Brain

Ying Wei

Peihao Chen

Learning vision-and-language navigation from youtube videos

Peihao Chen

Mingkui Tan

Chuang Gan

Masked motion encoding for self-supervised video representation learning

Peihao Chen

Changhao Li

Mingkui Tan

Chuang Gan

Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language Navigation

Peihao Chen

Runhao Zeng

Mingkui Tan

Chuang Gan

Learning Active Camera for Multi-Object Navigation

Peihao Chen

Wenbing Huang

Mingkui Tan

Chuang Gan

RSPNet: Relative Speed Perception for Unsupervised Video Representation Learning

Peihao Chen

Deng Huang

Runhao Zeng

Mingkui Tan

Chuang Gan

Generating visually aligned sound from videos

Peihao Chen

Yang Zhang

Mingkui Tan