Mingfei Han

Monash University

H-index: 6

Oceania-Australia

About Mingfei Han

Mingfei Han, With an exceptional h-index of 6 and a recent h-index of 6 (since 2020), a distinguished researcher at Monash University, specializes in the field of Video-Text Understanding, Video Object Perception, Action Recognition.

His recent articles reflect a diverse array of research interests and contributions to the field:

LongVLM: Efficient Long Video Understanding via Large Language Models

Progressive Frame-Proposal Mining for Weakly Supervised Video Object Detection

Mask propagation for efficient video semantic segmentation

Shot2Story20K: A New Benchmark for Comprehensive Understanding of Multi-shot Videos

Generating Action-conditioned Prompts for Open-vocabulary Video Action Recognition

Video Recognition in Portrait Mode

HTML: Hybrid Temporal-scale Multimodal Learning Framework for Referring Video Object Segmentation

An Efficient Spatio-Temporal Pyramid Transformer for Action Detection

Mingfei Han Information

University	Monash University
Position	; Shenzhen Institute of Advanced Technology Chinese Academy of Sciences
Citations(all)	276
Citations(since 2020)	276
Cited By	23
hIndex(all)	6
hIndex(since 2020)	6
i10Index(all)	5
i10Index(since 2020)	5
Email	Access Email
University Profile Page	Monash University
Google Scholar	View Google Scholar Profile

Mingfei Han Skills & Research Interests

Video-Text Understanding

Video Object Perception

Action Recognition

Mingfei Han

Monash University

About Mingfei Han

Mingfei Han Information

Mingfei Han Skills & Research Interests

Top articles of Mingfei Han

LongVLM: Efficient Long Video Understanding via Large Language Models

Mingfei Han

Haoyu He

Xiaojun Chang

Bohan Zhuang

Progressive Frame-Proposal Mining for Weakly Supervised Video Object Detection

Mingfei Han

Yali Wang

Mingjie Li

Xiaojun Chang

Yi Yang

Yu Qiao

Mask propagation for efficient video semantic segmentation

Mingfei Han

Haoyu He

Mingjie Li

Lina Yao

Xiaojun Chang

Bohan Zhuang

Shot2Story20K: A New Benchmark for Comprehensive Understanding of Multi-shot Videos

Mingfei Han

Xiaojun Chang

Heng Wang

Generating Action-conditioned Prompts for Open-vocabulary Video Action Recognition

Minnan Luo

Xiaojun Chang

Mingfei Han

Mengmeng Wang

Video Recognition in Portrait Mode

Mingfei Han

Jiashi Feng

Xiaojun Chang

Heng Wang

HTML: Hybrid Temporal-scale Multimodal Learning Framework for Referring Video Object Segmentation

Mingfei Han

Yali Wang

Zhihui Li

Lina Yao

Xiaojun Chang

Yu Qiao

An Efficient Spatio-Temporal Pyramid Transformer for Action Detection

Zizheng Pan

Mingfei Han

Xiaojun Chang

Bohan Zhuang

Generalizable memory-driven transformer for multivariate long sequence time-series forecasting

Xiaoyun Zhao

Rui Liu

Mingjie Li

Mingfei Han

Changlin Li

Ling Chen

Xiaojun Chang

Dual-AI: Dual-path Actor Interaction Learning for Group Activity Recognition

Yali Wang

Rui Yan

Lina Yao

Xiaojun Chang

Yu Qiao

Mining inter-video proposal relations for video object detection

Mingfei Han

Yali Wang

Xiaojun Chang

Yu Qiao

Co-Authors

Xiaojun Chang

Changlin Li

Shiyu Xuan