ProfessorsProfessors of Columbia University in the City of New YorkMike Z. SHOU

Mike Z. SHOU

Columbia University in the City of New York

H-index: 26

North America-United States

About Mike Z. SHOU

Mike Z. SHOU, With an exceptional h-index of 26 and a recent h-index of 26 (since 2020), a distinguished researcher at Columbia University in the City of New York, specializes in the field of Computer Vision, AR/VR, Multimedia.

His recent articles reflect a diverse array of research interests and contributions to the field:

Datasetdm: Synthesizing data with perception annotations using diffusion models

DragAnything: Motion Control for Anything using Entity Representation

Towards A Better Metric for Text-to-Video Generation

RingID: Rethinking Tree-Ring Watermarking for Enhanced Multi-Key Identification

Mix-of-show: Decentralized low-rank adaptation for multi-concept customization of diffusion models

Sct: A simple baseline for parameter-efficient fine-tuning via salient channels

Moonshot: Towards controllable video generation and editing with multimodal conditions

Spiking-Leaf: A Learnable Auditory Front-End for Spiking Neural Networks

Mike Z. SHOU Information

University	Columbia University in the City of New York
Position	Facebook AI;
Citations(all)	5747
Citations(since 2020)	5319
Cited By	1828
hIndex(all)	26
hIndex(since 2020)	26
i10Index(all)	44
i10Index(since 2020)	44
Email	Access Email
University Profile Page	Columbia University in the City of New York
Google Scholar	View Google Scholar Profile

Mike Z. SHOU Skills & Research Interests

Computer Vision

AR/VR

Multimedia

Top articles of Mike Z. SHOU

Title	Journal	Author(s)	Publication Date
Datasetdm: Synthesizing data with perception annotations using diffusion models	Advances in Neural Information Processing Systems	Weijia Wu Yuzhong Zhao Hao Chen Yuchao Gu Rui Zhao ...	2024/2/13
DragAnything: Motion Control for Anything using Entity Representation	arXiv preprint arXiv:2403.07420	Wejia Wu Zhuang Li Yuchao Gu Rui Zhao Yefei He ...	2024/3/12
Towards A Better Metric for Text-to-Video Generation	arXiv preprint arXiv:2401.07781	Jay Zhangjie Wu Guian Fang Haoning Wu Xintao Wang Yixiao Ge ...	2024/1/15
RingID: Rethinking Tree-Ring Watermarking for Enhanced Multi-Key Identification	arXiv preprint arXiv:2404.14055	Hai Ci Pei Yang Yiren Song Mike Zheng Shou	2024/4/22
Mix-of-show: Decentralized low-rank adaptation for multi-concept customization of diffusion models	Advances in Neural Information Processing Systems	Yuchao Gu Xintao Wang Jay Zhangjie Wu Yujun Shi Yunpeng Chen ...	2024/2/13
Sct: A simple baseline for parameter-efficient fine-tuning via salient channels	International Journal of Computer Vision	Henry Hengyuan Zhao Pichao Wang Yuyang Zhao Hao Luo Fan Wang ...	2024/3
Moonshot: Towards controllable video generation and editing with multimodal conditions	arXiv preprint arXiv:2401.01827	David Junhao Zhang Dongxu Li Hung Le Mike Zheng Shou Caiming Xiong ...	2024/1/3
Spiking-Leaf: A Learnable Auditory Front-End for Spiking Neural Networks	ICASSP-24	Zeyang Song Jibin Wu Malu Zhang Mike Zheng Shou Haizhou Li	2023/9/18
Object-centric learning with cyclic walks between parts and whole		Ziyu Wang Mike Zheng Shou Mengmi Zhang	2023/2/16
Bring Your Own Character: A Holistic Solution for Automatic Facial Animation Generation of Customized Characters	arXiv preprint arXiv:2402.13724	Zechen Bai Peng Chen Xiaolan Peng Lu Liu Hui Chen ...	2024/2/21
COSMO: COntrastive Streamlined MultimOdal Model with Interleaved Pre-Training	arXiv preprint arXiv:2401.00849	Alex Jinpeng Wang Linjie Li Kevin Qinghong Lin Jianfeng Wang Kevin Lin ...	2024/1/1
Cross-Attention Makes Inference Cumbersome in Text-to-Image Diffusion Models	Technical Report	Wentian Zhang Haozhe Liu# Jinheng Xie Francesco Faccio Mike Zheng Shou ...	2024/4/3
Skip $\textbackslash n $: A simple method to reduce hallucination in Large Vision-Language Models	arXiv preprint arXiv:2402.01345	Zongbo Han Zechen Bai Haiyang Mei Qianli Xu Changqing Zhang ...	2024/2/2
Xagen: 3d expressive human avatars generation	Advances in Neural Information Processing Systems	Zhongcong Xu Jianfeng Zhang Jun Hao Liew Jiashi Feng Mike Zheng Shou	2024/2/13
Hallucination of Multimodal Large Language Models: A Survey	arXiv preprint arXiv:2404.18930	Zechen Bai Pichao Wang Tianjun Xiao Tong He Zongbo Han ...	2024/4/29
Delocate: Detection and Localization for Deepfake Videos with Randomly-Located Tampered Traces	arXiv preprint arXiv:2401.13516	Juan Hu Xin Liao Difei Gao Satoshi Tsutsui Qian Wang ...	2024/1/24
Learning Visual Prior via Generative Pre-Training	Advances in Neural Information Processing Systems	Jinheng Xie Kai Ye Yudong Li Yuexiang Li Kevin Qinghong Lin ...	2024/2/13
Diffusion-Driven Self-Supervised Learning for Shape Reconstruction and Pose Estimation	arXiv preprint arXiv:2403.12728	Jingtao Sun Yaonan Wang Mingtao Feng Chao Ding Mike Zheng Shou ...	2024/3/19
Managing Metaverse Data Tsunami: Actionable Insights	IEEE Transactions on Knowledge and Data Engineering	Bingxue Zhang Gang Chen Beng Chin Ooi Mike Zheng Shou Kian-Lee Tan ...	2024/1/16
Learning Long-form Video Prior via Generative Pre-Training	arXiv preprint arXiv:2404.15909	Jinheng Xie Jiajun Feng Zhaoxu Tian Kevin Qinghong Lin Yawen Huang ...	2024/4/24