Xinyuan Qian at National University of Singapore

University	National University of Singapore
Position	___
Citations(all)	410
Citations(since 2020)	402
Cited By	56
hIndex(all)	10
hIndex(since 2020)	10
i10Index(all)	10
i10Index(since 2020)	10
Email	Access Email
University Profile Page	National University of Singapore
Google Scholar	View Google Scholar Profile

Audio-Visual Target Speaker Extraction with Reverse Selective Auditory Attention

arXiv preprint arXiv:2404.18501

2024/4/29

Xinyuan Qian

H-Index: 4

Junjie Li

H-Index: 4

Haizhou Li

H-Index: 48

GLMB 3D Speaker Tracking with Video-Assisted Multi-Channel Audio Optimization Functions

2024/4/14

Xinyuan Qian

H-Index: 4

Qiquan Zhang

H-Index: 5

Visually Guided Binaural Audio Generation with Cross-Modal Consistency

2024/4/14

Miao Liu

H-Index: 4

Jing Wang

H-Index: 18

Xinyuan Qian

H-Index: 4

LocSelect: Target Speaker Localization with an Auditory Selective Hearing Mechanism

2024/4/14

Yu Chen

H-Index: 3

Xinyuan Qian

H-Index: 4

Haizhou Li

H-Index: 48

Enhancing Real-World Active Speaker Detection with Multi-Modal Extraction Pre-Training

arXiv preprint arXiv:2404.00861

2024/4/1

Xinyuan Qian

H-Index: 4

Rohan Kumar Das

H-Index: 16

Xiaoxue Gao

H-Index: 3

Haizhou Li

H-Index: 48

M3TTS: Multi-modal text-to-speech of multi-scale style control for dubbing

Pattern Recognition Letters

2024/2/10

Yan Liu

H-Index: 1

Xinyuan Qian

H-Index: 4

Tian-Hao Zhang

H-Index: 9

Xu-Cheng Yin

H-Index: 16

Attention-Based End-to-End Differentiable Particle Filter for Audio Speaker Tracking

2023/9/8

Wenwu Wang

H-Index: 29

Adapting Pre-Trained Self-Supervised Learning Model for Speech Recognition with Light-Weight Adapters

Electronics

2024/1/1

Xiaoxue Gao

H-Index: 3

Xinyuan Qian

H-Index: 4

Haizhou Li

H-Index: 48

Audio-Visual Temporal Forgery Detection Using Embedding-Level Fusion and Multi-Dimensional Contrastive Loss

IEEE Transactions on Circuits and Systems for Video Technology

2023/10/23

Miao Liu

H-Index: 4

Jing Wang

H-Index: 18

Xinyuan Qian

H-Index: 4

Haizhou Li

H-Index: 48

Audio-visual speaker tracking: Progress, challenges, and future directions

arXiv preprint arXiv:2310.14778

2023/10/23

Yong Xu

H-Index: 18

Xinyuan Qian

H-Index: 4

Davide Berghi

H-Index: 0

Meng Cui

H-Index: 21

Wenwu Wang

H-Index: 29

Deep Cross-Modal Retrieval Between Spatial Image and Acoustic Speech

IEEE Transactions on Multimedia

2023/10/13

Xinyuan Qian

H-Index: 4

Wei Xue

H-Index: 22

Qiquan Zhang

H-Index: 5

Haizhou Li

H-Index: 48

Audio Visual Speaker Localization from EgoCentric Views

arXiv preprint arXiv:2309.16308

2023/9/28

Yong Xu

H-Index: 18

Xinyuan Qian

H-Index: 4

Wenwu Wang

H-Index: 29

L F-TOUCH: A Wireless GelSight with Decoupled Tactile and Three-axis Force Sensing

IEEE Robotics and Automation Letters

2023/7/5

Wanlin Li

H-Index: 4

Meng Wang

H-Index: 9

Jiarui Li

H-Index: 1

Xinyuan Qian

H-Index: 4

Kaspar Althoefer

H-Index: 38

Hangxin Liu

H-Index: 7

Self-Convolution for Automatic Speech Recognition

2023/6/4

Tian-Hao Zhang

H-Index: 9

Qi Liu

H-Index: 28

Xinyuan Qian

H-Index: 4

Feng Chen

H-Index: 15

Xu-Cheng Yin

H-Index: 16

Stream Attention Based U-Net for L3DAS23 Challenge

2023/6/4

Yanjie Fu

H-Index: 24

Junjie Li

H-Index: 4

Meng Ge

H-Index: 5

Longbiao Wang

H-Index: 15

Xinyuan Qian

H-Index: 4

Ripple sparse self-attention for monaural speech enhancement

2023/6/4

Qiquan Zhang

H-Index: 5

Qi Song

H-Index: 2

Xinyuan Qian

H-Index: 4

Haizhou Li

H-Index: 48

A miniaturised camera-based multi-modal tactile sensor

2023/5/29

Kaspar Althoefer

H-Index: 38

Wanlin Li

H-Index: 4

Xinyuan Qian

H-Index: 4

Peng Qi

H-Index: 8

Rethinking Speech Recognition with A Multimodal Perspective via Acoustic and Semantic Cooperative Decoding

arXiv preprint arXiv:2305.14049

2023/5/23

Tian-Hao Zhang

H-Index: 9

Qi Liu

H-Index: 28

Feng Chen

H-Index: 15

Xinyuan Qian

H-Index: 4

Xu-Cheng Yin

H-Index: 16

InterFormer: Interactive Local and Global Features Fusion for Automatic Speech Recognition

Network

2023/5

Tian-Hao Zhang

H-Index: 9

Qi Liu

H-Index: 28

Xinyuan Qian

H-Index: 4

Feng Chen

H-Index: 15

Xu-Cheng Yin

H-Index: 16

Device features based on linear transformation with parallel training data for replay speech detection

IEEE/ACM Transactions on Audio, Speech, and Language Processing

2023/4/17

Longting Xu

H-Index: 5

Jichen Yang

H-Index: 11

Xinyuan Qian

H-Index: 4

Xinyuan Qian

National University of Singapore

About Xinyuan Qian

Xinyuan Qian Information

Xinyuan Qian Skills & Research Interests

Top articles of Xinyuan Qian

Audio-Visual Target Speaker Extraction with Reverse Selective Auditory Attention

Xinyuan Qian

Junjie Li

Haizhou Li

GLMB 3D Speaker Tracking with Video-Assisted Multi-Channel Audio Optimization Functions

Xinyuan Qian

Qiquan Zhang

Visually Guided Binaural Audio Generation with Cross-Modal Consistency

Miao Liu

Jing Wang

Xinyuan Qian

LocSelect: Target Speaker Localization with an Auditory Selective Hearing Mechanism

Yu Chen

Xinyuan Qian

Haizhou Li

Enhancing Real-World Active Speaker Detection with Multi-Modal Extraction Pre-Training

Xinyuan Qian

Rohan Kumar Das

Xiaoxue Gao

Haizhou Li

M3TTS: Multi-modal text-to-speech of multi-scale style control for dubbing

Yan Liu

Xinyuan Qian

Tian-Hao Zhang

Xu-Cheng Yin

Attention-Based End-to-End Differentiable Particle Filter for Audio Speaker Tracking

Wenwu Wang

Adapting Pre-Trained Self-Supervised Learning Model for Speech Recognition with Light-Weight Adapters

Xiaoxue Gao

Xinyuan Qian

Haizhou Li

Audio-Visual Temporal Forgery Detection Using Embedding-Level Fusion and Multi-Dimensional Contrastive Loss

Miao Liu

Jing Wang

Xinyuan Qian

Haizhou Li

Audio-visual speaker tracking: Progress, challenges, and future directions

Yong Xu

Xinyuan Qian

Davide Berghi

Meng Cui

Wenwu Wang

Deep Cross-Modal Retrieval Between Spatial Image and Acoustic Speech

Xinyuan Qian

Wei Xue

Qiquan Zhang

Haizhou Li

Audio Visual Speaker Localization from EgoCentric Views

Yong Xu

Xinyuan Qian

Wenwu Wang

L F-TOUCH: A Wireless GelSight with Decoupled Tactile and Three-axis Force Sensing

Wanlin Li

Meng Wang

Jiarui Li

Xinyuan Qian

Kaspar Althoefer

Hangxin Liu

Self-Convolution for Automatic Speech Recognition

Tian-Hao Zhang

Qi Liu

Xinyuan Qian

Feng Chen

Xu-Cheng Yin

Stream Attention Based U-Net for L3DAS23 Challenge

Yanjie Fu

Junjie Li

Meng Ge

Longbiao Wang

Xinyuan Qian

Ripple sparse self-attention for monaural speech enhancement

Qiquan Zhang

Qi Song

Xinyuan Qian