Chenjia Bai at Harbin Institute of Technology

University	Harbin Institute of Technology
Position	(Ph.D. student)
Citations(all)	436
Citations(since 2020)	435
Cited By	20
hIndex(all)	10
hIndex(since 2020)	10
i10Index(all)	11
i10Index(since 2020)	11
Email	Access Email
University Profile Page	Harbin Institute of Technology
Google Scholar	View Google Scholar Profile

Diverse Randomized Value Functions: A Provably Pessimistic Approach for Offline Reinforcement Learning

arXiv preprint arXiv:2404.06188

2024/4/9

Xudong Yu

H-Index: 9

Chenjia Bai

H-Index: 2

Hongyi Guo

H-Index: 1

Changhong Wang

H-Index: 6

Zhen Wang

H-Index: 42

Regularized Conditional Diffusion Model for Multi-Task Preference Alignment

arXiv preprint arXiv:2404.04920

2024/4/7

Xudong Yu

H-Index: 9

Chenjia Bai

H-Index: 2

Changhong Wang

H-Index: 6

Large-Scale Actionless Video Pre-Training via Discrete Diffusion for Efficient Policy Learning

arXiv preprint arXiv:2402.14407

2024/2/22

Chenjia Bai

H-Index: 2

Ling Pan

H-Index: 14

Weinan Zhang

H-Index: 35

Bin Zhao

H-Index: 18

Skill Matters: Dynamic Skill Learning for Multi-Agent Cooperative Reinforcement Learning

Available at SSRN 4790564

2024

Tong Li

H-Index: 15

Chenjia Bai

H-Index: 2

Kang Xu

H-Index: 6

Chen Chu

H-Index: 15

Zhen Wang

H-Index: 42

OVD-Explorer: Optimism Should Not Be the Sole Pursuit of Exploration in Noisy Environments

Proceedings of the AAAI Conference on Artificial Intelligence

2024/3/24

Zhi Wang

H-Index: 9

Yan Zheng

H-Index: 3

Chenjia Bai

H-Index: 2

Junjie Ye

H-Index: 1

Zhen Wang

H-Index: 42

Yang Sun

H-Index: 36

Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learning

Artificial Intelligence

2024/1/1

Chenjia Bai

H-Index: 2

Lingxiao Wang

H-Index: 1

Zhuoran Yang

H-Index: 1

Bin Zhao

H-Index: 18

Zhen Wang

H-Index: 42

Robust Quadrupedal Locomotion via Risk-Averse Policy Learning

arXiv preprint arXiv:2308.09405

2023/8/18

Chenjia Bai

H-Index: 2

Lei Han

H-Index: 2

Dong Wang

H-Index: 7

Bin Zhao

H-Index: 18

Xiu Li

H-Index: 17

Provably Efficient Information-Directed Sampling Algorithms for Multi-Agent Reinforcement Learning

arXiv preprint arXiv:2404.19292

2024/4/30

Qiaosheng Zhang

H-Index: 12

Chenjia Bai

H-Index: 2

Shuyue Hu

H-Index: 4

Zhen Wang

H-Index: 42

False Correlation Reduction for Offline Reinforcement Learning

IEEE Transactions on Pattern Analysis and Machine Intelligence

2023/10/30

Zuyue Fu

H-Index: 3

Lingxiao Wang

H-Index: 1

Zhuoran Yang

H-Index: 1

Chenjia Bai

H-Index: 2

Tianyi Zhou

H-Index: 17

Zhaoran Wang

H-Index: 25

Jing Jiang

H-Index: 3

Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and Smoothness

arXiv preprint arXiv:2309.16973

2023/9/29

Xiaoyu Wen

H-Index: 2

Xudong Yu

H-Index: 9

Rui Yang

H-Index: 4

Chenjia Bai

H-Index: 2

Zhen Wang

H-Index: 42

Self-Supervised Imitation for Offline Reinforcement Learning With Hindsight Relabeling

IEEE Transactions on Systems, Man, and Cybernetics: Systems

2023/8/17

Xudong Yu

H-Index: 9

Chenjia Bai

H-Index: 2

Changhong Wang

H-Index: 6

Zhen Wang

H-Index: 42

Privileged Knowledge Distillation for Sim-to-Real Policy Generalization

arXiv preprint arXiv:2305.18464

2023/5/29

Chenjia Bai

H-Index: 2

Lingxiao Wang

H-Index: 1

Weinan Zhang

H-Index: 35

On the Value of Myopic Behavior in Policy Reuse

arXiv preprint arXiv:2305.17623

2023/5/28

Kang Xu

H-Index: 6

Chenjia Bai

H-Index: 2

Shuang Qiu

H-Index: 3

Bin Zhao

H-Index: 18

Zhen Wang

H-Index: 42

Wei Li

H-Index: 8

Exploration in Deep Reinforcement Learning: From Single-Agent to Multi-Agent Domain

IEEE Transactions on Neural Networks and Learning Systems

2023/1/19

Tianpei Yang

H-Index: 5

Chenjia Bai

H-Index: 2

Peng Liu

H-Index: 8

Zhen Wang

H-Index: 42

Diffusion Model is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning

Advances in neural information processing systems

2024/2/13

Chenjia Bai

H-Index: 2

Kang Xu

H-Index: 6

Zhuoran Yang

H-Index: 1

Weinan Zhang

H-Index: 35

Dong Wang

H-Index: 7

Bin Zhao

H-Index: 18

Cross-Domain Policy Adaptation via Value-Guided Data Filtering

Advances in Neural Information Processing Systems

2024/2/13

Kang Xu

H-Index: 6

Chenjia Bai

H-Index: 2

Xiaoteng Ma

H-Index: 3

Dong Wang

H-Index: 7

Bin Zhao

H-Index: 18

Zhen Wang

H-Index: 42

Wei Li

H-Index: 8

Behavior Contrastive Learning for Unsupervised Skill Discovery

International Conference on Machine Learning

2023/5/8

Chenjia Bai

H-Index: 2

Hongyi Guo

H-Index: 1

Siyuan Li

H-Index: 4

Bin Zhao

H-Index: 18

Zhen Wang

H-Index: 42

Peng Liu

H-Index: 8

Monotonic Quantile Network for Worst-Case Offline Reinforcement Learning

IEEE Transactions on Neural Networks and Learning Systems

2022/11/4

Chenjia Bai

H-Index: 2

Ting Xiao

H-Index: 3

Lingxiao Wang

H-Index: 1

Fan Zhou

H-Index: 1

Animesh Garg

H-Index: 21

Bin He

H-Index: 3

Peng Liu

H-Index: 8

Zhaoran Wang

H-Index: 25

Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning

2022

Shuang Qiu

H-Index: 3

Lingxiao Wang

H-Index: 1

Chenjia Bai

H-Index: 2

Zhuoran Yang

H-Index: 1

Zhaoran Wang

H-Index: 25

RORL: Robust Offline Reinforcement Learning via Conservative Smoothing

Advances in Neural Information Processing Systems (NeurIPS) 2022

2022/6/6

Xiaoteng Ma

H-Index: 3

Zhaoran Wang

H-Index: 25

Chongjie Zhang

H-Index: 14

Lei Han

H-Index: 2

Chenjia Bai

Harbin Institute of Technology

About Chenjia Bai

Chenjia Bai Information

Chenjia Bai Skills & Research Interests

Top articles of Chenjia Bai

Diverse Randomized Value Functions: A Provably Pessimistic Approach for Offline Reinforcement Learning

Xudong Yu

Chenjia Bai

Hongyi Guo

Changhong Wang

Zhen Wang

Regularized Conditional Diffusion Model for Multi-Task Preference Alignment

Xudong Yu

Chenjia Bai

Changhong Wang

Large-Scale Actionless Video Pre-Training via Discrete Diffusion for Efficient Policy Learning

Chenjia Bai

Ling Pan

Weinan Zhang

Bin Zhao

Skill Matters: Dynamic Skill Learning for Multi-Agent Cooperative Reinforcement Learning

Tong Li

Chenjia Bai

Kang Xu

Chen Chu

Zhen Wang

OVD-Explorer: Optimism Should Not Be the Sole Pursuit of Exploration in Noisy Environments

Zhi Wang

Yan Zheng

Chenjia Bai

Junjie Ye

Zhen Wang

Yang Sun

Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learning

Chenjia Bai

Lingxiao Wang

Zhuoran Yang

Bin Zhao

Zhen Wang

Robust Quadrupedal Locomotion via Risk-Averse Policy Learning

Chenjia Bai

Lei Han

Dong Wang

Bin Zhao

Xiu Li

Provably Efficient Information-Directed Sampling Algorithms for Multi-Agent Reinforcement Learning

Qiaosheng Zhang

Chenjia Bai

Shuyue Hu

Zhen Wang

False Correlation Reduction for Offline Reinforcement Learning

Zuyue Fu

Lingxiao Wang

Zhuoran Yang

Chenjia Bai

Tianyi Zhou

Zhaoran Wang

Jing Jiang

Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and Smoothness

Xiaoyu Wen

Xudong Yu

Rui Yang

Chenjia Bai

Zhen Wang

Self-Supervised Imitation for Offline Reinforcement Learning With Hindsight Relabeling

Xudong Yu

Chenjia Bai

Changhong Wang

Zhen Wang

Privileged Knowledge Distillation for Sim-to-Real Policy Generalization

Chenjia Bai

Lingxiao Wang

Weinan Zhang

On the Value of Myopic Behavior in Policy Reuse

Kang Xu

Chenjia Bai

Shuang Qiu

Bin Zhao

Zhen Wang