Shivaram Venkataraman at University of Wisconsin-Madison

University	University of Wisconsin-Madison
Position	___
Citations(all)	11983
Citations(since 2020)	8484
Cited By	6781
hIndex(all)	39
hIndex(since 2020)	34
i10Index(all)	68
i10Index(since 2020)	56
Email	Access Email
University Profile Page	University of Wisconsin-Madison
Google Scholar	View Google Scholar Profile

Mitigating communication bottlenecks during parameter exchange in data-parallel DNN training

2024/1/9

Blox: A Modular Toolkit for Deep Learning Schedulers

2024/4/22

Saurabh Agarwal

H-Index: 15

Shivaram Venkataraman

H-Index: 25

CHAI: Clustered Head Attention for Efficient LLM Inference

arXiv preprint arXiv:2403.08058

2024/3/12

Saurabh Agarwal

H-Index: 15

Bilge Acun

H-Index: 8

Yejin Lee

H-Index: 2

Shivaram Venkataraman

H-Index: 25

Decoding Speculative Decoding

arXiv preprint arXiv:2402.01528

2024/2/2

Saurabh Agarwal

H-Index: 15

Shivaram Venkataraman

H-Index: 25

Mirage: Towards Low-interruption Services on Batch GPU Clusters with Reinforcement Learning

2023/11/12

Shivaram Venkataraman

H-Index: 25

Zhao Zhang

H-Index: 15

PolyThrottle: Energy-efficient Neural Network Inference on Edge Devices

arXiv preprint arXiv:2310.19991

2023/10/30

Hongyi Wang

H-Index: 8

Shivaram Venkataraman

H-Index: 25

Bagpipe: Accelerating deep recommendation model training

2023/10/23

Saurabh Agarwal

H-Index: 15

Ziyi Zhang

H-Index: 0

Shivaram Venkataraman

H-Index: 25

Mariusgnn: Resource-efficient out-of-core training of graph neural networks

2023/5/8

Jason Mohoney

H-Index: 0

Theodoros Rekatsinas

H-Index: 13

Shivaram Venkataraman

H-Index: 25

F2: Designing a Key-Value Store for Large Skewed Workloads

arXiv preprint arXiv:2305.01516

2023/5/2

Konstantinos Kanellis

H-Index: 1

Shivaram Venkataraman

H-Index: 25

Estimating Battery State-of-Charge using Machine Learning and Physics-Based Models

2023/4/11

Sahana Upadhya

H-Index: 1

Michael Wagner

H-Index: 18

Shivaram Venkataraman

H-Index: 25

Sage Kokjohn

H-Index: 28

Does compressing activations help model parallel training?

arXiv preprint arXiv:2301.02654

2023/1/6

Hongyi Wang

H-Index: 8

Shivaram Venkataraman

H-Index: 25

Shockwave: Fair and efficient cluster scheduling for dynamic adaptation in machine learning

2023

Rui Pan

H-Index: 4

Shivaram Venkataraman

H-Index: 25

Aditya Akella

H-Index: 43

Not all gpus are created equal: characterizing variability in large-scale, accelerator-rich systems

2022/11/13

Akhil Guliani

H-Index: 3

Brandon Tran

H-Index: 11

Shivaram Venkataraman

H-Index: 25

On the utility of gradient compression in distributed training systems

Proceedings of Machine Learning and Systems

2022/4/22

Saurabh Agarwal

H-Index: 15

Hongyi Wang

H-Index: 8

Shivaram Venkataraman

H-Index: 25

The Roaming Edge and its Applications

GetMobile: Mobile Computing and Communications

2022/3/30

Suman Banerjee

H-Index: 15

Remzi Arpaci-Dusseau

H-Index: 38

Kassem Fawaz

H-Index: 16

Mohit Gupta

H-Index: 4

Kangwook Lee

H-Index: 14

Shivaram Venkataraman

H-Index: 25

LlamaTune: Sample-efficient DBMS configuration tuning

arXiv preprint arXiv:2203.05128

2022/3/10

Konstantinos Kanellis

H-Index: 1

Cong Ding

H-Index: 1

Brian Kroth

H-Index: 3

Andreas Müller

H-Index: 4

Shivaram Venkataraman

H-Index: 25

Marius++: Large-scale training of graph neural networks on a single machine

arXiv preprint arXiv:2202.02365

2022/2/4

Jason Mohoney

H-Index: 0

Theodoros Rekatsinas

H-Index: 13

Shivaram Venkataraman

H-Index: 25

Doing more by doing less: how structured partial backpropagation improves deep learning clusters

2021/12/7

Adarsh Kumar

H-Index: 2

Shivaram Venkataraman

H-Index: 25

Aditya Akella

H-Index: 43

Kaisa: an adaptive second-order optimizer framework for deep neural networks

2021/11/14

Qi Huang

H-Index: 5

Lei Huang

H-Index: 4

Shivaram Venkataraman

H-Index: 25

Kyle Chard

H-Index: 25

Zhao Zhang

H-Index: 15

Atoll: A scalable low-latency serverless platform

2021/11/1

Arjun Singhvi

H-Index: 6

Mohammed Danish Shaikh

H-Index: 1

Shivaram Venkataraman

H-Index: 25

Aditya Akella

H-Index: 43

Shivaram Venkataraman

University of Wisconsin-Madison

About Shivaram Venkataraman

Shivaram Venkataraman Information

Shivaram Venkataraman Skills & Research Interests

Top articles of Shivaram Venkataraman

Mitigating communication bottlenecks during parameter exchange in data-parallel DNN training

Blox: A Modular Toolkit for Deep Learning Schedulers

Saurabh Agarwal

Shivaram Venkataraman

CHAI: Clustered Head Attention for Efficient LLM Inference

Saurabh Agarwal

Bilge Acun

Yejin Lee

Shivaram Venkataraman

Decoding Speculative Decoding

Saurabh Agarwal

Shivaram Venkataraman

Mirage: Towards Low-interruption Services on Batch GPU Clusters with Reinforcement Learning

Shivaram Venkataraman

Zhao Zhang

PolyThrottle: Energy-efficient Neural Network Inference on Edge Devices

Hongyi Wang

Shivaram Venkataraman

Bagpipe: Accelerating deep recommendation model training

Saurabh Agarwal

Ziyi Zhang

Shivaram Venkataraman

Mariusgnn: Resource-efficient out-of-core training of graph neural networks

Jason Mohoney

Theodoros Rekatsinas

Shivaram Venkataraman

F2: Designing a Key-Value Store for Large Skewed Workloads

Konstantinos Kanellis

Shivaram Venkataraman

Estimating Battery State-of-Charge using Machine Learning and Physics-Based Models

Sahana Upadhya

Michael Wagner

Shivaram Venkataraman

Sage Kokjohn

Does compressing activations help model parallel training?

Hongyi Wang

Shivaram Venkataraman

Shockwave: Fair and efficient cluster scheduling for dynamic adaptation in machine learning

Rui Pan

Shivaram Venkataraman

Aditya Akella

Not all gpus are created equal: characterizing variability in large-scale, accelerator-rich systems

Akhil Guliani

Brandon Tran

Shivaram Venkataraman

On the utility of gradient compression in distributed training systems

Saurabh Agarwal

Hongyi Wang

Shivaram Venkataraman

The Roaming Edge and its Applications

Suman Banerjee

Remzi Arpaci-Dusseau

Kassem Fawaz

Mohit Gupta

Kangwook Lee

Shivaram Venkataraman

LlamaTune: Sample-efficient DBMS configuration tuning

Konstantinos Kanellis

Cong Ding

Brian Kroth

Andreas Müller

Shivaram Venkataraman

Marius++: Large-scale training of graph neural networks on a single machine

Jason Mohoney

Theodoros Rekatsinas

Shivaram Venkataraman

Doing more by doing less: how structured partial backpropagation improves deep learning clusters

Adarsh Kumar

Shivaram Venkataraman

Aditya Akella

Kaisa: an adaptive second-order optimizer framework for deep neural networks

Qi Huang

Lei Huang

Shivaram Venkataraman