Dilip Arumugam at Stanford University

University	Stanford University
Position	Ph.D. Candidate -
Citations(all)	668
Citations(since 2020)	618
Cited By	235
hIndex(all)	12
hIndex(since 2020)	12
i10Index(all)	14
i10Index(since 2020)	13
Email	Access Email
University Profile Page	Stanford University
Google Scholar	View Google Scholar Profile

Bayesian reinforcement learning with limited cognitive load

Open Mind

2024/4/16

Dilip Arumugam

H-Index: 8

Benjamin Van Roy

H-Index: 38

Social Contract AI: Aligning AI Assistants with Implicit Group Norms

2023/10/26

Kanishk Gandhi

H-Index: 1

Dilip Arumugam

H-Index: 8

Jared Moore

H-Index: 6

Alex Tamkin

H-Index: 5

Tobias Gerstenberg

H-Index: 18

Hindsight-DICE: Stable Credit Assignment for Deep Reinforcement Learning

arXiv preprint arXiv:2307.11897

2023/7/21

Akash Velu

H-Index: 0

Dilip Arumugam

H-Index: 8

Shattering the agent-environment interface for fine-tuning inclusive language models

arXiv preprint arXiv:2305.11455

2023/5/19

Shi Dong

H-Index: 6

Dilip Arumugam

H-Index: 8

Benjamin Van Roy

H-Index: 38

Cultural reinforcement learning: a framework for modeling cumulative culture on a limited channel

Proceedings of the Annual Meeting of the Cognitive Science Society

2023

Ben Prystawski

H-Index: 0

Dilip Arumugam

H-Index: 8

Inclusive Artificial Intelligence

arXiv preprint arXiv:2212.12633

2022/12/24

Dilip Arumugam

H-Index: 8

Shi Dong

H-Index: 6

Benjamin Van Roy

H-Index: 38

Planning to the Information Horizon of BAMDPs via Epistemic State Abstraction

Advances in Neural Information Processing Systems

2022/12/6

Dilip Arumugam

H-Index: 8

Satinder Singh

H-Index: 43

Deciding what to model: Value-equivalent sampling for reinforcement learning

Advances in Neural Information Processing Systems

2022/12/6

Dilip Arumugam

H-Index: 8

Benjamin Van Roy

H-Index: 38

On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement Learning

arXiv preprint arXiv:2210.16877

2022/10/30

Dilip Arumugam

H-Index: 8

Benjamin Van Roy

H-Index: 38

Between rate-distortion theory & value equivalence in model-based reinforcement learning

arXiv preprint arXiv:2206.02025

2022/6/4

Dilip Arumugam

H-Index: 8

Benjamin Van Roy

H-Index: 38

In the ZONE: Measuring difficulty and progression in curriculum generation

2022

Rose E Wang

H-Index: 2

Jesse Mu

H-Index: 5

Dilip Arumugam

H-Index: 8

The value of information when deciding what to learn

Advances in Neural Information Processing Systems

2021/12/6

Dilip Arumugam

H-Index: 8

Benjamin Van Roy

H-Index: 38

Bad-policy density: A measure of reinforcement learning hardness

ICML Workshop on Reinforcement Learning Theory

2021/7

David Abel

H-Index: 5

Dilip Arumugam

H-Index: 8

D Ellis Hershkowitz

H-Index: 5

Interpreting human-robot instructions

2021/8/10

Deciding what to learn: A rate-distortion approach

2021/7/1

Dilip Arumugam

H-Index: 8

Benjamin Van Roy

H-Index: 38

Sequence-to-sequence language grounding of non-Markovian task specifications

2021/6/15

An information-theoretic perspective on credit assignment in reinforcement learning

arXiv preprint arXiv:2103.06224

2021/3/10

Dilip Arumugam

H-Index: 8

Peter Henderson

H-Index: 13

Flexible and efficient long-range planning through curious exploration

2020/11/21

Aidan Curtis

H-Index: 3

Dilip Arumugam

H-Index: 8

Kevin Feigelis

H-Index: 2

Daniel Yamins

H-Index: 21

Randomized value functions via posterior state-abstraction sampling

arXiv preprint arXiv:2010.02383

2020/10/5

Dilip Arumugam

H-Index: 8

Benjamin Van Roy

H-Index: 38

Reparameterized variational divergence minimization for stable imitation

arXiv preprint arXiv:2006.10810

2020/6/18

Dilip Arumugam

H-Index: 8

Dilip Arumugam

Stanford University

About Dilip Arumugam

Dilip Arumugam Information

Dilip Arumugam Skills & Research Interests

Top articles of Dilip Arumugam

Bayesian reinforcement learning with limited cognitive load

Dilip Arumugam

Benjamin Van Roy

Social Contract AI: Aligning AI Assistants with Implicit Group Norms

Kanishk Gandhi

Dilip Arumugam

Jared Moore

Alex Tamkin

Tobias Gerstenberg

Hindsight-DICE: Stable Credit Assignment for Deep Reinforcement Learning

Akash Velu

Dilip Arumugam

Shattering the agent-environment interface for fine-tuning inclusive language models

Shi Dong

Dilip Arumugam

Benjamin Van Roy

Cultural reinforcement learning: a framework for modeling cumulative culture on a limited channel

Ben Prystawski

Dilip Arumugam

Inclusive Artificial Intelligence

Dilip Arumugam

Shi Dong

Benjamin Van Roy

Planning to the Information Horizon of BAMDPs via Epistemic State Abstraction

Dilip Arumugam

Satinder Singh

Deciding what to model: Value-equivalent sampling for reinforcement learning

Dilip Arumugam

Benjamin Van Roy

On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement Learning

Dilip Arumugam

Benjamin Van Roy

Between rate-distortion theory & value equivalence in model-based reinforcement learning

Dilip Arumugam

Benjamin Van Roy

In the ZONE: Measuring difficulty and progression in curriculum generation

Rose E Wang

Jesse Mu

Dilip Arumugam

The value of information when deciding what to learn

Dilip Arumugam

Benjamin Van Roy

Bad-policy density: A measure of reinforcement learning hardness

David Abel

Dilip Arumugam

D Ellis Hershkowitz

Interpreting human-robot instructions

Deciding what to learn: A rate-distortion approach

Dilip Arumugam

Benjamin Van Roy

Sequence-to-sequence language grounding of non-Markovian task specifications

An information-theoretic perspective on credit assignment in reinforcement learning

Dilip Arumugam

Peter Henderson

Flexible and efficient long-range planning through curious exploration

Aidan Curtis

Dilip Arumugam

Kevin Feigelis

Daniel Yamins

Randomized value functions via posterior state-abstraction sampling

Dilip Arumugam

Benjamin Van Roy

Reparameterized variational divergence minimization for stable imitation

Dilip Arumugam

Co-Authors

Michael Littman

Satinder Singh

Noah D. Goodman

Doina Precup

Benjamin Van Roy