Concepts4

Groups

Stochastic Variational Inference

Stochastic Variational Inference (SVI) scales variational inference to large datasets by taking noisy but unbiased gradient steps using minibatches.

#stochastic variational inference#elbo#variational inference+12

⚙️AlgorithmIntermediate

PPO & Trust Region Methods

Proximal Policy Optimization (PPO) stabilizes policy gradient learning by preventing each update from moving the policy too far from the previous one.

#ppo

Concepts4

Stochastic Variational Inference

PPO & Trust Region Methods

Natural Gradient Method

Policy Gradient Theorem