Concepts6

Groups

Implicit Bias of Gradient Descent

In underdetermined linear systems (more variables than equations), gradient descent started at zero converges to the minimum Euclidean norm solution without any explicit regularizer.

#implicit bias#gradient descent#minimum norm+12

⚙️AlgorithmIntermediate

Gradient Clipping & Normalization

Gradient clipping limits how large gradient values or their overall magnitude can become during optimization to prevent exploding updates.

#gradient clipping

Concepts6

Implicit Bias of Gradient Descent

Gradient Clipping & Normalization

Adam & Adaptive Methods

Momentum Methods

Gradient Descent

Gradient Descent Convergence Theory