1D Stochastic Gradient Descent

Target function

Target slope (m) Target intercept (b)

Dataset

Num samples (N) x min x max Random seed

N=100

Training

Fit bias? (ŷ = weight·x + bias)

Learning rate (η) Iterations Init w Init b Random seed

iters=200

i=200

SGD update rule

Data + Lines (scrub iterations)

Slope w over time

Bias b over time