ash80

Follow

Ash ash80

Follow

Deep Learning Engineer | PhD

38 followers · 12 following

London, United Kingdom

Achievements

Achievements

Pinned Loading

RLHF_in_notebooks RLHF_in_notebooks Public

RLHF (Supervised fine-tuning, reward model, and PPO) step-by-step in 3 Jupyter notebooks

Jupyter Notebook 209 18
diffusion-gpt diffusion-gpt Public

From babyGPT to diffusion GPT: An annotated implementation of a character-level discrete diffusion model (adapted from Karpathy’s baby GPT).

Jupyter Notebook 220 18
backtracking_gpt backtracking_gpt Public

A GPT agent with a Text Interface tool

Python 15 1