Notes

Reading notes of papers on a broad range of topics

Whisper: Web-Scale Supervised Pretraining for Speech Recognition

Robust Speech Recognition via Large-Scale Weak Supervision

17 min read · September 21, 2022

2022
Latent Diffusion (Stable Diffusion)

High-Resolution Image Synthesis with Latent Diffusion Models

13 min read · April 13, 2022

2022
InstructGPT

Training language models to follow instructions with human feedback

13 min read · January 27, 2022

2022
CLIP: Contrastive Language-Image Pre-training

Learning Transferable Visual Models From Natural Language Supervision

9 min read · February 26, 2021

2021
DDIM

Denoising Diffusion Implicit Models

13 min read · October 6, 2020

2020
GPT-3

Language Models are Few-Shot Learners

11 min read · July 22, 2020

2020
DDPM

Denoising Diffusion Probabilistic Models

11 min read · June 19, 2020

2020
T5: Text-to-Text Transfer Transformer

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

12 min read · October 23, 2019

2019
GPT-2

Language Models are Unsupervised Multitask Learners

8 min read · February 14, 2019

2019
BERT: Bidirectional Encoder Representations from Transformers

Pre-training of Deep Bidirectional Transformers for Language Understanding

8 min read · October 11, 2018

2018