Annotated Transformer

This is an annotated paper of the Transformer architecture implemented in numpy to explain the main mechanisms of self-attention and multihead attention to the students of the attention seminar.

TODO:

add JAX/autograd

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
Attention_is_all_you_need_–_WS2021_22.ipynb		Attention_is_all_you_need_–_WS2021_22.ipynb
jax.ipynb		jax.ipynb
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Annotated Transformer

TODO:

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Annotated Transformer

TODO:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages