Article,

On Layer Normalization in the Transformer Architecture.

, , , , , , , , , and .
CoRR, (2020)

Meta data

Tags

Users

  • @jonaskaiser
  • @dblp
  • @arthi706

Comments and Reviewsshow / hide

  • @jonaskaiser
    4 years ago (last updated 4 years ago)
    In der Ausarbeitung genutzt, um die ADD & NORM Schicht des Transformers zu erläutern. Untersucht die Bedeutung der Layer Normalization im Kontext des Transformers.
Please log in to take part in the discussion (add own reviews or comments).