@tgandor7 лет назад
(последнее обновление7 лет назад)
Very readable, explaining both why and how BN works.
Great build-up from the basics (activations, vanishing gradient, Internal Covariate Shift).
It's no wonder, that Keras documentation links to it.
Ссылки
Закладки
Рецензия удаляется
Пожалуйста, войдите в систему, чтобы принять участие в дискуссии (добавить собственные рецензию, или комментарий)
Цитировать эту публикацию
%0 Journal Article
%1 DBLP:journals/corr/IoffeS15
%A Ioffe, Sergey
%A Szegedy, Christian
%D 2015
%J CoRR
%K
%T Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift.
%U http://arxiv.org/abs/1502.03167
%V abs/1502.03167