рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рд╣рдо рдпрд╣рд╛рдВ рдПрд╕рдЬреАрдбреА рд╕реЗ рднреАрдЧрдиреЗ рд╡рд╛рд▓реЗ рдкреИрд░рд╛рдореАрдЯрд░ рдХреЛ рд╣рдЯрд╛ рд╕рдХрддреЗ рд╣реИрдВ https://github.com/pytorch/pytorch/blob/master/torch/optim/sgd.py#L10 , рдпрд╣ рднреНрд░рдорд┐рдд рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ рд╣реИ рдФрд░ рдпрджрд┐ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рддреЛ рдЧрддрд┐ рдХреЛ рдмрджрд▓ рджреЗрддрд╛ рд╣реИ
рд╢рд╛рдпрдж рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдорд╛рди рдХреЛ momentum
рдХреЗ рдмрдЬрд╛рдп 0 рдкрд░ рд╕реЗрдЯ рдХрд░реЗрдВ?
0 рдкрд░ рдбрд┐рдлреЙрд▓реНрдЯ рдХрд┐рдпрд╛ рдЧрдпрд╛ред
https://github.com/pytorch/pytorch/commit/4eb12a26bc5e3671c03f154f61076fd72fcfd233 рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рддрдп
рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░реВрдк рд╕реЗ рднреАрдЧрдиреЗ рдХреЗ рдЗрд╕ рдкрд░рд┐рд╡рд░реНрддрди рдиреЗ рдореБрдЭреЗ рдЕрднреА рдорд╛рд░рд╛ рд╣реИ :) рдпрд╣ рдкрддрд╛ рд▓рдЧрд╛рдиреЗ рдореЗрдВ рдХреБрдЫ рджрд┐рди рдмрд┐рддрд╛рдП рдХрд┐ рдкреЛрд░реНрдЯ рдХрд┐рдП рдЧрдП рдиреЗрдЯ рдиреЗ рд╕рд╣реА рд╕рдЯреАрдХрддрд╛ рдХреЗ рд╕реНрддрд░ рддрдХ рдкрд╣реБрдВрдЪрдирд╛ рдХреНрдпреЛрдВ рдмрдВрдж рдХрд░ рджрд┐рдпрд╛ред рдЯрд┐рдк рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж @szagoruyko ред
рдкрд╣рд▓реЗ, рдЧрддрд┐ = 0.9 (рдФрд░ 1 - dampening = 0.1
) рдХреЗ рд╕рд╛рде, рдкреБрд░рд╛рдирд╛ рдЧреНрд░реЗрдбрд┐рдПрдВрдЯ рд╡рд░реНрддрдорд╛рди рдХреА рддреБрд▓рдирд╛ рдореЗрдВ 9x рдЕрдзрд┐рдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдерд╛ред рдЕрдм рдпрд╣ рдХреЗрд╡рд▓ 10% рдХрдо рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ ( 1 - dampening = 1
)ред
рд╕рдВрднрд╡рддрдГ рдпрд╣ рдзреНрдпрд╛рди рджреЗрдиреЗ рдпреЛрдЧреНрдп рд╣реИ
http://pytorch.org/docs/optim.html рдпрд╛ http://pytorch.org/tutorials/beginner/former_torchies_tutorial.html рдореЗрдВ, рдЪреВрдВрдХрд┐ рднреЛрд▓реЗ рдЕрдкреЗрдХреНрд╖рд╛рдУрдВ рдХреЗ рдмрд╛рд╡рдЬреВрдж, рд▓реБрдЖ рдЯреЙрд░реНрдЪ рдХреЛрдб рдХреЛ рдкреЛрд░реНрдЯ рдХрд░рддреЗ рд╕рдордп рдЕрдм тАЛтАЛрд╕реАрдЦрдиреЗ рдХреА рджрд░реЛрдВ рдХреЛ рд╕рдорд╛рдпреЛрдЬрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред
рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА
рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░реВрдк рд╕реЗ рднреАрдЧрдиреЗ рдХреЗ рдЗрд╕ рдкрд░рд┐рд╡рд░реНрддрди рдиреЗ рдореБрдЭреЗ рдЕрднреА рдорд╛рд░рд╛ рд╣реИ :) рдпрд╣ рдкрддрд╛ рд▓рдЧрд╛рдиреЗ рдореЗрдВ рдХреБрдЫ рджрд┐рди рдмрд┐рддрд╛рдП рдХрд┐ рдкреЛрд░реНрдЯ рдХрд┐рдП рдЧрдП рдиреЗрдЯ рдиреЗ рд╕рд╣реА рд╕рдЯреАрдХрддрд╛ рдХреЗ рд╕реНрддрд░ рддрдХ рдкрд╣реБрдВрдЪрдирд╛ рдХреНрдпреЛрдВ рдмрдВрдж рдХрд░ рджрд┐рдпрд╛ред рдЯрд┐рдк рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж @szagoruyko ред
рдкрд╣рд▓реЗ, рдЧрддрд┐ = 0.9 (рдФрд░
1 - dampening = 0.1
) рдХреЗ рд╕рд╛рде, рдкреБрд░рд╛рдирд╛ рдЧреНрд░реЗрдбрд┐рдПрдВрдЯ рд╡рд░реНрддрдорд╛рди рдХреА рддреБрд▓рдирд╛ рдореЗрдВ 9x рдЕрдзрд┐рдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдерд╛ред рдЕрдм рдпрд╣ рдХреЗрд╡рд▓ 10% рдХрдо рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ (1 - dampening = 1
)редрд╕рдВрднрд╡рддрдГ рдпрд╣ рдзреНрдпрд╛рди рджреЗрдиреЗ рдпреЛрдЧреНрдп рд╣реИ
http://pytorch.org/docs/optim.html рдпрд╛ http://pytorch.org/tutorials/beginner/former_torchies_tutorial.html рдореЗрдВ, рдЪреВрдВрдХрд┐ рднреЛрд▓реЗ рдЕрдкреЗрдХреНрд╖рд╛рдУрдВ рдХреЗ рдмрд╛рд╡рдЬреВрдж, рд▓реБрдЖ рдЯреЙрд░реНрдЪ рдХреЛрдб рдХреЛ рдкреЛрд░реНрдЯ рдХрд░рддреЗ рд╕рдордп рдЕрдм тАЛтАЛрд╕реАрдЦрдиреЗ рдХреА рджрд░реЛрдВ рдХреЛ рд╕рдорд╛рдпреЛрдЬрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред