Pytorch: Eliminar la amortiguación de SGD

Creado en 31 ago. 2016 · 3Comentarios · Fuente: pytorch/pytorch

Creo que podríamos eliminar el parámetro de amortiguación de SGD aquí https://github.com/pytorch/pytorch/blob/master/torch/optim/sgd.py#L10 , es confuso y cambia el impulso si se usa

Fuente

szagoruyko

Comentario más útil

Este cambio en la amortiguación predeterminada me acaba de llegar :) Pasé unos días averiguando por qué la red portada dejó de alcanzar los niveles de precisión correctos. Gracias @szagoruyko por el consejo.

Anteriormente, con impulso = 0,9 (y 1 - dampening = 0.1 ), el gradiente anterior era 9 veces más importante que el actual. Ahora es solo un 10% menos importante ( 1 - dampening = 1 ).

Posiblemente esto valga la pena mencionarlo en
http://pytorch.org/docs/optim.html o en http://pytorch.org/tutorials/beginner/former_torchies_tutorial.html , ya que ahora es necesario ajustar las tasas de aprendizaje al portar el código lua Torch, a pesar de las expectativas ingenuas.

vadimkantorov en 2 abr. 2017

👍3

Todos 3 comentarios

tal vez establecer el valor predeterminado en 0 en lugar de momentum ?

fmassa en 9 sept. 2016

Por defecto es 0.
arreglado a través de https://github.com/pytorch/pytorch/commit/4eb12a26bc5e3671c03f154f61076fd72fcfd233

soumith en 10 sept. 2016

Anteriormente, con impulso = 0,9 (y 1 - dampening = 0.1 ), el gradiente anterior era 9 veces más importante que el actual. Ahora es solo un 10% menos importante ( 1 - dampening = 1 ).

vadimkantorov en 2 abr. 2017

👍3

¿Fue útil esta página

0 / 5 - 0 calificaciones

Temas relacionados

Error al hacer CUDA Conv2d con kernel 1x1.

NgPDat · 3Comentarios

Solicitud de función: load_state_dict debe tomar nombres de archivo

soumith · 3Comentarios

Ruido de gumbel

eliabruni · 3Comentarios

agregar instrucciones para instalar versiones anteriores

soumith · 3Comentarios

dar una entrada 3d a Conv2d da un mensaje de error incorrecto

soumith · 3Comentarios