Detectron: ¿Cómo puedo entrenar un modelo desde cero?

Creado en 27 ene. 2018  ·  3Comentarios  ·  Fuente: facebookresearch/Detectron

Hola.

Quiero entrenar máscara rcnn desde cero (sin usar el peso pre-entrenado)

Espero que el parámetro de peso comience a partir de una inicialización aleatoria.

¿Cómo puedo hacer esto?

bug

Comentario más útil

El entrenamiento desde cero es posible en términos de codificación y se puede realizar sin mucha modificación en este código. Sin embargo, puede haber problemas de convergencia, por ejemplo, causados ​​por no usar BN, o por usar BN pero con un tamaño de mini-lote pequeño. Alentamos a que se realicen más investigaciones al respecto.

Todos 3 comentarios

El entrenamiento desde cero es posible en términos de codificación y se puede realizar sin mucha modificación en este código. Sin embargo, puede haber problemas de convergencia, por ejemplo, causados ​​por no usar BN, o por usar BN pero con un tamaño de mini-lote pequeño. Alentamos a que se realicen más investigaciones al respecto.

Una advertencia para agregar: notamos justo antes del lanzamiento que actualmente hay un error que causará un bloqueo al intentar entrenar desde cero (los parámetros de escala y sesgo de las operaciones de AffineChannel no se inicializarán). Tenemos un parche para esto que esperamos se implemente esta semana. Una vez que se solucione, dejar TRAIN.WEIGHTS como cadena vacía activará el entrenamiento desde cero. Como dice @KaimingHe , es necesario realizar más investigaciones antes de esperar obtener buenos resultados.

Dado que se confirmó e59c30bb1a6ced1a310b72d563bd9a60aba84999, ahora es posible entrenar desde cero configurando TRAIN.WEIGHTS en la cadena vacía (equiv. Eliminar de su archivo yaml). Pero quiero reforzar el punto de Kaiming de que se necesitará una experimentación significativa para obtener resultados razonables al hacerlo.

¿Fue útil esta página
0 / 5 - 0 calificaciones