Detectron: Como posso treinar modelo do zero

Criado em 27 jan. 2018  ·  3Comentários  ·  Fonte: facebookresearch/Detectron

Olá.

Quero treinar a máscara rcnn do zero (sem usar o peso pré-treinado)

Espero que o parâmetro de peso comece na inicialização aleatória.

Como posso fazer isso?

bug

Comentários muito úteis

O treinamento do zero é possível em termos de codificação e pode ser feito sem muitas modificações neste código. No entanto, pode haver problemas de convergência, por exemplo, causados ​​por não usar BN ou usar BN, mas com um tamanho de minilote pequeno. Nós encorajamos mais pesquisas a serem feitas sobre isso.

Todos 3 comentários

O treinamento do zero é possível em termos de codificação e pode ser feito sem muitas modificações neste código. No entanto, pode haver problemas de convergência, por exemplo, causados ​​por não usar BN ou usar BN, mas com um tamanho de minilote pequeno. Nós encorajamos mais pesquisas a serem feitas sobre isso.

Uma advertência a ser adicionada: notamos pouco antes do lançamento que atualmente há um bug que causará uma falha ao tentar treinar do zero (os parâmetros de escala e polarização das operações do AffineChannel não serão inicializados). Temos um patch para isso que, com sorte, será lançado esta semana. Uma vez que isso seja corrigido, deixar TRAIN.WEIGHTS como a string vazia irá iniciar o treinamento do zero. Como @KaimingHe diz, mais pesquisas precisam ser feitas antes que se espere obter bons resultados.

Como e59c30bb1a6ced1a310b72d563bd9a60aba84999 foi confirmado, agora é possível treinar do zero definindo TRAIN.WEIGHTS para a string vazia (equiv. Delete do seu arquivo yaml). Mas quero reforçar o ponto de Kaiming de que experimentação significativa será necessária para obter resultados razoáveis ​​de fazê-lo.

Esta página foi útil?
0 / 5 - 0 avaliações