Olá.
Quero treinar a máscara rcnn do zero (sem usar o peso pré-treinado)
Espero que o parâmetro de peso comece na inicialização aleatória.
Como posso fazer isso?
O treinamento do zero é possível em termos de codificação e pode ser feito sem muitas modificações neste código. No entanto, pode haver problemas de convergência, por exemplo, causados por não usar BN ou usar BN, mas com um tamanho de minilote pequeno. Nós encorajamos mais pesquisas a serem feitas sobre isso.
Uma advertência a ser adicionada: notamos pouco antes do lançamento que atualmente há um bug que causará uma falha ao tentar treinar do zero (os parâmetros de escala e polarização das operações do AffineChannel não serão inicializados). Temos um patch para isso que, com sorte, será lançado esta semana. Uma vez que isso seja corrigido, deixar TRAIN.WEIGHTS
como a string vazia irá iniciar o treinamento do zero. Como @KaimingHe diz, mais pesquisas precisam ser feitas antes que se espere obter bons resultados.
Como e59c30bb1a6ced1a310b72d563bd9a60aba84999 foi confirmado, agora é possível treinar do zero definindo TRAIN.WEIGHTS
para a string vazia (equiv. Delete do seu arquivo yaml). Mas quero reforçar o ponto de Kaiming de que experimentação significativa será necessária para obter resultados razoáveis de fazê-lo.
Comentários muito úteis
O treinamento do zero é possível em termos de codificação e pode ser feito sem muitas modificações neste código. No entanto, pode haver problemas de convergência, por exemplo, causados por não usar BN ou usar BN, mas com um tamanho de minilote pequeno. Nós encorajamos mais pesquisas a serem feitas sobre isso.