Lightweight-human-pose-estimation.pytorch: Comment améliorer la précision dans ce travail ?

Créé le 29 avr. 2021 · 5Commentaires · Source: Daniil-Osokin/lightweight-human-pose-estimation.pytorch

J'ai utilisé de nombreux autres modèles de réseau pour remplacer le réseau mobile d'origine, tels que ghostnet, Octmobile net, etc. Mais leurs pertes diminuent lentement et restent constantes pendant longtemps. Existe-t-il un moyen d'améliorer la précision?

Source

zhenzhongle

Commentaire le plus utile

Oh, comprends. Vous pouvez toujours ajouter l'attention (par exemple "Squeeze-and-Excitation Networks" ), cela augmentera probablement la précision :smiley:. Une autre façon d'améliorer la précision consiste à augmenter la résolution de sortie du réseau (et à le recycler): maintenant, il sous-échantillonne l'entrée 8 fois, la plupart des autres modèles sous-échantillonnent l'entrée seulement 4 fois. Je crois que la chose cruciale à ajouter est la supervision multi-échelles (par exemple "Multi-Scale Structure-Aware Network for Human Pose Estimation" , "HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation" ). Une autre astuce consiste à voter sur les cartes pour des emplacements de points clés améliorés : chaque pixel de sortie dans une ou plusieurs cartes prédit un déplacement vers le ou les points de repère les plus proches, ou un type de (par exemple "PifPaf : Champs composites pour l'estimation de la pose humaine" , "Distribution-Aware Représentation coordonnée pour l'estimation de la pose humaine » ). Il existe également quelques astuces mineures, telles que les convolutions déformables, l'extraction d'exemples difficiles, etc. Je pense que la dorsale EfficientNet (avec des poids pré-formés) améliorera la précision si vous l'utilisez simplement à la place de MobileNet. Il s'agit d'améliorer la précision. Améliorer la vitesse d'inférence devrait être relativement facile (mais les astuces diffèrent d'un dispositif d'inférence particulier), au moins la distillation ou l'élagage fonctionnera.

Daniil-Osokin le 30 avr. 2021

👍3

Tous les 5 commentaires

Salut! Le problème ici est la précision sur quels objets vous souhaitez améliorer ? Ont-ils une échelle/taille/forme différente ? Comme la chose la plus simple que vous puissiez essayer est d'augmenter la résolution d'entrée du réseau.

Daniil-Osokin le 29 avr. 2021

❤1 😄1 👍1

Merci pour votre réponse.
Mon idée est basée sur votre travail ( checkpoint _ iter _ 370000 atteint la carte = 40 % ). Amélioration du réseau mobile à plus de 40 % ou alléger le modèle, mais j'ai changé plusieurs modèles de pré-formation pendant près de deux ans et j'ai constaté que l'effet n'était pas aussi bon que mobilenet _ sgd _ 68.848.pth。Je souhaite sincèrement que vous puissiez en fournir idée.
Enfin, je vous souhaite une bonne santé, travaillez en douceur !

zhenzhongle le 30 avr. 2021

👍1