Lightweight-human-pose-estimation.pytorch: Comment améliorer la précision dans ce travail ?

Créé le 29 avr. 2021  ·  5Commentaires  ·  Source: Daniil-Osokin/lightweight-human-pose-estimation.pytorch

J'ai utilisé de nombreux autres modèles de réseau pour remplacer le réseau mobile d'origine, tels que ghostnet, Octmobile net, etc. Mais leurs pertes diminuent lentement et restent constantes pendant longtemps. Existe-t-il un moyen d'améliorer la précision?

Commentaire le plus utile

Oh, comprends. Vous pouvez toujours ajouter l'attention (par exemple "Squeeze-and-Excitation Networks" ), cela augmentera probablement la précision :smiley:. Une autre façon d'améliorer la précision consiste à augmenter la résolution de sortie du réseau (et à le recycler): maintenant, il sous-échantillonne l'entrée 8 fois, la plupart des autres modèles sous-échantillonnent l'entrée seulement 4 fois. Je crois que la chose cruciale à ajouter est la supervision multi-échelles (par exemple "Multi-Scale Structure-Aware Network for Human Pose Estimation" , "HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation" ). Une autre astuce consiste à voter sur les cartes pour des emplacements de points clés améliorés : chaque pixel de sortie dans une ou plusieurs cartes prédit un déplacement vers le ou les points de repère les plus proches, ou un type de (par exemple "PifPaf : Champs composites pour l'estimation de la pose humaine" , "Distribution-Aware Représentation coordonnée pour l'estimation de la pose humaine » ). Il existe également quelques astuces mineures, telles que les convolutions déformables, l'extraction d'exemples difficiles, etc. Je pense que la dorsale EfficientNet (avec des poids pré-formés) améliorera la précision si vous l'utilisez simplement à la place de MobileNet. Il s'agit d'améliorer la précision. Améliorer la vitesse d'inférence devrait être relativement facile (mais les astuces diffèrent d'un dispositif d'inférence particulier), au moins la distillation ou l'élagage fonctionnera.

Tous les 5 commentaires

Salut! Le problème ici est la précision sur quels objets vous souhaitez améliorer ? Ont-ils une échelle/taille/forme différente ? Comme la chose la plus simple que vous puissiez essayer est d'augmenter la résolution d'entrée du réseau.

Merci pour votre réponse.
Mon idée est basée sur votre travail ( checkpoint _ iter _ 370000 atteint la carte = 40 % ). Amélioration du réseau mobile à plus de 40 % ou alléger le modèle, mais j'ai changé plusieurs modèles de pré-formation pendant près de deux ans et j'ai constaté que l'effet n'était pas aussi bon que mobilenet _ sgd _ 68.848.pth。Je souhaite sincèrement que vous puissiez en fournir idée.
Enfin, je vous souhaite une bonne santé, travaillez en douceur !

Oh, comprends. Vous pouvez toujours ajouter l'attention (par exemple "Squeeze-and-Excitation Networks" ), cela augmentera probablement la précision :smiley:. Une autre façon d'améliorer la précision consiste à augmenter la résolution de sortie du réseau (et à le recycler): maintenant, il sous-échantillonne l'entrée 8 fois, la plupart des autres modèles sous-échantillonnent l'entrée seulement 4 fois. Je crois que la chose cruciale à ajouter est la supervision multi-échelles (par exemple "Multi-Scale Structure-Aware Network for Human Pose Estimation" , "HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation" ). Une autre astuce consiste à voter sur les cartes pour des emplacements de points clés améliorés : chaque pixel de sortie dans une ou plusieurs cartes prédit un déplacement vers le ou les points de repère les plus proches, ou un type de (par exemple "PifPaf : Champs composites pour l'estimation de la pose humaine" , "Distribution-Aware Représentation coordonnée pour l'estimation de la pose humaine » ). Il existe également quelques astuces mineures, telles que les convolutions déformables, l'extraction d'exemples difficiles, etc. Je pense que la dorsale EfficientNet (avec des poids pré-formés) améliorera la précision si vous l'utilisez simplement à la place de MobileNet. Il s'agit d'améliorer la précision. Améliorer la vitesse d'inférence devrait être relativement facile (mais les astuces diffèrent d'un dispositif d'inférence particulier), au moins la distillation ou l'élagage fonctionnera.

Merci pour votre proposition, je vais sérieusement réfléchir et essayer, merci beaucoup !
Vous êtes un 'blogueur' responsable et sympathique

Ok, je le ferme.

Cette page vous a été utile?
0 / 5 - 0 notes

Questions connexes

mathblue picture mathblue  ·  12Commentaires

RCpengnan picture RCpengnan  ·  6Commentaires

hxm1150310617 picture hxm1150310617  ·  4Commentaires

jinfagang picture jinfagang  ·  18Commentaires

tangfayuan picture tangfayuan  ·  7Commentaires