Paddlevideo: Você pode dar um exemplo de como rotular a atenção de treinamento do projeto de tag de vídeo como multi-tag?

Criado em 1 fev. 2021  ·  10Comentários  ·  Fonte: PaddlePaddle/PaddleVideo

O projeto acabou de falar sobre o uso de lstm de ajuste fino de vários rótulos e não explicou como rotular o vídeo com vários rótulos. Isso também é difícil para os novatos. Você pode dar um exemplo para ilustrar, dê aos acompanhamentos inexperientes um direção de rotulagem, muito obrigado! Obrigado!

good first issue VideoTag

Todos 10 comentários

https://github.com/PaddlePaddle/PaddleVideo/blob/application/VideoTag/FineTune.md#Data Preparação -1 Esta parte do documento ajuda seu problema?

Muito obrigado pela sua resposta! Eu sei que a principal razão para isso é que não sei até que ponto as tags de vídeo precisam ser tags semânticas + tags de entidade ou apenas precisam ser marcadas com tags semânticas. Veja as mais de três mil categorias de belezas com tags semanticamente , bem como tags específicas, como pernas longas. Isso significa que um vídeo de uma jovem dançando é marcado como uma bela mulher dançando com pernas longas? Três rótulos? Da mesma forma, existem marcas semânticas para animais de estimação. Especificamente, existem pandas e algumas marcas muito estranhas, como madeira compensada e vigas. . . Não sei em que se baseia esta definição?

A estratégia geral de construção de rótulos de classificação 3k é: mineração de máquina + revisão manual parcial.
A revisão manual refere-se a algumas estratégias do papel do conjunto de dados do youtube-8m, como considerar se as tags são visualmente separáveis ​​e excluir as tags sem sentido.
A estratégia de mineração específica @ irmão

Essas tags são obtidas com base em consultas populares na linha de negócios, incluindo tags semânticas e tags de entidade. Durante o treinamento, todas as tags são achatadas e não há relação hierárquica.

A estratégia geral de construção de rótulos de classificação 3k é: mineração de máquina + revisão manual parcial.
A revisão manual refere-se a algumas estratégias do papel do conjunto de dados do youtube-8m, como considerar se as tags são visualmente separáveis ​​e excluir as tags sem sentido.
A estratégia de mineração específica @ irmão

O Sr. Xie respondeu que cada vídeo precisa ser marcado com tags semânticas + tags de entidade (ou seja, tags visuais). Existe um requisito de quantidade? Espero que o patrão possa dar uma castanha! Basta dar um vídeo e treinar o rótulo de lstm. Obrigado!

Essas tags são obtidas com base em consultas populares na linha de negócios, incluindo tags semânticas e tags de entidade. Durante o treinamento, todas as tags são achatadas e não há relação hierárquica.

Chefe, é fácil revelar que a máquina de mineração usa uma estratégia mágica? @ @
-

A estratégia geral de construção de rótulos de classificação 3k é: mineração de máquina + revisão manual parcial.
A revisão manual refere-se a algumas estratégias do papel do conjunto de dados do youtube-8m, como considerar se as tags são visualmente separáveis ​​e excluir as tags sem sentido.
A estratégia de mineração específica @ irmão

O Sr. Xie respondeu que cada vídeo precisa ser marcado com tags semânticas + tags de entidade (ou seja, tags visuais). Existe um requisito de quantidade? Espero que o patrão possa dar uma castanha! Basta dar um vídeo e treinar o rótulo de lstm. Obrigado!

Algumas sugestões (em https://research.google.com/youtube8m/ ):
Cada vídeo deve ser público e ter pelo menos 1000 visualizações
Cada vídeo deve ter entre 120 e 500 segundos de duração
Cada vídeo deve estar associado a pelo menos uma entidade de nosso vocabulário alvo
Conteúdo adulto e sensível é removido (conforme determinado por classificadores automatizados)

A estratégia geral de construção de rótulos de classificação 3k é: mineração de máquina + revisão manual parcial.
A revisão manual refere-se a algumas estratégias do papel do conjunto de dados do youtube-8m, como considerar se as tags são visualmente separáveis ​​e excluir as tags sem sentido.
A estratégia de mineração específica @ irmão

O Sr. Xie respondeu que cada vídeo precisa ser marcado com tags semânticas + tags de entidade (ou seja, tags visuais). Existe um requisito de quantidade? Espero que o patrão possa dar uma castanha! Basta dar um vídeo e treinar o rótulo de lstm. Obrigado!

Algumas sugestões (em https://research.google.com/youtube8m/ ):
Cada vídeo deve ser público e ter pelo menos 1000 visualizações
Cada vídeo deve ter entre 120 e 500 segundos de duração
Cada vídeo deve estar associado a pelo menos uma entidade de nosso vocabulário alvo
Conteúdo adulto e sensível é removido (conforme determinado por classificadores automatizados)

A estratégia geral de construção de rótulos de classificação 3k é: mineração de máquina + revisão manual parcial.
A revisão manual refere-se a algumas estratégias do papel do conjunto de dados do youtube-8m, como considerar se as tags são visualmente separáveis ​​e excluir as tags sem sentido.
A estratégia de mineração específica @ irmão

O Sr. Xie respondeu que cada vídeo precisa ser marcado com tags semânticas + tags de entidade (ou seja, tags visuais). Existe um requisito de quantidade? Espero que o patrão possa dar uma castanha! Basta dar um vídeo e treinar o rótulo de lstm. Obrigado!

Algumas sugestões (em https://research.google.com/youtube8m/ ):
Cada vídeo deve ser público e ter pelo menos 1000 visualizações
Cada vídeo deve ter entre 120 e 500 segundos de duração
Cada vídeo deve estar associado a pelo menos uma entidade de nosso vocabulário alvo
Conteúdo adulto e sensível é removido (conforme determinado por classificadores automatizados)

Muito obrigado!

Essas tags são obtidas com base em consultas populares na linha de negócios, incluindo tags semânticas e tags de entidade. Durante o treinamento, todas as tags são achatadas e não há relação hierárquica.

Chefe, é fácil revelar que a máquina de mineração usa uma estratégia mágica? @ @

Embora as estratégias relacionadas aos negócios de nossa empresa não sejam convenientes de divulgar.
No entanto, é recomendado consultar: https://arxiv.org/pdf/1609.08675.pdf

Essas tags são obtidas com base em consultas populares na linha de negócios, incluindo tags semânticas e tags de entidade. Durante o treinamento, todas as tags são achatadas e não há relação hierárquica.

Chefe, é fácil revelar que a máquina de mineração usa uma estratégia mágica? @ @

Embora as estratégias relacionadas aos negócios de nossa empresa não sejam convenientes de divulgar.
No entanto, é recomendado consultar: https://arxiv.org/pdf/1609.08675.pdf

Ok obrigado galera

Esta página foi útil?
0 / 5 - 0 avaliações

Questões relacionadas

gpetukhov picture gpetukhov  ·  3Comentários

kodeshpa picture kodeshpa  ·  3Comentários

ispmarin picture ispmarin  ·  3Comentários

AndreaCrotti picture AndreaCrotti  ·  3Comentários

blite picture blite  ·  3Comentários