Paddlevideo: 能举个例子说明video tag项目训练attention lstm多标签怎么标注吗？

Created on 1 Feb 2021 · 10Comments · Source: PaddlePaddle/PaddleVideo

项目中只是说了使用多标签微调lstm 没有说明具体该怎么给视频标注多标签标注几个这个对于新手也比较难，能举个例子说明一下嘛，给没有经验的小菜一个标注的方向，万分感谢！谢谢！

good first issue VideoTag

Source

wangxinzhe0617

All 10 comments

https://github.com/PaddlePaddle/PaddleVideo/blob/application/VideoTag/FineTune.md#数据准备-1 这部分文档对你的问题是否有帮助呢

huangjun12 on 1 Feb 2021

https://github.com/PaddlePaddle/PaddleVideo/blob/application/VideoTag/FineTune.md#数据准备-1 这部分文档对你的问题是否有帮助呢

非常感谢您的回答！这个我知道主要是不知道视频标签具体到哪种程度需要是语义标签+实体标签还是说只需要标语义标签就行看三千多分类里有语义标签美女，还有特别具体的标签比如大长腿是不是说有个小姐姐跳舞的视频就标为美女跳舞大长腿？三个标签？类似的还有语义标签宠物具体的有熊猫还有一些很奇怪的标签比如胶合板，横梁。。。不知道这是根据什么定义的？

wangxinzhe0617 on 1 Feb 2021

3k分类标签的整体构建策略是：机器挖掘+部分人工review。
人工review时参考了youtube-8m数据集论文的部分策略，比如考虑了标签是否视觉可分，进行无意义标签删除。
具体的挖掘策略 @huangjun12 大佬补充。

chajchaj on 1 Feb 2021

👍1

这些标签是根据业务线上热门query得到的，包括语义标签和实体标签，训练的时候所有标签都打平了，没有层级关系

huangjun12 on 1 Feb 2021

👍1

3k分类标签的整体构建策略是：机器挖掘+部分人工review。
人工review时参考了youtube-8m数据集论文的部分策略，比如考虑了标签是否视觉可分，进行无意义标签删除。
具体的挖掘策略 @huangjun12 大佬补充。

谢大佬回答那就是每个视频需要打上语义标签+实体标签（也就是可视化的标签）？有数量要求么？希望大佬能给个栗子！就是给出一个视频然后训练lstm的标签这样谢谢！

wangxinzhe0617 on 1 Feb 2021

这些标签是根据业务线上热门query得到的，包括语义标签和实体标签，训练的时候所有标签都打平了，没有层级关系

大佬，机器挖掘具体用的是神马策略方便透漏吗？ @ @
--

wangxinzhe0617 on 1 Feb 2021

3k分类标签的整体构建策略是：机器挖掘+部分人工review。
人工review时参考了youtube-8m数据集论文的部分策略，比如考虑了标签是否视觉可分，进行无意义标签删除。
具体的挖掘策略 @huangjun12 大佬补充。

谢大佬回答那就是每个视频需要打上语义标签+实体标签（也就是可视化的标签）？有数量要求么？希望大佬能给个栗子！就是给出一个视频然后训练lstm的标签这样谢谢！

几点建议（from https://research.google.com/youtube8m/）：
Each video must be public and have at least 1000 views
Each video must be between 120 and 500 seconds long
Each video must be associated with at least one entity from our target vocabulary
Adult & sensitive content is removed (as determined by automated classifiers)

chajchaj on 1 Feb 2021

🎉1

3k分类标签的整体构建策略是：机器挖掘+部分人工review。
人工review时参考了youtube-8m数据集论文的部分策略，比如考虑了标签是否视觉可分，进行无意义标签删除。
具体的挖掘策略 @huangjun12 大佬补充。

谢大佬回答那就是每个视频需要打上语义标签+实体标签（也就是可视化的标签）？有数量要求么？希望大佬能给个栗子！就是给出一个视频然后训练lstm的标签这样谢谢！

几点建议（from https://research.google.com/youtube8m/）：
Each video must be public and have at least 1000 views
Each video must be between 120 and 500 seconds long
Each video must be associated with at least one entity from our target vocabulary
Adult & sensitive content is removed (as determined by automated classifiers)

非常感谢！

wangxinzhe0617 on 1 Feb 2021

这些标签是根据业务线上热门query得到的，包括语义标签和实体标签，训练的时候所有标签都打平了，没有层级关系

大佬，机器挖掘具体用的是神马策略方便透漏吗？ @ @

虽然，我们公司业务相关的策略不方便透露。
但是，建议参考：https://arxiv.org/pdf/1609.08675.pdf

chajchaj on 1 Feb 2021

👍1

这些标签是根据业务线上热门query得到的，包括语义标签和实体标签，训练的时候所有标签都打平了，没有层级关系

大佬，机器挖掘具体用的是神马策略方便透漏吗？ @ @

虽然，我们公司业务相关的策略不方便透露。
但是，建议参考：https://arxiv.org/pdf/1609.08675.pdf

好的谢谢大佬

wangxinzhe0617 on 1 Feb 2021

Was this page helpful?

0 / 5 - 0 ratings

Related issues

Playbooks on only one host instead of what is in the playbook

RaymiiOrg · 3Comments

Cannot override blocks in included templates

dwt · 3Comments

Unable to create issue using oAuth token

kodeshpa · 3Comments

Ability to post arrays of anonymous JSON objects

chuma · 3Comments

Add a silent or quiet mode for gsutil

jterrace · 3Comments

Paddlevideo: 能举个例子说明video tag项目训练attention lstm多标签怎么标注吗？

All 10 comments

大佬，机器挖掘具体用的是神马策略 方便透漏吗？ @ @

大佬，机器挖掘具体用的是神马策略 方便透漏吗？ @ @

Related issues

大佬，机器挖掘具体用的是神马策略方便透漏吗？ @ @

大佬，机器挖掘具体用的是神马策略方便透漏吗？ @ @