Paddlevideo: Können Sie ein Beispiel dafür geben, wie das Video-Tag-Projekt Training Aufmerksamkeit Lstm Multi-Tag gekennzeichnet wird?

Erstellt am 1. Feb. 2021  ·  10Kommentare  ·  Quelle: PaddlePaddle/PaddleVideo

Das Projekt hat nur über die Verwendung von Multi-Label-Fine-Tuning-Lstm gesprochen und nicht erklärt, wie das Video mit mehreren Labels gekennzeichnet wird. Dies ist auch für Anfänger schwierig. Können Sie ein Beispiel zur Veranschaulichung geben, geben Sie die unerfahrenen Beilagen a Richtung für die Beschriftung, vielen Dank! Danke!

good first issue VideoTag

Alle 10 Kommentare

https://github.com/PaddlePaddle/PaddleVideo/blob/application/VideoTag/FineTune.md#Datenvorbereitung -1 Hilft dieser Teil des Dokuments bei Ihrem Problem?

Ich danke Ihnen sehr für Ihre Antwort! Ich weiß, der Hauptgrund dafür ist, dass ich nicht weiß, inwieweit die Video-Tags semantische Tags + Entity-Tags sein müssen oder einfach nur mit semantischen Tags markiert werden müssen.Schauen Sie sich die mehr als dreitausend Kategorien von semantisch markierten Schönheiten an , sowie spezifische Tags wie lange Beine. Bedeutet das, dass ein Video einer tanzenden jungen Dame als schöne Frau mit langen Beinen gekennzeichnet ist? Drei Etiketten? Ebenso gibt es semantische Tags für Haustiere, insbesondere Pandas und einige sehr seltsame Tags wie Sperrholz und Balken. . . Ich weiß nicht, worauf diese Definition basiert?

Die allgemeine Konstruktionsstrategie von 3k-Klassifizierungsetiketten lautet: Machine Mining + teilweise manuelle Überprüfung.
Die manuelle Überprüfung bezieht sich auf einige Strategien des youtube-8m-Datensatzpapiers, z. B. die Prüfung, ob die Tags visuell trennbar sind, und das Löschen bedeutungsloser Tags.
Die spezifische Mining-Strategie @huangjun12big Brother hinzugefügt.

Diese Tags werden basierend auf beliebten Abfragen in der Geschäftslinie erhalten, einschließlich semantischer Tags und Entitäts-Tags.Während des Trainings werden alle Tags abgeflacht und es gibt keine hierarchische Beziehung.

Die allgemeine Konstruktionsstrategie von 3k-Klassifizierungsetiketten lautet: Machine Mining + teilweise manuelle Überprüfung.
Die manuelle Überprüfung bezieht sich auf einige Strategien des youtube-8m-Datensatzpapiers, z. B. die Prüfung, ob die Tags visuell trennbar sind, und das Löschen bedeutungsloser Tags.
Die spezifische Mining-Strategie @huangjun12big Brother hinzugefügt.

Herr Xie antwortete, dass jedes Video mit semantischen Tags + Entity-Tags (d. h. visuellen Tags) gekennzeichnet werden muss? Gibt es eine Mengenvorgabe? Hoffe, der Chef kann eine Kastanie geben! Gib einfach ein Video und trainiere das Label von lstm. Danke!

Diese Tags werden basierend auf beliebten Abfragen in der Geschäftslinie erhalten, einschließlich semantischer Tags und Entitäts-Tags.Während des Trainings werden alle Tags abgeflacht und es gibt keine hierarchische Beziehung.

Boss, ist es leicht zu enthüllen, dass das maschinelle Mining eine magische Strategie verwendet? @ @
-

Die allgemeine Konstruktionsstrategie von 3k-Klassifizierungsetiketten lautet: Machine Mining + teilweise manuelle Überprüfung.
Die manuelle Überprüfung bezieht sich auf einige Strategien des youtube-8m-Datensatzpapiers, z. B. die Prüfung, ob die Tags visuell trennbar sind, und das Löschen bedeutungsloser Tags.
Die spezifische Mining-Strategie @huangjun12big Brother hinzugefügt.

Herr Xie antwortete, dass jedes Video mit semantischen Tags + Entity-Tags (d. h. visuellen Tags) gekennzeichnet werden muss? Gibt es eine Mengenvorgabe? Hoffe, der Chef kann eine Kastanie geben! Gib einfach ein Video und trainiere das Label von lstm. Danke!

Einige Vorschläge (von https://research.google.com/youtube8m/ ):
Jedes Video muss öffentlich sein und mindestens 1000 Aufrufe haben
Jedes Video muss zwischen 120 und 500 Sekunden lang sein
Jedes Video muss mit mindestens einer Entität aus unserem Zielvokabular verknüpft sein
Nicht jugendfreie und sensible Inhalte werden entfernt (wie durch automatische Klassifizierer bestimmt)

Die allgemeine Konstruktionsstrategie von 3k-Klassifizierungsetiketten lautet: Machine Mining + teilweise manuelle Überprüfung.
Die manuelle Überprüfung bezieht sich auf einige Strategien des youtube-8m-Datensatzpapiers, z. B. die Prüfung, ob die Tags visuell trennbar sind, und das Löschen bedeutungsloser Tags.
Die spezifische Mining-Strategie @huangjun12big Brother hinzugefügt.

Herr Xie antwortete, dass jedes Video mit semantischen Tags + Entity-Tags (d. h. visuellen Tags) gekennzeichnet werden muss? Gibt es eine Mengenvorgabe? Hoffe, der Chef kann eine Kastanie geben! Gib einfach ein Video und trainiere das Label von lstm. Danke!

Einige Vorschläge (von https://research.google.com/youtube8m/ ):
Jedes Video muss öffentlich sein und mindestens 1000 Aufrufe haben
Jedes Video muss zwischen 120 und 500 Sekunden lang sein
Jedes Video muss mit mindestens einer Entität aus unserem Zielvokabular verknüpft sein
Nicht jugendfreie und sensible Inhalte werden entfernt (wie durch automatische Klassifizierer bestimmt)

Die allgemeine Konstruktionsstrategie von 3k-Klassifizierungsetiketten lautet: Machine Mining + teilweise manuelle Überprüfung.
Die manuelle Überprüfung bezieht sich auf einige Strategien des youtube-8m-Datensatzpapiers, z. B. die Prüfung, ob die Tags visuell trennbar sind, und das Löschen bedeutungsloser Tags.
Die spezifische Mining-Strategie @huangjun12big Brother hinzugefügt.

Herr Xie antwortete, dass jedes Video mit semantischen Tags + Entity-Tags (d. h. visuellen Tags) gekennzeichnet werden muss? Gibt es eine Mengenvorgabe? Hoffe, der Chef kann eine Kastanie geben! Gib einfach ein Video und trainiere das Label von lstm. Danke!

Einige Vorschläge (von https://research.google.com/youtube8m/ ):
Jedes Video muss öffentlich sein und mindestens 1000 Aufrufe haben
Jedes Video muss zwischen 120 und 500 Sekunden lang sein
Jedes Video muss mit mindestens einer Entität aus unserem Zielvokabular verknüpft sein
Nicht jugendfreie und sensible Inhalte werden entfernt (wie durch automatische Klassifizierer bestimmt)

Ich danke dir sehr!

Diese Tags werden basierend auf beliebten Abfragen in der Geschäftslinie erhalten, einschließlich semantischer Tags und Entitäts-Tags.Während des Trainings werden alle Tags abgeflacht und es gibt keine hierarchische Beziehung.

Boss, ist es leicht zu enthüllen, dass das maschinelle Mining eine magische Strategie verwendet? @ @

Die geschäftsbezogenen Strategien unseres Unternehmens sind jedoch nicht einfach offenzulegen.
Es wird jedoch empfohlen, nachzuschlagen: https://arxiv.org/pdf/1609.08675.pdf

Diese Tags werden basierend auf beliebten Abfragen in der Geschäftslinie erhalten, einschließlich semantischer Tags und Entitäts-Tags.Während des Trainings werden alle Tags abgeflacht und es gibt keine hierarchische Beziehung.

Boss, ist es leicht zu enthüllen, dass das maschinelle Mining eine magische Strategie verwendet? @ @

Die geschäftsbezogenen Strategien unseres Unternehmens sind jedoch nicht einfach offenzulegen.
Es wird jedoch empfohlen, nachzuschlagen: https://arxiv.org/pdf/1609.08675.pdf

Okay danke Leute

War diese Seite hilfreich?
0 / 5 - 0 Bewertungen