Paddlevideo: هل يمكنك إعطاء مثال على كيفية تسمية علامة الفيديو على مشروع تدريب الانتباه على lstm multi-tag؟

تم إنشاؤها على ١ فبراير ٢٠٢١  ·  10تعليقات  ·  مصدر: PaddlePaddle/PaddleVideo

تحدث المشروع للتو عن استخدام الضبط الدقيق متعدد العلامات lstm ، ولم يشرح كيفية تسمية الفيديو بعلامات متعددة. وهذا صعب أيضًا على المبتدئين. هل يمكنك إعطاء مثال لتوضيحه ، وإعطاء الأطباق الجانبية عديمة الخبرة اتجاه وضع العلامات ، شكرًا جزيلاً لك! شكرا!

good first issue VideoTag

ال 10 كومينتر

https://github.com/PaddlePaddle/PaddleVideo/blob/application/VideoTag/FineTune.md#Data Preparation -1 هل يساعد هذا الجزء من المستند مشكلتك؟

https://github.com/PaddlePaddle/PaddleVideo/blob/application/VideoTag/FineTune.md#Data Preparation -1 هل يساعد هذا الجزء من المستند مشكلتك؟

شكرا جزيلا على اجاباتك! أعلم أن السبب الرئيسي لذلك هو أنني لا أعرف إلى أي مدى يجب أن تكون علامات الفيديو علامات دلالية + علامات كيان أو تحتاج فقط إلى تمييزها بعلامات دلالية. انظر إلى أكثر من ثلاثة آلاف فئة من فئات الجمال ذات العلامات الدلالية ، وكذلك علامات محددة مثل سيقان طويلة .. هل يعني ذلك أن مقطع فيديو لسيدة شابة ترقص هو عبارة عن امرأة جميلة ترقص بأرجل طويلة؟ ثلاث تسميات؟ وبالمثل ، هناك علامات دلالية للحيوانات الأليفة ، وعلى وجه التحديد ، هناك حيوانات الباندا وبعض العلامات الغريبة جدًا مثل الخشب الرقائقي والعوارض الخشبية. . . لا أعلم على أي أساس هذا التعريف؟

استراتيجية البناء الشاملة لملصقات التصنيف 3k هي: التعدين بالآلة + المراجعة اليدوية الجزئية.
تشير المراجعة اليدوية إلى بعض الاستراتيجيات الخاصة بورقة مجموعة بيانات youtube-8m ، مثل النظر فيما إذا كانت العلامات قابلة للفصل بصريًا ، وحذف العلامات التي لا معنى لها.
وأضاف استراتيجية التعدين المحددة @ الأخ

يتم الحصول على هذه العلامات بناءً على الاستعلامات الشائعة على خط الأعمال ، بما في ذلك العلامات الدلالية وعلامات الكيان. أثناء التدريب ، يتم تسوية جميع العلامات ولا توجد علاقة هرمية.

استراتيجية البناء الشاملة لملصقات التصنيف 3k هي: التعدين بالآلة + المراجعة اليدوية الجزئية.
تشير المراجعة اليدوية إلى بعض الاستراتيجيات الخاصة بورقة مجموعة بيانات youtube-8m ، مثل النظر فيما إذا كانت العلامات قابلة للفصل بصريًا ، وحذف العلامات التي لا معنى لها.
وأضاف استراتيجية التعدين المحددة @ الأخ

أجاب السيد Xie أن كل مقطع فيديو يحتاج إلى تمييز بعلامات دلالية + علامات الكيان (أي العلامات المرئية)؟ هل هناك متطلبات كمية؟ آمل أن يتمكن الرئيس من إعطاء كستناء! فقط أعط مقطع فيديو وقم بتدريب ملصق lstm. شكرا لك!

يتم الحصول على هذه العلامات بناءً على الاستعلامات الشائعة على خط الأعمال ، بما في ذلك العلامات الدلالية وعلامات الكيان. أثناء التدريب ، يتم تسوية جميع العلامات ولا توجد علاقة هرمية.

أيها الرئيس ، هل من السهل الكشف عن أن التعدين الآلي يستخدم إستراتيجية سحرية؟ @ @
-

استراتيجية البناء الشاملة لملصقات التصنيف 3k هي: التعدين بالآلة + المراجعة اليدوية الجزئية.
تشير المراجعة اليدوية إلى بعض الاستراتيجيات الخاصة بورقة مجموعة بيانات youtube-8m ، مثل النظر فيما إذا كانت العلامات قابلة للفصل بصريًا ، وحذف العلامات التي لا معنى لها.
وأضاف استراتيجية التعدين المحددة @ الأخ

أجاب السيد Xie أن كل مقطع فيديو يحتاج إلى تمييز بعلامات دلالية + علامات الكيان (أي العلامات المرئية)؟ هل هناك متطلبات كمية؟ آمل أن يتمكن الرئيس من إعطاء كستناء! فقط أعط مقطع فيديو وقم بتدريب ملصق lstm. شكرا لك!

بعض الاقتراحات (من https://research.google.com/youtube8m/ ):
يجب أن يكون كل فيديو عامًا وأن يحصل على 1000 مشاهدة على الأقل
يجب أن يتراوح طول كل فيديو بين 120 و 500 ثانية
يجب أن يقترن كل فيديو بكيان واحد على الأقل من مفرداتنا المستهدفة
تتم إزالة محتوى البالغين والحساس (على النحو الذي تحدده المصنفات الآلية)

استراتيجية البناء الشاملة لملصقات التصنيف 3k هي: التعدين بالآلة + المراجعة اليدوية الجزئية.
تشير المراجعة اليدوية إلى بعض الاستراتيجيات الخاصة بورقة مجموعة بيانات youtube-8m ، مثل النظر فيما إذا كانت العلامات قابلة للفصل بصريًا ، وحذف العلامات التي لا معنى لها.
وأضاف استراتيجية التعدين المحددة @ الأخ

أجاب السيد Xie أن كل مقطع فيديو يحتاج إلى تمييز بعلامات دلالية + علامات الكيان (أي العلامات المرئية)؟ هل هناك متطلبات كمية؟ آمل أن يتمكن الرئيس من إعطاء كستناء! فقط أعط مقطع فيديو وقم بتدريب ملصق lstm. شكرا لك!

بعض الاقتراحات (من https://research.google.com/youtube8m/ ):
يجب أن يكون كل فيديو عامًا وأن يحصل على 1000 مشاهدة على الأقل
يجب أن يتراوح طول كل فيديو بين 120 و 500 ثانية
يجب أن يقترن كل فيديو بكيان واحد على الأقل من مفرداتنا المستهدفة
تتم إزالة محتوى البالغين والحساس (على النحو الذي تحدده المصنفات الآلية)

استراتيجية البناء الشاملة لملصقات التصنيف 3k هي: التعدين بالآلة + المراجعة اليدوية الجزئية.
تشير المراجعة اليدوية إلى بعض الاستراتيجيات الخاصة بورقة مجموعة بيانات youtube-8m ، مثل النظر فيما إذا كانت العلامات قابلة للفصل بصريًا ، وحذف العلامات التي لا معنى لها.
وأضاف استراتيجية التعدين المحددة @ الأخ

أجاب السيد Xie أن كل مقطع فيديو يحتاج إلى تمييز بعلامات دلالية + علامات الكيان (أي العلامات المرئية)؟ هل هناك متطلبات كمية؟ آمل أن يتمكن الرئيس من إعطاء كستناء! فقط أعط مقطع فيديو وقم بتدريب ملصق lstm. شكرا لك!

بعض الاقتراحات (من https://research.google.com/youtube8m/ ):
يجب أن يكون كل فيديو عامًا وأن يحصل على 1000 مشاهدة على الأقل
يجب أن يتراوح طول كل فيديو بين 120 و 500 ثانية
يجب أن يقترن كل فيديو بكيان واحد على الأقل من مفرداتنا المستهدفة
تتم إزالة محتوى البالغين والحساس (على النحو الذي تحدده المصنفات الآلية)

شكرا جزيلا لك!

يتم الحصول على هذه العلامات بناءً على الاستعلامات الشائعة على خط الأعمال ، بما في ذلك العلامات الدلالية وعلامات الكيان. أثناء التدريب ، يتم تسوية جميع العلامات ولا توجد علاقة هرمية.

أيها الرئيس ، هل من السهل الكشف عن أن التعدين الآلي يستخدم إستراتيجية سحرية؟ @ @

على الرغم من أن الاستراتيجيات المتعلقة بالأعمال لشركتنا ليست ملائمة للإفصاح عنها.
ومع ذلك ، يوصى بالرجوع إلى: https://arxiv.org/pdf/1609.08675.pdf

يتم الحصول على هذه العلامات بناءً على الاستعلامات الشائعة على خط الأعمال ، بما في ذلك العلامات الدلالية وعلامات الكيان. أثناء التدريب ، يتم تسوية جميع العلامات ولا توجد علاقة هرمية.

أيها الرئيس ، هل من السهل الكشف عن أن التعدين الآلي يستخدم إستراتيجية سحرية؟ @ @

على الرغم من أن الاستراتيجيات المتعلقة بالأعمال لشركتنا ليست ملائمة للإفصاح عنها.
ومع ذلك ، يوصى بالرجوع إلى: https://arxiv.org/pdf/1609.08675.pdf

طيب شكرا يا رفاق

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات