Привет! Во-первых, спасибо за ваши замечательные работы.
Я закончил обучение RetinaNet с набором данных COCO, как вы сказали.
Я хочу обучить свой собственный набор данных с помощью RetinaNet или других базовых моделей.
Я смотрю на внутреннюю структуру кода и выясняю, что все конфигурации модели определены в файле * .yaml, а train_net.py читает файл * .yaml и создает базу данных из файла .jason в каталоге аннотаций COCO.
Итак, если я хочу обучить свой собственный набор данных, единственный способ - создать файл .json, похожий на аннотации COCO?
@ nonstop1962 : да, рекомендуется преобразовать набор данных в формат аннотаций COCO json. Для ограничивающих прямоугольников это обычно можно сделать в <100 строках Python. Конечно, вы можете внести произвольные изменения в код Detectron для поддержки пользовательских форматов, но это, вероятно, сложнее и более подвержено проблемам с пропущенными угловыми случаями.
Спасибо за ваш ответ!
Спасибо за @rbgirshick !
Хорошо, так могу ли я получить набор тренировочных данных, если я хочу сегментировать футболку?
например, JSON get для использования COCO API.
Я думаю, что на этой платформе возможна сегментация.
ОК??
Спасибо ~!
Привет,
для тех, кому это нужно, вот скрипт для преобразования аннотаций xml pascal voice в формат coco json: https://github.com/gamcoh/Object-Detection-Tools/blob/master/pascal_voc_xml2coco_json.py
Спасибо, gamcoh!
Самый полезный комментарий
@ nonstop1962 : да, рекомендуется преобразовать набор данных в формат аннотаций COCO json. Для ограничивающих прямоугольников это обычно можно сделать в <100 строках Python. Конечно, вы можете внести произвольные изменения в код Detectron для поддержки пользовательских форматов, но это, вероятно, сложнее и более подвержено проблемам с пропущенными угловыми случаями.