Detectron: рд╕рдВрджрд░реНрдн_gpu.cu рд╕реНрдореГрддрд┐ рд╕рдорд╕реНрдпрд╛рдУрдВ рдХрд╛ рдХрд╛рд░рдг рдмрдирддрд╛ рд╣реИ

рдХреЛ рдирд┐рд░реНрдорд┐рдд 5 рдорд╛рд░реНрдЪ 2018  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: facebookresearch/Detectron

рдореЗрд░реЗ рд▓рд┐рдП рдпрд╣ рд╕рдорд╕реНрдпрд╛ рдмрд╣реБрдд рдмреЗрддрд░рддреАрдм рдврдВрдЧ рд╕реЗ рд╣реЛрддреА рд╣реИред рдиреЗрдЯрд╡рд░реНрдХ (рдЗрд╕ рдорд╛рдорд▓реЗ рдореЗрдВ рд░реЗрдЯрд┐рдирд╛рдиреЗрдЯ) рдареАрдХ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рджреЗ рд░рд╣рд╛ рд╣реИ, рдЬрдм рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐рдпреЛрдВ рдкрд░ context_gpu.cu рдЖрдЧ рд▓рдЧрддреА рд╣реИ рдФрд░ рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЬреАрдкреАрдпреВ рдореЗрдореЛрд░реА рдХреЛ рдЦрд╛ рд░рд╣рд╛ рд╣реИ рдЬреИрд╕реЗ рдХрд┐ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕реНрдореГрддрд┐ рддреНрд░реБрдЯрд┐ рд╕реЗ рдмрд╛рд╣рд░ рд╣реЛ рдЧрдпрд╛ рд╣реИред

рд╣рдо рдкрд╛рд╕реНрдХрд▓ рдЬреАрдкреАрдпреВ рдХреЗ рд╕рд╛рде рдЙрдмрдВрдЯреВ 16.04 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдХрдИ рдорд╢реАрдиреЛрдВ рдкрд░ рд╣реЛрддрд╛ рд╣реИ, рд╡рд┐рднрд┐рдиреНрди рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ GPU (1-4) рдХреЗ рд╕рд╛рде рдФрд░ рд╡рд┐рднрд┐рдиреНрди рдиреЗрдЯрд╡рд░реНрдХ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рддреЗ рд╕рдордпред

рдХреЛрдИ рд╡рд┐рдЪрд╛рд░?

json_stats: {"eta": "17:31:05", "fl_fpn3": 0.000720, "fl_fpn4": 0.001108, "fl_fpn5": 0.004955, "fl_fpn6": 0.020188, "fl_fpn7": 0.019255, "iter": 137400, "loss": 0.174941, "lr": 0.001250, "mb_qsize": 64, "mem": 7110, "retnet_bg_num": 31416503.000000, "retnet_fg_num": 63.500000, "retnet_loss_bbox_fpn3": 0.000000, "retnet_loss_bbox_fpn4": 0.000000, "retnet_loss_bbox_fpn5": 0.000000, "retnet_loss_bbox_fpn6": 0.011040, "retnet_loss_bbox_fpn7": 0.004171, "time": 0.614669}
json_stats: {"eta": "17:30:52", "fl_fpn3": 0.000606, "fl_fpn4": 0.001287, "fl_fpn5": 0.004547, "fl_fpn6": 0.027491, "fl_fpn7": 0.009270, "iter": 137420, "loss": 0.137118, "lr": 0.001250, "mb_qsize": 64, "mem": 7110, "retnet_bg_num": 31416766.000000, "retnet_fg_num": 65.000000, "retnet_loss_bbox_fpn3": 0.000000, "retnet_loss_bbox_fpn4": 0.000000, "retnet_loss_bbox_fpn5": 0.000000, "retnet_loss_bbox_fpn6": 0.015492, "retnet_loss_bbox_fpn7": 0.005272, "time": 0.614670}
I0225 23:55:34.962450 20807 context_gpu.cu:321] GPU 0: 7179 MB
I0225 23:55:34.962478 20807 context_gpu.cu:325] Total: 7179 MB
I0225 23:55:34.972862 20810 context_gpu.cu:321] GPU 0: 7323 MB
I0225 23:55:34.972884 20810 context_gpu.cu:325] Total: 7323 MB
I0225 23:55:34.987242 20807 context_gpu.cu:321] GPU 0: 7467 MB
I0225 23:55:34.987257 20807 context_gpu.cu:325] Total: 7467 MB
I0225 23:55:35.004983 20807 context_gpu.cu:321] GPU 0: 7611 MB
I0225 23:55:35.005004 20807 context_gpu.cu:325] Total: 7611 MB
I0225 23:55:35.019520 20807 context_gpu.cu:321] GPU 0: 7755 MB
I0225 23:55:35.019529 20807 context_gpu.cu:325] Total: 7755 MB
I0225 23:55:35.033624 20807 context_gpu.cu:321] GPU 0: 7899 MB
I0225 23:55:35.033632 20807 context_gpu.cu:325] Total: 7899 MB
I0225 23:55:35.048848 20808 context_gpu.cu:321] GPU 0: 8043 MB
I0225 23:55:35.048869 20808 context_gpu.cu:325] Total: 8043 MB
I0225 23:55:35.065871 20807 context_gpu.cu:321] GPU 0: 8187 MB
I0225 23:55:35.065881 20807 context_gpu.cu:325] Total: 8187 MB
I0225 23:55:35.082967 20807 context_gpu.cu:321] GPU 0: 8331 MB
I0225 23:55:35.082975 20807 context_gpu.cu:325] Total: 8331 MB
I0225 23:55:35.102628 20810 context_gpu.cu:321] GPU 0: 8467 MB
I0225 23:55:35.102646 20810 context_gpu.cu:325] Total: 8467 MB
I0225 23:55:35.123090 20807 context_gpu.cu:321] GPU 0: 8607 MB
I0225 23:55:35.123100 20807 context_gpu.cu:325] Total: 8607 MB
I0225 23:55:35.145066 20807 context_gpu.cu:321] GPU 0: 8739 MB
I0225 23:55:35.145074 20807 context_gpu.cu:325] Total: 8739 MB
I0225 23:55:35.166004 20807 context_gpu.cu:321] GPU 0: 8871 MB
I0225 23:55:35.166013 20807 context_gpu.cu:325] Total: 8871 MB
I0225 23:55:35.187448 20807 context_gpu.cu:321] GPU 0: 9003 MB
I0225 23:55:35.187456 20807 context_gpu.cu:325] Total: 9003 MB
I0225 23:55:35.208040 20807 context_gpu.cu:321] GPU 0: 9135 MB
I0225 23:55:35.208050 20807 context_gpu.cu:325] Total: 9135 MB
I0225 23:55:35.229956 20807 context_gpu.cu:321] GPU 0: 9267 MB
I0225 23:55:35.229964 20807 context_gpu.cu:325] Total: 9267 MB
I0225 23:55:35.251646 20807 context_gpu.cu:321] GPU 0: 9399 MB
I0225 23:55:35.251655 20807 context_gpu.cu:325] Total: 9399 MB
I0225 23:55:35.273802 20807 context_gpu.cu:321] GPU 0: 9531 MB
I0225 23:55:35.273811 20807 context_gpu.cu:325] Total: 9531 MB
I0225 23:55:35.294629 20807 context_gpu.cu:321] GPU 0: 9660 MB
I0225 23:55:35.294638 20807 context_gpu.cu:325] Total: 9660 MB
I0225 23:55:35.320922 20808 context_gpu.cu:321] GPU 0: 9795 MB
I0225 23:55:35.320945 20808 context_gpu.cu:325] Total: 9795 MB
I0225 23:55:35.346731 20809 context_gpu.cu:321] GPU 0: 9934 MB
I0225 23:55:35.346740 20809 context_gpu.cu:325] Total: 9934 MB
I0225 23:55:35.430550 20807 context_gpu.cu:321] GPU 0: 10068 MB
I0225 23:55:35.430560 20807 context_gpu.cu:325] Total: 10068 MB
I0225 23:55:35.566123 20809 context_gpu.cu:321] GPU 0: 10200 MB
I0225 23:55:35.566140 20809 context_gpu.cu:325] Total: 10200 MB
I0225 23:55:35.958365 20807 context_gpu.cu:321] GPU 0: 10332 MB
I0225 23:55:35.958379 20807 context_gpu.cu:325] Total: 10332 MB
terminate called after throwing an instance of 'caffe2::EnforceNotMet'
  what():  [enforce fail at context_gpu.cu:343] error == cudaSuccess. 2 vs 0. Error at: /home/user/workspace/caffe2/caffe2/core/context_gpu.cu:343: out of memory Error from operator: 
input: "gpu_0/res2_2_sum" input: "gpu_0/res3_0_branch1_w" input: "gpu_0/__m14_shared" output: "gpu_0/res3_0_branch1_w_grad" output: "gpu_0/__m13_shared" name: "" type: "ConvGradient" arg { name: "no_bias" i: 1 } arg { name: "stride" i: 2 } arg { name: "exhaustive_search" i: 0 } arg { name: "order" s: "NCHW" } arg { name: "kernel" i: 1 } device_option { device_type: 1 cuda_gpu_id: 0 } engine: "CUDNN" is_gradient_op: true
*** Aborted at 1519599336 (unix time) try "date -d @1519599336" if you are using GNU date ***
PC: @     0x7fd60edf8428 gsignal
*** SIGABRT (@0x3ea0000510d) received by PID 20749 (TID 0x7fd4b7fff700) from PID 20749; stack trace: ***
    @     0x7fd60f19e390 (unknown)
    @     0x7fd60edf8428 gsignal
    @     0x7fd60edfa02a abort
    @     0x7fd60c66484d __gnu_cxx::__verbose_terminate_handler()
    @     0x7fd60c6626b6 (unknown)
    @     0x7fd60c662701 std::terminate()
    @     0x7fd60c68dd38 (unknown)
    @     0x7fd60f1946ba start_thread
I0225 23:55:36.066072 20807 context_gpu.cu:321] GPU 0: 10524 MB
I0225 23:55:36.066085 20807 context_gpu.cu:325] Total: 10524 MB
    @     0x7fd60eeca41d clone
    @                0x0 (unknown)

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

рдореИрдВ рдЙрд╕реА рддрд░рд╣ рдХрд╛ рдореБрджреНрджрд╛ рдЬреЛрдбрд╝рддрд╛ рд╣реВрдВ (рд╕рд┐рд╡рд╛рдп рдЗрд╕рдХреЗ рдХрд┐ рдпрд╣ рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдирд╣реАрдВ рдерд╛)ред рдореИрдВ config.yaml рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рдореЗрдореЛрд░реА рдХреА рдорд╛рддреНрд░рд╛ рдХреЛ рдХрдо рдХрд░рдХреЗ рдЗрд╕реЗ рд╣рд▓ рдХрд░рддрд╛ рд╣реВрдВред
рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореИрдВ рдЯреНрд░реЗрди рдореЗрдВ MAX_SIZE рдкреИрд░рд╛рдореАрдЯрд░ рдХреЛ 1333 (рдмреЗрд╕рд▓рд╛рдЗрди) рд╕реЗ рдмрджрд▓рдХрд░ 833 рдХрд░ рджреЗрддрд╛ рд╣реВрдВред
рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЖрдк SCALES рдФрд░ BATCH_SIZE рдХреЛ рднреА рдХрдо рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рдЖрд╢рд╛ рд╣реИ рдХрд┐ рдпрд╣ рдорджрдж рдХрд░реЗрдЧрд╛

рд╕рднреА 4 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

рдореИрдВ рдЙрд╕реА рддрд░рд╣ рдХрд╛ рдореБрджреНрджрд╛ рдЬреЛрдбрд╝рддрд╛ рд╣реВрдВ (рд╕рд┐рд╡рд╛рдп рдЗрд╕рдХреЗ рдХрд┐ рдпрд╣ рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдирд╣реАрдВ рдерд╛)ред рдореИрдВ config.yaml рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рдореЗрдореЛрд░реА рдХреА рдорд╛рддреНрд░рд╛ рдХреЛ рдХрдо рдХрд░рдХреЗ рдЗрд╕реЗ рд╣рд▓ рдХрд░рддрд╛ рд╣реВрдВред
рдореЗрд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдореИрдВ рдЯреНрд░реЗрди рдореЗрдВ MAX_SIZE рдкреИрд░рд╛рдореАрдЯрд░ рдХреЛ 1333 (рдмреЗрд╕рд▓рд╛рдЗрди) рд╕реЗ рдмрджрд▓рдХрд░ 833 рдХрд░ рджреЗрддрд╛ рд╣реВрдВред
рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдЖрдк SCALES рдФрд░ BATCH_SIZE рдХреЛ рднреА рдХрдо рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

рдЖрд╢рд╛ рд╣реИ рдХрд┐ рдпрд╣ рдорджрдж рдХрд░реЗрдЧрд╛

@francoto рдЗрдирдкреБрдЯ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдмреИрдЪ рдХреЗ рдЖрдХрд╛рд░ рдХреЛ рдХрдо рдХрд░рдиреЗ рд╕реЗ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдореЗрдВ рдмрд╛рдзрд╛ рдЖ рд╕рдХрддреА рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рдореЙрдбрд▓ рдХреЗ рдкреНрд░рджрд░реНрд╢рди рдХреЛ рднреА рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд░реЗрдЧрд╛ред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛ рдмреИрдЪрд╕рд╛рдЗрдЬрд╝ рдЖрд╕рд╛рдиреА рд╕реЗ GPU рдореЗрдореЛрд░реА рдХреЗ рдЕрдВрджрд░ рдлрд┐рдЯ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рджреМрд░рд╛рди рдХреБрдЫ рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдмрд┐рдВрджреБ рдкрд░ (рдЖрдорддреМрд░ рдкрд░ ~ 16k рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЗ рдмрд╛рдж) рдореЗрдореЛрд░реА рдХрд╛ рдЙрдкрдпреЛрдЧ рдЕрдЪрд╛рдирдХ рдмрдврд╝ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреНрд░реИрд╢ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, рдЬреЛ рдЕрдЬреАрдм рд╡реНрдпрд╡рд╣рд╛рд░ рд╣реИред рдореЗрд░реЗ рдкрд╛рд╕ рдЕрднреА рддрдХ рдпрд╣ рджреЗрдЦрдиреЗ рдХрд╛ рд╕рдордп рдирд╣реАрдВ рд╣реИ рдХрд┐ рд╕рдВрджрд░реНрдн_рдЬреАрдкреАрдпреВ рдореЙрдбрд▓ рдХреЛ рдЖрдЧ рд▓рдЧрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдХреНрдпрд╛ рдЯреНрд░рд┐рдЧрд░ рдХрд░рддрд╛ рд╣реИред

рд╕рдорд╕реНрдпрд╛ рдореБрдЭреЗ рддрдм рд╣реЛрддреА рд╣реИ рдЬрдм рдореИрдВ рдХрд░рддрд╛ рд╣реВрдВ:
~/рдбрд┐рдЯреЗрдХреНрдЯреНрд░реЙрди$ CUDA_VISIBLE_DEVICES=0 python2 рдЯреВрд▓реНрд╕/train_net.py --cfg configs/04_2018_gn_baselines/scratch_e2e_mask_rcnn_R-50-FPN_3x_gn.yaml OUTPUT_DIR ~/tmp/detectron-output

рдбрд┐рдЯреЗрдХреНрдЯреНрд░реЙрди рдСрдкреНрд╕ рд▓рд┐рдм рдорд┐рд▓рд╛: /home/intern/usr/local/lib/libcaffe2_detectron_ops_gpu.so
рдбрд┐рдЯреЗрдХреНрдЯреНрд░реЙрди рдСрдкреНрд╕ рд▓рд┐рдм рдорд┐рд▓рд╛: /home/intern/usr/local/lib/libcaffe2_detectron_ops_gpu.so
E0504 22:55:48.136441 8525 init_intrinsics_check.cc:43] CPU рдлреАрдЪрд░ avx рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдореМрдЬреВрдж рд╣реИ, рд▓реЗрдХрд┐рди Caffe2 рдмрд╛рдЗрдирд░реА рдЗрд╕рдХреЗ рд╕рд╛рде рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рд╣реИред рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рдЖрдкрдХреЛ рдЕрдкрдиреЗ CPU рдХреА рдкреВрд░реА рд╕реНрдкреАрдб рдирд╣реАрдВ рдорд┐рд▓ рд╕рдХрддреА рд╣реИред
E0504 22:55:48.136483 8525 init_intrinsics_check.cc:43] CPU рд╕реБрд╡рд┐рдзрд╛ avx2 рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдореМрдЬреВрдж рд╣реИ, рд▓реЗрдХрд┐рди Caffe2 рдмрд╛рдЗрдирд░реА рдЗрд╕рдХреЗ рд╕рд╛рде рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рд╣реИред рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рдЖрдкрдХреЛ рдЕрдкрдиреЗ CPU рдХреА рдкреВрд░реА рд╕реНрдкреАрдб рдирд╣реАрдВ рдорд┐рд▓ рд╕рдХрддреА рд╣реИред
E0504 22:55:48.136489 8525 init_intrinsics_check.cc:43] CPU рдлреАрдЪрд░ fma рдЖрдкрдХреА рдорд╢реАрди рдкрд░ рдореМрдЬреВрдж рд╣реИ, рд▓реЗрдХрд┐рди Caffe2 рдмрд╛рдЗрдирд░реА рдЗрд╕рдХреЗ рд╕рд╛рде рд╕рдВрдХрд▓рд┐рдд рдирд╣реАрдВ рд╣реИред рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рдЖрдкрдХреЛ рдЕрдкрдиреЗ CPU рдХреА рдкреВрд░реА рд╕реНрдкреАрдб рдирд╣реАрдВ рдорд┐рд▓ рд╕рдХрддреА рд╣реИред
INFO train_net.py: 95: рдЖрд░реНрдЧ рдХреЗ рд╕рд╛рде рдХреЙрд▓ рдХрд┐рдпрд╛ рдЧрдпрд╛:
INFO train_net.py: 96: рдиреЗрдорд╕реНрдкреЗрд╕(cfg_file='configs/04_2018_gn_baselines/scratch_e2e_mask_rcnn_R-50-FPN_3x_gn.yaml', multi_gpu_testing=False, opts=['OUTPUT_DIR', '/home/rontern-output'], '/home/rontern-output' рд╕реНрдХрд┐рдк_рдЯреЗрд╕реНрдЯ = рдЭреВрдард╛)
INFO train_net.py: 102: рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдХреЗ рд╕рд╛рде рдкреНрд░рд╢рд┐рдХреНрд╖рдг:
INFO train_net.py: 103: {'BBOX_XFORM_CLIP': 4.135166556742356,

...

INFO train.py: 131: рдмрд┐рд▓реНрдбрд┐рдВрдЧ рдореЙрдбрд▓: normalized_rcnn
рдЪреЗрддрд╛рд╡рдиреА cnn.py: 25: [==== DEPRECATE WARNING====]: рдЖрдк CNNModelHelper рдХреНрд▓рд╛рд╕ рд╕реЗ рдПрдХ рдСрдмреНрдЬреЗрдХреНрдЯ рдмрдирд╛ рд░рд╣реЗ рд╣реИрдВ рдЬрд┐рд╕реЗ рдЬрд▓реНрдж рд╣реА рд╣рдЯрд╛ рджрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред рдХреГрдкрдпрд╛ рдмреНрд░реВ рдореЙрдбреНрдпреВрд▓ рдХреЗ рд╕рд╛рде ModelHelper рдСрдмреНрдЬреЗрдХреНрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВред рдЕрдзрд┐рдХ рдЬрд╛рдирдХрд╛рд░реА рдХреЗ рд▓рд┐рдП, рдХреГрдкрдпрд╛ рдЕрдзрд┐рдХ рдЬрд╛рдирдХрд╛рд░реА рдХреЗ рд▓рд┐рдП caffe2.ai рдФрд░ python/brew.py, python/brew_test.py рджреЗрдЦреЗрдВред
рдЪреЗрддрд╛рд╡рдиреА memonger.py: 55: рдиреЛрдЯ: рдЧреНрд░реЗрдбрд┐рдПрдВрдЯ рдореЗрдореЛрд░реА рдХреЛ рдСрдкреНрдЯрд┐рдорд╛рдЗрдЬрд╝ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдореЗрдореЛрдВрдЧрд░ рдХреЛ рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░рдирд╛
I0504 22:55:51.732862 8525 memonger.cc:236] 24 рд╕рд╛рдЭрд╛ рдмреНрд▓реЙрдмреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ 140 рдХрд╛ рд░реАрдореИрдкрд┐рдВрдЧред
...
'caffe2 :: EnforceNotMet' рдХрд╛ рдПрдХ рдЙрджрд╛рд╣рд░рдг рдлреЗрдВрдХрдиреЗ рдХреЗ рдмрд╛рдж рдХреЙрд▓ рд╕рдорд╛рдкреНрдд рдХрд░реЗрдВ
рдХреНрдпрд╛ (): [рд╕рдВрджрд░реНрдн_gpu.h:156 рдкрд░ рд╡рд┐рдлрд▓ рд▓рд╛рдЧреВ рдХрд░реЗрдВ]ред CUDA рддреНрд░реБрдЯрд┐ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛: рдЕрдорд╛рдиреНрдп рдбрд┐рд╡рд╛рдЗрд╕ рд╕рд╛рдорд╛рдиреНрдп
* 1525445757 рдкрд░ рдирд┐рд░рд╕реНрдд (рдпреВрдирд┐рдХреНрд╕ рд╕рдордп) рдпрджрд┐ рдЖрдк рдЬреАрдПрдирдпреВ рддрд┐рдерд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВ рддреЛ "рджрд┐рдирд╛рдВрдХ-рдбреА @ 1525445757" рдЖрдЬрдорд╛рдПрдВ
рдкреАрд╕реА: @ 0x7fa26afec428 gsignal
PID 8525 рд╕реЗ PID 8525 (TID 0x7fa26c4da740) рджреНрд╡рд╛рд░рд╛ рдкреНрд░рд╛рдкреНрдд SIGABRT (@ 0x3f400000214d);
@ 0x7fa26baa2390 (рдЕрдЬреНрдЮрд╛рдд)
@ 0x7fa26afec428 рдЬреАрд╕рд┐рдЧреНрдирд▓
@ 0x7fa26afee02a рдирд┐рд░рд╕реНрдд
@ 0x7fa26ad12b39 __gnu_cxx::__verbose_terminate_handler()
@ 0x7fa26ad111fb __cxxabiv1 :: __ рд╕рдорд╛рдкреНрдд ()
@ 0x7fa26ad10640 __cxa_call_terminate
@ 0x7fa26ad10e6f __gxx_personality_v0
@ 0x7fa26aa77564 _Unwind_RaiseException_Phase2
@ 0x7fa26aa7781d _Unwind_RaiseException
@ 0x7fa26ad11409 __cxa_throw
@ 0x7fa25379a109 caffe2::CUDAContext::~CUDAContext()
@ 0x7fa253939412 caffe2 :: рдСрдкрд░реЗрдЯрд░ <> :: ~ рдСрдкрд░реЗрдЯрд░ ()
@ 0x7fa2539e1bee caffe2::FillerOp<>::~FillerOp()
@ 0x7fa2539e58f6 caffe2::XavierFillOp<>::~XavierFillOp()
@ 0x7fa2539e5926 caffe2::XavierFillOp<>::~XavierFillOp()
@ 0x7fa252801809 рдПрд╕рдЯреАрдбреА :: рд╡реЗрдХреНрдЯрд░ <> :: ~ рд╡реЗрдХреНрдЯрд░ ()
@ 0x7fa2527fffcf caffe2::SimpleNet::SimpleNet()
@ 0x7fa2527cb1a6 caffe2 :: CreateNet ()
@ 0x7fa2527cb8fd caffe2 :: CreateNet ()
@ 0x7fa252835532 caffe2 :: рдХрд╛рд░реНрдпрдХреНрд╖реЗрддреНрд░ :: RunNetOnce ()
@ 0x7fa25525e1ba _ZZN6caffe26python16addGlobalMethodsERN8pybind116moduleEENKUlRKNS1_5bytesEE28_clES6_.isra.2767.constprop.2859
@ 0x7fa25525e455 _ZZN8pybind1112cpp_function10InitializeIZN6caffe26python16AddGlobalMethodsERNS_6рдореЙрдбреНрдпреВрд▓EEUlRKNS_5bytesEE28_bJS8_EJNS_4nameENS_5scopeENS_7siblingEE_Dp13_UNESPFT0
@ 0x7fa25528b24d pybind11 :: cpp_function :: рдбрд┐рд╕реНрдкреИрдЪрд░ ()
@ 0x7fa26bd8f9c0 PyEval_EvalFrameEx
@ 0x7fa26bd92519 PyEval_EvalCodeEx
@ 0x7fa26bd8f4b2 PyEval_EvalFrameEx
@ 0x7fa26bd92519 PyEval_EvalCodeEx
@ 0x7fa26bd8f4b2 PyEval_EvalFrameEx
@ 0x7fa26bd92519 PyEval_EvalCodeEx
@ 0x7fa26bd8f4b2 PyEval_EvalFrameEx
@ 0x7fa26bd92519 PyEval_EvalCodeEx
@ 0x7fa26bd8f4b2 PyEval_EvalFrameEx
рдирд┐рд░рд╕реНрдд (рдХреЛрд░ рдбрдВрдк рдХрд┐рдпрд╛ рдЧрдпрд╛)

рдореИрдВ рдЕрдкрдиреА рдкрд░реНрдпрд╛рд╡рд░рдг рдЬрд╛рдирдХрд╛рд░реА рдмрд╛рдж рдореЗрдВ рдЬреЛрдбрд╝реВрдВрдЧрд╛ред

рдпрд╣рд╛рдБ рднреА рдпрд╣реА рд╕рдорд╕реНрдпрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдореЗрд░реЗ рдкрд╛рд╕ 100 Gb рдЦрд╛рд▓реА рдЬрдЧрд╣ рд╣реИ... рдХреНрдпрд╛ рдореЗрд░реЗ GPU рджреНрд╡рд╛рд░рд╛ рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рдиреЗ рд╡рд╛рд▓реА рдХреЛрдИ рд╡рд┐рд╢рд┐рд╖реНрдЯ рдореЗрдореЛрд░реА рд╣реИ? рдХреНрдпрд╛ рдореБрдЭреЗ рдПрдХ рдмреЗрд╣рддрд░ GPU рдорд┐рд▓рдирд╛ рдЪрд╛рд╣рд┐рдП?
рдмреАрдЯреАрдбрдмреНрд▓реНрдпреВ, рдореИрдВрдиреЗ рдкрд╣рд▓реЗ рд╣реА рдореЙрдбрд▓ рдХреЛ рдПрдХ рдмрд╛рд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдпрд╛ рд╣реИ рдФрд░ рдЗрд╕рдиреЗ рдореБрдЭреЗ рдпрд╣ рддреНрд░реБрдЯрд┐ рдирд╣реАрдВ рджреА рд╣реИ

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

coldgemini picture coldgemini  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

Hwang-dae-won picture Hwang-dae-won  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

gaopeng-eugene picture gaopeng-eugene  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

lilichu picture lilichu  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

pacelu picture pacelu  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ