Celery: عامل عالق

تم إنشاؤها على ٥ مايو ٢٠١٥ · 45تعليقات · مصدر: celery/celery

عامل الكرفس يتعطل ويستهلك الكثير من الذاكرة المقيمة.

الإصدار هو الكرفس (3.1.17)

ستريس

الكرفس] # strace -p 8401
تم إرفاق العملية 8401 - المقاطعة للإنهاء
قراءة (10 ،

الكرفس] # lsof -n -p 8401 | egrep -v "(DIR | REG)"
الأمر PID USER FD TYPE DEVICE SIZE / OFF NODE NAME
أنبوب python 8401 dsl 0r FIFO 0،8 0t0 124716100
أنبوب python 8401 dsl 1w FIFO 0،8 0t0 124716101
أنبوب python 8401 dsl 2w FIFO 0،8 0t0 124716101
أنبوب python 8401 dsl 6r FIFO 0،8 0t0 124716462
أنبوب python 8401 dsl 7w FIFO 0،8 0t0 124716462
أنبوب python 8401 dsl 8r FIFO 0،8 0t0 124716463
أنبوب python 8401 dsl 9w FIFO 0،8 0t0 124716463
أنبوب python 8401 dsl 10r FIFO 0،8 0t0 124716464
أنبوب python 8401 dsl 13w FIFO 0،8 0t0 124716465
أنبوب python 8401 dsl 14r FIFO 0،8 0t0 124716466
python 8401 dsl 15r CHR 1،3 0t0 3662 / dev / null
أنبوب python 8401 dsl 16w FIFO 0،8 0t0 124716467

تفريغ Pstack

الكرفس] # pstack 8401

0 0x0000003056c0e740 في __read_nocancel () من /lib64/libpthread.so.0

1 0x00007fa96b97b4c6 في _Billiard_conn_recvall () من /home/apps/analy/app/venv/lib/python2.6/site-packages/_billiard.so

2 0x00007fa96b97b552 في Billiard_conn_recv_string () من /home/apps/analy/app/venv/lib/python2.6/site-packages/_billiard.so

3 0x00007fa96b97b668 في Billiard_connection_recv_payload () من المنزل / التطبيقات / التحليلات / التطبيق / venv / lib / python2.6 / site-packs / _billiard.so

4 0x00000030574d5916 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

5 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

6 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

7 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

8 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

9 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

10 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

11 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

12 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

13 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

14 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

15 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

16 0x000000305746acb0 في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

17 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

18 0x00000030574566af في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

19 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

20 0x000000305749568e في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

21 0x0000003057494298 في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

22 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

23 0x00000030574d4f74 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

24 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

25 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

26 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

27 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

28 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

29 0x000000305746ad في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

30 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

31 0x00000030574d4470 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

32 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

33 0x000000305746ad في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

34 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

35 0x00000030574566af في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

36 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

37 0x000000305749568e في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

38 0x0000003057494298 في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

39 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

40 0x00000030574d4470 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

41 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

42 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

43 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

44 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

45 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

46 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

47 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

48 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

49 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

50 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

51 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

52 0x000000305746ad في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

53 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

54 0x00000030574d4470 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

55 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

56 0x000000305746ad in ؟؟ () من /usr/lib64/libpython2.6.so.1.0

57 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

58 0x00000030574566af في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

59 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

60 0x0000003057495a54 في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

61 0x0000003057443c63 في PyObject_Call () من /usr/lib64/libpython2.6.so.1.0

62 0x00000030574d4470 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

63 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

64 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

65 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

66 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

67 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

68 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

69 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

70 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

71 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

72 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

73 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

74 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

75 0x00000030574d6b8f في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

76 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

77 0x00000030574d5aa4 في PyEval_EvalFrameEx () من /usr/lib64/libpython2.6.so.1.0

78 0x00000030574d7657 في PyEval_EvalCodeEx () من /usr/lib64/libpython2.6.so.1.0

79 0x00000030574d7732 في PyEval_EvalCode () من /usr/lib64/libpython2.6.so.1.0

80 0x00000030574f1bac في ؟؟ () من /usr/lib64/libpython2.6.so.1.0

81 0x00000030574f1c80 في PyRun_FileExFlags () من /usr/lib64/libpython2.6.so.1.0

82 0x00000030574f316c في PyRun_SimpleFileExFlags () من /usr/lib64/libpython2.6.so.1.0

83 0x00000030574ff8a2 في Py_Main () من /usr/lib64/libpython2.6.so.1.0

84 0x000000305681ed5d في __libc_start_main () من /lib64/libc.so.6

85 0x0000000000400649 في _start ()

Bug Report Feedback Needed ✘ Worker Hangs

مصدر

girishbin

التعليق الأكثر فائدة

+1. ضرب هذه المشكلة أيضًا:

لا يزال الكرفس قيد التشغيل ، ولكنه لا يعالج المهام
يظهر strace أنه محظور على recvfrom
رؤية cmd=NULL في Redis للاتصال

ericholscher في ١٤ أغسطس ٢٠١٨

👍2

ال 45 كومينتر

عالق في قراءة الأنبوب.

proc] # ls -l / proc / 8401 / fd
مجموع 0
lr-x ------ 1 dsl dsl 64 May 5 17:26 0 -> pipe: [124716100]
l-wx ------ 1 dsl dsl 64 May 5 17:26 1 -> pipe: [124716101]
lr-x ------ 1 dsl dsl 64 May 5 17:26 10 -> pipe: [124716464]
l-wx ------ 1 dsl dsl 64 May 5 17:26 13 -> pipe: [124716465]

girishbin في ٥ مايو ٢٠١٥

تضمين التغريدة

متى يحدث هذا عادة؟
كيف يبدو سجل العامل؟
هل هناك أيضًا الكثير من استخدام وحدة المعالجة المركزية أو مجرد استهلاك للذاكرة؟

joostdevries في ٨ مايو ٢٠١٥

هل تستخدم redis كوسيط؟ رؤية أعراض مماثلة مع سمسار redis على الكرفس 3.1.8 والبلياردو 3.3.0.16. على الرغم من عدم استهلاك ذاكرة عالية.

idealopamp في ٢٢ مايو ٢٠١٥

كذلك هنا. joostdevries يحدث هذا كثيرًا لنا ، ويصعب تحديد الظروف. لدينا 4 عمال يستخدمون خلفية redis.

يقوم العمال بتسجيل الدخول قبل أن يكونوا عالقين:

[2015-08-07 16:50:40,140: INFO/MainProcess] Task feeds.transformers.rss_atom.by[6dbd5f0d-222b-4c5c-bd22-5e05bb63447b] succeeded in 0.0153002970037s: {}
[2015-08-07 16:50:40,141: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[8a582425-456d-4e49-93c8-eb375967cac5]
[2015-08-07 16:50:40,155: INFO/MainProcess] Task feeds.transformers.rss_atom.by[3f60a721-2a6e-4494-bda7-b7b939efe66a] succeeded in 0.00693402900652s: {}
[2015-08-07 16:50:40,157: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[486cc62d-d330-467f-b30c-02005c2038b6]
[2015-08-07 16:50:40,171: INFO/MainProcess] Task feeds.transformers.rss_atom.by[8a582425-456d-4e49-93c8-eb375967cac5] succeeded in 0.0071912699932s: {}
[2015-08-07 16:50:40,173: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[538a71a6-0c33-494a-adfe-575f7465e9d4]
[2015-08-07 16:50:40,188: INFO/MainProcess] Task feeds.transformers.rss_atom.by[486cc62d-d330-467f-b30c-02005c2038b6] succeeded in 0.0155014329939s: {}
[2015-08-07 16:50:40,189: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[2ad9294a-7553-468a-a3dc-73a8f2cea188]
[2015-08-07 16:50:40,203: INFO/MainProcess] Task feeds.transformers.rss_atom.by[538a71a6-0c33-494a-adfe-575f7465e9d4] succeeded in 0.0153862849984s: {}
[2015-08-07 16:50:40,205: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[f7371090-aa05-4194-a327-cb41d1165b7e]
[2015-08-07 16:50:40,220: INFO/MainProcess] Task feeds.transformers.rss_atom.by[2ad9294a-7553-468a-a3dc-73a8f2cea188] succeeded in 0.0158518639946s: {}
[2015-08-07 16:50:40,222: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[6d35c0b2-9c5a-425f-9405-9f7e1fb3aa41]
[2015-08-07 16:50:40,236: INFO/MainProcess] Task feeds.transformers.rss_atom.by[f7371090-aa05-4194-a327-cb41d1165b7e] succeeded in 0.00751440098975s: {}
[2015-08-07 16:50:40,238: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[ed664157-a065-4b15-9bbe-633edf96d230]
[2015-08-07 16:50:40,252: INFO/MainProcess] Task feeds.transformers.rss_atom.by[6d35c0b2-9c5a-425f-9405-9f7e1fb3aa41] succeeded in 0.00709322700277s: {}
[2015-08-07 16:50:40,254: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[683bc593-44c1-4145-b698-1f2ba66a43bd]
[2015-08-07 16:50:40,260: INFO/MainProcess] Task feeds.transformers.rss_atom.by[ed664157-a065-4b15-9bbe-633edf96d230] succeeded in 0.015573162993s: {}
[2015-08-07 16:50:40,275: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[d8018f2b-a1f0-4112-97ba-335cd597be1c]
[2015-08-07 16:50:40,282: INFO/MainProcess] Task feeds.transformers.rss_atom.by[683bc593-44c1-4145-b698-1f2ba66a43bd] succeeded in 0.0205264859978s: {}
[2015-08-07 16:50:40,292: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[92f938ce-894a-49f4-8c89-a090c37b71c8]
[2015-08-07 16:50:40,299: INFO/MainProcess] Task feeds.transformers.rss_atom.by[d8018f2b-a1f0-4112-97ba-335cd597be1c] succeeded in 0.016343981988s: {}
[2015-08-07 16:50:40,302: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[ff12882d-61b8-403e-97ac-b096580de5f0]
[2015-08-07 16:50:40,318: INFO/MainProcess] Task feeds.transformers.rss_atom.by[92f938ce-894a-49f4-8c89-a090c37b71c8] succeeded in 0.0184662840038s: {}
[2015-08-07 16:50:40,330: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[3e0ff326-cd83-4d88-8dee-f9c167a44f6a]
[2015-08-07 16:50:40,338: INFO/MainProcess] Task feeds.transformers.rss_atom.by[ff12882d-61b8-403e-97ac-b096580de5f0] succeeded in 0.0187683639961s: {}
[2015-08-07 16:50:40,341: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[f12efd44-b2be-42fd-8872-5c979421bea3]
[2015-08-07 16:50:40,357: INFO/MainProcess] Task feeds.transformers.rss_atom.by[3e0ff326-cd83-4d88-8dee-f9c167a44f6a] succeeded in 0.0182138609962s: {}
[2015-08-07 16:50:40,359: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[57d8ba02-db1f-40d4-88f9-1d3d83939c2a]
[2015-08-07 16:50:40,374: INFO/MainProcess] Task feeds.transformers.rss_atom.by[f12efd44-b2be-42fd-8872-5c979421bea3] succeeded in 0.0165290409932s: {}
[2015-08-07 16:50:40,385: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[8ae76799-d19d-4acf-b2b4-cfe9d77e3000]
[2015-08-07 16:50:40,393: INFO/MainProcess] Task feeds.transformers.rss_atom.by[57d8ba02-db1f-40d4-88f9-1d3d83939c2a] succeeded in 0.0185826079978s: {}
[2015-08-07 16:50:40,405: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[ca5e9d23-f660-4f88-b7d1-d30b91750727]
[2015-08-07 16:50:40,414: INFO/MainProcess] Task feeds.transformers.rss_atom.by[8ae76799-d19d-4acf-b2b4-cfe9d77e3000] succeeded in 0.0205218030023s: {}
[2015-08-07 16:50:40,417: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[5cfdbbe8-3da1-45b5-b83e-599303ad02eb]
[2015-08-07 16:50:40,433: INFO/MainProcess] Task feeds.transformers.rss_atom.by[ca5e9d23-f660-4f88-b7d1-d30b91750727] succeeded in 0.0175381449953s: {}
[2015-08-07 16:50:40,436: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[cb864c28-b3c5-4def-a5de-8c15049c6d29]
[2015-08-07 16:50:40,453: INFO/MainProcess] Task feeds.transformers.rss_atom.by[5cfdbbe8-3da1-45b5-b83e-599303ad02eb] succeeded in 0.0190771400084s: {}
[2015-08-07 16:50:40,456: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[cc85e444-7969-45ed-98a4-f9ab074db260]
[2015-08-07 16:50:40,473: INFO/MainProcess] Task feeds.transformers.rss_atom.by[cb864c28-b3c5-4def-a5de-8c15049c6d29] succeeded in 0.0191195910011s: {}
[2015-08-07 16:50:40,476: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[4696c784-819d-4278-87fd-b74c2aab4c57]
[2015-08-07 16:50:40,491: INFO/MainProcess] Task feeds.transformers.rss_atom.by[cc85e444-7969-45ed-98a4-f9ab074db260] succeeded in 0.0098425810138s: {}
[2015-08-07 16:50:40,494: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[bce5ad3e-dd4a-4bbc-bb69-9585597ae010]
[2015-08-07 16:50:40,501: INFO/MainProcess] Task feeds.transformers.rss_atom.by[4696c784-819d-4278-87fd-b74c2aab4c57] succeeded in 0.0174191809929s: {}
[2015-08-07 16:50:40,512: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[cfefb0bb-399c-423e-9032-add27dabd6df]
[2015-08-07 16:50:40,526: INFO/MainProcess] Task feeds.transformers.rss_atom.by[bce5ad3e-dd4a-4bbc-bb69-9585597ae010] succeeded in 0.0162074130058s: {}
[2015-08-07 16:50:40,528: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[51f11154-3dbc-448a-a3a4-00c2fe7ab782]
[2015-08-07 16:50:40,543: INFO/MainProcess] Task feeds.transformers.rss_atom.by[cfefb0bb-399c-423e-9032-add27dabd6df] succeeded in 0.0163563999959s: {}
[2015-08-07 16:50:40,545: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[fb900a0c-403f-4941-aa6a-f242312e5d85]
[2015-08-07 16:50:40,560: INFO/MainProcess] Task feeds.transformers.rss_atom.by[51f11154-3dbc-448a-a3a4-00c2fe7ab782] succeeded in 0.0162344239943s: {}
[2015-08-07 16:50:40,563: INFO/MainProcess] Received task: feeds.transformers.rss_atom.by[330fff18-71e0-4d9e-9ad1-0111d44f7e03]

لا استخدام وحدة المعالجة المركزية واستخدام الذاكرة (الإخراج من الأعلى):

31059 celery    20   0  517176  64388   3456 S  0.0  1.7   0:14.86 celery                                                                                                                                                                                   
31058 celery    20   0  517204  64308   3456 S  0.0  1.7   0:14.32 celery                                                                                                                                                                                   
31062 celery    20   0  517044  64308   3456 S  0.0  1.7   0:14.88 celery                                                                                                                                                                                   
31061 celery    20   0  516912  63508   3064 S  0.0  1.7   0:14.32 celery                                                                                                                                                                                   
31046 celery    20   0  369344  63396   6964 S  0.0  1.7   1:09.70 celery                                                                                                                                                                                   
16967 celery    20   0  366648  57396   7612 S  0.0  1.6   0:04.04 celery

domenkozar في ٧ أغسطس ٢٠١٥

سيحاول تعيين BROKER_TRANSPORT_OPTIONS = {'socket_timeout': 10} ومعرفة ما إذا كان ذلك مفيدًا.

domenkozar في ٢ سبتمبر ٢٠١٥

domenkozar هل ساعدت؟

dtao في ٢ سبتمبر ٢٠١٥

راجع https://github.com/andymccurdy/redis-py/issues/306

domenkozar في ٣ سبتمبر ٢٠١٥

ربما لا:

[root@ip-172-30-0-183 ec2-user]# lsof -p 9253|grep 6379
celery  9253 celery   10u     IPv4            2738405       0t0      TCP ip-172-30-0-183.ec2.internal:37155->ip-172-30-3-169.ec2.internal:6379 (ESTABLISHED)
celery  9253 celery   23u     IPv4            2737905       0t0      TCP ip-172-30-0-183.ec2.internal:37090->ip-172-30-3-169.ec2.internal:6379 (ESTABLISHED)
celery  9253 celery   33u     IPv4            2737956       0t0      TCP ip-172-30-0-183.ec2.internal:37098->ip-172-30-3-169.ec2.internal:6379 (ESTABLISHED)
celery  9253 celery   36u     IPv4            2737990       0t0      TCP ip-172-30-0-183.ec2.internal:37105->ip-172-30-3-169.ec2.internal:6379 (ESTABLISHED)
celery  9253 celery   46u     IPv4            2739860       0t0      TCP ip-172-30-0-183.ec2.internal:37297->ip-172-30-3-169.ec2.internal:6379 (ESTABLISHED)
[root@ip-172-30-0-183 ec2-user]# lsof -p 9253|grep CLOSE_WAIT
celery  9253 celery   11u     IPv4            2739163       0t0      TCP ip-172-30-0-183.ec2.internal:45206->wordpress.com:http (CLOSE_WAIT)
celery  9253 celery   16u     IPv4            2737802       0t0      TCP ip-172-30-0-183.ec2.internal:53865->205.251.242.33:https (CLOSE_WAIT)
celery  9253 celery   32u     IPv4            2764510       0t0      TCP ip-172-30-0-183.ec2.internal:48242->ec2-52-2-102-195.compute-1.amazonaws.com:http (CLOSE_WAIT)
celery  9253 celery   37u     IPv4            2739073       0t0      TCP ip-172-30-0-183.ec2.internal:45198->wordpress.com:http (CLOSE_WAIT)
celery  9253 celery   38u     IPv4            2738052       0t0      TCP ip-172-30-0-183.ec2.internal:36962->230-156-220-74-available.ilandcloud.com:http (CLOSE_WAIT)
celery  9253 celery   39u     IPv4            2738313       0t0      TCP ip-172-30-0-183.ec2.internal:46067->qb-in-f118.1e100.net:http (CLOSE_WAIT)
celery  9253 celery   40u     IPv4            2739202       0t0      TCP ip-172-30-0-183.ec2.internal:43252->r2.ycpi.vip.dcb.yahoo.net:http (CLOSE_WAIT)
celery  9253 celery   42u     IPv4            2739382       0t0      TCP ip-172-30-0-183.ec2.internal:45228->wordpress.com:http (CLOSE_WAIT)
celery  9253 celery   43u     IPv4            2739488       0t0      TCP ip-172-30-0-183.ec2.internal:38920->wordpress.com:http (CLOSE_WAIT)
celery  9253 celery   45u     IPv4            2739667       0t0      TCP ip-172-30-0-183.ec2.internal:57721->ec2-54-165-198-100.compute-1.amazonaws.com:https (CLOSE_WAIT)

domenkozar في ٣ سبتمبر ٢٠١٥

تُظهر Flower جميع العمال على أنهم غير متصلون بالإنترنت ، ويبدو أن العمال ينتظرون فقط مهمة ما.

domenkozar في ٣ سبتمبر ٢٠١٥

فرضية جديدة: أعتقد أن السبب الرئيسي وراء ذلك هو أن ذاكرة redis نفدت (هناك بعض آثار OOM) ، وأن السيد غير قادر على إرسال مهام جديدة إلى العاملين.

domenkozar في ٣ سبتمبر ٢٠١٥

تبدو الدعامة التي تراها طبيعية بالنسبة لي ، ألا تنتظر فقط المزيد من المهام؟ أعتقد أنه من المحتمل أنه تم إرسال بيانات غير كاملة (مع ملاحظة وجود شيء ما في المخزن المؤقت)

ask في ٤ سبتمبر ٢٠١٥

نعم ، يبدو أن العمال ينتظرون المزيد من المهام ، لذلك هناك شيء ما يحدث مع عملية الكرفس الرئيسية. تحتوي قائمة انتظار المهام على 100 ألف عنصر.

domenkozar في ٤ سبتمبر ٢٠١٥

لذلك قمت بمسح قائمة انتظار redis celery ونبض الكرفس في العملية الرئيسية لا يقوم بجدولة مهام جديدة. بالنظر إلى gdb ، فإنه يفعل ما يجب عليه:

(gdb) py-list
 115            buf.seek(self.bytes_written)
 116            marker = 0
 117
 118            try:
 119                while True:
>120                    data = self._sock.recv(socket_read_size)
 121                    # an empty string indicates the server shutdown the socket
 122                    if isinstance(data, bytes) and len(data) == 0:
 123                        raise socket.error(SERVER_CLOSED_CONNECTION_ERROR)
 124                    buf.write(data)
 125                    data_length = len(data)

domenkozar في ٤ سبتمبر ٢٠١٥

Aha ، وجدت أي اتصال كان هو المشكلة ، من CLIENT LIST :

id=497 addr=172.30.0.183:45591 fd=20 name= age=1142 idle=1142 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=0 qbuf-free=0 obl=0 oll=0 omem=0 events=r cmd=NULL