Terraform-aws-github-runner: لا يبلغ Scale Up lambda عن أي أخطاء ولكنه لا يقوم بتدوير عداء جديد

تم إنشاؤها على ١ مارس ٢٠٢١  ·  15تعليقات  ·  مصدر: philips-labs/terraform-aws-github-runner

تسجل lambda التوسعة استدعائها إلى Cloudwatch مع عدم وجود أي شيء غير طبيعي في الإخراج - على الأقل لا يوجد شيء من الواضح أنه خطأ - ولكن لم يتم إنشاء حالات جديدة وتظل الوظائف في قائمة الانتظار. بسبب عدم وجود خطأ ، أنا عالق قليلاً فيما يتعلق بالمكان الذي يجب أن أبحث فيه بعد ذلك.

START RequestId: b6d27abc-24a7-5f67-a7a9-220b3a8f2e0a Version: $LATEST
--
{
Records: [
{
messageId: 'c5118c89-b1db-4a81-9fd1-c3211020f447',
receiptHandle: 'AQEBVpllIHtC29mzlvsdPt7y3HfIZHfGThi4dwb2ecHzqupGCRBtFBVFWNa9KKd7M3VwcyiVf6/uqKh/czW305hG9gkqvsnnDj1sdUIqXdzky6+z8ZJnylM/ekUA1bmv7bJna0K5Gbkr+2p1o5UcRoaZnr1EfijnlxabX2ft2JyxNvhVEjVJGEhJMOwIJmXnzlelKAqGh0gz+jde1hecenob2hS9aKEf+8pk6kJViSC0jZvb9S1hcBfHoNTsmP5z45+WzeyTeFDmcO3QmAeIsl4cj4fCwimpQvV1OyE8oBZ5QjE=',
body: '{     "id": 2005872726,     "repositoryName": "redacted",     "repositoryOwner": "redacted",     "eventType": "check_run",     "installationId": 15044875 }',
attributes: {
ApproximateReceiveCount: '1',
SentTimestamp: '1614617562674',
SequenceNumber: '18860086169754095872',
MessageGroupId: '2005872726',
SenderId: 'AROAYDZX6OHXHIADI55JV:gh-ci-webhook',
MessageDeduplicationId: '47a99738074ab0818b7881eee096ec21a5b82226764304d9ab69d90ff39ea349',
ApproximateFirstReceiveTimestamp: '1614617592695'
},
messageAttributes: {},
md5OfBody: 'd5e6cdc10ecd1a37128c56a1ed6bb90f',
eventSource: 'aws:sqs',
eventSourceARN: 'arn:aws:sqs:eu-west-1:redacted:gh-ci-queued-builds.fifo',
awsRegion: 'eu-west-1'
}
]
}

هل لدي احد اى افكار؟

التعليق الأكثر فائدة

كنت في v0.10.0 لذا لم يكن لدي الكثير من الأمل ، ولكن يبدو أن الإصدار v0.11.0 يصلح المشكلة. غريب!

ال 15 كومينتر

أرى الأمر نفسه من ناحيتي وأشك في أنه مرتبط بحادث الأداء المتدهور الأخير لإجراءات GitHub.

عند محاولة تصفية قائمة مهام سير العمل في قائمة الانتظار في الريبو الخاص بنا ، حصلنا على الخطأ التالي وقائمة فارغة عندما يكون من الواضح وجود مهام سير عمل في قائمة الانتظار:
We are having problems searching workflow runs. The results may not be complete.

أعتقد أن لامدا تعتمد على هذا لإرجاع مهام سير العمل في قائمة الانتظار لتدوير مثيل.

رؤية نفس الشيء بالضبط fwiw.

كنت أحاول معرفة ما إذا كانت هناك طريقة سهلة لفرض توسيع النطاق يدويًا. يبدو أن التهيئة الخاملة يتم فحصها فقط أثناء عمليات خفض النطاق؟ أنا لست على دراية بالرمز لذا ربما فاتني شيء ما.

لقد أمضيت بعض الوقت في حل مشكلة مماثلة ، ووجدت أن العلامات المطلوبة لـ EC2 حسب السياسة كانت تتسبب في فشلها. تمكنت من العثور عليه من خلال النظر في أخطاء CloudTrail API.

شكرا لردودكم حتى الآن ، الجميع.

rlove لا يمكنني العثور على أي شيء في Cloudtrail يشير إلى أن مقياس lambda يفعل أي شيء على الإطلاق ، خطأ أو غير ذلك.
samgiles نعم كان هذا شيئًا كنت أبحث عنه أيضًا ؛ لم أستطع (في وقت محدود ، باعتراف الجميع) صياغة حدث اختبار من شأنه أن يجبر مقياس لامدا على العمل.
@ eky5006 سيكون ذلك منطقيًا ، لكنني ما زلت أرى نفس المشكلة ووفقًا لـ https://www.githubstatus.com/incidents/xn0sd2x4nd7f تم حل المشكلة. هل ترى أي شيء أفضل في نهايتك؟

لدي نفس المشكلة.
INFO Repo < repo name > has 0 queued workflow runs بالرغم من وجود وظائف في قائمة الانتظار. وترجع واجهة برمجة التطبيقات https://docs.github.com/en/rest/reference/actions#list -workflow-run-for-a-repository هذه مهام سير العمل في قائمة الانتظار بشكل صحيح.
بدأ الأمر بالأمس ولم ينجح حتى الآن.

INFO Repo < repo name > has 0 queued workflow runs

bartoszjedrzejewski أين ترى هذا الناتج؟

rjcoupe في توسيع نطاق سجلات Cloudwatch. ما هو الإصدار الذي تستخدمه؟ أعتقد أن السبب هو أنني على 0.8.1. أحاول التحديث الآن. زميلي ليس لديه هذه المشكلة ، فهو في 0.10

كان لدي نفس المشكلة ، ترك انقطاع التيار بعض العدائين المسجلين باقية. لقد ألغيت تسجيلهم من منظمة GitHub الخاصة بي والآن يتوسع المتسابقون كما هو متوقع.

أتمنى أن يساعد هذا شخص ما.

أدى تحديث lambdas من 0.8.1 إلى 0.11.0 إلى إصلاح مشكلتي.

مرحبًا ، لقد واجهنا نفس المشكلة بالأمس وتم حلها أيضًا بترقية lambdas من 0.8.1 إلى 0.10.0.

كنت في v0.10.0 لذا لم يكن لدي الكثير من الأمل ، ولكن يبدو أن الإصدار v0.11.0 يصلح المشكلة. غريب!

gertjanmaas أي فكرة ، يبدو أنها تتعلق بانقطاع التيار الكهربائي أمس.

يمكن أن تكون مرتبطة بانقطاع الكهرباء أمس. في حالتنا ، لم ترسل مستودعات معينة حدثًا إلى webhook ، مما تسبب في وضع الوظائف في قائمة الانتظار وعدم إنشاء مثيل ، ولكن يمكن أن يكون قد أثر على أي من واجهات برمجة التطبيقات التي نستخدمها.

تم إصلاح الانقطاع ، لذا إذا كان هذا هو السبب فيجب حل ذلك.

لا ، إنه يحدث مرة أخرى اعتبارًا من هذا الصباح بدون إجراء أية تغييرات على موارد AWS. يبدو أن السلوك الصحيح كان صدفة.

لقد علمنا للتو أننا رأينا مشاكل متقطعة مع جميع الإجراءات اليوم وليس فقط المتسابقون الديناميكيون المستضافون ذاتيًا. أعتقد أن هناك مشكلات استقرار تحدث على GitHub.

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات