Grafana: نظام تنبيه المبنى لجرافانا

تم إنشاؤها على ٢٢ يونيو ٢٠١٥  ·  294تعليقات  ·  مصدر: grafana/grafana

مرحبا جميعا،
انضممت مؤخرًا إلى raintank وسأعمل مع torkelo و mattttt وأنت على دعم تنبيه لـ Grafana.

من نتائج استطلاع مستخدم Grafana ، من الواضح أن التنبيه هو الميزة الأكثر شيوعًا التي يتم تجاهلها في Grafana.
لقد عملت على / مع عدد قليل من أنظمة التنبيه في الماضي (nagios ، bosun ، Graph-explorer ، etsy's kale stack ، ...) وأنا متحمس للفرصة المتاحة أمامنا:
يمكننا أن نأخذ أفضل الأنظمة المذكورة ، ولكن نجمعها مع تركيز Grafana على تجربة مستخدم مصقولة ، مما ينتج عنه نظام تنبيه قوي ومتكامل بشكل جيد وسلس للعمل معه.

بادئ ذي بدء ، مزامنة المصطلحات:

  • التنبيه: تنفيذ المنطق (تدقيق العتبة أو أكثر تقدمًا) لمعرفة حالة الكيان. (حسنًا ، تحذير ، حاسم)
  • الإخطارات: رسائل البريد الإلكتروني ، والرسائل النصية ، والمشاركات إلى الدردشة ، وما إلى ذلك لتوعية الناس بتغيير الحالة
  • المراقبة: يغطي هذا المصطلح كل شيء عن المراقبة (جمع البيانات ، التصورات ، التنبيه) لذلك لن أستخدمه هنا.

أريد تحديد المتطلبات وأفكار التنفيذ الممكنة ومزاياها / سلبياتها. من خلال ملاحظاتك ، يمكننا ضبط وصقل واختيار اتجاه معين.

أفكار عامة:

  • التكامل مع الأدوات الموجودة مقابل المضمنة: هناك بعض أنظمة التنبيه القوية الموجودة (bosun ، kale) التي تستحق التكامل.
    العديد من أنظمة التنبيه أكثر أساسية (حدد التعبير / العتبة ، احصل على إشعار عند الاختراق) ، بالنسبة لأولئك الذين يبدو أن التكامل لا يستحق العناء (على الرغم من أنني لن أوقفك)
    عمليات الدمج هي جهد طويل الأمد. أعتقد أن الفاكهة المتدلية ("تلبي 80٪ من الاحتياجات بنسبة 20٪ من الجهد") يمكن تلبيتها بنظام
    يرتبط ارتباطًا وثيقًا بـ Grafana ، أي تم تجميعه في ثنائي grafana.
    ومع ذلك ، فإن الكثير من الناس يخلطون بين فصل المخاوف و "يجب أن تكون الخدمات مختلفة".
    إذا كانت الشفرة عاقلة ، فسيتم فصلها عن الحزم ولكن لا يوجد شيء خاطئ بالضرورة في تجميعها معًا. على سبيل المثال ، يمكنك تشغيل:

    • 1 grafana binary الذي يفعل كل شيء (grafana كما تعرفه + جميع ميزات التنبيه) من أجل البساطة

    • ثنائيات grafana المتعددة في أوضاع مختلفة (حالات التصور وحالات التنبيه) حتى الإعدادات المتاحة / الزائدة عن الحاجة إذا كنت ترغب في ذلك ، باستخدام قائمة انتظار عمال خارجية

ومع ذلك ، لا نريد إعادة اختراع العجلة: نريد أن تتكامل التعليمات البرمجية التنبيهية والوظائف بشكل جيد مع Grafana ، ولكن إذا كانت الشفرة عالية الجودة متوافقة ، فيجب علينا استخدامها. في الواقع ، لدي نموذج أولي يستفيد من بعض كود bosun الموجود. (انظر "الحالة الحالية")

  • الاقتراع مقابل معالجة الدفق: لديهم خصائص أداء مختلفة ،
    ولكن يجب أن يكونوا قادرين على أخذ نفس تعريفات قواعد التنبيه أو ما شابهها (العتبات ، والمنطق المنطقي ، ..) ، فهم في الغالب يتعلق بكيفية تنفيذ القواعد الفعلية ولا
    يغير الكثير حول كيفية تعريف القواعد. نظرًا لأن الاقتراع أبسط بكثير ويجب أن يكون قادرًا على التوسع إلى حد بعيد ، فيجب أن يكون تركيزنا الأولي على IMHO.

الوضع الحالي

يحتوي إصدار raintank / grafana حاليًا على حزمة تنبيه
مع جدولة بسيطة ، وحافلة عاملة قيد التشغيل بالإضافة إلى rabbitmq ، ومنفذ تنبيه وإشعارات عبر البريد الإلكتروني.
يستخدم مكتبات تعبير bosun التي تمنحنا القدرة على تقييم التعبيرات المعقدة بشكل تعسفي (استخدام العديد من المقاييس ، واستخدام المنطق المنطقي ، والرياضيات ، وما إلى ذلك).
هذه الحزمة خاصة بـ raintank حاليًا ولكننا سندمج نسخة عامة من هذا في المنبع grafana. سيوفر هذا نظامًا أساسيًا لتنفيذ التنبيه ولكن لا يزال مفقودًا بشكل خاص

  1. واجهة لإنشاء وإدارة قواعد التنبيه
  2. إدارة الدولة (إقرارات إلخ)

هذه مشكلات أصعب ، وآمل أن أعالجها بمدخلاتك.

المتطلبات والتطبيقات المستقبلية

أولاً ، أعتقد أن نظام bosun هو نظام رائع للتنبيه (ليس كثيرًا
يمكنك جعل قواعد التنبيه الخاصة بك متقدمة كما تريد ، وتمكنك من الضبط بمرور الوقت ، والاختبار الخلفي للبيانات التاريخية ، حتى تتمكن من الحصول عليها بالشكل الصحيح.
ولديها آلة دولة جيدة.
من الناحية النظرية ، يمكننا فقط تجميع bosun مباشرة في grafana ، والاستفادة من bosun عبر REST api بدلاً من Golang api ، ولكن بعد ذلك لدينا تحكم أقل دقة و
في الوقت الحالي ، أشعر براحة أكبر في تجربة تجربة قطعة قطعة (قطعة تعني حزمة golang) واتخاذ قرار التكامل على أساس كل حالة على حدة. على الرغم من التكامل
قد تبدو مختلفة على الطريق بناءً على الخبرة وعندما نكتشف الشكل الذي نريد أن يبدو عليه التنبيه.

في كلتا الحالتين ، لا نريد فقط تنبيهًا رائعًا. نريد تنبيهات رائعة مقترنة بتصورات رائعة وإشعارات مع سياق وسير عمل سلس حيث يمكنك إدارته
تنبيهاتك في نفس المكان الذي تدير فيه تصوراتك. لذلك يجب أن يتم دمجها بشكل جيد في Grafana. لتحقيق هذه الغاية ، هناك بعض الأشياء التي يجب وضعها في الاعتبار:

  1. لا يتم التنبيه على بعض المقاييس المرئية (المقاييس المرسومة على الرسوم البيانية)
  2. يتم تنبيه بعض المقاييس المرئية على:

    • ج: بفحوصات بسيطة للحد الأدنى: من السهل تصور منطق التنبيه

    • ب: بمنطق أكثر تقدمًا: (على سبيل المثال ، انظر إلى الانحراف المعياري للسلسلة التي يتم رسمها ، قارن الوسيط الحالي بالمتوسط ​​التاريخي ، إلخ): لا يمكن تصور ذلك بسهولة nex

      إلى سلسلة الإدخال

  3. بعض المقاييس المستخدمة في المنطق التنبيه لا يجب أن تكون فيزيائية

في الأساس ، هناك مجموعة من الأشياء التي قد ترغب في تصورها (V) ، ومجموعة من الأشياء التي تريد التنبيهات (A) ، و V و A لها بعض التداخل.
أحتاج إلى التفكير في هذا أكثر قليلاً وأتساءل عما تعتقدونه جميعًا.
ستحتاج بالتأكيد إلى مكان مركزي واحد حيث يمكنك الحصول على نظرة عامة على جميع الأشياء التي تنبه إليها ، بصرف النظر عن مكان تحديد هذه القواعد.

هناك بعض التعقيدات الأخرى التي سأشرحها من خلال رسم مثال لكيفية ظهور التنبيه:
sketch

لنفترض أن لدينا سلسلة زمنية للطلبات (أ) وواحدة للطلبات الخاطئة (ب) وهذا ما نريد رسمه.
ثم نستخدم الحقول C و D و E لوضع أشياء لا نريد التنبيه عليها.
يحتوي C على صيغة نسبة طلبات الخطأ مقابل الإجمالي.

قد نرغب على سبيل المثال في التنبيه (انظر E) إذا كان متوسط ​​هذه النسبة في آخر 5 دقائق مضت أكثر من 1.5 مما كانت النسبة في نفس فترة 5 دقائق الأسبوع الماضي ، وأيضًا
إذا كانت الأخطاء التي شوهدت في آخر 5 دقائق أسوأ من الأخطاء التي شوهدت منذ شهرين قبل وحتى 5 دقائق.

ملحوظات:

  • تستخدم بعض الاستعلامات نطاقات زمنية مختلفة عما يتم تقديمه
  • بالإضافة إلى المعالجة بواسطة tsdb (مثل مجموع الجرافيت () ، القسمة () إلخ التي ترجع السلسلة) نحتاج إلى أن نكون قادرين على تقليل السلسلة إلى أرقام فردية. سهل التنفيذ إلى حد ما (وفي الواقع تقوم مكتبة bosun بهذا من أجلنا حاليًا)
  • نحتاج إلى منطق منطقي (تعطينا bosun هذا أيضًا)
  • في هذا المثال ، يستخدم التعبير فقط المتغيرات المحددة في نفس اللوحة ، ولكن قد يكون من المنطقي تضمين تعبيرات اللوحات / الرسوم البيانية الأخرى.

تأملات أخرى:

  • هل نتكامل مع إعدادات عتبة الرسم البياني الحالية لبرنامج grafana (والتي هي حاليًا للمعالجة فقط ، وليس للمعالجة)؟ إذا كان التعبير هو فحص العتبة ، فيمكننا تلقائيًا
    عرض خط عتبة
  • استخدام الأحرف صعب بعض الشيء ، فهل يمكننا الإشارة إلى الأسماء المستعارة بدلاً من ذلك؟ مثل # طلبات و # أخطاء؟
  • إذا كان التعبير stats.$site.requests و stats.$site.errors ، ونريد أن يكون لدينا مثيلات تنبيه منفصلة لكل موقع (لكن قم بإعداد القاعدة مرة واحدة فقط)؟ ماذا لو أردنا ذلك لعدد قليل من المواقع المختارة. ماذا لو أردنا معايير مختلفة على أساس أي موقع؟ تدعم bosun بالفعل كل هذه الميزات ، ويمكننا كشفها على الرغم من أنه من المحتمل أن نبني واجهة مستخدم حولها.

أعتقد أنه من أجل التنفيذ الأولي ، يمكن أن يحتوي كل رسم بياني على حقلين ، مثل:

warn: - expression
         - notification settings (email,http hook, ..)
crit: - expression
        -notification settings

حيث يكون التعبير مثل ما أضعه في الحرف E في الرسم التخطيطي.
بالنسبة إلى المنطق / البيانات التي لا نريد تصورها ، فنحن فقط نبدل رمز الرؤية.
سوف يحل grafana محل المتغيرات في الصيغة ، وتنفيذ التعبير (مع المنفذ الحالي القائم على bosun). يمكن إدخال النتائج (تغييرات الحالة) في شيء مثل البحث المرن وعرضها عبر نظام التعليقات التوضيحية.

أفكار؟
هل لديك مخاوف أو احتياجات لم أذكرها؟

arealerting

التعليق الأكثر فائدة

تم الآن دمج فرع التنبيه في النظام الرئيسي. : رفع اليدين:

نحن نقدر جميع التعليقات التي تلقيناها من هذه المشكلة. شكرا لكم جميعا !
للمناقشة والتعليقات في المستقبل ، يرجى النشر في قضية التنبيه المقابلة أو إنشاء واحدة جديدة. يساعدنا هذا في تنظيم عملنا المستقبلي وتحديد أولوياته. أنا أغلق هذه التذكرة لصالح البطاقات الجديدة. لكن لا تتردد في متابعة المناقشة في هذه المسألة.

إذا ما هو التالي؟

  • إصدار ألفا (مستندات ومدونة)
  • جمع ردود الفعل من المجتمع.
  • استمر في العمل على المشكلات المتبقية
  • حرر Grafana 4.0 مع التنبيه.

حاول؟

  • يجب عليك تمكين التنبيه في ملف التكوين .
  • يمكنك الآن العثور على تنبيه في القائمة الجانبية.
  • يمكنك إضافة تنبيه بالذهاب إلى لوحة الرسم البياني واختيار علامة تبويب التنبيه.
  • استخدم الزر _Test alert_ للتحقق من تنبيهك.
  • لحفظ التنبيه ، ما عليك سوى حفظ لوحة القيادة.
  • قم بإعداد الإخطار / التنبيه / الإخطارات ليتم إخطارك بإطلاق التنبيهات.
  • أضف المخطر إلى تنبيه في علامة تبويب التنبيه.

القيود الحالية

  • حتى الآن نحن ندعم فقط الجرافيت.
  • بالنسبة لهذا الإصدار ، تدعم لوحة الرسم البياني فقط التنبيه.

مثال على لوحات المعلومات

يمكنك العثور على أمثلة على لوحات المعلومات في مجلد الأمثلة.
تعتمد لوحات المعلومات النموذجية على البيانات المأخوذة من كاتب بيانات الجرافيت المزيف. يمكنك بدء تشغيل الجرافيت وكاتب البيانات المزيفة من ملفات إنشاء عامل الإرساء.

cd docker/
./create_docker_compose.sh graphite
docker-compose up

يجب اعتبار هذا دليلًا تقريبيًا فقط وسنضيف المزيد من الوثائق حول التنبيه في الأسابيع التالية.

تنبيه سعيد! : كوكتيل:: تادا:

ال 294 كومينتر

أود المساعدة في هذا! اقتراحي هو التمسك بإرشادات أسلوب nagios. بهذه الطريقة يمكن بسهولة استخدام الأدوات مع أدوات المراقبة الأخرى. على سبيل المثال Nagios و Zenoss و Icinga وما إلى ذلك.

أهم شيء في هذه الميزة هو الحصول على البنية الأساسية الصحيحة.

بعض الأسئلة أود استكشافها
1) ما هي المكونات المطلوبة كيف يتم تشغيلها (في proc في grafana ، خارج proc) ،
2) كيف ينبغي تنسيق الأمور.
3) هل يجب أن نتجاهل التنبيه "في البث المباشر" (ركز فقط على القائمة على السحب)

التعمق أكثر في 1)
أنا قلق بشأن تحويل خادم grafana إلى وحدة متراصة. هل ترغب في العثور على طريقة لفصل خادم grafana إلى خدمات معزولة أكثر عن بعضها البعض (ويمكن تشغيلها إما inproc أو كعمليات منفصلة). كان هذا نوعًا من الخطة مع تجريد الحافلة. هناك خيار آخر يتمثل في جعل مكون التنبيه يتحدث فقط إلى grafana عبر واجهة برمجة تطبيقات HTTP ، وقد يحد من التكامل ، غير متأكد.

أنا أتفق مع torkelo. في تجربتي مع المشاريع الأخرى مع كل شيء "مدمج" ، يمكن أن يكون استكشاف الأخطاء وإصلاحها مرهقًا للغاية. تعجبني فكرة تشغيل الخدمة خارجيًا ، ولكن صفحة تهيئة لطيفة في grafana تتحدث إلى الخدمة من خلال واجهة برمجة تطبيقات HTTP للتعامل مع إدارة جميع التنبيهات. أيضًا ، بالنسبة لعمليات النشر واسعة النطاق ، من المحتمل أن ينتهي هذا الأمر إلى أن يصبح أحد المتطلبات حيث سيتدهور الأداء في النهاية (سيكون لدي على الأقل هذا كخيار تكوين).

هل نتكامل مع إعدادات عتبة الرسم البياني الحالية لبرنامج grafana (والتي هي حاليًا للمعالجة فقط ، وليس للمعالجة)؟ إذا كان التعبير هو فحص العتبة ، فيمكننا تلقائيًا عرض سطر الحد

أعتقد أن هذا يمكن أن يكون مكانًا جيدًا للبدء. تنبيه إذا تم ضبطه ، فلا تفعل إذا لم يكن كذلك.

العودة إلى الرقم 1. أعتقد أنه إذا كان من الممكن تشغيل خدمة bosun بشكل منفصل ولكن لا تزال لديها القدرة على تكوين كل شيء بشكل كامل من خلال grafana ، فسيكون ذلك ، في رأيي ، مثاليًا.

استمروا في العمل الرائع.

العيب الوحيد الذي رأيته مع bosun هو مصادر البيانات التي يمكنه استخدامها. إذا كان بإمكانك الاستفادة من اللغة للتعبير عن تنبيه bosun ولكنك تتكامل أيضًا مع مصادر البيانات الحالية التي تم تكوينها عبر واجهة مستخدم grafana العادية ، فسيكون ذلك بالتأكيد مثاليًا.

أن تكون قادرًا على تمثيل عتبات التنبيه ، عندما تكون قريبًا منها ، بالإضافة إلى دفع التعليقات التوضيحية تلقائيًا عندما يتم تشغيلها في ذهني ، فإن ذلك يجعل واجهة المستخدم المثالية للجزء الواحد.

نتطلع إلى العمل الذي سيتم القيام به هنا!

  1. يجب أن يستخدم الحدود الدنيا المحددة في لوحة المعلومات للتنبيه بشأن
    دعونا نجعلها بسيطة ؛ إذا كانت لوحة القيادة تعرض اللون للتحذير ، فيجب أن تكون في حالة تنبيه.
  2. من المحتمل أن يكون هذا شيئًا خارج عملية خادم grafana نفسها.
    ... شيء من شأنه أن يستخدم بقية واجهات برمجة التطبيقات لتتخلص من لوحات المعلومات وإعداداتها وعرضها وتنبيهها باستخدام أمر خارجي.
  3. مستوى التنبيه مجرد مربع لإسقاطه في المحرر بحيث يجب مراقبة لوحة التحكم هذه ؛ ويجب فحصه كل دقيقة. إذا لم تكن هناك بيانات ، فيجب أن تظل في حالة تأهب لفترة معينة؟ (مربع اختيار)

أخيرا؛ نظرًا لأننا نعتمد على Grafana أكثر فأنا أعترف أنني على استعداد للقول 2. يمكن أن يكون شيئًا سأكون على استعداد لدفع ثمنه.

لدي فضول لماذا يعتقد الناس أنه يجب تضمين هذا في Grafana على الإطلاق؟
لا يتلقى Grafana ولا يخزن تلك البيانات الفعلية ولكنه يتخيلها "فقط". يجب أن يعتمد أي نظام تنبيه بدلاً من ذلك على البيانات الموجودة في المتجر المتري.
إذا تم دمج هذا بالفعل في Grafana ، آمل أن يتم تعطيله لأننا هنا نستخدم بالفعل Icinga للتنبيه ، لذا فإن أي نوع من التنبيه في Grafana لن يؤدي إلا إلى تشويش واجهة المستخدم الرسومية بشكل أكبر على الرغم من عدم استخدامها على الإطلاق.

صحيح تماماdennisjac ؛ غرافانا يجعل الأشياء فقط.

ولكن نظرًا لأننا نقلنا الأشياء من جانب الخادم ، فلم يعد الأمر مجرد عرض للعميل ؛ إمكانيات عملية عاملة يمكنها التحقق من مقاييسك وتنبيهك ؛ أقل صعوبة.

البيانات في قاعدة بيانات ؛ بشرط أن يتم رشها بالبيانات التي تخبرها بالتحقق من المقياس ...

قد يتفق بعض الأشخاص أو لا يوافقون على أنه لا ينبغي لنا عبور التدفقات وأن نجعل غرافانا يفعل أكثر من تخيلها (تقريبًا) لكنني لست هم.

أنا لا أعارض حقًا الميزة للأشخاص الذين يريدون دمجها ولكن آمل أن تكون اختيارية للأشخاص الذين لديهم بالفعل أنظمة مراقبة / تنبيه متاحة.

يبحث مشروع Telegraf الجديد (المجمع المتري من فريق influxdb) أيضًا في ميزات المراقبة / التنبيه التي لا تحبها لنفس السبب. لقد شرحت هذا هنا:
https://influxdb.com/blog/2015/06/19/Announcing-Telegraf-a-metrics-collector-for-InfluxDB.html#comment -2114821565

أعتقد أن torkelo قام بعمل جيد حقًا في إعطائنا ميزات في Grafana2 لا يتعين علينا تمكينها.

وبقدر ما يتعلق الأمر بالتدفق ، سيتعين عليهم كسب بعض المال بطريقة ما ؛ إما من خلال دعم التدفق والخدمات المهنية أو المنتجات الخاصة به.

هذا الأخير يبدو أكثر قابلية للتطبيق

زاوية أخرى في هذا. يبدو أن هناك دعمًا قادمًا للبحث المرن كمخزن متري لـ grafana. يمكن لـ Bosun الآن الاستعلام عن elasticsearch للحصول على بيانات السجل.

هل من المنطقي عند تصميم نظام التنبيه السماح بالتنبيهات من بيانات السجل أيضًا؟ ربما ليست ميزة للإصدار الأول ، ولكنها شيء يمكن تنفيذه لاحقًا.

كما أنني أتفق مع فكرة تقسيم العمليات. اجعل Grafana الواجهة لعرض التنبيهات وإنشائها ، ولديك شيء آخر يتعامل مع التنبيه. سيسمح وجود جزء التنبيه على أساس api أيضًا للأدوات الأخرى بالتفاعل معها.

+1 للتنبيه. خارج استخدام DevOps ، تحتاج التطبيقات المصممة للمستخدمين النهائيين إلى توفير تنبيهات يحددها المستخدم. من الجيد الحصول عليها في أداة التصور ...

+1 سيؤدي هذا إلى إغلاق الحلقة - اقتراح الحصول على المقاييس.

+1 تنبيه من Grafana + واجهة خلفية متدرجة أفقية من InfluxDB ستجعلها المعيار الذي يجب التغلب عليه في تكوينات التنبيه بالمقاييس

+1 أريد التحجيم الأفقي للتنبيه على عقد غرافانا المتعددة.

سيكون من الرائع أن يربط المرء بين سلوك يشبه "الارتداد" مع التنبيه. على سبيل المثال ، أريد إطلاق تنبيه فقط إذا تجاوزت العتبة المحددة س لـ N من الدقائق.

لقد رأيت هذا مع بعض أدوات التنبيه ، للأسف نحن نستخدم حاليًا Seyren والذي لا يبدو أنه يوفر مثل هذا الخيار. نحن نستخدم Grafana لتطوير لوحة القيادة الخاصة بنا ونتطلع إلى جذب التنبيه إلى Grafana أيضًا. ثابر على العمل الجيد.

لدينا حالتا استخدام:

  • ينشئ فريق البنية التحتية تنبيهًا من خلال أدوات التزويد كالمعتاد في مكدس المراقبة المشترك (فحص مجموعة مشترك أو فحوصات النظام في نظام متوافق مع nagios)
  • ينشئ مطورو البرامج مقاييس التطبيق عبر Grafana

نود أن يكون لدينا نظام تنبيه موحد يتعامل مع التنبيهات واكتشاف الرفرف والتصعيد وجهات الاتصال. يساعدنا ذلك في تسجيل الأحداث / العمليات وربطها بنفس مصدر الحقيقة. لقد حل الكثير من النظام مشكلة التنبيه. آمل أن تتمكن Grafana من القيام بعمل أفضل على المدى الطويل ، وعلى المدى القصير ، فإن عدم إعادة اختراع الأنظمة الحالية سيكون مفيدًا من حيث الإنجازات.

أحد الاقتراحات هو أن Grafana يمكنها توفير واجهة برمجة تطبيقات لاستخراج تعريف المراقبة (حالة التنبيه) ، ويمكن لطرف ثالث المساهمة في مكونات تصدير التكوين. سيكون هذا مثاليًا جدًا في حالة استخدامنا لتصدير تكوين nagios.

والأهم من ذلك ، أود أن أرى بعض الحلول المتكاملة لاكتشاف الشذوذ أيضًا!

في 15 يوليو 2015 ، الساعة 17:40 ، كتب Pierig Le Saux [email protected] :

+1 أريد التحجيم الأفقي للتنبيه على عقد غرافانا المتعددة.

-
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub.

أتفق معactivars. لا أفهم حقًا لماذا يجب أن يتعامل حل لوحة المعلومات مع التنبيه الذي يمثل مشكلة تم حلها إلى حد ما بواسطة الكثير من الأدوات الأخرى ، ومعظمها ناضجة تمامًا. افعل شيئًا واحدًا وافعله جيدًا.

IMHO سيكون من المنطقي التركيز على جزء _ التكامل.

مثال: حدد عتبات التحذير / النقد الديناميكي في grafana (على سبيل المثال في مثال Dieterbe أعلاه) وقم بتوفير واجهة برمجة تطبيقات (REST؟) تُرجع الحالة (عادي ، تحذير ، نقد) لهذا الرسم البياني بالضبط. يمكن لـ nagios و icinga و bosun وما إلى ذلك طلب جميع الرسوم البيانية التي تم تمكين "المراقبة" (ميزة أخرى لواجهة برمجة التطبيقات) ، وتكرارها من خلال الحالات الفردية والقيام بالتنبيهات اللازمة.

في حالتنا ، فإن كتالوجات الخدمة والإجراءات المحددة هي الجزء الصعب - ما الخدمة التي تمثل مدى أهمية الأعمال ، وأين ترسل رسائل البريد الإلكتروني ، وما إلى ذلك ، كما أنك لن تقلق بشأن إدارة المستخدم / المجموعة في grafana التي تمتلكها معظم الشركات بالفعل في مكان مركزي (AD ، LDAP ، Crowd وما إلى ذلك) ومتكامل مع نظام التنبيه.

علينا أيضًا أن نأخذ في الاعتبار أنه على عكس حل لوحة القيادة ، يمكن اعتبار متطلبات الجودة لأداة التنبيه أعلى بكثير من حيث الموثوقية والمرونة والاستقرار وما إلى ذلك مما يخلق جهدًا (اختبارًا) لا ينبغي الاستهانة به.

وأيضًا ماذا عن عمليات التحقق غير ذات الصلة بالسلسلة الزمنية ، مثل الاتصال بخدمة الويب ، أو اختبار اتصال الجهاز ، أو تشغيل البرامج النصية المخصصة ... هل تريد ذلك في grafana أيضًا؟ أعتقد أن تبني bosun سيوفر كل هذا ولكني لست على دراية به حقًا.

من ناحية أخرى ، يمكنني أن أتخيل كيف سيجعل نظام التنبيه البسيط الكثير من المستخدمين سعداء لأنه ليس لديه بديل جيد ، ولكن يمكن حل ذلك ببعض الأمثلة على أنماط التكامل لأدوات التنبيه الأخرى.

بقدر ما أريد من غرافانا أن يحل جميع مشاكلي ، أعتقد أن falkenbt أصاب رأسه بهذه المشكلة.

واجهة برمجة التطبيقات (API) لفضح البيانات المذكورة ، وبعض أعمال السباكة في bosun ، وبعض أنماط التكامل مع منصات التنبيه الشائعة أمر منطقي للغاية.

تهانينا على وظيفتك الجديدة في Raintank @ Dieterbe! لقد كنت أقرأ مدونتك منذ فترة ولديك بعض الأفكار الجيدة حقًا حول المراقبة ، لا سيما فيما يتعلق بالمقاييس ومكانها في التنبيه. أنا واثق من أنك ستجد طريقة جيدة لتنفيذ التنبيه في grafana.

كما قد تتفقون عليه على الأرجح ، فإن الأشخاص الذين يقفون وراء Bosun يقومون بتنبيه الطريق الصحيح إلى حد كبير. الشيء الذي ينقصه Bosun هو التصورات حقًا. أود أن أرى Bosun خلف Grafana UI. إن الجمع بين لوحة معلومات Grafanas وتنبيه bosuns خلف نفس الواجهة من شأنه أن يوفر حل مراقبة رائعًا وكاملاً.

كما أعتقد أنه سيكون من العار أن يتم تفتيت مجتمع مراقبة المصادر المفتوحة بشكل أكبر ، يبدو أن أفكارك حول المراقبة متوافقة حقًا مع أفكار الأشخاص الذين يقفون وراء Bosun. إذا اتحدت ، فأنا متأكد من أن النتيجة ستكون رائعة.

في مكان عملي ، نستخدم Elastic للسجلات / الأحداث وقد بدأنا للتو في استخدام InfluxDB للمقاييس. لقد كنا نستكشف حلولًا مختلفة للمراقبة ونميل حاليًا نحو Bosun. نحن نستخدم Grafana بالفعل للوحات المعلومات ، لكننا نرغب في الوصول إلى جميع معلومات المراقبة الخاصة بنا من خلال نفس الواجهة ، سيكون من الرائع أن تصبح Grafana تلك الواجهة.

استمر في العمل الرائع ، ونتمنى لك التوفيق!

في ظل ذي صلة ، حصلنا على الجزء التنبيه الذي يعمل على التنبيه من خلال دمج grafana مع riemann. كان تمرينًا لطيفًا للتعرف على الأجزاء الداخلية لـ grafana :).

كان هذا أسهل مع riemann لأن التكوين هو مجرد كود clojure. أتخيل أن هذا التكامل سيكون أكثر صعوبة في Bosun.

فيما يلي بعض لقطات الشاشة أثناء العمل
screen shot 2015-07-21 at 7 14 25 pm

screen shot 2015-07-21 at 7 18 52 pm

screen shot 2015-07-21 at 7 30 36 pm

تضمنت التغييرات التي تم إجراؤها على جزء grafana إضافة نقطة نهاية "/ التنبيهات" و "/ subscriptions" وجعلها تتحدث إلى واجهة برمجة تطبيقات صغيرة أخرى موجودة في الأعلى حتى يقوم riemann بعمل crud.

الشيء الجميل هو حقيقة أن التغييرات في تعريفات التنبيه تنعكس على الفور دون الحاجة إلى إرسال SIGHUP إلى riemann. لذا فإن التمكين / التعطيل ، وتعديل الفترة الزمنية لتغييرات الحالة هو مجرد مسألة تغييرها في واجهة المستخدم وجعل هذا التغيير ينتشر إلى riemann.

ما زلت لم أقم بقياس هذا التكامل ولكني لا أعتقد أنه سيكون بهذا السوء. سنقوم بتدوينه بعد تنظيف الكود وبمجرد نشره.

السبب الكامل وراء قيامنا بذلك هو أنه يمكن للأشخاص المضي قدمًا وتعيين هذه التنبيهات والإشعارات من واجهة مستخدم مألوفة جدًا وعدم إزعاجنا لكتابة تكوينات riemann :).

sudharsh يبدو

الكثير من الأفكار الجيدة ، شكراً للجميع.
مستوحاة من بعض التعليقات ومشروع https://github.com/pabloa/grafana-alerts الخاص بـ pabloa ، قررنا التركيز أولاً وقبل كل شيء على واجهة المستخدم
ربما عبر ملف ، أو استدعاء API ، أو قسم في تكوين لوحة القيادة ، أو إدخال في قاعدة البيانات.
(أحب فكرة الحصول عليها كجزء من تعريف لوحة القيادة نفسها ، بحيث يمكن أن تأتي المشروعات مفتوحة المصدر مع ملفات json الخاصة بلوحة معلومات grafana والتي سيكون لها قواعد تنبيه متضمنة على الرغم من أنها ليست بالضرورة نشطة بشكل افتراضي. من ناحية أخرى ، وجودهم في تبدو قاعدة البيانات أكثر قوة)
في كلتا الحالتين ، نريد توفير وصول سهل حتى تتمكن من إنشاء تكوين لأي نظام آخر تريد استخدامه والذي ينفذ بالفعل قواعد التنبيه ويعالج الأحداث. (من هنا سأشير إلى هذا على أنه "معالج").
مثل هذا المعالج يمكن أن يكون nagios ، أو sensu ، أو bosun ، أداة تكتبها أو أداة جدولة تنبيه عباد الشمس وهي معالج يمكنك تجميعه في grafana والذي يوفر تكاملًا لطيفًا وبسيطًا مدعومًا من bosun ولكننا نريد حقًا ذلك تأكد من أنه يمكنك استخدام أي نظام تريده.

طالما أن المعالج الخاص بك يدعم الاستعلام عن مخزن البيانات الذي تستخدمه. سنبدأ بعتبة ثابتة بسيطة ولكن لاحقًا نريد أيضًا تسهيل اختيار وظائف الاختزال والتعبيرات المنطقية بين شروط متعددة وما إلى ذلك.

sudharsh هذا أسلوب لطيف للغاية. يعجبني كيف يمكن للحل الخاص بك التحدث مباشرة إلى واجهة برمجة تطبيقات بعيدة ، متجاوزًا الخطوة المتوسطة الموضحة أعلاه (بالطبع هذا يعني أنه يعمل فقط لخلفية واحدة نحاول تجنبها) ، وأنه يمكنه إعادة تحميل التكوين تلقائيًا. (أنت على حق ، bosun حاليًا لا يدعمها ، وربما في المستقبل. FWIW معالج عباد الشمس يتعامل مع هذه الغرامة ويستخدم آلية تقييم تعبير bosun). أنا حقا لم أدخل في ريمان كثيرا. في الغالب كنت قلقًا بشأن إضافة لغة مختلفة إلى المجموعة التي لا يفهمها كثير من الناس أو يمكنهم تصحيحها عندما تسوء الأمور. لكنني أشعر بالفضول لمعرفة المزيد عن نظامك وعن كود Riemann's CLJ. (أنا أحب ذلك إذا كانت شكوكي غير صحيحة)

dennisjac نعم سيكون اختياريًا.
elvarb هناك تذكرة لـ ES كمصدر بيانات . في الواقع ، الهدف هو أنه إذا كان grafana يدعم عرض البيانات من مصدر بيانات معين ، فيجب أن يدعم أيضًا إنشاء قواعد التنبيه الخاصة به. بالنسبة إلى تنفيذ الاستعلام / الاستعلام ، يعتمد هذا بالطبع على المعالج الذي تقرر استخدامه. (بالنسبة لمعالج عباد الشمس ، سنبدأ بأكثرها شيوعًا مثل الجرافيت و influxdb)
rsetzer : موافق ، إنه لأمر جيد أن تكون قادرًا على تحديد المدة التي يجب تجاوزها قبل أن نبدأ
falkenbt : أعتقد أنه يمكن صياغة العديد من الأشياء على أنها مشكلة استعلام عن سلسلة زمنية (على سبيل المثال ، مثال pings). لكنك على صواب ، فبعض الأشياء ليست مرتبطة بالسلاسل الزمنية حقًا وهذه الأشياء خارج نطاق ما نحاول بنائه هنا. وأعتقد أن هذا أمر جيد: نريد تقديم أفضل طريقة لتهيئة وإدارة التنبيه في السلاسل الزمنية ونهدف إلى التكامل مع الأنظمة الأخرى التي ربما تكون أكثر تحسينًا لحالة "البرامج النصية المتنوعة" (مثل nagios و icinga و sensu و .. .). بالنسبة إلى المخاوف مثل موثوقية التسليم والتصعيد وما إلى ذلك ، يمكنك ربط خدمة مثل pagerduty.
activars & falkenbt هل يبدو أن هذا
@ jemilsson شكرا لك! وهذا هو بالضبط ما أراه: bosun رائع في التنبيه ولكنه ليس جيدًا في التخيل. Grafana رائع في التصور و UX ولكن ليس لديه تنبيه. أحاول قيادة تعاون سينمو بمرور الوقت على ما أعتقد

هل لدى أي شخص أي أفكار حول نوع السياق الذي يجب إرساله في الإشعارات مثل رسائل البريد الإلكتروني؟
على الأقل ، يجب أن يحتوي الإشعار على نموذج للبيانات التي تنبه إليها ، ولكن يجب أن يكون من الممكن تضمين الرسوم البيانية الأخرى ذات الصلة. هنا يمكننا استخدام الخلفية الخلفية لعرض png الخاص بـ grafana عند إنشاء محتوى الإخطار. أفكر أيضًا في الاستفادة من ميزة لقطة grafana. مثل عندما يتم تشغيل تنبيه ، خذ لقطة من لوحة تحكم معينة للسياق.
وربما يمكن تضمين تلك اللقطة (صفحة html) في البريد الإلكتروني ، أو قد يكون هناك الكثير من البيانات / التعقيد. كما أن ميزات جافا سكريبت لن تكون متاحة في عملاء البريد على أي حال (لذلك لن تتمكن من تكبير الرسوم البيانية في رسالة بريد إلكتروني). ربما يمكننا الارتباط من البريد الإلكتروني بلقطة لوحة معلومات مستضافة.

أنا أحب النهج العام لرسو السفن - البطاريات متضمنة ، لكنها قابلة للإزالة. لذا فإن تطبيق التنبيه الأساسي الذي يمكن تبديله سيكون نهجًا جيدًا imho.

سيتم دعم influxdb للتنبيه؟ أو الجرافيت فقط؟

شيء واحد أود رؤيته هو فكرة أشجار التنبيه الهرمية. ببساطة ، هناك العديد من الجوانب التي تتم مراقبتها وحالات التنبيه المستقلة لها علاقة أساسية لا يمكن التحكم فيها. باستخدام شجرة التسلسل الهرمي ، يمكنني تحديد كل هذه التنبيهات ذات المستوى المنخفض والتي تصل إلى تنبيهات المستوى المتوسط ​​والتي تتدحرج إلى مستوى عالٍ ......

على هذا النحو ، يفترض كل تنبيه ملفوف تلقائيًا درجة الخطورة العالية لجميع الأطفال تحته. بهذه الطريقة ، يمكنني الحصول على انطباع عن [وإدارة] صحة النظام بدقة مع مساحة سطح أقل بكثير للتحليل.

هذا مثال استعرته من مستند قديم كتبته منذ فترة. نعم ، من فضلك ضحكة مكتومة بعيدًا عند استخدام كلمة "Struts". انها قديمة طيب؟ يقدم هذا تسلسل هرمي بسيط للغاية لخادم واحد.

image

في مرحلة ما ، استمر الخادم في استخدام 75٪ من وحدة المعالجة المركزية ، لذا فإن هذا ينقل هذه التنبيهات إلى حالة تحذير: CPU- # -> CPU -> Host / OS -> System

image

إذا طبق المرء نفسه حقًا ، يمكن للمرء أن يراقب مركز البيانات بأكمله بمؤشر واحد. (نعم ، ليس حقًا ، لكن هذا بمثابة تمرين فكري)

image

لماذا لا تستخدم منارة الجرافيت ؟ أعتقد أنه يمكنك دمج منارة الجرافيت الخفيفة جدًا مع الجرافانا.

felixbarny أحب هذه المصطلحات. من المحتمل أن نعتمد هذه الصياغة.
JulienChampseix نعم المعالج القياسي سيدعم / سيدعم التدفق
nickman هذا مثير للاهتمام. إنه في الواقع يتماشى مع الهدف النهائي الذي يدور في ذهننا ، وهو القدرة على إنشاء تنبيهات عالية المستوى يمكن أن تتضمن / تعتمد على المزيد من قواعد التنبيه والمعلومات الدقيقة. bosun يقوم بهذا بالفعل ، وعلى المدى الطويل نريد أن نجعل هذه الوظيفة متاحة من خلال واجهة أكثر سهولة في الاستخدام ، ولكن علينا أن نبدأ أكثر بساطة من هذا.
يبدو amirhosseinrajabi كمشروع رائع وأعتقد أن تحويل منارة الجرافيت إلى معالج للتنبيهات التي تم تكوينها من خلال واجهة مستخدم grafana سيكون له معنى كبير.

Dieterbe هل من الممكن الحصول على تحديث للوضع الحالي؟ لنظام التنبيه
من أجل معرفة النظام المتوافق (الجرافيت / التدفق)؟
أي اشتراك متاح؟ ما نوع التنبيه المتاح؟
شكرا لالتحديث.

نعمل حاليًا على إنشاء نماذج أولية لـ UX / UI. لذلك نحن بعيدون تمامًا عن هذا الأمر القابل للاستخدام.

مرحبًا @ Dieterbe

هل هناك اي مستجدات على تقدم نظام التنبيه ؟؟

سيكون من الرائع الحصول على تنبيه في جرافانا! نتطلع إلى هذه الميزة. أي تحديثات الآن؟

mattttt هل يمكنك تقديم تحديث بخصوص عمل UX الخاص بك؟

نعم بالتاكيد. سيتم تحميل بعض الشاشات / تدفقات المستخدم غدًا.

نحتاج إلى التنبيه: واجهة المستخدم لتعريف القاعدة وواجهة برمجة التطبيقات لتعريف القاعدة وواجهة برمجة التطبيقات لإشعارات التنبيه. سوف نشاهد هذا الموضوع باهتمام. لدينا نظام متعدد المستأجرين ونحب واجهة مستخدم Grafana والواجهة الخلفية.

نعم ، أنا أيضًا مهتم جدًا وغير صبور لرؤية هذه الميزة الجديدة!
شكرا جزيلا مات! ؛)

2015-08-27 6:49 GMT + 02: 00 andyl [email protected] :

نحتاج إلى التنبيه: واجهة المستخدم لتعريف القاعدة وواجهة برمجة التطبيقات لتعريف القاعدة وواجهة برمجة التطبيقات
لإخطارات التنبيه. سوف نشاهد هذا الموضوع باهتمام.

-
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -135290295.

هناك الكثير من العناصر التي تقع في مكانها داخليًا ، لكنني لم أرغب في ترك هذا الموضوع مهملاً.

هذا أحد نماذج بالحجم الطبيعي للوحة كنت أعمل عليها. يوضح هذا الصحة التاريخية بمرور الوقت ، مع دمج الحالة في تلميح الأداة واستخدام العتبات الحالية المحددة في تكوين اللوحة لتكوين التنبيه.

في هذا المثال ، يتم التنبيه على استعلام واحد مع سلسلة متعددة. يتم تمديد تلميحات الأدوات لإظهار الحالة في وقت التمرير.

image

_ زوجان صغيران من الأسئلة المعلقة _: ما مقدار المعلومات حول إشعار التنبيه الذي يجب إدخاله في تلميح الأداة ، إن وجد - أو هل يجب الوصول إلى هذه المعلومات في مكان آخر بطريقة عرض أكثر تفصيلاً؟ أعتقد أن هذا الأخير في هذا الوقت ، لكن الأمر يستحق السؤال بصوت عالٍ.

التكوين ، شاشات التنبيه ، تدفقات المستخدم قادمة ببطء. الكثير قادم.

mattttt لطيف!

أحب الخط الأخضر والأحمر أسفل الرسم البياني!

هذا يرتبط بحسابات الجهوزية ، أود أن أكون قادرًا على رؤية ذلك كرقم في مكان ما. إجماليات جميع الاستعلامات ولكل مقياس.

حول تلميح الأداة هل تتحدث عن الإحصائيات التي تظهر عندما تحوم فوق السطور؟

mattttt لعنة التي تبدو رائعة. لن أقلق حتى بشأن وضع أي شيء في تلميح الأدوات. خط العتبة وشريط سلامة حالة التنبيه في الأسفل أكثر من كافيين.

لا أطيق الانتظار لرؤية هذا عند الانتهاء!

أنا متحمس لرؤية هذا يتقدم بشكل جيد!

نستخدم حاليًا Grafana + Bosun + OpenTSDB كمكدس المراقبة والتنبيه. أنا أتفق بالتأكيد أنه سيكون من الرائع امتلاك قوة Bosun مع تجربة المستخدم الرائعة لـ Grafana.

فيما يلي مثال على المكان الذي يكون فيه تكوين UX الخاص بتكوين Grafana أفضل من Bosun:

مفهوم

يتم مشاركة حزمة المراقبة الخاصة بنا بين فرق متعددة وخدماتها. يتم نشر مجموعة مختلفة من الخدمات إلى مجموعات / مواقع مختلفة بناءً على مواصفات المشروع. يجب أن يتحمل كل فريق / خدمة المسؤولية عن لوحات المعلومات / التنبيهات الخاصة به.

مقارنة

يمكن لفرق HTTP API من Grafana وضع لوحات المعلومات الخاصة بهم عند نشر خدمتهم. لدى Bosun حاليًا ملف واحد فقط لتخزين التكوين ؛ هذا يجعل من الصعب المشاركة بين الفرق المختلفة وعبر المشاريع المختلفة.

mattttttorkeloDieterbe أي فكرة القطعة التنبيهية (أو إصدار بيتا)؟

صدى ^. هل لديهم إصدار تجريبي أو ألفا لهذا؟ أقوم بالبحث عن حلول تنبيهية ، لكني أرغب في الحصول على شيء مبني في grafana. يمكنني تقديم الكثير من ملاحظات الاختبار.

لا تزال ميزة التنبيه بعد بضعة أشهر في المستقبل ، وما زلنا نصمم نماذج أولية لواجهة المستخدم ونفكر في طرق مختلفة لتنفيذها ، ولكن التقدم يجب أن يتحرك بسرعة أكبر في الشهرين المقبلين حتى نعرف المزيد بعد ذلك

mattttt هل تنوي جعل ألوان شريط الصحة التاريخي

فيما يتعلق بالتنبيه: أنا مهتم جدًا بكيفية حدوث ذلك. لقد قمنا بجمع البيانات وتصورها لفترة من الوقت الآن ، والتنبيه هو شيء نحاول حاليًا اكتشافه. يمكن أن يكون لـ Grafana مكان جميل هناك ، خاصة وأن التصورات موجودة بالفعل. ما الذي أتساءل عنه: إلى أي مدى يجب أن يكون جرافانا أكثر وعيًا بـ "الكيانات" بدلاً من السلاسل المترية للتنبيه؟ يمكنني أن أتخيل نفسي أرغب في تبديل تغيير الحالة المرئية تلقائيًا (فشل فحص ping أو http) أو يدويًا (إجراء الصيانة) لما سيكون في حالتي خادمًا ، بالإضافة إلى التنبيه القائم على المقاييس.

أنا مثير للاهتمام لمعرفة أين يذهب التنبيه في Grafana ، ولكن بالنسبة لأولئك منكم الذين يحتاجون إلى شيء ما الآن ، هناك ملحقات nagios مثل https://exchange.nagios.org/directory/Plugins/System-Metrics/Others/check_graphite_metric/details يمكن أن يطلق تنبيهات عند تجاوز الحدود.

تضمين التغريدة

ما الذي أتساءل عنه: إلى أي مدى يجب أن يكون جرافانا أكثر وعيًا بـ "الكيانات" بدلاً من السلاسل المترية للتنبيه؟ يمكنني أن أتخيل نفسي أرغب في تبديل تغيير الحالة المرئية تلقائيًا (فشل فحص ping أو http) أو يدويًا (إجراء الصيانة) لما سيكون في حالتي خادمًا ، بالإضافة إلى التنبيه القائم على المقاييس.

هذا سؤال جيد وأيضًا شيء تحدثنا عنه قليلاً.
الحل الذي نريد اتباعه على المدى القريب (وربما الطويل أيضًا) هو جعل grafana غير مدرك لمفاهيم المستوى الأعلى هذه. على سبيل المثال ، كمستخدم ، لديك القدرة على ضبط التنبيهات على سلسلة المقاييس ، ومن قواعد التنبيه هذه ، سيتم إنشاء نتائج التنبيه (من المحتمل أن تتضمن سمات أو علامات من أسماء السلاسل) والتي يمكنك من خلالها إنشاء أي كيانات تريدها. هذا شيء يجب أن نفكر فيه أكثر قليلاً ، لكن على سبيل المثال

لنفترض أنك قمت بتعيين تنبيه على غرار movingAverage(cluster1.web-*.cpu.idle,10) < 20 -> warn . سيؤدي هذا إلى التحقق من العتبة على جميع خوادم الويب الخاصة بك في المجموعة المحددة ، وإنشاء تنبيهات لأي انتهاكات مثل movingAverage(cluster1.web-123.cpu.idle,10) is currently 3! .
ربما يمكننا تمكينك من قول "الحقل الأول هو اسم المجموعة ، والثاني هو اسم المضيف" وما إلى ذلك ، بحيث يمكن أن تحتوي التنبيهات على معلومات أفضل.
لكن النقطة المهمة هي أن _النتائج_ التنبيهية تحتوي على المعلومات التي تحتاجها لتحديد الكيان الذي يواجه مشكلات ، ولكنه يقع خارج نطاق grafana. سيكون Grafana أكثر مصدرًا لتكوين قواعد التنبيه ، ويمكن تكوين لوحات معلومات grafana لتحميل التعليقات التوضيحية وما لديك لتصور حالة التنبيهات ، ولكنها لن تحتوي على فكرة عن المفاهيم عالية المستوى مثل المضيفين أو عناقيد المجموعات. أعتقد أن هذا شيء يمكن التعامل معه في معالجات التنبيه

تضمين التغريدة

هناك نوعان من مخاوف المستخدم / المنظمة عند إنشاء ميزة التنبيه:

  • بدء التشغيل مثل ، حيث لا يكون لديهم عمومًا الوقت لبناء حل التنبيه الخاص بهم. كل شيء سيعتمد على غرافانا للتنبيه على المقاييس
  • مؤسسة هندسية راسخة ، ولديها أدوات تنبيه موجودة في المنزل ، وتنبيهات لقواعد العمل مبنية على أساس إشارات التنبيه الدقيقة الأخرى (ستكون Grafana واحدة منها).

يجب أن تعمل Grafana مع ممارسات التشغيل الحالية الراسخة ، وجعلها خارج الدورة يتجاهل هدف التنبيه - الحصول على رؤية واضحة لصحة كيان الأعمال الحرج. من الأفضل أن يكون التنبيه مركزًا للسماح ببناء حالة واضحة للبيئة. سيكون من الضروري السماح لمستخدمي الطاقة الذين يستخدمون واجهة برمجة تطبيقات grafana (أو أي حل آخر) بتصدير قواعد التنبيه إلى أنظمة أخرى.

عند قول التشغيل ، يجب أن يحتوي كل تنبيه اختياريًا على حقل توثيق / رابط لشرح الغرض من التنبيهات والسلوك التاريخي.

activars أعتقد أنني أتفق مع كل ذلك. من وجهة نظري ، نحن نتخذ نهجًا يعزز توصيل grafana ببقية البيئة (بشكل أساسي بفضل فصل الاهتمامات ، مع معالجات قابلة للتوصيل). هل تعتقد أن التصميم المقترح يمكن تحسينه بأي شكل من الأشكال؟

أعتقد أن @ deebs031 يشير إلى نقطة جيدة لم تتم معالجتها كثيرًا "تحتاج التطبيقات
IMHO the graal عبارة عن مراقبة قائمة على مقاييس الخدمة الذاتية ، في حالتي ، تكون Grafana الواجهة الأمامية الرئيسية للأشخاص الذين يرغبون في إلقاء نظرة على المقاييس ، فمن المنطقي تمكينهم من إنشاء تنبيهات لأنفسهم داخل نفس واجهة المستخدم الرائعة.
لقد قمت شخصيًا بتنبيه Sensu استنادًا إلى المقاييس ولكن تقديمه كخدمة ذاتية ليس في الحقيقة قطعة من الكعكة مقارنة بمدى سلاسة الأمر إذا تم دمجه مع Grafana. لقد نظرت أيضًا إلى Cabot لأنه يحتوي على إمكانات تصور ولكن لم يتم بناؤه مع وضع الخدمة الذاتية في الاعتبار ، لذلك لا يمكن استخدامه كما هو.
أنا في جانب "أفعل شيئًا واحدًا جيدًا" ولكني أعتقد أنه في حالة تنبيهات الخدمة الذاتية المعينة استنادًا إلى المقاييس التي تقترن بها هذه الإمكانية مع طبقة تصور المقاييس أمر منطقي للغاية:

  • المستخدم على دراية بواجهة المستخدم بالفعل
  • تمت مصادقة المستخدم حتى يتمكن من إنشاء تنبيهات لنفسه أو أي مخطط أذونات تمكّنه المصادقة
  • يمكن للمستخدم أن يرى الرسوم البيانية التي عادة ما تكون مفيدة للغاية عند إنشاء تلك التنبيهات القائمة على المقاييس

شرائح من عرض grafanacon الخاص بي حول التنبيه:
http://www.slideshare.net/Dieterbe/alerting-in-grafana-grafanacon-2015
يصعب فهمها نوعًا ما بدون سياق ، يجب أن يكون الفيديو عبر الإنترنت في غضون أسبوع تقريبًا ، وسأنشره عندما يكون جاهزًا.

لقد بدأنا الآن في وضع نماذج أولية لطرق تنفيذ نماذج التنبيه / واجهة المستخدم / التعريفات / إلخ. لدينا فكرة جيدة عن سير العمل الرئيسي ، على الرغم من أن هناك نقطة واحدة كبيرة ما زلنا نحاول اكتشافها وهي كيف يجب أن يبدو التكامل مع معالجات التنبيه التابعة لجهات خارجية.
تفكيرنا الحالي هو أنك ستتمكن من استخدام grafana لتعيين العتبات / قواعد التنبيه / تحديد الإخطارات وتصور الحالة التاريخية والحالية لقواعد التنبيه.

الافتراض هو أنك تريد استخدام برنامج التنبيه الذي تختاره (bosun / cabot / sensu / nagios / ...)
لذلك ستكون هناك أداة منفصلة تستعلم عن grafana عبر واجهة برمجة تطبيقات http لاسترداد جميع قواعد التنبيه. يمكن لهذه الأداة بعد ذلك تحديث تكوين bosun / cabot / sensu / nagios / ... ، بحيث يمكنك استخدام برنامج التنبيه الذي تختاره لتشغيل التنبيهات وتنفيذها وإرسال الإخطارات.
لكننا نريد أن نكون قادرين على تصور الحالة الحالية والتاريخية بشكل صحيح ، لذلك إما أن يكون برنامج التنبيه الخاص بك بحاجة إلى أن يكون قادرًا على استدعاء برنامج نصي أو خطاف ويب أو أي شيء لإبلاغ grafana بالحالة الجديدة ، أو سيتعين على grafana الاستعلام عنها. (والذي يبدو مقرفًا ، نظرًا لأن معظم الأدوات لا يبدو أنها تحتوي على واجهات برمجة تطبيقات رائعة)
كل هذا معقد بعض الشيء ولكن يجب أن يكون بهذه الطريقة لدعم الأشخاص الذين من المهم بالنسبة لهم أن يظلوا قادرين على استخدام برنامج التنبيه الذي يختارونه ، أثناء استخدام grafana لتحديد قواعد التنبيه وتصور الحالة.

هل من المهم بالنسبة لك أن تكون قادرًا على استخدام أداة التنبيه الحالية التي تختارها؟

الشيء الآخر الذي نرغب في القيام به ، هو أيضًا كتابة منفذ تنبيه بسيط بأنفسنا ، يقوم بالاستعلام عن grafana api للتنبيهات ، وجدولتها وتنفيذها ، ويقوم بالإشعارات (سيدعم البريد الإلكتروني ، و Slack ، و pagerduty ، وبرنامج نصي مخصص ، و ربما عدد قليل من الآخرين) وتحديث الحالة في grafana مرة أخرى.
سيكون من السهل إلى حد ما الكتابة إلينا ، ويسهل عليك استخدامها ويمكن أن يكون لدينا إمكانية تشغيل تفاعلي رائعة.

هل منفذ التنبيه المدمج (انظر أعلاه) شيء تعتقد أنه سيكون كافيًا للتعامل مع جميع قواعد التنبيه التي أعددتها في grafana؟

هل تريد أيضًا قل مدمج + bosun + ناجيوس ، أو شيء من هذا القبيل؟

jaimegago آمين ؛)

بالنسبة لي ، يبدو الرقم 2 أفضل من حيث أنه يمكنك حقًا تقليل عدد الأشياء التي يجب عليك تكوينها حتى يعمل كل شيء بسلاسة. في الإعداد الحالي لدينا سوف نذهب مع ذلك.

فقط هكذا قيل إذا اختلف الجميع ؛)

تحرير سريع: شرائح رائعة. إذا كان المنتج النهائي يبدو بنصف جودة ذلك فهو مذهل.

+1
أوافق على أن معالج الإشعارات الداخلي مع عمليات الدمج هذه مثالي! لحالة الاستخدام الأكثر شيوعًا.

سأكون سعيدًا لكوني تجريبيًا :) وستكون الشرائح مذهلة!

أعتقد أن آخر مشاركة لـ Dieterbe توضح الأمور قليلاً ، لكنني أردت نشر هذا الرسم التخطيطي السريع لمزيد من التوضيح.

التنبيه في Grafana هو حقًا شيئان ، تكوين تنبيه الخدمة الذاتية (بفضل jaimegago ، لم يكن من

سنقوم بشحن معالج تنبيه Grafana ، ولكننا نوفر أيضًا إطار عمل للتكامل مع برنامج التنبيه الذي تختاره:

alerting-structure-layout

+1 لبناء نوع من الجسور لأنظمة التنبيه الأخرى (ربما يمكننا التفكير في تنفيذ نظام مكون إضافي للتنبيه العام :-))

يمكنك إضافة Prometheus أيضًا في جزء "معالجات التنبيه الخارجية". أول إصدار من Prometheus alertmanager قيد الإنتاج في العديد من الشركات وجاري حاليًا إعادة كتابة كاملة. قد يستخدم SoundCloud Grafana لتكوين التنبيهات ، ولكن بالتأكيد فقط إذا تم استخدام برنامج تنبيه Prometheus كمعالج تنبيه.

grobie ، التقاط جيد ، ثابت في التعليق الأصلي.

mattttt @ Dieterbe هذا رائع! يبدو أنك على طريق "البطاريات المضمنة ولكن القابلة للإزالة" والتي تعد IMHO أفضل ما في العالمين. هل فكرت بالفعل في كيفية تمرير بيانات التفويض إلى معالج التنبيه؟ أفكر في قصة مثل هذه:
بصفتي أحد مستخدمي Grafana ، أود أن يتم تنبيهك عبر _email_ و / أو _pagerduty_ و / أو _foo_ عندما يحدث (تم إنشاء بعض الشروط عبر واجهة مستخدم Grafana للتنبيه).
يجب أن يكون هذا المستخدم قادرًا فقط على إرسال التنبيهات إلى نظام الإشعارات المرخص له ، وهذا مطلب للخدمة الذاتية وسيحتاج إلى معالجته بطريقة ما بطريقة ما. نظرًا لأن Grafana 2 لدينا مصادقة / تخويل من SQL backend + للمستخدمين مع تكامل LDAP ، لذلك لا يبدو أن الحصول على هذه القدرة منذ اليوم الأول للتنبيه أمر بعيد المنال؟
باستخدام Sensu (وهي الأداة التي سأقوم بتوصيلها) ، يجب أن يكون تمرير هدف التنبيه (مثل عنوان البريد الإلكتروني) عبر المعالج مستقيمًا للأمام تمامًا ، ولا يمكنه التحدث عن الآخرين.

تحية للجميع،
يسعدني أن أرى أن هذه التكلفة يتم دفعها إلى الأمام ، لأنني أحب نهج تكوين تنبيه الخدمة الذاتية.

أنا شخصياً لست بحاجة إلى معالج تنبيه محدد. أرغب في رؤية معالج HTTP POST عام ، يتم تشغيله بمجرد إصدار تنبيه. أعتقد أن معظم المشرفين يمكنهم بسرعة بناء شيء قادر على قبول HTTP ثم القيام بكل ما يحتاجون إليه (إرساله إلى nagios ، و riemann ، و younameit). لذلك سأكون سعيدًا بمعالج HTTP الذي يرسل جميع المعلومات حول التنبيه كبيانات JSON.

بالحديث عن التنبيه عبر grafana ، هل تخطط لإضافة شيء مثل اكتشاف الخفقان؟ أم أن هذا أمر يجب أن يعتني به نظام المراقبة الخارجية؟

استمروا في العمل الجيد الرجال!

هتافات

أرغب في رؤية معالج HTTP POST عام ، يتم تشغيله بمجرد إصدار تنبيه. أعتقد أن معظم المشرفين يمكنهم بسرعة بناء شيء قادر على قبول HTTP ثم القيام بكل ما يحتاجون إليه (إرساله إلى nagios ، و riemann ، و younameit)

لذلك إذا تم إطلاق تنبيه (قل "web123 به وحدة معالجة مركزية حرجة خاملة !، القيمة 1 أقل من العتبة 15") ونقوم بعمل http لهذه البيانات ، كيف يمكنك التعامل مع ذلك في nagios؟ تقصد أن nagios سيأخذها كتحقق سلبي للخدمة ، ثم يرسل nagios الإخطارات؟

بالحديث عن التنبيه عبر grafana ، هل تخطط لإضافة شيء مثل اكتشاف الخفقان؟ أم أن هذا أمر يجب أن يعتني به نظام المراقبة الخارجية؟

هذا أيضًا شيء نحتاج إلى التفكير فيه أكثر. يمكن أن يصبح هذا الأمر فوضويًا ، وإذا استخدم الأشخاص شيئًا مثل pagerduty أو flapjack ، فيمكنهم استخدام ذلك لتجميع الأحداث / الضغط على التكرارات ، لذلك نحن نبحث عما إذا كان بإمكاننا تجنب تطبيق ذلك في معالج grafana ، على الرغم من أننا قد نضطر إلى ذلك. لاحظ أيضًا أنه نظرًا لأنك ستتمكن من تعيين التنبيهات على تعبيرات استعلام المقاييس التعسفية ، فسيكون لديك الكثير من القوة لأخذ البيانات السابقة في الاعتبار في التعبير الفعلي ، وبالتالي يمكنك إنشاء إشارة أكثر قوة في التعبير الذي لا يغير الحالة في كثير من الأحيان.

لذلك إذا تم إطلاق تنبيه (قل "web123 به وحدة معالجة مركزية حرجة خاملة !، القيمة 1 أقل من العتبة 15") ونقوم بعمل> http لهذه البيانات ، كيف يمكنك التعامل مع ذلك في nagios؟ تقصد أن nagios سيأخذها كتحقق سلبي للخدمة ، ثم يرسل nagios الإخطارات؟

نوع من. أنا في الواقع أتطلع إلى تنبيه جرافانا للتخلص من ناجيوس. باستخدام معالج HTTP ، تحتاج إلى تكوين عمليات تدقيق سلبية لـ nagios لتتمكن من إرسال النتائج هناك. لكني أود أن يكون grafana هو المصدر الوحيد حيث يمكنك تكوين التنبيه. في حالتنا ، الأشخاص المسموح لهم بإضافة التنبيهات هم مسؤول النظام الفعلي الذي سيقوم أيضًا بتهيئة عمليات التحقق في nagios.

باستخدام معالج http ، سيكون لدى grafana كل ما نحتاجه لذلك: لوحة تحكم للمراقبة في الوقت الفعلي ، وواجهة برمجة تطبيقات ، وتكوين تنبيه سهل ومعالج http حيث يمكننا إعادة توجيه التنبيهات إلى نظام الإخطار الداخلي الخاص بنا.

هتافات

على الرغم من أنني أستطيع رؤية المنطق في استراتيجية التكامل هذه ، لا يسعني إلا أن أعتقد أنها مبالغة قليلاً. وفقًا لما أفهمه (وما يمكنني قراءته في الموضوع) ، فإن السبب الوحيد الذي يجعل معظم مستخدمي Grafana يواصلون استخدام تقنية تنبيه قائمة بذاتها هو أن Grafana لا يقترح واحدة. لذلك ، لن يكون التركيز أكثر على جزء تنبيه Grafana ، وتطويره كمكون يتواصل مع بقية المكدس من خلال واجهة برمجة التطبيقات ، حتى يتمكن المساهمون الآخرون من محاكاة السلوك وإنشاء محولات محددة لاحقًا؟

tl ؛ dr: من خلال التركيز على بناء "بطاريات" خاصة بها أولاً ، سيكون لدى Grafana نظام تنبيه كامل الميزات ، والذي يمكن أن يتطور لاحقًا إلى خدمة للتكامل مع أدوات التنبيه الخاصة بطرف ثالث.

قلق بسيط ، إذا لم تتم معالجة ذلك. لا يتناسب نظام التنبيه التقليدي بشكل جيد مع البنية التحتية السحابية ، لأن الموارد ديناميكية للغاية (يتم توفيرها وتدميرها). يجب أن يدعم التنبيه على المقاييس ميزة الإغراء أو التجميع (مع تجاوز الاستثناءات ، وأحيانًا تكون أعباء العمل مختلفة). يجب أن يكون التنبيه المُجمَّع أو النموذجي قادرًا على اكتشاف مجموعة مجموعات جديدة.

شكرا للتحديث! في حالة الاستخدام الخاصة بي ، فإن التنبيه المدمج في Grafana هو كل ما أحتاجه في هذا الوقت. لقد كنت بصبر ينتظر بفارغ الصبر تنبيه غرافانا.

كما وعدت في IRC ، إليك حالة استخدامنا لهذا:

لدينا تطبيق Rails قديم searches our logs مقابل patterns ولديه
HTTP API للإجابة في حالة تجاوز pattern thresholds و
وبالتالي فإن الحالة هي {OK,WARNING,CRITICAL} .

يمكن أن يكون Threshold إما:

  • a status من CRITICAL إذا كان pattern موجودًا على الإطلاق.
  • أن status هو WARNING إذا تم العثور على pattern أكثر من X مرة
    و status هو CRITICAL إذا تم العثور عليه أكثر من Y مرة.
  • إذا كان pattern أقدم من ساعة واحدة ، فإن status هو OK ،
    أقل من 3 ساعات status هو WARNING وبخلاف ذلك status هو
    CRITICAL .

إذا فهمت هذه الميزة بشكل صحيح ، فستدعم Grafana هذا الاستخدام
النمط (عبر Logstash و Elasticsearch بالطبع) عندما تكون هذه الميزة و
تم تنفيذ مصدر بيانات Elasticsearch بالكامل؟

Dieterbemattttt تبدو الشرائح بالحجم الطبيعي مذهلة للغاية! هذا حقا تغيير قواعد اللعبة.
بالنسبة لي ، فإن معالج تنبيه Grafana الداخلي يناسب احتياجاتنا بشكل أفضل.
الأسباب:

  • الخدمة الذاتية - مهم جدا . قال مستخدمونا بصوت عالٍ وواضح أنهم يريدون إنشاء تنبيهات بأنفسهم من طرف إلى طرف داخل Grafana.
  • سير عمل موحد - أريد تقليل الأجزاء المتحركة وليس زيادتها. كما أشار Dieterbe ، سيتطلب معالج التنبيه
  • تكامل محكم وعدم الاعتماد على البنية التحتية لتنبيه الطرف الثالث.

بعض المخاوف:

  • ما هي حدود التحقق من التردد؟
  • كيف تتعامل مع تردد الاستقصاء السريع جدًا لاستعادة البيانات؟ تسجيل ، تنبيه وإسقاط؟
  • بالنسبة للتوسع ، نشعر بالقلق من أن Grafana قد لا تكون قادرة على مواكبة العدد الهائل من عمليات الفحص والتكرار السريع وخاصة مع زمن الانتقال بين مصادر البيانات التي سنحتاج إليها على الأرجح لإضافة / توسيع نطاق خوادم Grafana لدعم التنبيه الداخلي. أعلم هذا لأننا بحاجة إلى العديد من حالات معالج التنبيه من جهة خارجية الآن. في هذه الحالة ، كيف سنكون قادرين على تعيين أو ترتيب عمليات التحقق من الحد الأدنى بسلاسة بين مجموعة من خوادم Grafana ، خاصةً إذا كانت الشيكات من نفس مصدر البيانات؟ من تجربة المستخدم ، أود أن يقوم المستخدمون بإنشاء عتبات بسلاسة من خلال مجموعة متوازنة من خوادم Grafana دون الحاجة إلى انتقال المستخدمين إلى مثيل معين "معين" من Grafana لإجراء فحص معين.
  • بالنسبة للإشعارات ، هل يدعم هذا نوعًا من بنية المكونات الإضافية بحيث يمكن تطوير الإشعارات ودمجها بسهولة؟ بشكل عام ، نحتاج إلى شيء يمكنه تنفيذ عمليات HTTP POST. هذا هو الأكثر شيوعًا مع أمثال PagerDuty ، و xMatters ، و VictorOps ، و Opsgenie ، وما إلى ذلك. يتطلب كل واحد تنسيقًا مختلفًا قليلاً ، ومصادقة ، وما إلى ذلك. خدمة HTTP مخصصة قادرة على فعل ما تريد به. بدلاً من ذلك ، يجب أن تعمل إمكانية البرنامج النصي المخصص أيضًا.
  • أفترض أنه يمكن تعيين الحدود واسترجاعها والحصول على الانتهاكات من خلال واجهة برمجة التطبيقات؟ أعتقد أن هذا سيكون مفيدًا

أعتقد أنه من المثالي أن تكون قادرًا على دمج التنبيه في أنظمة التنبيه الحالية. هناك بعض المشكلات الصعبة والقبيحة مثل اكتشاف الرفرف كما ذكرنا والتي تم التعامل معها ويبدو أنه من الهدر إعادة اختراع كل شيء من البداية. أنا أكره أن أرى هذا مدفونًا تحت وطأة زحف الميزات.

لكنني لا أعتقد أن هذا يحتاج حقًا إلى تكامل وثيق مع كل معالجات التنبيه هذه. يجب أن تسمح واجهة برمجة التطبيقات الجيدة والموثقة جيدًا للأشخاص المطلعين على هذا النظام بالتكامل مع القليل من الجهد. لذا فإن الشريحة التي تحتوي على "grafana api -> handler" هي ما يبدو جذابًا بالنسبة لي.

سكوت

مرحبًا بالجميع - لقد جئت متأخرًا إلى هذه المناقشة ، لكن لدي بعض الخبرة في هذا الموضوع ، وأنا المطور الرئيسي لإحدى الأدوات التي حاولت حل مشكلة التنبيه. أداتنا StatsAgg يمكن مقارنتها ببرامج مثل bosun. يهدف StatsAgg إلى تغطية التنبيهات المرنة وتعليق التنبيهات والإشعارات وهو ناضج / مستقر جدًا في هذه المرحلة (على الرغم من أن واجهة برمجة التطبيقات ليست جاهزة).

على أي حال ، بعض الأفكار حول موضوع التنبيه:

  • التنبيه عن طريق المقاييس الفردية تمتص. أعمل في شركة تدير آلاف الخوادم ، وأضطر إلى إنشاء / تكوين / إدارة تنبيهات منفصلة لكل سلسلة مترية من "مساحة القرص الحرة٪" أمر غير عملي من الناحية اللوجستية. غالبًا ما تربط أدوات مراقبة المؤسسة عدة سلاسل متريّة مع التعبيرات العادية (أو مجرد تعبيرات أحرف البدل). تم إنشاء StatsAgg على نفس الفرضية ؛ يتم ربط سلاسل المقاييس المتعددة معًا ، ومن ثم تحتوي مجموعة المقاييس على عمليات التحقق من حد التنبيه التي يتم تنفيذها مقابلها بواسطة "تنبيه" واحد. على نطاق واسع ، هذا النوع من القدرة هو ضرورة.
  • إذا قبل أحد تأكيدي السابق بأن أداة التنبيه يجب ألا تنبه من المقاييس الفردية ، فسيترتب على ذلك أن الأداة يجب أن يكون لديها آلية للحصول بسرعة على قائمة المقاييس المؤهلة وقيم المقاييس. تعتمد العديد من الأدوات على مخازن البيانات الاستعلام للحصول على قائمة المقاييس والقيم المترية ، وهذا الحل بصراحة لا يعمل بشكل جيد على نطاق واسع. يحتاج منطق التنبيه ، بطبيعته ، إلى التشغيل كثيرًا (كل X ثانية ، أو مع مرور كل نقطة بيانات مؤهلة جديدة). لم يتم إنشاء مخازن البيانات (الجرافيت ، و opentsdb ، و influxdb ، وما إلى ذلك) للتعامل مع الاستعلام المستمر عن "أعطني القائمة الحالية للمقاييس التي تتوافق مع هذا النمط" و "أظهر لي قيم X الأخيرة لمقاييس Y هذه". إما أنهم لا يمتلكون لغة API / الاستعلام المناسبة ، أو أنهم ببساطة لا يستطيعون التعامل مع الحمل. لكي أكون واضحًا ، أنا أتحدث عن مقاييس تشغيل منطق التنبيه مقابل 10000 سلسلة متري عندما يكون هناك 10000000 سلسلة متري متوفرة في مخزن البيانات. هذه ليست حالة استخدام الجميع ، لكنها شركتي.
  • لقد وجدت أن معالجة المشكلة عبر معالجة البث هي الطريقة الوحيدة القابلة للتطبيق لمعالجة المشكلات التي أثارتها آخر نقطة. لهذا السبب تم إنشاء StatsAgg للجلوس أمام مخزن البيانات. يمكن أن يعمل منطق التنبيه ضد المقاييس دون لمس مخزن البيانات ، وتنتقل المقاييس فقط إلى مخزن البيانات. تتمثل الأفكار الرئيسية لهذا النهج في أن 1) التنبيهات التي تم إنشاؤها حديثًا لا يمكنها / لن تستخدم القيم المترية القديمة / المؤرشفة لتقييم التنبيه 2) إذا تعطل برنامج معالجة الدفق (ex- StatsAgg) ، فإن نقاط البيانات لا تنجح في ذلك في مخزن البيانات 3) يتم تخزين القيم المترية اللازمة لتقييم التنبيه في الذاكرة ، والتي قد تكون مصدر قلق لاستقرار الخادم. 4) يجب أن يكون برنامج معالجة الدفق قادرًا على تفكيك وإعادة بناء المقاييس الواردة (التي لم تجعلها InfluxDB سهلة خلال العام الماضي ...). حتى مع هذه الأفكار ، نجح هذا الحل جيدًا لشركتي ، وعلى نطاق واسع جدًا. في بعض الأحيان ، كان لدينا أكثر من 200000 سلسلة مترية حية ، بمتوسط ​​30 ألف + مقياس وارد / ثانية ، ومئات التنبيهات التي تقيم الآلاف من السلاسل المترية ، وخادم يقوم بتشغيل StatsAgg والذي بالكاد يكسر العرق. طوال الوقت ، لا يتم الاستعلام عن متجر البيانات على الإطلاق.

هذه هي الأشياء الرئيسية التي أردت ذكرها. هناك الكثير من الجوانب المهمة الأخرى للتنبيه أيضًا (الإخطارات ، والإيقاف ، وما إلى ذلك) ، ولكن من السهل تثبيت هذه الحلول بمجرد أن يتم حل بنية المشكلة الأساسية. أدرك أن حجم احتياجاتنا ليس هو نفسه المستخدم العادي ، ولكن آمل أن تقدروا جميعًا هذا المنظور.

أود أن أقترح البدء باستخدام معالج إعلام يمكنه إرسال البيانات إلى Alerta: https://github.com/guardian/alerta

لدى Alerta واجهة برمجة تطبيقات REST عاقلة جدًا لتلقي الإخطارات.

أنا أفضل تطبيق grafana الهزيل فقط!
أعتقد أن الأمر يستحق إعادة التقييم بعد أن يكون لدى الجميع خبرة مع هذه الميزة في تجربة Grafana UX الرائعة النموذجية.

سيكون هناك العديد من الحالات المعقدة و / أو الأنظمة الخلفية المخصصة التي سيرغب الناس في الاندماج معها. يمكنك رؤية الكثير في هذا الموضوع ، معظمها مفتوح المصدر ، ولكن هناك العديد من المنتجات التجارية أيضًا! لا تهتم بالمعالجات الفردية - ستكون عبارة عن جرذ كامل وستظل دائمًا في وضع الالتقاط

أنصح بشدة بتنفيذ نوعين فقط من المعالجات. أحدهما بالتأكيد HTTP POST ، وسيكون الأداة الأكثر تنوعًا ومرونة. الآخر هو البرمجة النصية المخصصة ، بحيث يمكن للمستخدمين تنفيذ التكامل مع الأداة المحددة التي يختارونها. نموذج البرنامج المساعد ليس سيئًا ، لكنه يفرض استخدام لغة مكون إضافي محدد. تعتبر البرامج النصية الخارجية أفضل - طالما قمت بتمرير جميع التفاصيل إلى نص برمجي ، يمكن كتابة البرنامج النصي بأي لغة - سيناريو شل ، بايثون ، إلخ.

أنا مع @ 007reader

أنا موافق. طالما يتم توفير طرق التكامل الشائعة ، يمكن أن يكون التنفيذ المخصص مشروعًا أو نشرًا منفصلاً.

على سبيل المثال ، يعد إصدار CloudWatch الأخير لائقًا ، ومع ذلك أود أن أجعله مشروعًا منفصلاً عن طريق المقاييس المختارة المتزامنة فقط للتخزين البديل. سوف يمنحنا احتفاظًا كاملاً بدلاً من بيانات أسبوعين فقط.

مرحبا جميعا،
فيديو عرض grafanacon الخاص بي على الإنترنت!
إنه على https://www.youtube.com/watch؟v=C_H2ew8e5OM
أعتقد أنه سيوضح الكثير ، على الرغم من أنه يمكنك أن ترى. لا يزال يتعين تحديد تفاصيل عمليات الدمج وكان أيضًا موضوعًا يريد الكثير من الأشخاص مناقشته. (على الرغم من وجود وقت محدود وطلبت من الأشخاص مواصلة المحادثة هنا حتى يتمكن الجميع من المشاركة)

simmel نعم بالضبط. يمكنك استخدام استعلام ES وتعيين قاعدة على ذلك.
activars re التجميع والاكتشاف ، أعتقد أن الكثير من ذلك سيعتمد على مصدر البيانات الخاص بك ، ولكن يجب معالجة المتطلبات الأكثر شيوعًا إذا كنت تستخدم شيئًا مثل الجرافيت أو ES الذين أعرف أنهم جيدون جدًا في "الاكتشاف التلقائي" للمقاييس / المتسلسلات غير المرئية سابقًا / المستندات التي تطابق التعبير المحدد (مع أحرف البدل) للجرافيت أو الاستعلام (لـ ES). لست متأكدا من المصادر الأخرى. إن تعليقك حول الحاجة إلى تطبيق استثناءات على القواعد هو تعليق أكثر تعقيدًا ، فربما نحتاج إلى معالجة ذلك في مرحلة ما ولكن أعتقد أنه يمكن أن ينتظر حتى تصبح الأمور أكثر وضوحًا وأكثر استقرارًا. ربما يمكننا تجنب الحاجة إلى ذلك بطريقة ما.
تردد mgravlin سيكون إعدادًا في القاعدة ، يتعامل مع مصادر بيانات بطيئة جدًا ، لست متأكدًا بعد. لكن لا تفعل ذلك ؛-). أيضا معالج يعتمد. يجب أن يكون النشر على نطاق واسع ممكنًا ، وأيضًا باستخدام المعالج المضمن ، لذا من المؤكد أننا سننظر في ذلك. ولكن ربما لا تكون أولوية للإصدار الأول. نعم ، ستكون المكونات الإضافية للإشعارات أساسية وسنتأكد من أنه يمكنك استخدام ما تريد / تحتاجه. re api: نعم :)
sknolin إذا فهمت بشكل صحيح ، من وجهة نظرك ، فإن grafana ستقوم بجدولة التنبيه ، والتنفيذ ، وخطافات التنبيه ، وما إلى ذلك ، حتى عند استخدام نظام آخر مثل nagios / bosun. ثم ما هو بالضبط دور النظام الخارجي (ناجيوس / بوسون / ...). يبدو هذا أيضًا مشابهًا لما كان يتحدث عنه Crapworks .
@ jds86930 تبدو StatsAgg مثيرة للاهتمام. أعتقد هنا أيضًا أن التكامل مع grafana سيكون منطقيًا. أعتقد أن معالجة الدفق هي طريقة صالحة لها مكان كبديل للاستعلام المتكرر. لكن الأخير أسهل في البدء به وأبسط بشكل عام على ما أعتقد. لكن كلاهما يجب أن يتم دعمهما. لذا ، نعم في grafana ، ستتمكن من إعداد أنماط / استعلامات تتطابق مع مجموعة من البيانات ، ومن المحتمل أن تغطي سلسلة / بيانات جديدة عندما تصبح حية. من وجهة نظرنا ، يمكنك فقط الاستفادة من أي وظيفة يمتلكها مصدر البيانات (على سبيل المثال ، الجرافيت جيد جدًا في هذا مع أحرف البدل الخاصة به ، وتعبيرات الكرة الأرضية ، وما إلى ذلك ، وبيانات البحث الغنية ونموذج الاستعلام) ، أو إذا كان شخص ما سيستخدم grafana + StatsAgg ، فقط استخدم StatsAgg لحل هذه المشكلة. هل تقول أن غرافانا نفسها يجب أن تفعل أي شيء محدد هنا؟ أعتقد أنه إذا لم يكن مصدر البيانات لديك سريعًا بما يكفي ، فقم بحل مشكلة مصدر البيانات. الحصول على شيء أسرع ، يحتوي على تخزين مؤقت للبيانات الوصفية المترية ، ربما خادم ذاكرة في المقدمة أو معالجة التدفق. ولكن في كلتا الحالتين فيما يتعلق بجرافانا ، لن يتغير الكثير الذي يمكنني التفكير فيه؟
blysik نعم تبدو مثيرة للاهتمام. هناك الكثير من أدوات التنبيه التي يجب أن ندمجها مع :) لكي نكون واضحين ، هل تحب فكرة إدارة قواعد التنبيه وتصورها في grafana بالطريقة التي تم تقديمها بها حتى الآن ، ولكنك تريد استخدام تنبيه للإشعارات ؟ قد يكون تنبيهًا هو المكان الأساسي الذي تذهب إليه لإلقاء نظرة على حالة التنبيهات الخاصة بك (يبدو أن هذا أمر معقول القيام به) ، ولكن أريد التأكد من أنني أفهم تمامًا كيف ترى التكامل.

@ 007reader ، shanielh ، activars فقط منشور أو نص HTTP عام ، ما هو الهدف. لإخبار النظام الخارجي "هناك قاعدة جديدة ، ها هو الاستعلام ، والحدود ، والتكرار ، وما إلى ذلك ، انتقل الآن من فضلك نفذها"؟ أم أن grafana هو الشيء الذي ينفذ القواعد ثم يقوم بتحديث الأنظمة الخارجية بحالة جديدة؟

blysik نعم تبدو مثيرة للاهتمام. هناك الكثير من أدوات التنبيه التي يجب أن ندمجها مع :) لكي نكون واضحين ، هل تحب فكرة إدارة قواعد التنبيه وتصورها في grafana بالطريقة التي تم تقديمها بها حتى الآن ، ولكنك تريد استخدام تنبيه للإشعارات ؟ قد يكون تنبيهًا هو المكان الأساسي الذي تذهب إليه لإلقاء نظرة على حالة التنبيهات الخاصة بك (يبدو أن هذا أمر معقول القيام به) ، ولكن أريد التأكد من أنني أفهم تمامًا كيف ترى التكامل.

صيح. أليرتا تتشكل لتكون مركز الإشعارات لدينا. كل أنواع الأشياء ترسل التنبيهات إليه. على سبيل المثال: البرامج النصية المخصصة ، Cabot ، Zenoss ، vCenter ، وربما Grafana. هذا يعطي العمليات مكانًا واحدًا لمشاهدة جميع التنبيهات. ثم هذا هو المكان الوحيد الذي يرسل الإشعارات إلى مهندس الاتصال.

sknolin https://github.com/sknolin إذا فهمت بشكل صحيح ، في ملف
view، grafana ستقوم بجدولة التنبيه، التنفيذ، الزناد
خطافات الإخطار وما إلى ذلك ، حتى عند استخدام نظام آخر مثل
ناجيوس / بوسن. ثم ما هو بالضبط دور النظام الخارجي
(ناجيوس / بوسن / ...). يبدو هذا أيضًا مشابهًا لماCrapworks
https://github.com/Crapworks كان يتحدث عنه.

أعتقد أنني لم أشرح جيدًا. هذا ليس ما أريده ، لا غرافانا
تفعل كل تلك الأشياء. Crapworks (من الممتع الكتابة) هو التحدث المبني للمجهول
فحوصات الخدمة ، سأستخدم الاقتراع النشط فقط.

لذلك كل ما أريده هو واجهة برمجة تطبيقات حيث يمكنني قراءة حالة تنبيهات grafana.
الأنظمة الخارجية تفعل كل شيء آخر.

هذا لا يعني أنه لم يتطور بطريقة ما إلى جنرال عظيم
أداة التنبيه لن أستخدمها. فقط ما كنت سأفعله الآن.

سكوت

تضمين التغريدة

لذلك كل ما أريده هو واجهة برمجة تطبيقات حيث يمكنني قراءة حالة تنبيهات grafana.

كيف سيتم تحديث هذه الحالة في جرافانا؟ ما هي العملية التي سيتم تنفيذ التنبيهات وتحديث الحالة في grafana؟

في كل مرة يتم فيها استقصاء حالة تنبيه تحديثات grafana ، مع نوع من الفاصل الزمني للتخزين المؤقت للتعامل مع أنظمة متعددة تقوم باستقصائها.

أرى أن هذا لا يزال يتطلب من grafana القيام بالمنطق للتنبيهات وتقديمها. لذا بالتفكير في الأمر ، لا ، لست بحاجة إلى أي تنبيهات من أي نوع.

أعتقد أنه يمكنني القيام بأي تنبيهات مطلوبة إذا كنت قادرًا على استرداد القيمة الحالية لمقياس على لوحة الرسم البياني. على سبيل المثال ، عندما نستمد معدلًا من مجموع مقاييس العداد المتعددة ونرسمه ، سيكون من الجيد استطلاع القيمة الحالية باستخدام نظام المراقبة. ربما يكون هذا ممكنًا تمامًا الآن وأنا مجرد بلاغ.

سكوت

@ ديتيربي الأخير:

grafana هو الشيء الذي ينفذ القواعد ثم يقوم بتحديث الأنظمة الخارجية بحالة جديدة

Dieterbe أوافق على أن استطلاع مصدر البيانات (الجرافيت ، OpenTSDB ، إلخ) باستخدام بناء جملة الاستعلام الأصلي لمصدر البيانات هو أبسط / أسهل وربما يكون أسرع طريقة للحصول على شكل من أشكال التنبيه أصلاً إلى Grafana. بالنسبة للعديد من الأشخاص ، سيلبي هذا النوع من الحلول احتياجاتهم ، وأعتقد أن هذا هو الحل الأفضل لتطبيق Grafana الأولي (في رأيي). كانت نقطتي الرئيسية هي أن هناك حدًا أقصى لإمكانية تكوين التنبيه والأداء الذي سيكون من الصعب تجاوزه مع نموذج "استطلاع رأي مصدر البيانات".

فيما يتعلق بالاتجاهات التي يمكن أن يتبعها Grafana لحلول التنبيه طويلة المدى ، يمكنني رؤية بعض الخيارات:

  • اعمل مع المشرفين على مخزن البيانات لإنشاء واجهات برمجة تطبيقات مُصممة لغرض أسرع / أفضل لحالة الاستخدام التنبيهية. لا يعجبني هذا الخيار لأن العديد من هذه المشاريع تتحرك بوتيرة أبطأ (من أشهر إلى سنوات) وقد لا تقبل بعض / كل طلبات التحسين. ربما يرغبون أيضًا في الترميز باللغة الأم لمخازن البيانات الخاصة بهم ، والتي ليست دائمًا لغات سريعة (مثل الجرافيت في بيثون).
  • بناء طبقات معالجة التدفق / التخزين المؤقت لكل مخزن بيانات كمشاريع منفصلة للمجمع. أعتقد أن هذا سيكون له في النهاية نتيجة أفضل من محاولة إقناع مسؤولي صيانة مخزن البيانات المختلفين لبناء حلول لمشاريعهم. سيسمح لك هذا أيضًا بمواصلة التوسع في العمل الذي تقوم به بالفعل (باستخدام آليات الاستعلام الموجودة في مخزن البيانات). يمكنك أيضًا إنشاء واجهات برمجة التطبيقات المخصصة الخاصة بك في طبقات معالجة الدفق / التخزين المؤقت التي يمكن أن تبسط بناء جملة استعلام Grafana إلى مخزن البيانات.
  • التزم بالحل الأصلي الذي تعمل عليه واجعله يعمل بشكل جيد. ستكون أدوات الجهات الخارجية مثل StatsAgg و bosun وما إلى ذلك موجودة في حالات الاستخدام الأكثر تطلبًا / التخصص / التعقيد. إن تكامل Grafana مع هذه الأدوات سيكون بالتأكيد فائدة إضافية للمستخدم ، ولكنه سيضيف تعقيدًا غير تافه إلى Grafana. ومع ذلك ، يبدو أنه قد ينتهي بك الأمر إلى القيام بذلك على أي حال (أنا أنظر إلى "التنبيه للخلفيات" في الشريحة 35 من عرضك التقديمي الآن). أنا شخصياً منفتح على تنفيذ مجموعة من واجهات برمجة التطبيقات المتوافقة مع Grafana في StatsAgg ؛ كان علينا فقط معرفة كيفية إنشاء واجهات برمجة التطبيقات والحصول على بعض وثائق بروتوكول واجهة برمجة التطبيقات. لا تتردد في مراسلتي / مراسلتي عبر البريد الإلكتروني إذا كنت ترغب في مناقشة أي من ذلك.

تحية للجميع،

Dieterbe لقد شاهدت للتو العرض التقديمي الخاص بك والأشياء تبدو رائعة. أقدر حقًا أنك تحاول إنشاء نظام تنبيه بالطريقة "الصحيحة" ، باستخدام الكثير من مدخلات المجتمع! شكرا!

أريد أيضًا أن أوضح وجهة نظري قليلاً ، لأنني لا أعتقد أن ما كنت أحاول قوله كان واضحًا. أطلب من grafana أن يكون على دراية بأي نظام مراقبة آخر مثل Nagios و Icinga و Bosun وما إلى ذلك ، فأنا في الواقع بحاجة إلى هذا فقط:

  • واجهة المستخدم الرائعة التي أظهرتها في العرض التقديمي الخاص بك أو أيًا كان شكله عندما يتم الانتهاء منه تمامًا
  • معالج HTTP POST عام (كما اقترح بعض الأشخاص الآخرين هنا أيضًا) قابل للتكوين تمامًا (سأعطيك مثالًا لاحقًا)

تدفق الأحداث الذي أفكر فيه:

  • أنت تصور بياناتك في غرافانا
  • يمكنك إضافة عتبات للتنبيه في grafana
  • بمجرد تجاوز العتبة ، يتم تشغيل معالج HTTP POST
  • من تلك النقطة فصاعدًا ، يتم عمل grafanas

مثل mgravlin و @ 007reader المذكورين ، تستخدم معظم خدمات التنبيه والإعلام HTTP POST ، مما يتطلب أنواعًا مختلفة من البيانات. لذا فإن الشيء الأكثر عمومية الذي يمكن أن أفكر فيه هو السماح للمستخدم بتحديد بيانات POST والعناوين الرئيسية ، بحيث يمكنك تغذية عدة أنظمة بمعالج واحد ، باستخدام قوالب مختلفة. مثال على الكود الزائف:

"notificator": {
    "httppost": {
        "data": {
            "host": "$hostname",
            "alert": "$alertname",
            "state": "$state"
        },
        "header": {
            "content-type": "application/json"
        }
    }
}

إن إعطاء المستخدم ما يكفي من المتغيرات لاستخدامها هنا ، سيكون قوياً بما يكفي لإطعام الكثير من الخلفيات.

ومرة أخرى ، باستخدام هذا النوع من المعالجات ، يمكن لأي مسؤول نظام لديه بعض المعرفة عن الترميز إنشاء مستقبل بريد http الخاص به وتحويل الطريقة التي يحبها ، على سبيل المثال ، تغذية الخلفية التي لا تفهم منشور http.

نظرًا لأن هذا عديم الجنسية ، فإنه يتوسع أيضًا. ما عليك سوى وضع موازن التحميل أمام الواجهة الخلفية / واجهة برمجة التطبيقات / أيًا كان ، وستكون جاهزًا للعمل.

على الأقل ، هذا من شأنه أن يحل معظم / تقريبًا كل مشاكلي ؛)

هتافات

شكرا لبناء هذه الميزة. هل هناك تاريخ إطلاق تقريبي له؟

قال torkelo تقريبًا 3 أشهر على IRC.
إذا فهمته بشكل صحيح فهذا تقدير تقريبي حقًا ويجب معاملته على هذا النحو.

أنا متحمس للقدرة على القيام بالتنبيه باستخدام grafana. أعتقد أن هذه هي الميزة الوحيدة التي تمنع grafana من أن تكون أداة المراقبة النهائية.

إذا كان لديك إصدار مبكر من ألفا / بيتا ، فأنا أرغب في الاختبار وتقديم ملاحظات مبكرة مع بيانات الإنتاج.

++

لي 2 لول

+1

Em seg، 16 de nov de 2015 às 21:03، Jing Dong [email protected]
escreveu:

إذا كان لديك إصدار مبكر من ألفا / بيتا ، فأنا أرغب في الاختبار والعطاء مبكرًا
ردود الفعل مع بيانات الإنتاج.

-
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -157202686.

+1
إذا كان لديك إصدار مبكر من ألفا / بيتا ، فأنا أرغب في الاختبار وتقديم ملاحظات مبكرة مع بيانات الإنتاج.

+1 لي 2

2015-11-21 14:44 بتوقيت جرينتش -02: 00 chaosong [email protected] :

+1
إذا كان لديك إصدار مبكر من ألفا / بيتا ، فأنا أحب أن أجربه وأعطيه مبكرًا
ردود الفعل مع بيانات الإنتاج.

-
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -158661279.

+1

من الرائع رؤية جميع إجراءات +1 ولكن FWIW ليست هناك حاجة إليها حقًا. نحن نعلم بالفعل أنها الميزة الجديدة التي ننتظرها بفارغ الصبر ، وبمجرد أن نحقق تقدمًا ملموسًا ، سيظهر الرمز في فرع منفصل يمكن لأي شخص اللعب به. راجع للشغل نحن أيضًا نجلب المزيد من الأشخاص للعمل بدوام كامل على grafana ، لذا ترقبوا الجميع :)

نعم من فضلك ، هناك 484 شخصًا "يشاهدون" هذه القضية. في كل مرة "+1" ، يتلقى 484 شخصًا إشعارًا بالبريد الإلكتروني. ما عليك سوى الاشتراك في الإشعار وسيكون مؤشرًا على اهتمامك بالمشكلة.

+1> ؛ ص

في يوم الإثنين ، 2015/11/30 الساعة 10:33:52 -0800 ، كتب فاديم تشيكان:

نعم من فضلك ، هناك 484 شخصًا "يشاهدون" هذه القضية. في كل مرة "+1" ، يتلقى 484 شخصًا إشعارًا بالبريد الإلكتروني.

حسنًا ، أعلم أنكم تعملون بجد على هذا يا رفاق. هل هناك أي جدول زمني للإصدار الأول؟

سأكون أكثر من سعيد لكوني قادرًا على تكوين مقاييس التنبيه والعتبات (إما من خلال واجهة الويب أو واجهة برمجة التطبيقات) و Grafana cronjob / daemon الذي يتحقق من هذه المقاييس ويقوم بعمل HTTP POST مع JSON أو يستدعي نصًا برمجيًا مع JSON في stdout. سيكون من السهل جدًا للأفراد كتابة نص برمجي بسيط من لغة بيثون يمرر هذه المعلومات إلى Pagerduty أو Slack أو IRC أو SMS أو البريد الإلكتروني أو أي شيء آخر.

على الرغم من أنني سأكون ممتنًا للغاية للراحة ، إلا أنني لا أعتقد أن مهمة Grafana هي الاندماج بإحكام مع أدوات الطرف الثالث ، وأفضّل رؤية تطبيق الحد الأدنى في وقت أقرب من تنفيذ واحد بشكل جيد لاحقًا.

أتفق تمامًا مع anlutro . يرجى تقديم شيء بسيط للبدء. الشيء الأكثر إثارة للاهتمام بالنسبة لي هو تمكين الأشخاص من تعيين تنبيهات بسيطة بأنفسهم (الخدمة الذاتية). لا ينبغي أن تحاول Grafana استبدال حلول التنبيه / التصعيد الحالية.

أتفق مع anlutro أيضًا. ولكن بدلاً من مجرد توفير واجهة برمجة تطبيقات بسيطة ، اجعل الجزء التنبيه قادرًا على التعامل مع المكونات الإضافية المخصصة التي تتفاعل مع واجهة برمجة التطبيقات. بهذه الطريقة يمكن أن تتضمن الحزمة الأساسية بريدًا إلكترونيًا و pagerduty وعدد قليل من الآخرين ، ثم يمكن للمجتمع أن يضيف إليها حسب الحاجة. على غرار كيفية التعامل مع ملحقات Logstash الآن.

+1

أي أخبار عن نظام التنبيه؟ أي تقديرات؟

+1

+1
من الجدير بالذكر أن آلية الزيارات والتباطؤ تعمل على التنبيهات المجمعة كمفهوم يجب مراعاته.

هل فكرت في ميزات التنبيه المتقدمة مثل اكتشاف الانحراف ، واكتشاف الارتباط ، واكتشاف السبب الجذري ، وما إلى ذلك؟

+1. التنبيه كنظام فرعي للمكوِّن الإضافي - سيكون هذا الحل الأكثر مرونة. لا حاجة لإضافة العديد من الميزات داخل grafana إذا كان هناك العديد من المشاريع التي يمكنها القيام بذلك بشكل أفضل في الخلفية.

Dieterbetorkelo انها تريد ان تكون عظيم أن يكون حتى "guesstimate" صعبة للغاية في هذا الشأن. أنا شخصياً ما زلت أحتفظ به لأن التنبيه بالخدمة الذاتية المستند إلى المقاييس هو ميزة مطلوبة بشدة في حالتي وأنا مقتنع بأن Grafana هي الواجهة الأمامية الصحيحة للمستخدم لها. المشكلة هي ، لقد مر الآن 6 أشهر ولم يكن هناك تحديث لـ ETA أو حتى تعليق من أحدكم منذ فترة طويلة ، لذلك بدأت في الحصول على أفكار عكسية "سأضطر إلى اختراق شيء ما". .. إذا كان بإمكاني معرفة ما إذا كانت ستستغرق 6 أشهر أخرى مقابل بضعة أسابيع أخرى ، فيمكنني اتخاذ قرار مستنير بشكل أفضل.

شكرا!

+1
في 18 كانون الثاني (يناير) 2016 ، الساعة 9:54 مساءً ، كتب "Jaime Gago" [email protected] :

Dieterbe https://github.com/Dieterbe torkelo
https://github.com/torkelo سيكون من الرائع أن يكون لديك حتى خشن جدًا
"تخمين" على هذا. أنا شخصياً ما زلت أتحمل منذ المقاييس
خدمة التنبيه الذاتية القائمة على الخدمة الذاتية هي ميزة مطلوبة بشدة في حالتي وأنا
مقتنعًا بأن Grafana هو الواجهة الأمامية الصحيحة للمستخدم. المشكلة هي الآن
6 أشهر ولم يكن هناك تحديث لـ ETA أو حتى تعليق من أحد
أنت منذ فترة طويلة ، لذا بدأت أشعر بعبارة "سأضطر إلى ذلك
اختراق شيء ما "أفكار عكسية ... إذا كان بإمكاني معرفة ما إذا كان الأمر كذلك
ستكون ستة أشهر أخرى مقابل بضعة أسابيع أخرى يمكنني تحقيق الكثير
قرار مستنير أفضل.

شكرا!

-
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -172722684.

+1

+1

jaimegago آسف حقًا لعدم التحديث هنا بشأن تقدمنا ​​أو عدم إحراز تقدم بشأن هذه المشكلة. كنا نظن أنه سيكون لدينا وقت للإنفاق على هذا ولكن دائمًا ما يتم دفعه لأن شيئًا ما ذي أولوية أعلى جاء في الطريق.

مرة أخرى في سبتمبر ، بدأت العمل على دعم مصدر بيانات Elasticsearch الذي أصبح الأساس لإصدار 2.5 يركز على مصدر البيانات ، بعد ذلك كانت المشكلة الأعلى تصنيفًا في Grafana منذ الإصدار 1 عبارة عن لوحة طاولة ، وخاصة بعد دعم Elasticsearch شعرت بإصدار صغير مع جدول كانت اللوحة أكثر أهمية من التنبيه بحيث أصبحت الأساس لـ 2.6.

في الآونة الأخيرة ، لدينا الكثير من المستخدمين والشركات الذين يرغبون في الاندماج بشكل أكبر مع Grafana مما دفعنا للعمل على تحسين واجهة برمجة تطبيقات البرنامج الإضافي وقدراته ، مما أدى إلى تأجيل آخر لهذه المشكلة. أنا آسف حقًا لأننا قمنا بتوصيل هذا بشكل سيء. لطالما كان لدينا طموح للبدء قريبًا ، ولكن سرعان ما تم الدفع مرارًا وتكرارًا :(

لكن هناك أمل! لقد قمنا بتوسيع فريق Grafana الذي يعمل بدوام كامل ، في ديسمبر انضم bergquist وفي فبراير سنحصل على التعزيز مرة أخرى. لا يمكنني تقديم ETA ولكن هذه لا تزال قضية ذات أولوية عالية ونريد أن نبدأ في أسرع وقت ممكن. نريد أن تكون هذه الميزة هي الميزة الرئيسية لـ Grafana 3.0.

torkelo شكرا على التحديث ؛ لا أستطيع أن أقول إنني سعيد ، لكن على الأقل جديد نحن نعرف أين نقف.

أحد الأسئلة المتبقية هو ما إذا كان الإصدار 2.x سيحصل على المزيد من إصدارات النقاط أو إذا كان الإصدار 3.x هو الإصدار التالي. ؛)

RichiH فيما يتعلق بإصدار نقطة أخرى ، لست متأكدًا ولكن من المحتمل أن يتم إصدار نقطة أخرى قبل الإصدار 3.0 في فبراير.

torkelo شكرًا جزيلاً على الوقت الذي

ربما هذا موجود بالفعل على خارطة الطريق ، إذا لم يكن كذلك ، يرجى التفكير في إضافة "POST" اعتبارًا من الإشعار.
حتى نتمكن من إرسال التنبيه إلى نظام مختلف لمعالجتها مثل الكفاك

+1 لإخطارات SNMP!

+1 أعتقد أن هذه هي أكبر ميزة مفقودة من Grafana لجعلها أداة مراقبة قابلة للتطبيق (والأفضل في فئتها) للإنتاج.

+1

هل يوجد أي مشرف (Dieterbe؟) لقفل التعليق على هذه المشكلة من غير المتعاون؟ لذلك سنحصل فقط على محتوى مثير للاهتمام حول تقدم الميزات ، وليس المحتوى عديم الفائدة +1 ...

إذا كنت لا تعرف هذه الميزة ، فإليك رابط GitHub doc المخصص .

بفضل القلب:

Mayeu آه ، كأحد "غير المتعاونين" الذين ساهموا بأكثر من 1+ لهذه المشكلة وفي أماكن أخرى لا أعتقد أن إقفال هذه المشكلة على المتعاونين هو السبيل للذهاب. ما عليك سوى إنشاء مرشح ذكي على بريدك الإلكتروني ؛-).

أعتقد أيضًا أن إجراءات 1+ تملأ غرضًا ، وتوضح مقدار الفائدة وانتشارها (وفي أي مكان آخر).
ربما يكون ما ينقصك هو زر +1 في واجهة المستخدم الذي من شأنه أن يملأ الدور نفسه ، ولكن بدون كل الإشعارات لجميع المشتركين .. لذا طلب ميزة لـgithub.

نحن نبتعد عن الموضوع وهذه هي المرة الأولى والأخيرة التي أكتب فيها بخصوص هذا الموضوع.

يجب على أي شخص مهتم بهذه المشكلة الاشتراك في الجزء العلوي الأيمن ؛ سيبقيك على اطلاع ولن ترسل بريدًا إلكترونيًا إلى الجميع.

بالنسبة لنظام التصويت لمنع تراكم +1 ، راجع https://github.com/dear-github/dear-github - 27 يومًا لا معنى لها ولا يوجد رد فعل من GitHub.

+1

أي خبر عن هذا ؟

لا أعتقد أن هناك أي أخبار حتى الآن حول هذه المسألة. لكن الشيء الجيد في الإصدار التالي من Grafana هو:

سيكون Grafana قادرًا على تسليم التطبيقات / المكونات الإضافية المخصصة. ثم يمكننا كتابة المكونات الإضافية / التطبيقات المخصصة للتنبيه واستيرادها إلى Grafana. ستكون كتابة هذه التطبيقات / المكونات الإضافية الصغيرة بمثابة فوز سريع أثناء انتظار ميزة التنبيه الكبيرة.

تعجبني فكرة تكوين التنبيهات في نفس مكان التصور. سخرية مذهلة على https://www.youtube.com/watch ؟

فيديو جميل ، شكرا!

بعض الملاحظات.

أنا سعيد بفكرة الحدود الخطية البسيطة والاستعلامات المخصصة المتقدمة

الإخطارات الأكثر فائدة:

  • exec - يمكن أن تستخدم شيئًا مثل ssh أو sendmail
  • خطاطيف الويب - يمكن للمستخدم الوقوف على webcgi لالتقاط خطاطيف الويب للقيام بأشياء ...
  • البريد الإلكتروني - أطلق بريدًا إلكترونيًا بسيطًا مع تفريغ json لبيانات الإخطار.
  • الإضافات ... ليست هناك حاجة حقا

api لسحب حالة التنبيهات ... تبدو وكأنها فكرة سيئة ،
ومع ذلك ، قد يكون من الجيد استخدام واجهة برمجة التطبيقات لسحب تكوين التنبيه بتنسيق json الأساسي.
يمكن تحويل هذا التفريغ json إلى شيء قد تجده الأنظمة الأخرى مفيدًا في تحويله.

لست متأكدًا مما إذا كان هذا مرفوضًا أم لا .. تعذر العثور على رابط تبرع في أي مكان ولكن ما هو نوع المساهمة التي ستكون ضرورية للحصول على هذا في الإصدار 3 بحلول نهاية الشهر .. يمكننا حقًا استخدام هذه الميزة ولكن مواردنا مقيدة حتى أجهزة الصراف الآلي

+1

+1

هذه ميزة نحتاجها بشدة هنا في سوق العمل.

هل تم إطلاق التنبيهات المميزة؟

لا
في الخميس ، 25 فبراير 2016 الساعة 11:13 مساءً ، كتب kskaran94 [email protected] :

هل تم إطلاق التنبيهات المميزة؟

-
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -189143056.

هل من الآمن افتراض إطلاق ميزة التنبيهات في الصيف؟

_تشديد التعليق_
في 26 فبراير 2016 10:23 صباحًا ، كتب "إيان ها" [email protected] :

هل سيكون من الآمن افتراض أن ميزة التنبيهات سيتم إصدارها في
الصيف؟

-
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -189320869.

أي خبر عن هذا؟

+1

سيكون من الجيد الحصول على +1 بالفعل ، فالناس ينتظرون عام كامل بالفعل أو حتى أكثر.

: +1: أحبه. شكرا على الفيديو والعرض التقديمي ،Dieterbe. هل هو متاح للاختبار / المتبنين الأوائل؟

torkelo لقد أعلنت

نريد أن تكون هذه الميزة هي الميزة الرئيسية لـ Grafana 3.0

ولكن بالنظر إلى الإصدار 3.0 من سجل التغيير الفرعي الذي لم يتم إصداره (1) لم يتم ذكر التنبيه ، فهل يجب أن أبدأ في البكاء أم أن الخطة لا تزال تحتوي على ميزة التنبيه 3.0 الرئيسية؟

(1) https://github.com/grafana/grafana/blob/master/CHANGELOG.md

لقد اتخذنا قرارًا بوضع نظام المكون الإضافي لـ grafana 3 حتى نتمكن من إصدار grafana 3 ، ثم نبدأ العمل على التنبيه ، بدلاً من تأجيل grafana 3 دون داع.

Dieterbe لا أستطيع أن أقول إنني سعيد ، لكن هذا منطقي. المتابعة الواضحة هي إذا كان هناك أي شيء ETA-ish للتنبيه ؛ وإذا كانت ميزة مؤكدة وملتزمة لـ 3.1.

أيضًا ، كحل بديل ، يقوم http://alerta.io/ بجزء مما أريد أن يقوم به Grafana ؛ قد يرغب الأشخاص الذين ينتظرون هذه الميزة في تجربتها.

هل هناك مواصفات للمكوِّن الإضافي؟ قد يكون من الجيد بناء شيء ما في
المجتمع للتعامل مع التنبيه ليتزامن مع إصدار الإصدار 3؟

بيث
في 16 آذار (مارس) 2016 الساعة 8:44 صباحًا ، تلقيت "Richard Hartmann" [email protected]
كتب:

Dieterbe https://github.com/Dieterbe لا أستطيع أن أقول إنني سعيد ، لكن هذا
لا معنى له. المتابعة الواضحة هي ما إذا كان هناك أي شيء ETA-ish
تنبيه. وإذا كانت ميزة مؤكدة وملتزمة لـ 3.1.

-
أنت تتلقى هذا لأنك مشترك في هذا الموضوع.
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -197214149

Dieterbe أعتقد أنه سيكون من الجيد أيضًا أن يكون لديك القدرة على إنشاء إشعار من جانب العميل. على سبيل المثال الرسائل الصوتية على الشاشة العامة مع لوحة القيادة ، لذلك لا تحتاج إلى إلقاء نظرة على لوحة القيادة لمعرفة أن هناك بعض المشاكل. مثل التنبيهات الصوتية Zabbix. لهذا الغرض ، قمت بكتابة كود JavaScript بسيط يقوم بمسح لوحة تحكم معينة وإذا كان هناك بعض المشاكل فإنه يقوم بإعلامني باستخدام Web Speech API . في الوقت الحالي تعمل بشكل جيد بالنسبة لي.

ماذا عن استخدام kapacitor كخلفية للتنبيهات ، فإن لغة البرمجة النصية الخاصة بهم بسيطة وفعالة حقًا؟ أو ماذا عن دعم العديد من الخلفيات التنبيهية ، والتجرد من ذلك.

الآن بعد الإصدار 3.0 ، أنا متحمس حقًا لأتمنى التنبيه في grafana. التنبيه سيجعل من grafana الأداة المثلى.

مرحبًا @ Dieterbe ،

كما يمكنني أن أرى من هذا الإصدار https://github.com/raintank/grafana (الذي قلته أنه يحتوي على حزمة التنبيه) ، فقد تم إهمال الريبو الآن ويقول إن كل التطوير الجديد سيجري في https: // github. com / raintank / worldping-api. هذا يجعلني أتساءل عما إذا كانت ميزة التنبيه هذه لا تزال قيد التطوير أو تم التخطيط لها وتغييرها لشيء آخر (مثل worldPing الذي لا يشبه ما كنا نناقشه هنا).

مرحبًا minhdanh ، كان الهدف دائمًا هو إضافة التنبيه "بشكل صحيح" إلى grafana ، وليس مجرد اختراق في مفترق خاص بمصادر ريترو ، وهو الريبو الذي تشير إليه (والذي يغطي نطاقًا ضيقًا للغاية على أي حال ، على الرغم من أنه قد يكون من المنطقي إعادة استخدام بعض من هذا الرمز بمجرد أن نبدأ العمل على المجدول / المنفذ ، والذي كان يمتلكه هذا الريبو). لهذا السبب كنا نعمل بجد لجعل grafana قابلاً للتوصيل لإصدار grafana 3 القادم. (ونتيجة لذلك ، سمح لنا بنقل احتياجاتنا الخاصة إلى تطبيق مستقل ، وهو worldping-api الذي تشير إليه).
أصبح من الواضح جدًا أنه كخطوة أولى ، يجب علينا فقط إنشاء واجهة المستخدم لإدارة القواعد من داخل لوحات معلومات ولوحات grafana وتعريضها من خلال نوع من واجهات برمجة التطبيقات ، بحيث يمكن للمكونات الإضافية استخدامها لتنفيذها. ستكون هذه أسرع طريقة لبدء التنبيه. ثم يأتي "المجدول / المنفذ المتضمن للبطاريات" لاحقًا وقد يعيد استخدام بعض الكود الذي أشرت إليه.

على أي حال ، سنقوم أولاً بواجهة مستخدم الإدارة في grafana ونكشف القواعد من خلال واجهة برمجة التطبيقات ، وسنأخذها من هناك.

شكرا @ ديتيربي.

كما هو الحال دائمًا ، هناك مسألة جدول زمني تقريبي ، حتى لو كانت "ليست كذلك
قبل X ".

أنا أفهم كيف يمكن أن يكون هذا السؤال مزعجًا وبالتالي يمكن أن تكون الصياغة في
جزء ثان. أتمنى أن تفهم مدى الإحباط الذي ينتظره الآخرون
يمكن أن يكون جانب السياج.

ريتشارد

مرسلة عن طريق الهاتف المحمول. عفواً للإيجاز.

تحية للجميع،

آمل أنه لا بأس من أن يقولها raintank هنا ، لكننا طلبنا مؤخرًا ما يقرب من شهر من ساعات الترميز المخصصة من قبل raintank للعمل على التنبيه. فلماذا لن ينتج عن ذلك ميزة تنبيه نهائية حتى الآن ، يجب أن نرى شيئًا قادمًا قريبًا لوضع الأساس للتنبيه في grafana. إذا اتبعت الشركات الأخرى نهجنا أو قام الأفراد أيضًا باستثمار بعض الأموال في هذه المسألة ، فمن المفترض أن يسرع التفكير والأولويات بشكل أكبر.

flyersa ، شكرًا جزيلاً على المساهمة! كيف يمكننا أن نضع نقودًا أيضًا؟

جون

اهلا جميعا،

أعلم أن الكثيرين حريصون على هذه الميزة ، ويسعدني أن أبلغكم أن الفريق قد بدأ العمل عليها. أوضحنا أسباب التأخير في مدونة إعلان الإصدار التجريبي من Grafana 3.0

سنقوم بإصدار التنبيهات على مرحلتين. ستسمح المرحلة الأولى للمستخدمين بتحديد تنبيهاتهم وحدودهم داخل واجهة مستخدم Grafana. سيعرض Grafana أيضًا تعريفات التنبيه هذه عبر واجهة برمجة تطبيقات HTTP إلى برامج الجدولة التابعة لجهات خارجية والخلفيات التنبيهية. في المرحلة الثانية ، سنوفر خدمة الواجهة الخلفية للاستهلاك والعمل وفقًا لهذه التعريفات ، من أجل حل متكامل تمامًا.

نأمل أن يتم إطلاق المرحلة الأولى في غضون أسابيع.

نحاول تحقيق التوازن بين الربحية والسرعة ، ونقدر بشدة الدعم التجاري لعملائنا مثلflyersa. إذا أراد الآخرون دعم تطوير هذه الميزة و Grafana بشكل عام ، فيرجى التفكير في شراء خطة دعم . سيساعدنا ذلك في تطوير برامج رائعة تكون مفتوحة المصدر بنسبة 100٪.

سنعمل عن كثب مع جميع العملاء المدعومين أثناء طرح الميزة ، والتأكد من أنها تلبي احتياجاتهم بشكل جيد.

-راج دوت | الرئيس التنفيذي / المؤسس المشارك | raintank

مرحبًا @ nopzor1200 ،

شكرا لالتحديث. هل لديك تقدير عندما يكون التنبيه متاحًا؟

من الواضح أنه من المستحيل الالتزام بتاريخ محدد ، ولكن سيكون الإطار الزمني موضع تقدير كبير (أسابيع ، أشهر ، إلخ).

10x!

مرحبا شباب ، متحمس جدا لهذا. إليك كيف أتخيل استخدام هذا ، إذا تمكن شخص ما من التحقق من أنه نمط قياسي / مدعوم ، فأنا أقدر ذلك.

  • كل مضيف أريد مراقبته يصدر "شيكات". يتكون "الشيك" من:

    • اسم المضيف

    • الطابع الزمني

    • الحالة ، والتي تكون إما 0 = موافق ، 1 = تحذير أو 2 = حرجة

  • يمكن أن تأتي هذه الشيكات من مجموعة متنوعة من المصادر التعسفية (برامج شل + cron ، statsd / collectiond ، وشيكات Nagios ، وما إلى ذلك) وسيتم تجميعها في Elasticsearch. قد يكون لنفس الفحص تكوينات مختلفة على مضيفين مختلفين ، ولكن هذا سيكون معتمًا لـ Grafana.
  • سأقوم بتكوين اتصال Grafana بـ Elasticsearch وللتنبيه عندما يكون لأي فحص وارد من أي مضيف قيمة حالة> = 1.
  • إذا انضم مضيفون جدد إلى الكتلة ، فلا يوجد تكوين مطلوب في Grafana ؛ سترى Grafana ببساطة أي نقطة بيانات في الحالة 1 أو 2 بغض النظر عن مصدرها.
  • إذا مات المضيف فجأة وتوقف عن إرسال الشيكات ، فنحن بحاجة إلى اكتشاف ذلك. للتعامل مع هذا الأمر ، عندما يبدأ المضيف ، فإنه سيسجل فحصًا رئيسيًا كحالة "ON" ، وستنتقل القيمة إلى "OFF" فقط عندما يتم إيقافها بشكل طبيعي. بهذه الطريقة يمكنني البحث عن أي مضيف "تشغيل" لم يرسل شيكات في آخر X ثانية.
  • بشكل عام ، لن أستخدم التنبيهات المستندة إلى العتبة على بيانات السلاسل الزمنية في Graphana. بمعنى آخر ، لن أفعل "التحقق مما إذا كان استخدام وحدة المعالجة المركزية> 80٪" داخل Grafana نفسها ، ولكن بدلاً من ذلك ، سيتلقى Grafana فحص "حالة استخدام وحدة المعالجة المركزية" (0/1/2) وتنبيهًا في حالة واحدة أو 2.

مرحبًا @ johnnyshields ،

يبدو هذا جيدًا جدًا ، ولكن بدلاً من "0 = حسنًا ، 1 = تحذير أو 2 = حاسم" لماذا لا تستخدم تعريف المستوى القياسي؟ الذي يستخدمه سجل النظام هو إلى حد كبير معيار واقعي لهذه الأشياء:

  • القيمة -> الخطورة
  • 0 -> الطوارئ
  • 1 -> تنبيه
  • 2 -> الحرجة
  • 3 -> خطأ
  • 4 -> تحذير
  • 5 -> إشعار
  • 6 -> معلوماتية
  • 7 -> التصحيح

ولديك تكوين (عالمي؟) لإخبار grafana بالمستوى الذي يجب اعتباره حدًا للتنبيه.

بالنظر إلى هذا ، أود أن أضيف التغييرات التالية إلى مشاركتك:

  • تنبيه عندما يكون أي فحص وارد من أي مضيف له قيمة حالة> = CONFIGURABLE_ALERT_LEVEL.
  • سترى Grafana ببساطة أي نقطة بيانات في الحالة> = CONFIGURABLE_ALERT_LEVEL بغض النظر عن مصدرها
  • سيتلقى Grafana مستوى فحص وتنبيه "حالة استخدام وحدة المعالجة المركزية" إذا تم تكوينه وفقًا لذلك.

brunorey شكرا ، منطقي!

مستويات السجل والحالات هما شيئان مختلفان. يمكن أن يكون لديك رسالة سجل 6-Informational ، ولكن كيف يمكن أن يكون أي شيء في حالة 6-Informational؟

حالات الموافقة والتحذير والنقد جيدة ، وقد تكون جيدة جدًا لأولئك الذين يهتمون فقط بالموافقة والحرجة. تضيف إضافة المزيد من الحالات الارتباك ما لم يتم فهم معناها عالميًا ، وأقترح تحديدها عند 3.

فيما يتعلق بالتنبيه فقط على "حالة وحدة المعالجة المركزية> = تحذير" مقابل "وحدة المعالجة المركزية> 80٪" ، فإنني أقر بأن بعض الأشخاص سيرغبون في الاحتفاظ بحالاتهم ذات المستويات الثلاثة في قاعدة بيانات متسلسلة زمنية حتى يتمكنوا من رؤية كيف تغيرت الحالة بمرور الوقت. سينبه هؤلاء الأشخاص بناءً على بيانات السلاسل الزمنية لحالتهم. سيرغب الآخرون في التنبيه إلى أن قيمة وحدة المعالجة المركزية الأولية تزيد عن 80٪. النقطة المهمة هي أن تنبيه بيانات السلاسل الزمنية هو الشيء الوحيد المطلوب.

السبب في أنني اخترت حصصًا لحالات سجل الأعداد الصحيحة بدلاً من استخدام بيانات السلاسل الزمنية مباشرةً هو أنني أريد أن أكون قادرًا على التحكم فيما يعتبر تنبيهًا لكل عقدة.

على سبيل المثال ، تحتوي خوادم العاملين بشكل روتيني على وحدة معالجة مركزية قريبة من 100٪ ، وهي ليست مشكلة - أريدهم أن يطلقوا الخانق الكامل على جميع النوى. لكن لا ينبغي أن تحتوي خوادم الويب على وحدة معالجة مركزية أعلى من 20٪. لذلك إذا كنت سأصنع وحدة معالجة مركزية عامة> 80٪ ، فسيكون ذلك مرتفعًا جدًا للشبكات ومنخفضًا جدًا بالنسبة للعمال. (هذه حالة واحدة فقط).

johnnyshields لا أفهم لماذا لا تستخدم التنبيهات المستندة إلى العتبة على بيانات السلاسل الزمنية ، IMO هو المكان الذي تكون فيه القيمة القوية (فقط؟) لإضافة التنبيه إلى grafana / الجرافيت. تبدو أشياء أسلوب "الشيكات" الخاصة بك أكثر ملاءمة لشيء بسيط مثل المراقبة - هل فاتني شيء هنا؟

كما هو موضح أعلاه ، لدي الكثير من الخوادم ذات الأدوار المختلفة والعتبات تختلف لكل خادم. في النهاية ، يتعلق الأمر بمسألة ما إذا كانت العتبات محددة داخل Grafana أو على الخادم نفسه ، أعتقد أن الخادم أسهل في حالتي.

بالإضافة إلى ذلك ، تكون بعض عمليات التحقق "نعم أو لا" ، على سبيل المثال ، تشغيل العملية X ، هل يستجيب اختبار الاتصال للمنفذ Y ، وما إلى ذلك.

مفهوم. أحيانًا يكون تحديد هذه الحالات أمرًا بسيطًا (> 80٪) ، وأحيانًا يكون معقدًا. عندما تكون معقدة ، ستحدد بعض التعليمات البرمجية المستويات وترسل المستوى إلى قاعدة بيانات TS. هذه ممارسة شائعة ، حيث يتم تحويل البيانات إلى معلومات. وجهة نظري هي أنه لا يوجد فرق من الشعور باليقظة.

إذا كنت بحاجة إلى قواعد معقدة لتنبيهاتك ، فلا تضع القواعد في محرك التنبيه ، بل ضع القواعد في خط أنابيب TS لإنشاء بيانات TS جديدة ، وقم بتنبيه ذلك.

تبسيط نظام التنبيه. إخفاء التعقيد في خط أنابيب TS.

تتمثل فائدة إنشاء بيانات TS جديدة في خط الأنابيب مقابل نظام التنبيه المستند إلى القواعد في أنها تحافظ على التنبيهات مرئية وبسيطة لإعداد الأشخاص والحصول على التنبيهات. هناك تصور يمكن إرساله عبر البريد الإلكتروني أو الرسائل القصيرة يظهر الشيء الذي تم تنبيهه فقط - حتى لو كان مخطط حالة بسيطًا حيث يرون الحالة انتقلت من تحذير إلى حرج قبل 20 دقيقة.

أعتقد أنه إذا كنت تريد التحكم في ما يعتبر يستحق التنبيه على أساس كل مضيف / دور ، فأنت في وضع جيد في إضافة منطق إلى ما يعتبر WARN وما يعتبر CRIT حيث تضيف 8 طبقات من التفصيل إلى شدة إنذار.

يبدو أن جميع أنظمة التنبيه الحديثة الأخرى تقريبًا قد تقاربت على OK / WARN / CRIT ، وعلى الرغم من أنه من المحتمل جزئيًا الرغبة في التوافق مع فحوصات Nagios ، أعتقد أن فكرة الرغبة في إبقائها بسيطة أكثر أهمية. إذا فعلت Grafana الشيء نفسه ، فسيكون التكامل مع خدمات التنبيه / المراقبة الأخرى أسهل. على سبيل المثال ، في حالتي ، من المحتمل أن ينتهي بي الأمر بتغذية تنبيهات Grafana إلى Sensu ، والتي سترسل بعد ذلك رسالة بريد إلكتروني أو رسالة Slack أو أي شيء آخر. يحتوي Sensu على OK / WARN / CRIT فقط ، لذا سيتم إهدار أي تفاصيل أخرى.

يبدو أن مستوى تنبيه سجل الموافقة مبالغ فيه. حسنًا ، تحذير ، من المحتمل أن يقوم Crit بالمهمة في معظم الحالات.

في حدود التنبيهات ، أود أن أتمكن من إجراء تنبيهات تستند إلى الانحراف المعياري. هم الأكثر فائدة في الممارسة imo.

في 12 مايو 2016 ، في الساعة 8:49 صباحًا ، كتب RWhar [email protected] :

johnnyshields لا أفهم لماذا لا تستخدم التنبيهات المستندة إلى العتبة على بيانات السلاسل الزمنية ، IMO هو المكان الذي تكون فيه القيمة القوية (فقط؟) لإضافة التنبيه إلى grafana / الجرافيت. تبدو أشياء أسلوب "الشيكات" الخاصة بك أكثر ملاءمة لشيء بسيط مثل المراقبة - هل فاتني شيء هنا؟

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة أو قم بعرضه على GitHub

أنا شخصياً كنت أتطلع إلى التنبيه باستخدام بيانات TS الحالية التي يتم إدخالها في الجرافيت كمدخلات ، وخاصة تجميع الإحصائيات من مقاييس التطبيق من (عبر StatsD) خلال نطاقات زمنية محددة.

أيضًا ، سيكون من الجيد أن يكون لديك خيار حيث يمكن تشغيل التنبيهات عند الحد الفاصل والفترات الزمنية المحددة التي تتجاوز الحد - على سبيل المثال ، تعيين حد التنبيه "rpl_delay" 200 int 50 - قد يتسبب في تنبيهات عند 200 و 250 و 300 وما إلى ذلك بدون تحتاج إلى تحديد مستويات عتبة إضافية يدويًا.

johnnyshields لا أحصل على الفرق بين 1 = تحذير أو 2 = حرج. التنبيه إما أن يتم تشغيله أو لا يتم تشغيله. إما أن تكون فوق 80٪ أو لا تزيد عن 80٪. لذلك لا أرى سوى حالتين 0 و 1.
سيكون من الجيد أيضًا أن يكون لديك تنبيه أكثر ذكاءً حيث يمكنك اكتشاف أنك تجاوزت نسبة 80٪ لمدة 5 دقائق متتالية حتى لا يتم تنبيهك عند حدوث ارتفاعات مؤقتة. والأكثر تقدمًا هي أشياء مثل الانتقال إلى الحدود ، حيث تقوم على سبيل المثال بمراقبة حركة المرور على موقع الويب الخاص بك ، وتحصل على X كمية حركة المرور وتزداد ببطء على سبيل المثال 1٪ شهريًا ، ولكن فجأة تحصل على زيادة بنسبة 10٪ في حركة المرور في ساعة. قد ترغب أيضًا في أن تكون قادرًا على مراقبة عكس الانخفاض المفاجئ في حركة المرور. شيء مشابه لـ https://github.com/etsy/skyline منذ أن توقف Skyline.

يا رفاق ، لم تكن رسالتي هنا تتعلق بالعدد الدقيق لحالات التنبيه التي يجب استخدامها - كنت أسأل بشكل أكثر عمومية "هل ستدعم Grafana الحالات التي تم تعدادها كحالة استخدام تنبيه؟"

نظرًا لوجود خلاف حول الرقم الأمثل (يستخدم Nagios 3 ، يستخدم syslog 7 ، بعض الأشخاص مثل 2 ، إلخ.) يجب أن يدعم Grafana عددًا عشوائيًا من الحالات.

مجرد إعادة ذكر ما قلته من قبل أنني أعتقد أنه يجب أن يكون هناك حالتين فقط لكل تنبيه يتم تشغيله 1 أو لا يتم تشغيل 0. إذا كنت تريد معرفة ما إذا كنت تقترب من الحد الأدنى ، فقم بوضع حد إضافي للقيمة الأقل.

سبب WARN مقابل CRITICAL هو أن الإجراءات التي تتخذها مختلفة. يتم إخطار مجموعة واحدة من الأشخاص والإجراءات بشكل عام في WARN ، ومجموعة مختلفة / إجراءات مختلفة بشأن الحرجة.

هذا تمايز قيم للغاية ، ولا أريد التخلص منه بنظام 0-1.

lorenwest إذا كنت تريد فحصًا مختلفًا لعتبة مختلفة ،
بحيث يكون كل حد إما 0 أو 1.
على سبيل المثال ، سبب آخر قد ترغب في إعداد التنبيه بهذه الطريقة هو عندما تريد بريدًا إلكترونيًا عندما يكون الحد الأقصى أكبر من 70٪ ولكن الصفحة عندما تكون فوق 80٪. تمامًا مثلما تريد مجموعات منفصلة. يحتوي WARN vs. CRITICAL على الكثير من الغموض.

doanerock هذا منطقي. يسمح السماح بعدد تعسفي من التنبيهات على أي مقياس أو حدث TS بأكبر قدر من المرونة. يعمل ذلك على تبسيط تعريف التنبيه من خلال عدم وجود إجراءات متعددة لمستويات متعددة.

وبالتالي:

  • يمكن أن تحتوي المقاييس على عدد تعسفي من الحالات (بما في ذلك القيم العشرية / التسلسل الزمني)
  • يمكن أن تحتوي المقاييس على إجراءات تنبيه متعددة مرفقة بالمقياس نفسه
  • كل تنبيه عبارة عن صواب أو خطأ منطقي - إما أنه يتم تشغيله أو لا يتم تشغيله.

لإعطاء مثال:

  • لدي مقياس معين بقيم 0 = موافق ، 1 = تحذير ، 2 = حرج
  • أقوم بتهيئة 3 تنبيهات:

    • إذا كانت القيمة = 1 ، اعرض علامة صفراء في لوحة المعلومات الخاصة بي

    • إذا كانت القيمة = 2 ، فقم بإظهار علامة حمراء في لوحة المعلومات الخاصة بي

    • إذا كانت القيمة> = 1 ، أرسل لي بريدًا إلكترونيًا

اهلا جميعا،

لا أعرف ما إذا كان هذا هو المكان المناسب للسؤال عن هذا الموضوع ، لكنني سأحاول بأي طريقة فيما يتعلق بوحدة التنبيه Grafana القادمة.
لدينا في مؤسستنا جميع مستشعرات التنبيهات الأمنية التي تغذي Logstash / Elasticsearch للأحداث ونستخدم Yelp / elastalert لتنفيذ التنبيهات بأنماط معينة بالمعايير التالية:

"Match where there are X events in Y time" (frequency type)
"Match when the rate of events increases or decreases" (spike type)
"Match when a certain field matches a blacklist/whitelist" (blacklist and whitelist type)
"Match on any event matching a given filter" (any type)
"Match when a field has two different values within some time" (change type)

بالإضافة إلى ذلك ، عند اكتشاف معايير التنبيه ، نقوم بتنفيذ نص برمجي بيثون خارجي مع الوسائط التي تمرر الحجج من Elastalert إلى البرنامج النصي بمعلومات مثل حقل IP المصدر / الوجهة ، وحقل الطابع الزمني والحدث ، ويتولى نظام NAC الخاص بنا الاهتمام من هناك.

الآن بالنظر إلى وحدة التنبيه القادمة من Grafana ومع Elasticsearch كمصدر للبيانات ، أتساءل عما إذا كان من الممكن أن تتعاون وحدة Grafan Alerting مع Elastalert وفي النهاية استبدالها بالمعلومات الواردة أعلاه؟
يرجى تقديم النصيحة

شكرا

أعلم أن فريق grafana يعمل بجد في هذا ، وهذا الخيط طويل ولكني أريد أن أشير إلى أن Kapacitor قد دمجت للتو ميزة من شأنها أن تسهل بشكل كبير تطوير تطبيقات تكوين تنبيه الواجهة الأمامية: influxdata / kapacitor # 577

بقدر ما أفهم أن الهدف من جانب Grafana هو جعل الواجهة الخلفية التنبيهية قابلة للتوصيل (مثل الطريقة التي تدعم بها Grafana العديد من متاجر TSDB) ولكني أردت أن أذكر على أمل أن يحصل Kapacitor على دعم من الدرجة الأولى عندما يتم إصدار وظيفة التنبيه الخاصة بـ Grafana. يبدو مناسبًا تمامًا ، مثله مثل InfluxDB + Grafana.

@ thom-nic شكرًا للنصيحة Kapacitor هو بالضبط ما أبحث عنه ...

ريمان أيضًا عظيم وقوي جدًا. telegraf -> riemann (تنبيه) -> influxdb <- grafana

نحن نحقق تقدمًا في فرع alerting_definitions.

لدينا الآن نموذج قاعدة تنبيه بسيط يمكنك تحديده في واجهة المستخدم وعبر واجهة برمجة تطبيقات HTTP. يمكنك جلب القواعد وتغييرات القواعد وحالات القواعد عبر واجهة برمجة تطبيقات HTTP. كما بدأت جدولة قواعد التنبيه البسيطة وتنفيذ الاستعلام وتنفيذ القواعد معًا.

الشيء الوحيد الذي يمثل علامة استفهام كبيرة بالنسبة لي الآن هو ما إذا كان نموذج التنبيه الحالي بسيطًا جدًا وطريقًا مسدودًا. أعني بذلك أن تمديد نموذج قاعدة التنبيه في المستقبل سيتطلب تغييرات واسعة النطاق.

نموذج القاعدة الحالي:

description
query: #A  (referencing a query in the metrics tab)
aggregation: avg
timerange:  3600   (seconds from now to look back when fetching data)
frequency: 60  (how often to execute alert rule query and evaluation rule)
critLevel: 80
warnLevel: 50

يتم تمثيل نموذج التخزين هذا في واجهة المستخدم وفي جدول قاعدة البيانات الفعلي. ما أخشاه هو أن نموذج القاعدة البسيط هذا لا يستفيد من بيانات السلاسل الزمنية بشكل كافٍ. لا يمكنك تحديد عتبات ديناميكية (حيث تكون الحدود نفسها نتائج استعلام). بالطبع هذا
يمكن إضافتها لاحقًا ، ولكنها تتطلب نموذج قاعدة ومحرك تنفيذ مختلفين تمامًا.

لذا فإن فكرتي هي إلغاء هذا النموذج البسيط والتوصل إلى نموذج جديد أكثر تعقيدًا وديناميكية يمكنه لاحقًا دعم استعلامات متعددة لنطاقات زمنية مختلفة.

استعلام بسيط:

"alert": {
   "name": "CPU usage last 5min above 90%",
   "frequency": "1m",      
   "expr": "query(#A, 5m, now, avg)",
   "operator": ">",
   "critLevel": 90,
  },

// الآن لتنبيه يستخدم حدًا ديناميكيًا بناءً على القيم التي تم تمريرها

"alert": {
   "name": "CPU usage last 5m is 20% higher compared to last 24hours avg",
   "frequency": "1m",
   "expr": "query(#A, 5m, now, avg) => percentDiff() => query(#A, 1d, now, avg)",
   "operator": ">",
   "critLevel": 20,
  },

الآن يمكنك أن تتساءل عن هذا بالقول إننا نعيد اختراع الجرافيت هنا ، وأن تعبيرًا مثل هذا يجب أن يتعامل معه TSDB. لكن لا يوجد TSDB يدعم العمليات الحسابية باستخدام استعلامات لنطاقات زمنية مختلفة (يتغير التحول الزمني فقط في نفس الفترة الزمنية). تتمثل بعض المشكلات المتعلقة بالعتبات الديناميكية في كيفية تصورها. يمكن أيضًا أن تجعل قاعدة التنبيه أكثر فصلًا عما هو مرئي بالفعل في اللوحة.

لست متأكدًا تمامًا من الشكل الذي يجب أن تبدو عليه GAL (لغة تنبيه Grafana). يجب أن تكون مجرد سلاسل تعبير حيث يمكن أن يكون كل جزء إما استعلامًا يقوم بإرجاع سلسلة واحدة أو أكثر (كل سلسلة مجمعة إلى نقطة واحدة) ، ثم وظيفة طرح أو نسبة مئوية اختيارية يمكن مقارنتها باستعلام آخر. ينتج عن التعبير بالكامل قيمة يمكن استخدامها بعد ذلك مع مستويات عامل التشغيل والنقد / التحذير للحصول على حالة التنبيه.

أم يجب أن يحتوي التعبير على العامل والمستويات؟

ستتحول الخيارات الأخرى إلى لغة برمجة كاملة وتقوم بما يلي:

expr: "
let last5mAvg = query(#A, 5m, now, avg)
let last24hAvg = query(#A, 1d, now, avg)

return percentDiff(last5minAvg, last24Avg)
"

torkelo :

  1. هل تصمم هذا كعنصر مستقل؟ في النهاية تقوم ببناء معالج إشارة مشابه لـ Kapacitor for Influxdb ** والذي هو نفسه
  2. بالمثل ، هل سيكون لدى grafana خيار عدم استخدام محرك الإشارة أعلاه ، ولكن بدلاً من ذلك تلقي إشارة 0/1/2 من مصدر خارجي مثل مكون Nagios الإضافي ، والذي يوجد العديد منها بالفعل في البرية؟

** = Kapicator الممنوح يستخدم معالجة تدفق التسلسل الزمني في حين أن محركك يعتمد على الاقتراع ، لكنه لا يزال يرسل إشارة.

شكرا لك على التماس المدخلات.

رأيي هو إبقاء تنبيهات grafana بسيطة ، وأفضل مقياس للبساطة هو التصور. إذا لم تتمكن من تصور التنبيه كخط على الرسم البياني TS الحالي ، فهو معقد للغاية.

اترك التعقيد للرسم البياني TS. إذا كان للتنبيه احتياجات أكبر ، فأنشئ مجموعة أخرى من بيانات TS بناءً على تلك الاحتياجات ، ثم ضع التنبيه على رسم بياني لتلك البيانات.

إذا كان لديك مبدأ إرشادي واحد فقط فهو يتطلب تصورًا بسيطًا للتنبيه.

المشكلة الأخرى هي "كم عدد التنبيهات التي يجب أن أقوم بتكوينها"؟ تمت مناقشة هذا الموضوع في هذا الموضوع ، وأنا أرى أنه بمجرد أن تبدأ في وضع تنبيهات متعددة في تنبيه واحد (تحذير ، خطأ ، تحذير عالي ، خطأ منخفض ، إلخ) ، فإنك تبدأ في فقدان المرونة. التحذيرات والأخطاء أشياء مختلفة - فهي لها مستويات مختلفة ، ويهتم بها أشخاص مختلفون ، ولديهم طرق إعلام مختلفة.

اجعل التنبيهات بسيطة ، واسمح للأشخاص بوضع تنبيهات متعددة على الرسم البياني.

أعتقد أن # 3677 (التحويلات العامة في نتائج استعلام المتسلسلة الزمنية) ستكون مفيدة حقًا هنا. باستخدام وظائف TSDB المستقلة هذه ، يمكنك إنشاء "رسم بياني تنبيه" معقد حيث يمكنك استخدام عتبات قيمة ثابتة بسيطة للتحذير والنقد وما إلى ذلك.

سيكون نموذج قاعدة التنبيه البسيط هو كل ما هو مطلوب بعد ذلك. ثم يتم "إخفاء" التعقيد في إنشاء الرسوم البيانية وتوليفها.

أنا جميعًا لأبقى الأمر بسيطًا. أنا لست مطورًا ، فأنا أكثر خبرة في التطوير ، وأود أن أكون قادرًا على تسليم منصة Grafana / Graphite الخاصة بي إلى فريقي من المسؤولين لإدارتها. في هذه الحالة ، سيكون من الأسهل بكثير استخدام أداة إنشاء التنبيهات المشابهة لتلك الموجودة. ليس منزعجًا جدًا إذا قدم عددًا من الإرشادات الجديدة طالما أنه لا يزال من الممكن إنشاء القواعد بنفس طريقة إنشاء استعلامات الرسوم البيانية حاليًا ، فسيكون من السهل التعامل معها.

ليرة لبنانية ؛ قد تكون لغة جديدة بالكامل مبالغة ومعقدة للغاية. قواعد البناء مع الماوس = جيد.

بعيدًا عن بناء لغة جديدة تمامًا ، افترضت أن هذا سيكون إلى حد كبير واجهة أمامية لمنصات التنبيه الحالية مثل Kapacitor و Reimann و Bosun ، على غرار الطريقة التي يوفر بها Grafana واجهة أمامية لتكوين استعلامات InfluxDB. على سبيل المثال ، يتم رفع الأحمال الثقيلة بواسطة نظام تنبيه تابع لجهة خارجية وتوفر Grafana واجهة المستخدم. ربما هذا ليس هو الحال؟

IIRC ، Grafana يريد أن يذهب بطريقة "البطاريات المضمنة ، ولكن القابلة للإزالة". أي أنه يجب أن يعمل بشكل مستقل مع محرك تنبيه مضمن ولكن يجب أيضًا أن يكون قابلاً للتوصيل بالمنصات الحالية.

أود أن أقول أنه يجب أن يأتي مع طريقتين يحملان في ثناياه عوامل - البريد الإلكتروني (مزود SMTP مضيف) و WebAPI / Webhook. ثم يمكن أن يأتي الباقي مع المكونات الإضافية ، مثل التكامل في PagerDuty.

felixbarny هل يمكنك وصف ما تعنيه

GriffReborn أنت تفكر في مستوى مختلف. الخلفيات الحالية للتنبيه التي أشرت إليها _فهيًا _ تدعم النواتج مثل SMTP و PagerDuty وما إلى ذلك:
https://docs.influxdata.com/kapacitor/v0.13//introduction/getting_started/#a -real-world-example
http://riemann.io/api/riemann.pagerduty.html

هذه المنتجات _ بالفعل _ تقوم بعمل تنبيه ديناميكي معقد بشكل جيد. ما لا يتوفر لديهم هو واجهة مرئية رائعة لتكوين التنبيهات وإدارتها ، وتحديد التنبيهات النشطة بشكل مرئي ، وما إلى ذلك. ما كنت أرغب في الحصول عليه هو واجهة مستخدم أمامية تدفع التكوينات بشكل أساسي إلى التنبيه (المدعوم من Grafana) نظام الاختيار الذي يؤدي في الواقع كل العمل.

@ thom-nic أوافق. يجب أن ينصب التركيز الأساسي على إنشاء لوحة معلومات للتنبيه يمكنها استخدام خلاصات معلومات التنبيه الحالية ("غير معلومة للخلاصة"). يجب أن يكون صنع محرك معالجة الإشارات خفيف الوزن برعاية Grafana (مثالي كمحرك مستقل) مصدر قلق ثانوي.

johnnyshields يعد إنشاء لوحات جديدة تعرض معلومات من الخلفيات

أعتقد أيضًا أن النموذج البسيط يجب أن يكون كافيًا وسيؤدي أيضًا إلى الحصول على الميزة التي طال انتظارها في أقرب وقت ممكن. grafana على الإطلاق للمقاييس ، يجب أن يكون التنبيه الأساسي كافياً.

torkelo لأكون صادقًا ، لست على دراية كبيرة بالمنصات التنبيهية مثل bosun ولا أعرف كيف يمكن أن يبدو التكامل المناسب على وجه التحديد. كنت أشير إلى الأشياء التي قالهاDieterbe ، على سبيل المثال في عرضه Grafanacon: http://de.slideshare.net/Dieterbe/alerting-in-grafana-grafanacon-2015#50

felixbarny حسنًا ، هذا ما نخطط للقيام به أيضًا. للحصول على واجهة برمجة تطبيقات لخلفيات التنبيه الأخرى لاستخدامها من أجل قراءة القواعد المحددة في Grafana. لكننا لن نوفر الجسر الذي يقرأ قواعد التنبيه من Grafana ويترجمها إلى محرك آخر لتنفيذ القواعد.

لذا فإن إحدى الأفكار التي لدينا الآن هي تحديد قواعد بسيطة مثل هذه

image

ولكن يمكنك أيضًا الحصول على حدود ديناميكية ومقارنتها باستعلام آخر أو نفس الاستعلام ولكن مع نطاق زمني وتجميع مختلفين.

image

استعلام "توقع" آخر معقد. عندما يتم استخدام استعلام للحصول على خط اتجاه ، فتوقع ذلك إلى الأمام في الوقت المناسب والتنبيه على ذلك.

image

يبدو أنه أفضل ما في العالمين. أحب هذه الفكرة! هل وظائف "التقييم ضد" جزء من Grafana أم أنها محددة من TSDB؟

felixbarny هم جزء من نموذج قاعدة تنبيه Grafana وستتم معالجته بواسطة محرك تقييم قاعدة التنبيه Grafana.

هل ستكون قادرًا على إرفاق قواعد متعددة برسم بياني واحد؟ أنا أحب بساطة مستويات التحذير / الحرجة في قاعدة واحدة ، وبعض الرسوم البيانية لها عتبات مرتفعة ومنخفضة والتي قد تتطلب إما مستويات متعددة في تنبيه واحد ، أو تنبيهات متعددة على رسم بياني واحد.

وبينما أحب وظيفة القاعدة المعقدة ، يمكن تحقيق كل ذلك من خلال إنشاء رسم بياني مختلف والتنبيه على هذا الرسم البياني بقاعدة بسيطة. فائدة إبقاء التعقيد خارج نظام التنبيه هو تاريخ الظروف التي أدت إلى إطلاق القاعدة في TSDB.

يتيح لك هذا تصور التنبيه على أنه خط أفقي بسيط على الرسم البياني ، ومعرفة كيف يمكن لهذه القاعدة أن تنطلق (أو تنطلق) بمرور الوقت.

إنه يظل تنبيهًا بسيطًا للشخص العادي ، ومعقدًا بما يكفي للجميع ، ويمكن الوصول إليه لمن يفهم الأشياء بصريًا.

lorenwest ، نعم ،

وبينما أحب وظيفة القاعدة المعقدة ، يمكن تحقيق كل ذلك من خلال إنشاء رسم بياني مختلف والتنبيه على هذا الرسم البياني بقاعدة بسيطة.

لست متأكدا ما تعنيه هنا. لا يحل رسم بياني آخر على الإطلاق السيناريو حيث تريد التنبيه على استعلام مقارنةً بنفسه خلال نطاق زمني مختلف ، مقارنةً باستعلام آخر تمامًا (ربما يكون الاستعلام الآخر هو مصدر بيانات آخر يجلب عتبات ديناميكية من قاعدة بيانات). لا يمكن حل هذا السيناريو في TSDB أو بمجرد تقسيم القاعدة إلى قاعدتين في لوحتين منفصلتين.

لكن الهدف الرئيسي هو حل الحالة البسيطة وجعل ذلك سهلاً وبديهيًا ، لكننا نريد أيضًا ، على الأقل لاحقًا ، دعم بعض قواعد التنبيه الأكثر تعقيدًا التي تستفيد حقًا من حقيقة أنك تتعامل مع بيانات TSDB وكذلك الحقيقة يمكن أن تستهدف الاستعلامات المختلفة مصادر بيانات مختلفة

أعتقد أن النقطة التي أثارتهاlorenwest هي أنه مع كون قواعد التنبيه عتبات بسيطة ، يتم تطبيق القواعد على البيانات التي يتم تصورها في الرسم البياني. لذلك ، إذا قمت بتراكب الحدود الدنيا ، يمكنك أن ترى بوضوح المكان الذي كان سيتم فيه تشغيل التنبيه في الماضي استنادًا إلى الحدود الحالية

مع نموذج تنبيه أكثر تعقيدًا ، لم يعد هناك مؤشر مرئي يشير إلى المكان الذي ستؤدي فيه العتبات إلى إصدار تنبيه.

بالتمسك بالنموذج البسيط ، يمكنك تحقيق العديد من متطلبات المراقبة المعقدة بشرط أن يوفر مصدر البيانات القدرة. بالنسبة إلى "النسبة المئوية للتغيير مقارنة بـ" ، يمكنك إنشاء استعلام جرافيت (رسم بياني مختلف) يقارن اليوم الحالي باليوم السابق ، ثم تعيين عتبات بسيطة لذلك. من المؤكد أن إنشاء التنبيهات عملية أكثر تعقيدًا ، لكنها تعمل بالفعل.

image

سعيد لأننا على نفس الصفحةtorkelo. هذا يتناسب مع الوصف في المنشور الأصلي.

لا أتخيل إنشاء منصة تنبيه جديدة تمامًا لربطها بـ Grafana. ما أتمناه من تنبيه Grafana هو شيء ليحل محل NewRelic ، ولكن بالقوة الهائلة التي يجلبها Grafana. أن تكون قادرًا على تشغيل تنبيه (سواء البريد الإلكتروني أو واجهة برمجة التطبيقات لأي شيء) عندما يصل أحد الرسوم البيانية الخاصة بي إلى العتبة ... هذا هو GOLD. الأشياء المتغيرة للحياة.

حتى تنبيهات العتبة البسيطة ستكون حلاً بسيطًا لطيفًا.

grafana-threshold-alerting

إذا اتبعت هذه القاعدة ، فستكون ذهبيًا:

لا تسمح أبدًا بتنبيه لا يمكن تخيله من خلال التراكب على لوحة.

إذا كنت لا تستطيع تصور ذلك ، فهو معقد للغاية. أنشئ مخططًا يجسد هذا التعقيد ، وتنبه على هذا المخطط. هذا يجبرنا على بناء تصورات تجسد هذا التعقيد (شيء جيد) مع إبقاء الأمر سهلاً على منشئ التنبيه (والمستهلك) لمعرفة ما يحصلون عليه.

woodsaj أوافق على أننا نريد تشجيع الارتباط بين ما تنبه إليه وما تراه ، فهذا ليس شيئًا ناقشنا التخلي عنه. ما تحاول العصف الذهني هو إلى أي مدى تذهب الحدود الثابتة للاستعلام الفردي ، هل هي جيدة بما يكفي لـ v2 من Grafana Alerting أو v3؟ ولإثارة مناقشة حول القيود الموجودة في نوع قواعد التنبيه التي يمكن تحقيقها باستخدام استعلام واحد وحدود ثابتة.

تعتبر TSDBs حاليًا غير مرنة للغاية في نوع الاستعلامات المتداخلة التي يمكنك القيام بها (مقارنة سلسلة مقابل نفسها على سبيل المثال). الجرافيت هو الوحيد الذي يدعم الاستعلامات المتداخلة. ولكن حتى الجرافيت لا يمكنه مقارنة استعلامين يستهدفان نوافذ زمنية مختلفة (يعمل التحول الزمني فقط على تغيير نفس النافذة ، ولكن ليس النافذة الزمنية ذات الأحجام المختلفة). ولكن كلما فكرت في هذا الأمر أكثر ، أوافق على أن معظم هذا يمكن حله في استعلام TSDB نظرًا لأنه قوي بدرجة كافية.

السبب الرئيسي لإثارة هذه المناقشة هو العصف الذهني حول كيفية نمذجة القاعدة ، وما هي المكونات التي تشكل القاعدة ، وما هي التجريدات التي تحتوي عليها (الاستعلام ، النافذة الزمنية ، التجميع ، المستويات ، إلخ). كيف يمكننا دعم الحدود الديناميكية في الإصدار 2 أو أكثر من استعلامات التنبيه الغنية بالميزات التي تتنبأ بالاتجاهات في المستقبل. كيف سيحتاج محرك تقييم القواعد والنموذج إلى التغيير؟

فيما يتعلق بـ "هل يجب تعيين التنبيهات على اللوحات" - أعتقد أن هذا قد يكون خيارًا مفيدًا ولكنه سيكون قيد تصميم سيئًا ، حتى بالنسبة للإصدار 1.

أعتقد أن أحد الجوانب الأكثر صعوبة في التنبيه هو النطاق ، وبمجرد أن تبدأ الحديث عن التصور ، تصبح المشكلة واضحة.

أعتقد أن النطاق هو مساحة / عمق النظام الذي يغطيه التنبيه باعتباره النطاق. لذلك على سبيل المثال ، قد يتم تحديد نطاق تنبيهاتك:

  • الخدمات (مقاييس التطبيق)
  • مجموعات كاملة تشكل خدمة
  • العقد الفردية في الكتلة
  • المضيفين / العمليات في كتلة
  • النظام الفرعي للعمليات / التطبيقات (مقاييس البرمجيات الوسيطة)
  • الأنظمة الفرعية للمضيفين (مثل القرص ، وحدة المعالجة المركزية) (مقاييس النظام)

لا أعتقد أن هناك إجابة واحدة "صحيحة" حول الطبقة التي يجب التنبيه عليها. في بعض الأحيان يعتمد ذلك على الفرق ، وأهمية الخدمة ، والبنية التحتية العامة (مثل السحابة مقابل الأجهزة ، والكتلة مقابل الكتلة المتراصة) ، وما إلى ذلك ... لذلك ، بالنظر إلى النطاقات متعددة الطبقات ، يبدو التسلسل الوراثي المنبه كأنه جيد. لكنني لا أعتقد أن تحديد تلك الأنظمة يمكن الحفاظ عليه بشكل عام. إنه يتطلب الكثير من العمل والتغييرات ، وغالبًا ما تكون هناك علاقات لا تصنعها الأشجار الجميلة في أنظمة العالم الحقيقي. كتاب جوجل SRE العدواني:

""
لقد حقق Google SRE نجاحًا محدودًا فقط مع التسلسلات الهرمية التبعية المعقدة. نادرًا ما نستخدم قواعد مثل ، "إذا كنت أعرف أن قاعدة البيانات بطيئة ، فاحذر من وجود قاعدة بيانات بطيئة ؛ وإلا ، فقم بتنبيه موقع الويب ببطء بشكل عام." تتعلق القواعد المعتمدة على التبعية عادةً بأجزاء مستقرة جدًا من نظامنا ، مثل نظامنا لتصريف حركة مرور المستخدم بعيدًا عن مركز البيانات. على سبيل المثال ، "إذا تم استنزاف مركز البيانات ، فلا تنبهني بشأن وقت الاستجابة" إحدى قواعد التنبيه الشائعة لمركز البيانات. تحتفظ فرق قليلة في Google بتسلسلات هرمية معقدة للتبعية لأن بنيتنا التحتية لديها معدل ثابت لإعادة البناء المستمر.
""

يرتبط أيضًا بالنطاق نوع التنبيه (أي إرسال بريد إلكتروني مقابل تسجيله / إظهاره على لوحة القيادة لشخص ما للتعامل معه عند قيامهم بجولاتهم الصباحية)

لذلك بالنسبة إلى Grafana ، قد يتم تعيين التنبيهات الخاصة بي إلى:

  • لوحة
  • مجموعة اللوحات
  • لوحة القيادة
  • مجموعة من لوحات المعلومات (أتخيل أنها ستمتد إلى أسفل)

في بعض الأحيان ، أرغب في أن ترسل هذه التنبيهات إشعارًا ، وفي أحيان أخرى أريد أن تكون مجرد مؤشر مرئي في مكان ما في Grafana في أحد النطاقات (على سبيل المثال ، الحد المتجاوز ، أو تغييرات الحالة كعلامات توضيحية). سيكون الأمر مختلفًا بالنسبة للشركات المختلفة وحتى المجموعات / الخدمات المختلفة داخل الشركة.

kylebrandt الفكرة بأكملها مع التنبيه في Grafana هي ربطها باللوحات والتصورات. حيث يمكنك الحصول على الرسوم البيانية واللوحات التي تصور المقاييس بنطاق مختلف (مثل الخدمات والمجموعات والمضيفين الفرديين) ومن خلال ذلك يمكنك التنبيه على أي مستوى أو نطاق.

عدم رؤية كيف سيؤدي ربط تنبيه بلوحة وشيء يمكن تصوره إلى إيقاف تحديد التنبيهات على مستويات مختلفة. وبالطبع ستحدد لكل تنبيه ما هي الإخطارات التي يجب استخدامها.

torkelo سيتحول قرار التنبيه دائمًا إلى

إذن ، $metric > $threshold هو التنبيه الأساسي ، ويعود صحيحًا إذا تجاوز المقياس الحد الأدنى بالطبع. يتناسب هذا بشكل جيد مع لوحة (تصور المقياس وتصور العتبة داخل لوحة). ولكن ، من أجل القضاء على ضوضاء التنبيه ، يميل النطاق والظروف إلى التوسع إلى ما هو أبعد من ذلك في معظم الحالات (عندما بدأنا العمل على Bosun ، اعتقدت أن هذه الحالات ستكون أقلية ، وليس كثيرًا ما يتضح إذا كنت تريد ذلك السيطرة على الضوضاء). لذلك قد تقول شيئًا مثل:

تنبيه إذا:

  • وحدة المعالجة المركزية أعلى من 80٪ لمدة X دقيقة
  • المهمة أ ليست قيد التشغيل (نعلم أنها سترفع وحدة المعالجة المركزية ولا نهتم) والوظيفة أ لم تعمل منذ أكثر من ساعة
  • تناول ديتر أكثر من 3 أكواب من ستاربكس في الـ 24 ساعة الماضية (لأنه عندما يكون لديه الكثير يفعل أشياء سخيفة ترفع وحدة المعالجة المركزية ولا نريد التنبيه على ذلك)

لذا فإن تصور التنبيه هو (صواب / خطأ) عندما تكون هناك شروط متعددة ليس مفيدًا. نحن بحاجة إلى تصور كل حالة (وربما بعض المعلومات الداعمة).

إن تحويل كل هذه الشروط إلى مقياس جديد لا يساعد حقًا في التخيل في الوقت الحالي لأنه سيكون مجرد صواب / خطأ وما تحتاج حقًا إلى رؤيته هو كل المعلومات الأساسية. إذن ما لدينا بدلاً من تصور المقياس + العتبة هو تصور المقياس (المقاييس) + العتبة (العتبات) التي يمكن أن تكون بمقاييس مختلفة.

لذلك في هذه الحالة ، نعم ، يمكن تعيين التنبيه على لوحة واحدة ، ولكن اعتمادًا على التصور والتنبيه ، هناك العديد من الحالات التي لا يرغب فيها المرء حقًا. أرغب في لوحة لكل عنصر من العناصر المنطقية التي تشكل التنبيه ، لمعرفة أي منها تم التعثر - ولكن لتجنب إجهاد التنبيه ، أريد فقط إشعارًا واحدًا لمجموعة كل الشروط.

يبدو أن هناك نوعًا من المنخرات التنبيهية باستخدام منطق منطقي بسيط قد يجعل هذا الأمر سهلاً.

alert1:
  select: CPU is above 80% for X minutes
  output: null
alert2:
  select: Job A is not running
  output: null
alert3:
  select: Job A has being running for more than an hour
  output: send alert
alert4:
  select: Dieter has had more than 3 cups of starbucks in the last 24 hours
  output: null

(alert joiner does simple true/false logic and perhaps can graph it.)
alert5:
  database: alerts
  select: alert1 & alert2 &!alert4
  output: send alert

torkelo قمت بسحب فرع alerting_definitions من Github وقمت ببنائه وفقًا للتعليمات. ولكن للأسف لا يمكنني رؤية أي علامة تبويب "تنبيه" (معروضة أعلاه) في لوحة الرسم البياني.
بالإضافة إلى ذلك ، وجدت "تنبيه: ممكّن = خطأ" ضمن "إعداد الخادم" في "إدارة الخادم". هل يؤثر ذلك على ميزة التنبيه؟ هل هناك أي علامة بناء أو وقت تشغيل يجب أن أستخدمها؟
من فضلك النصيحة.

لقد حاولت باستخدام أحدث رمز (ebada26b85d8410142c2942ef7ba78b17e88313c) ، وتمكين التنبيه وحصلت على واجهة المستخدم.

لكن حصلت على أطنان من الأخطاء

EROR[06-17|14:38:23] Failed to extract alerts from dashboard  logger=alerting.extractor error="missing query.query"
EROR[06-17|14:38:23] Failed to save alerts                    logger=context userId=1 orgId=1 uname=admin error="Failed to extract alerts from dashboard"

لقد جربت مع مصادر بيانات InfluxDB ، في الوضع المباشر والمباشر.

هل هو شيء متوقع؟

نعم ، ليس جاهزًا للاختبار بعد.

حسنا من الجيد أن أعرف.

سأتعقب التحديثات من وقت لآخر.
قد يكون من الأفضل انتظار هذا الفرع ليتم دمجه بشكل رئيسي بحيث يكون جاهزًا تمامًا للاستخدام؟

نعم ، نأمل في دمجه لإتقان ربما في منتصف يوليو هناك

هل لديك تحديث للتقدم في هذا؟
هل مازلت ستصل منتصف يوليو؟
إن الحصول على هذه الميزة في الإنتاج في أسرع وقت ممكن سيكون حقًا مساعدة كبيرة!

حتى الإصدار الخفيف مع التنبيه بالبريد الإلكتروني فقط سيكون رائعًا جدًا!
سيكون تحديث تقدمك رائعًا (أحتاج إلى الاختيار بين تنفيذ نظام تنبيه مخصص أو الاعتماد على Grafana ، وأنا بالتأكيد أفضل الخيار الثاني!).
شكرا يا رفاق

لقد حان الشتاء ، لذلك سوف يتم التنبيه :)

في الثلاثاء ، 12 تموز (يوليو) 2016 ، الساعة 1:41 صباحًا ، كتب c-val [email protected] :

حتى الإصدار الخفيف مع التنبيه بالبريد الإلكتروني فقط سيكون رائعًا جدًا!
سيكون تحديث تقدمك رائعًا (أحتاج للاختيار من بينها
تنفيذ نظام تنبيه مخصص أو الاعتماد على Grafana ، وأنا بالتأكيد
تفضل الخيار الثاني!).
شكرا يا رفاق

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -231975390 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe/AAY0-eQ6jCI8a-k_U05xbcfFcYuGy4YVks5qU1NDgaJpZM4FJUTl
.

ديباك

سأعتبر هذا "متطلبًا تجاريًا" وأنصح بتقييمه على مستوى "بنية المؤسسة". من خلال تطبيق بعض الممارسات والأنماط المستخدمة في هندسة برامج المؤسسة ، ستتمكن من توصيل أفكارك من خلال النمذجة الرشيقة والتي بدورها تعزز جودة أعلى للفهم لكل من أصحاب المصلحة وفريق التطوير.

قبل أن نبدأ الحديث عن صلصة سرية التكنولوجيا والهندسة المعمارية ، نحتاج إلى الاتفاق على ما يلي على الأقل:

  1. نفكر في ميزاتنا من حيث "إدارة عمليات الأعمال (BPM)" ؛ و
  2. نحن نستخدم "لغة نمذجة عمليات الأعمال (BPML)" حتى نتمكن من البدء بنمذجة المتطلبات والتطبيقات في نفس المكان مع UML.
  3. نحدد هندستنا مع انضباط على مستوى المؤسسة.

الآن الجزء الممتع! من خلال خبرة واسعة في المراقبة على نطاق عالمي ، أوصي بأن نأخذ في الاعتبار ما يلي:

  • اترك غرافانا وشأنها ، إنها طبقة العرض ! إذا كنت ترغب في إضافة سير عمل لتصميم القواعد وتحديدها لإنشاء التنبيهات ، فلا بأس بذلك ، ولكن اترك الأمر عند هذا الحد. بعد كل شيء ، هذا هو السبب في تنفيذ اللوحات والإضافات بشكل صحيح؟
  • اترك البيانات في المكان الذي كان مقدرًا لها أن تكون فيه. يجب التعامل مع المقاييس التي يتم الاتصال بها في المنزل
  • للحصول على الإعداد الخاص بالتوافر + قابلية التوسع ، نحتاج إلى استخدام الأطر الصحيحة التي تم تصميمها خصيصًا لهذا الغرض: تلبية البنية الموجهة للخدمة ("SOA"). على مستوى عالٍ جدًا ، يمكننا استخدام بروتوكول قائمة انتظار الرسائل لإرسال واستقبال الأحداث والرسائل عبر بروتوكول "AMQP". ننسى REST و HTTP ... في الوقت الحالي. باستخدام خادم قائمة انتظار الرسائل مثل RabbitMQ أو ZeroMQ ، لدينا خط أنابيب اتصالات موزع ، ومتسامح مع الأخطاء ، ومتوفر للغاية ، يمكن لكل من الناشرين / مرسلي البيانات والعاملين / المستقبلين استخدامه الشرائح هذه التي تشرح ZeroMQ).
  • استخدم لغة استعلام تم إنشاؤها خصيصًا لنماذج بيانات مركبة متباينة وغير مرتبطة. باستخدام "قاعدة بيانات الرسم البياني" وواجهة الاستعلام "

يسمح SPARQL للمستخدمين بكتابة استعلامات مقابل ما يمكن تسميته بشكل فضفاض ببيانات "قيمة المفتاح" أو ، بشكل أكثر تحديدًا ، البيانات التي تتبع مواصفات RDF الخاصة بـ W3C. وبالتالي فإن قاعدة البيانات بأكملها عبارة عن مجموعة من ثلاثيات "الموضوع - المسند - الكائن". هذا مشابه لاستخدام بعض قواعد بيانات NoSQL لمصطلح "قيمة مفتاح المستند" ، مثل MongoDB.
[..]
وبالتالي يوفر SPARQL مجموعة كاملة من عمليات الاستعلام التحليلي مثل JOIN و SORT و AGGREGATE للبيانات التي يعد مخططها جزءًا جوهريًا من البيانات بدلاً من طلب تعريف مخطط منفصل. غالبًا ما يتم توفير معلومات المخطط (علم الوجود) خارجيًا ، على الرغم من ذلك ، للسماح بدمج مجموعات البيانات المختلفة بطريقة لا لبس فيها. بالإضافة إلى ذلك ، يوفر SPARQL بنية محددة لاجتياز الرسم البياني للبيانات التي يمكن اعتبارها رسم بياني وشكل.
..
https://en.wikipedia.org/wiki/SPARQL

تذكر أن ما قدمه لنا جرافانا ولم يفعله Nagios أبدًا يتلخص في نقطة واحدة من الفشل: الافتقار إلى قابلية التوسع. Grafana "سريع" كما تقول ولكنك لا تأخذ في الاعتبار حقيقة أنك تقوم فقط بتخزين ومعالجة بيانات السلاسل الزمنية - وليس طبقة (طبقات) البيانات الوصفية أيضًا ! نحتاج إلى دلالات SparQL وقوة محرك (محركات) قاعدة بيانات Elasticache + الرسومية.

قد يبدو الأمر معقدًا .. يمكن أن يصبح أكثر تعقيدًا بسهولة من هاتين الصفحتين ، لكنني أنقذتك من سنوات من القوة الغاشمة والتجربة والخطأ وتخلصت من الضوضاء (على سبيل المثال: هناك 30 نمط تصميم لهندسة المؤسسة ، 12 من أجل uml ، إلخ .. ، نحتاج فقط إلى التحدث عن 3 حتى نتمكن من التخلص من هذا - في الوقت الحالي)

هذا من شأنه أن قسط من النوم (توقف طوال appsoa على سكايب أو يوميتو على IRC.

يعامل البعض في الوقت الحالي:

talbaror من الناحية المثالية ، يمكنك التقاط رسائل سجل NAC باستخدام وكيل مثل جدار حماية PIX وجعلها ببساطة تشحن / تعاد عبر rsyslogd أو أي بروتوكول يستخدمه خادم معالجة الأحداث.

إذا لم يكن لديك إعداد خدمة معالجة الحدث ، يمكنك استخدام معالجة قواعد Snort - Network Intrusion Detector . اتصل بي إذا احتجت إلى مساعدة .. قضيت 4 سنوات في شركة للأمن كخدمة ؛)

هل يمكنك دمج كشف الشذوذ مثل الشهوة ؟
مع علامات مرئية وتنبيه.

torkelo يرجى إعطائنا علامة للتسويق على الجدول الزمني لشحن هذا؟

johnnyshields أنا أعمل على هذا الآن كل يوم. إنها أشياء صعبة وتريد حقًا تصحيح الأساسيات حتى يتطور نظام التنبيه ويصبح أكثر ثراءً في المستقبل. النموذج الحالي الذي أعمل معه يبدو جيدًا حقًا ، وسينشر التحديث الأسبوع المقبل على نموذج قاعدة التنبيه الجديد المستند إلى الشروط.

نأمل في دمجه لإتقانه وإتاحته (خلف تبديل الميزة) في غضون أسبوعين إذا سارت الأمور بسلاسة. ليس لدينا تاريخ محدد بعد للإصدار التالي من Grafana ، إما إصدار 3.2 في سبتمبر أو إصدار 4.0 أكبر في نهاية أكتوبر.

torkelo نأمل أن نحصل على التنبيه في أقرب وقت ممكن. ينتظر.
استخدام grafana لـ kubernetes.

بالنسبة للأشخاص الآخرين الذين لديهم بالفعل statsd / الجرافيت / grafana في مكانهم وينتظرون فقط نظام تنبيه Grafana ليكون جاهزًا للقيام بالتنبيهات الأولى ، وجدت بديلاً رائعًا لاستخدامه في هذه الأثناء ، Seyren: https://github.com / سكوبال / سيرين

يتكامل بسهولة مع PagerDuty ويمكنك فقط نسخ أهداف الرسم البياني التي لديك بالفعل في لوحات معلومات grafana الخاصة بك للتنبيه بتحديد عتبات التحذير والخطأ.

يبدو أن الفريق قد أحرز تقدمًا كبيرًا في ميزة التنبيه. أنا أؤمن بفلسفة "القيام بشيء واحد ولكن القيام به بشكل جيد". لست متأكدًا مما إذا كان وضع منطق التنبيه بالكامل داخل Grafana هو أفضل فكرة. على أي حال ، لقد كتبت للتو node js daemon الصغير "flapjack-grafana-receiver" لنشر أحداث grafana على flapjack. ربما سأفتح مصدره على الأرجح. أي شخص مهتم؟

https://github.com/Charles546/flapjack-grafana-receiver

تحديث متقدم!

كان هناك شخص واحد على الأقل يعمل بدوام كامل في التنبيه منذ أبريل ، ولم يكن التقدم بالسرعة التي كنا نتمناها بسبب العديد من عمليات إعادة الكتابة. على الرغم من أننا نهدف إلى ميزات التنبيه الأساسية للإصدار الأولي ، فإننا نشعر أنه من المهم الحصول على نموذج قاعدة التنبيه الأساسي بشكل صحيح حتى نتمكن من توسيع تعريف قاعدة التنبيه ومحرك تقييم قاعدة التنبيه في الإصدارات المستقبلية دون إجراء إصلاح شامل.

لقد أدى الهدف المتمثل في البدء بتنبيه بسيط للغاية إلى القضاء على بعض الطرق المسدودة التي لم تكن على ما يرام وتطلبت بعض عمليات إعادة الكتابة الكبيرة. لكننا الآن عدنا إلى المسار الصحيح ونحرز تقدمًا جيدًا في نموذج القواعد المستندة إلى الشروط الذي نحن أكثر سعادة به.

image

تعريف القاعدة

يتكون نموذج قاعدة التنبيه الجديد من شرط واحد أو أكثر. يمكن أن تكون الظروف من أنواع مختلفة. يوجد الآن نوع استعلام فقط. لكن يمكننا لاحقًا إضافة شروط مثل Time of day أو Day of week أو الأكثر إثارة للاهتمام Other alert (لذا يمكنك تضمين حالة قاعدة تنبيه أخرى كشرط).

يتكون شرط الاستعلام من استعلام ونطاق زمني ، وهو مخفض يأخذ جميع نقاط البيانات التي يتم إرجاعها لكل سلسلة قام الاستعلام بإرجاعها ويقللها إلى قيمة واحدة لاستخدامها في مقارنة العتبة. يمكن أن يكون المخفض أيضًا في المستقبل "تنبؤًا" يقوم بانحدار خطي على البيانات ويتنبأ بقيمة مستقبلية.

يمكن أن يكون جزء التقييم لشرط الاستعلام إما أكبر من ، أو أقل ، أو بين الخ. وستتمكن من سحب المقابض في الرسم البياني لتعيين الحدود.

يوفر النموذج المستند إلى الشروط الكثير من الاحتمالات المثيرة لجعل قواعد التنبيه أكثر قوة في المستقبل دون إجراء إصلاح شامل للمحرك ، كما أن شرط الاستعلام يحتوي على هذه المكونات القابلة للتوصيل التي ستسمح بالتمديد (المخفض مع المعلمات ، والمقيم مع المعلمات).

إشعارات

لقد مر هذا الأسبوع ، ونحن نعمل على الإخطارات وبدأت الأمور تتضافر!

image

لدينا أنواع إشعارات البريد الإلكتروني والويب هوك والركود. يبدو إشعار الركود جيدًا :)
image

هل تريد المساعدة؟

يمكنك الاختبار وإعطاء الملاحظات بالفعل ، الكود موجود في فرع التنبيه ، وتحتاج أيضًا إلى تمكينه في ملف التكوين باستخدام.

[alerting]
enabled = true

دمج لإتقان

نحن قريبون جدًا من دمج هذا لإتقان ومواصلة العمل هناك. كنت آمل أن أفعل ذلك قبل إجازتي الصيفية (لقد مر أسبوع واحد فقط) ولكن لا تزال هناك بعض التغييرات الطفيفة في مخطط SQL التي أود القيام بها قبل الدمج للإتقان. الدمج للإتقان سيحدث بحلول 19 أغسطس ، أعدك :) بعد ذلك سيكون التنبيه في أحدث إصدار 4.0 ليليًا ، لذا سيكون من السهل عليك اختبار الأخطاء والإبلاغ عنها والتعليقات.

ماذا تبقى؟

هناك عدد من الميزات المفقودة التي نريدها لإصدار بيتا.

  • المزيد من المخفضات والقدرة على تغيير المخفض (فقط متوسط ​​الآن)
  • يبدو إشعار البريد الإلكتروني مثل حماقة
  • قفل مخطط الويب هوك
  • تصميم لصفحة قائمة التنبيه
  • عرض محفوظات التنبيه
  • عرض سجل التنبيه كتعليقات توضيحية على الرسم البياني
  • جدولة التنبيه واستقرار المحرك
  • تحسينات جدولة التنبيه لتوزيع الحمل (بحيث لا يتم تنفيذ التنبيهات في نفس الوقت)
  • تنبيه جدولة المجموعات

يؤسفني حقًا أن هذه الميزة تستغرق وقتًا طويلاً.

torkelo ، يرجى أن يكون لديك القدرة على وضع الآلات في وضع الصيانة لفترة محددة في الإصدار التجريبي.

torkelo شكرا على التحديث. مما يمكنني رؤيته ، هذا موجه نحو التنبيه داخل جرافانا. هل ما زلت تتبع الدورة المعيارية الموضحة في https://github.com/grafana/grafana/issues/2209#issuecomment -149351263؟

أيضا بفضل كل من يعمل على هذا الجان المخفية. أشك في Dieterbe ، لكنني لا أعرف.

RichiH لسنا متأكدين من كيفية عمل ذلك ، لقد حاولنا معرفة كيفية عمل نظام مثل هذا التعليق ولكننا لسنا متأكدين من كيفية عمله. نحن نركز الآن على تجربة تنبيه قوية خارج الصندوق يمكن أن تتحسن بمرور الوقت. يمكن للمستخدمين الذين لديهم معالج تنبيه حالي تعطيل منفذ التنبيه في Grafana وجعل Grafana يرسل التنبيه الذي يحتاج إلى تقييم إلى نظام آخر. سيتطلب الأمر الكثير من العمل على أنظمة الجهات الخارجية لتنفيذ هذا التكامل بالرغم من ذلك.

torkelo كانت أفكاري على نفس المنوال ، ولهذا قررت أن أسأل.

أنا شخصياً أهتم بتنبيه بروميثيوس ، لكنني سأقدر التكامل البصري اللطيف مع جرافانا. لا أهتم كثيرًا بمكان تحديد القواعد طالما تم تخزينها وتنفيذها بواسطة Prometheus.

bergquist كما ستكون في برومكون ، قد يكون الجلوس والتحدث عن الأساليب الممكنة منطقيًا. إذا كنت ترغب في ذلك ، فسأخبر مطوري بروميثيوس عن الوقت المناسب. قد يكون هناك بعض الوقت الهادئ للجلوس في المساء قبل و / أو بعد التنظيف ؛ يمكنني إخبارك إذا كنت تريد.

مرحبًا torkelo - هذا يبدو رائعًا.

لقد قمت للتو بسحب فرعك وعندما أختبر إنذارًا لـ ElasticSearch أحصل على الخطأ

firing false
timeMs 0.225ms
error tsdb.HandleRequest() error Could not find executor for data source type elasticsearch

... هل هذا يعني أن ElasticSearch لم يتم دعمه بعد: بكاء:

ملاحظة في إخراج العملية أحصل على هذا:

EROR[08-04|09:15:00] Alert Rule Result Error                  logger=alerting.engine ruleId=1 error="tsdb.HandleRequest() error Could not find executor for data source type elasticsearch" retry=nil LOG15_ERROR="Normalized odd number of arguments by adding nil"

@ Workshop2 نحن ندعم الجرافيت فقط للتنبيه حتى الآن ولكننا سندعم Elasticsearch في النهاية :) سأضيف رسالة خطأ أفضل لهذا.

كيف سيتصرف نظام التنبيه إذا لم يُرجع الاستعلام أي بيانات؟ هل ستطلق تنبيهًا افتراضيًا؟
أيضًا ، سيكون المخفض البسيط count رائعًا والذي يعرض ببساطة عدد نقاط البيانات التي يتم إرجاعها بواسطة استعلام.

bergquist اعتقدت أن التنبيه سيكون شفافًا فيما يتعلق بمصدر البيانات المستخدم. كم من الوقت قبل أن نتمكن من بدء معاينة / اختبار ميزة التنبيه على مصدر بيانات آخر غير الجرافيت؟ (أدركت أسئلة "إلى متى ..." لا يحبها أحد ، آسف)

RichiH أحد الخيارات هو إنشاء تطبيق grafana مثل bosun. https://grafana.net/plugins/bosun-app لكن هذا لا يمكّن إعادة استخدام الاستعلام / لوحة القيادة بطريقة بسيطة. دعونا نتحدث أكثر عن ذلك في برومكون. أتطلع للقائك! :)

لا يوجد دعم influxdb في البداية أيضا؟

لم أكن أعرف ارتباطه المحدد بالجرافيت :( نحن أيضًا نستخدم التدفق و
بحث مطاطي ؛)

في يوم الاثنين ، 8 أغسطس ، 2016 الساعة 2:18 مساءً ، كتب elvarb [email protected] :

لا يوجد دعم influxdb في البداية أيضا؟

-
أنت تتلقى هذا لأنه تم ذكرك.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -238218714 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/AEKf_4yp6-34PaOE2z4ynSriRxQpjKcvks5qdx59gaJpZM4FJUTl
.

إنريكو كيرن

مهندس نظام الرصاص

glispa GmbH
Sonnenburger Straße 73
10437 برلين ، ألمانيا

هاتف: 17 5557130 30 49+
الفاكس: +49 30 5557130-50
سكايب: flyersaenrico. [email protected]


سيتز برلين ، إيه جي شارلوتنبورغ HRB 114678B

في البداية فقط ، من المحتمل أن نضيف بروميثيوس قبل الإصدار. ربما InfluxDB أو Elasticsearch أيضًا ، نظرًا لأن جدولة التنبيه وتنفيذها مستمران في الواجهة الخلفية ، تمت كتابة كود الطلب والاستجابة من البداية (في Go) ، لا يمكن إعادة استخدام كود البرنامج المساعد لمصدر بيانات الواجهة الأمامية (مكتوب بلغة js).

نحن نستخدم التدفق ، أعتقد أننا قد نتخلى عن تكامل grafana ونستخدم Kapacitor مع واجهة ويب بسيطة لإنشاء التنبيهات وإدارتها.

+1 تنبيه + InfluxDB.

يوم الاثنين 8 أغسطس 2016 الساعة 6:01 صباحًا ، Thom Nichols [email protected]
كتب:

نحن نستخدم التدفق ، أعتقد أننا قد نتخلى عن تكامل واستخدام برنامج grafana
Kapacitor بواجهة ويب بسيطة لإنشاء التنبيهات وإدارتها.

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -238228133 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/AAY0-VP--Ysoxu5IV0hslQrP8cvF5ePSks5qdyi_gaJpZM4FJUTl
.

ديباك

من المؤسف أن العمل الذي وضعناه في بناء المكونات الإضافية لمصادر البيانات مفيد فقط للعميل.

بالنظر إلى العمل الفوري والطويل الأجل الذي يدعم التنبيه لمصادر البيانات المختلفة ، وبناء بنية go plugin وما إلى ذلك ، فلن يكون نفس مقدار العمل تقريبًا (إن لم يكن أقل) لبناء خادم التنبيه في NodeJS ، لذلك يمكنه استخدام موجود الإضافات لمصادر البيانات؟

بغض النظر عن الآراء حول go vs. nodejs ، يمكن أن يقلل هذا بشكل كبير من تكرار الكود للتنبيه على مصادر البيانات المختلفة.

وإذا كنت لا تحب العقدة حقًا ، فأنا أراهن على وجود آلية شرح قيد التشغيل لتحميل JS وتنفيذه.

+1 تنبيه لـ ElasticSearch

مرحبًا ، لقد كنا ننتظر نظام التنبيه لـ ... OpenTSDB! هل نستطيع
آمل في الحصول عليه لـ OpenTSDB قريبًا؟ (ربما متى؟)

شكرا جزيلا للفريق!

2016-08-08 17:28 GMT + 02: 00 Slava Vishnyakov [email protected] :

+1 تنبيه لـ ElasticSearch

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -238273405 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/ARsY50v7meI_EuzSAJGtvDMDareYKSDhks5qd0sggaJpZM4FJUTl
.

+1 تنبيه لـ ElasticSearch
هل سيكون لديها إمكانية تنفيذ برنامج نصي عند التنبيه؟

هل لديكم فرع التنبيه في صورة عامل ميناء حتى الآن؟

  1. هل استعلامات التنبيه تعمل فقط للاستعلام "أ"؟ هل هذا مشفر؟
  2. متى نتوقع إصدار تنبيه يعمل بكامل طاقته؟ (التاسع عشر لا يزال الهدف)
  3. متى نتوقع أن يعمل Elasticsearch مع التنبيه؟

يحرر:

  1. هل يمكنني إضافة أكثر من قاعدة إنذار واحدة لكل رسم بياني؟
  2. هل يمكنني إضافة بعض المعلومات حول التنبيه إلى رسالة HTTP؟ (لوحة القيادة / الرسم البياني / الاستعلام_المالحظ / alarm_config / alarm_query / العتبة / warn_or_crit / القيمة / الملاحظة_إطار / time_of_occurence)

تضمين التغريدة

1) يمكنك التغيير إلى أي استعلام لديك في علامة التبويب المقاييس.
2) العمل بشكل كامل ، يعتمد على ما تعنيه. نحن نخطط لدمجه لإتقان هذا الأسبوع. ثم يمكن للأشخاص البدء في اختبار التصميم الليلي وإبداء الرأي. إصدار ألفا في غضون 2-3 أسابيع ، الإصدار التجريبي والمستقر يعتمد على التعليقات ومدى سرعة استقراره
3) Elasticsearch صعب ، ويتطلب الكثير من التعليمات البرمجية للاستعلام عن الاستجابة وتحليلها في سلاسل زمنية ، لذلك من المحتمل أن يأتي بعد إضافة دعم Prometheus و InfluxDB

تضمين التغريدة
أنا جديد في elasticsearch و grafana و go lang. وأعتقد أنك بحثت بالفعل عن عملاء ولكن هل رأيت هؤلاء؟
https://github.com/olivere/elastic
https://github.com/mattbaird/elastigo
قد تقلل تلك الليبات من الجهد.

أيضا بفضل كل من يعمل على هذا الجان المخفية. أشك في Dieterbe ، لكنني لا أعرف.

التنبيه الآن بشكل أساسي torkelo و bergquistmattttt ). لقد حولت التركيز إلى الواجهة الخلفية للجرافيت القادمة ، https://github.com/raintank/metrictank

يسعدني جدًا أن أرى هذه الميزة تحقق تقدمًا. أرغب في الحصول على دعم OpenTSDB لأن حلول التنبيه الأخرى (Bosun) لن تكون سهلة الاستخدام بدرجة كافية للاستخدام المنتظم هنا.

آمل أن أرى ناقوس الخطر في النسخة الرسمية التالية وأن أشيد بالمبرمجين الذين عملوا بجد لكتابة الكود.

آمل أن أرى ناقوس الخطر في النسخة الرسمية التالية وأن أشيد بالمبرمجين الذين عملوا بجد لكتابة الكود.

superbool آسف لم

الدمج للإتقان سيحدث بحلول 19 أغسطس ، أعدك :)

torkelo ها هي المرة القادمة التي أراهن فيها. هل هناك موعد جديد؟

هل يمكننا أن نتوقع جدولة التنبيه الخاص بـ OpenTSDB؟
(متواضع) التأسيس لتشجيع التنمية.

2016-08-22 10:05 GMT + 02: 00 A. Binzxxxxxx [email protected] :

آمل أن أرى ناقوس الخطر في النسخة الرسمية التالية وأن أشيد بالمبرمجين الذين عملوا بجد لكتابة الكود.

superbool https://github.com/superbool آسف لا أستطيع قراءة هذا و
لم تكن ترجمة جوجل مفيدة للغاية

الدمج للإتقان سيحدث بحلول 19 أغسطس ، أعدك :)

torkelo https://github.com/torkelo هيه في المرة القادمة التي أراهن فيها
موعد جديد؟

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment -241340597 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/ARsY59771TaHEIaqCHbf-4TKWc4OdjVXks5qiVhdgaJpZM4FJUTl
.

@ DEvil0000 آمل أن ترى ميزة التنبيه ستكون قادرة على النشر في إصدار Grafana المستقر التالي ، وأود أن أشيد تقديراً عالياً لكل من طوروا الأداة.
آسف ، لغتي الإنجليزية ليست جيدة ، آمل أن تتمكن من فهم كلامي

@ DEvil0000 كانت الخطة هي الدمج يوم الجمعة الماضي ولكن بسبب بعض الأحداث غير المخطط لها (https://twitter.com/torkelo/status/766514688997732352) كان علينا تأجيلها قليلاً :) لا يزال لدينا بعض الأشياء البسيطة للقيام بها.

torkelo مبروك!
bergquisttorkelo أحتاج إلى التنبيه

تم الآن دمج فرع التنبيه في النظام الرئيسي. : رفع اليدين:

نحن نقدر جميع التعليقات التي تلقيناها من هذه المشكلة. شكرا لكم جميعا !
للمناقشة والتعليقات في المستقبل ، يرجى النشر في قضية التنبيه المقابلة أو إنشاء واحدة جديدة. يساعدنا هذا في تنظيم عملنا المستقبلي وتحديد أولوياته. أنا أغلق هذه التذكرة لصالح البطاقات الجديدة. لكن لا تتردد في متابعة المناقشة في هذه المسألة.

إذا ما هو التالي؟

  • إصدار ألفا (مستندات ومدونة)
  • جمع ردود الفعل من المجتمع.
  • استمر في العمل على المشكلات المتبقية
  • حرر Grafana 4.0 مع التنبيه.

حاول؟

  • يجب عليك تمكين التنبيه في ملف التكوين .
  • يمكنك الآن العثور على تنبيه في القائمة الجانبية.
  • يمكنك إضافة تنبيه بالذهاب إلى لوحة الرسم البياني واختيار علامة تبويب التنبيه.
  • استخدم الزر _Test alert_ للتحقق من تنبيهك.
  • لحفظ التنبيه ، ما عليك سوى حفظ لوحة القيادة.
  • قم بإعداد الإخطار / التنبيه / الإخطارات ليتم إخطارك بإطلاق التنبيهات.
  • أضف المخطر إلى تنبيه في علامة تبويب التنبيه.

القيود الحالية

  • حتى الآن نحن ندعم فقط الجرافيت.
  • بالنسبة لهذا الإصدار ، تدعم لوحة الرسم البياني فقط التنبيه.

مثال على لوحات المعلومات

يمكنك العثور على أمثلة على لوحات المعلومات في مجلد الأمثلة.
تعتمد لوحات المعلومات النموذجية على البيانات المأخوذة من كاتب بيانات الجرافيت المزيف. يمكنك بدء تشغيل الجرافيت وكاتب البيانات المزيفة من ملفات إنشاء عامل الإرساء.

cd docker/
./create_docker_compose.sh graphite
docker-compose up

يجب اعتبار هذا دليلًا تقريبيًا فقط وسنضيف المزيد من الوثائق حول التنبيه في الأسابيع التالية.

تنبيه سعيد! : كوكتيل:: تادا:

تضمين التغريدة

هل هناك مشكلة يمكننا متابعتها حول مستقبل هذه الميزة؟

لا يوجد سوى "و" وليس "أو" في شروط التنبيه لإضافة "فوق" أو "أدناه" في لوحة واحدة أو هل هناك طريقة أخرى لدعم هذا؟

أعتقد أن هناك خيار "خارج النطاق" / "في النطاق". ولكن أود أيضًا أن أرى علامة "أو".

اهلا جميعا! شكرا جزيلا لمساهمتك في هذه الوظيفة المفيدة.

إنه أمر مثير للاهتمام حقًا بالنسبة لي ، ولكن في كثير من الحالات سأحتاج إلى "OR" في شروط التنبيه لأنه لا توجد إمكانية لإنشاء أكثر من تنبيه واحد في gragh.

أعتقد أنه بدون ذلك "أو" لن أتمكن من إنشاء تنبيهات لهذا النوع من الرسوم البيانية:

image

اي فكرة؟ هل تخطط لإضافة خيار "أو"؟

BR

jmgonzalezp نعم ، نأمل أن ندعم OR أيضًا (لست متأكدًا من الخلط AND و OR حتى الآن)

لدينا قراران تصميم متبقيان للتنبيه إلى أننا نرغب في الحصول على بعض التعليقات حول (التصنيف ، والخطورة / الحالة).

هذه هي المشكلة مع أفكارنا الحالية وسنقدر حقًا تعليقاتك.
https://github.com/grafana/grafana/issues/6007

تحية للجميع! شكرا لهذه الميزة الرائعة في جرافانا!

لدي سؤال بخصوص نظام التنبيه هذا. حاليًا ، نحن نستخدم مجموعة التحجيم التلقائي في AWS لنشر grafana ، فهل ستكون هذه مشكلة إذا قمت بتشغيل grafana في أجهزة متعددة؟ المشكلة التي أشير إليها هي ، هل سيكون هناك العديد من التنبيهات نفسها من عدة أجهزة grafana؟ أو تعاملت غرافانا بالفعل مع ذلك؟

torkelo لدي نفس سؤالakurniawan. دعنا نفكر في هذا الإعداد: 1 موازن التحميل ، 3 مثيلات Grafana خلف موازن التحميل ، 1 Mysql DB التي تشاركها جميع المثيلات الثلاثة. كيف ستتعامل خوادم Grafana مع التنبيهات في هذا النوع من الإعداد؟ هل يجب علينا تمكين التنبيه في حالة واحدة فقط ، أم أن Grafana يتتبع التنبيهات بحيث لا تتحقق العقد المتعددة من نفس التنبيهات وترسلها؟

utkarshcmuakurniawan تنبيه ضمن grafana لا يدعم HA حتى الان. خطتنا هي إضافة دعم لتنبيهات التقسيم بين الخوادم في المستقبل.

bergquist شكرا على الإجابة. :)

bergquist هل هناك أي وقت متوقع للوصول عند إضافة دعم InfluxDB لهذا؟

thisisjaid بناءً على https://github.com/grafana/grafana/milestone/40 ، يجب أن يكون هنا في العاشر.

Dieterbe هل من أي

sofixa شكرًا ، كان يجب أن

Dieterbe هل من أي

لم أعد أعمل على التنبيه. ربما يستطيعtorkelo أو bergquist الإجابة.

تضمين التغريدة

أي ETA لتنبيه دعم OpenTSDB

LoaderMick @ naveen-tirupattur تمت إضافة تنبيه OpenTSDB إلى Grafana ، يجب أن يكون جزءًا من الإصدار التالي. أيضًا ، يعمل التنبيه الخاص بـ OpenTSDB في الإنشاءات الليلية.

أي ETA لتنبيه الدعم لـ influxDB و prometheus أيضًا؟

تنبيه nnsaln لكلا مصدري البيانات موجود بالفعل في الفرع الرئيسي.

لا أستطيع الحصول على التنبيه أثناء العمل مع OpenTSDB مع (Grafana v4.0.0-pre1 (الالتزام: 578507a)). لقد اختبرت نظام البريد الإلكتروني (يعمل) ولكن التنبيهات لا تنطلق حتى عندما يكون لدي حد منخفض للغاية. هل هناك طريقة لتشغيل الاستعلامات يدويًا والاطلاع على البيانات التي يتم سحبها؟

alerting

Grafana v4.0.0-pre1 (الالتزام: 9b28bf2)
خطأ tsdb.HandleRequest () خطأ قام Influxdb بإرجاع رمز الحالة غير صالح: 400 طلب غير صحيح

تضمين التغريدة
هل يمكن لـ "إشعار تنبيه الخطاف التلقائي" نشر مقياس التنبيه أو نوع json أو النموذج؟

مرحبًا يا شباب ، هل ستدعم Grafana التنبيه للاستفسارات باستخدام متغيرات القالب أم أن هناك إصدارًا مستهدفًا لهذا؟

الكل ، يرجى المحاولة 4.0 بيتا ؛ إذا كان هناك شيء مفقود ، افتح قضايا جديدة.

ريتشارد

مرسلة عن طريق الهاتف المحمول. عفواً للإيجاز.

لقد جربت 4.0 بيتا ، لكن ما زلت أتلقى هذا الخطأ
خطأ tsdb.HandleRequest () خطأ قام Influxdb بإرجاع رمز الحالة غير صالح: 400 طلب غير صحيح

لا يمكنني حفظ إشعارات التنبيه - الإرسال إلى ، بعد أن حفظت ، يصبح صف الإرسال إلى فارغًا مرة أخرى

nnsaln من المفترض أن تملأ هدف الإشعار هناك ، وليس عنوان البريد الإلكتروني. افتح قائمة grafana الجانبية وقم بالمرور فوق خيار قائمة التنبيه ، ثم اضغط على خيارات قائمة التنبيهات. هناك يمكنك إعداد هدف إعلام يمكنك استخدامه من قواعد التنبيه الخاصة بك.

هل هناك أي خطة لدعم متغيرات النموذج جنبًا إلى جنب مع التنبيه؟ أنا افعل
فهم كل رسم بياني تم إنشاؤه بواسطة متغير قالب (أو مجموعة) يتوافق
إلى رسم بياني مختلف ، وبالتالي إنشاء تنبيه مقابل قيمة ثابتة هو
غير صحيح.

يوم الإثنين 5 ديسمبر 2016 الساعة 2:06 صباحًا ، توماس بارتون [email protected]
كتب:

nnsaln https://github.com/nnsaln من المفترض أن تملأ الإشعار
الهدف هناك ، وليس عنوان البريد الإلكتروني. افتح قائمة grafana الجانبية وقم بالمرور فوقها
خيار قائمة التنبيه ، ثم اضغط على خيارات قائمة التنبيهات. هناك
يمكنك إعداد هدف إعلام يمكنك استخدامه من قواعد التنبيه الخاصة بك.

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment-264813888 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/AAY0-X4UkyVE0MeBlSiYD9892OuruGcVks5rE-I6gaJpZM4FJUTl
.

-
ديباك

لا ، لا يوجد حاليًا أي دعم للقيام بذلك. ربما في المستقبل البعيد ولكن

99٪ من لوحات المعلومات تستخدم متغيرات القالب. تم تصميمها مع القالب
المتغيرات لتجنب مشكلة "انفجار لوحة القيادة".

يوم الاثنين ، 5 ديسمبر 2016 ، الساعة 8:20 مساءً ، Torkel Ödegaard [email protected]
كتب:

لا ، لا يوجد حاليًا أي دعم للقيام بذلك. ربما في المستقبل البعيد ولكن

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment-265056805 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/AAY0-T9iFrqUcq4KbIECDe526040U6DHks5rFOJ4gaJpZM4FJUTl
.

-
ديباك

نعم ، لكن لوحة معلومات الاستكشاف العامة تختلف عن تصميم لوحة المعلومات لقواعد التنبيه.

حتى الآن لم يكن هناك اقتراح حول كيفية دعم متغيرات القالب بطريقة بديهية / مفهومة. ما الذي يجب أن يفعله استعلام التنبيه مع المتغير؟ أقحم مع القيمة المتغيرة المحفوظة الحالية ، مع كل؟ يجب أن يتعامل مع كل قيمة كقاعدة منفصلة والاحتفاظ بالحالة لكل إلخ. متغيرات القوالب الداعمة تفتح علبة من الديدان للتعقيد والسلوك الذي يحتمل أن يكون مربكًا. قد يضاف يومًا ما إذا توصل أحدهم إلى طريقة بسيطة ومفهومة.

في غضون ذلك ، لا شيء يمنعك من إنشاء لوحات معلومات منفصلة للتنبيه.
التنبيه جديد وإضافة ضخمة إلى grafana. سوف تتطور مع الوقت ،
ولكن في وقت قصير تم تنفيذه أضاف قيمة كبيرة إلى grafana ،
وشكرًا لجميع المساهمين على ذلك!

صباح 06.12.2016 11:14 nachm. schrieb "Torkel Ödegaard" <
[email protected]>:

نعم ، لكن لوحة معلومات الاستكشاف العامة ليست هي نفسها لوحة القيادة
تصميم قواعد التنبيه.

حتى الآن لم يكن هناك اقتراح حول كيفية دعم متغيرات القالب
بطريقة بديهية / مفهومة. ما يجب التنبيه الاستعلام مع المتغير
فعل؟ أقحم مع القيمة المتغيرة المحفوظة الحالية ، مع كل؟ ينبغي له
تعامل مع كل قيمة كقاعدة منفصلة واحتفظ بالحالة لكل دعم وما إلى ذلك
تفتح متغيرات القوالب علبة من الديدان للتعقيد وربما
سلوك محير. قد يضاف e يومًا ما إذا ظهر أحد الأشخاص بامتداد
طريقة بسيطة ومفهومة.

-
أنت تتلقى هذا لأنه تم ذكرك.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment-265290049 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/AEKf_5VldwX2fG-USjnmlMH2qOZIDdKpks5rFd5DgaJpZM4FJUTl
.

+1 توركل.

إنه يجعل التنبيه معقدًا إلى حد ما.

يوم الثلاثاء ، 6 ديسمبر 2016 ، الساعة 2:14 مساءً ، Torkel Ödegaard [email protected]
كتب:

نعم ، لكن لوحة معلومات الاستكشاف العامة ليست هي نفسها لوحة القيادة
تصميم قواعد التنبيه.

حتى الآن لم يكن هناك اقتراح حول كيفية دعم متغيرات القالب
بطريقة بديهية / مفهومة. ما يجب التنبيه الاستعلام مع المتغير
فعل؟ أقحم مع القيمة المتغيرة المحفوظة الحالية ، مع كل؟ ينبغي له
تعامل مع كل قيمة كقاعدة منفصلة واحتفظ بالحالة لكل دعم وما إلى ذلك
تفتح متغيرات القوالب علبة من الديدان للتعقيد وربما
سلوك محير. قد يضاف e يومًا ما إذا ظهر أحد الأشخاص بامتداد
طريقة بسيطة ومفهومة.

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment-265290049 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/AAY0-UgrMH9u7sI-FmPVgFhMVXJBvzTvks5rFd48gaJpZM4FJUTl
.

-
ديباك

bergquist بخصوص هذا التعليق

التنبيه داخل grafana لا يدعم HA حتى الآن. خطتنا هي إضافة دعم لتنبيهات التقسيم بين الخوادم في المستقبل

هل هناك تذكرة لتتبع التقدم؟ أي فرع للمساهمة؟

وشكرا جزيلا على العمل الرائع!

كيرن ،

<3 جرافانا.

كنت أحاول فقط مشاركة الأفكار حول التنبيه باستخدام النموذج
لوحات القيادة.

يوم الجمعة ، 9 ديسمبر 2016 الساعة 2:53 صباحًا ، Dmitry Zhukov [email protected]
كتب:

bergquist https://github.com/bergquist بخصوص هذا التعليق

التنبيه داخل grafana لا يدعم HA حتى الآن. خطتنا هي إضافة
دعم لتقسيم التنبيهات بين الخوادم في المستقبل

هل هناك تذكرة لتتبع التقدم؟ أي فرع للمساهمة؟

وشكرا جزيلا على العمل الرائع!

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/grafana/grafana/issues/2209#issuecomment-265986808 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/AAY0-aQXFZUeEfVl0MSQP7FQpMZGIh0mks5rGTMsgaJpZM4FJUTl
.

-
ديباك

أخيرا وتنبيه بنيتtorkeloDieterbe انها رهيبة لفي Grafana! ما هي الطريقة الموصى بها (إن وجدت) لإنشاء التنبيهات برمجيًا؟

jaimegago لإنشاء تنبيهات برمجيًا ، استخدم تطبيقات لوحة القيادة ، ويتم حفظ التنبيهات مع لوحة ولوحة معلومات.

torkelo ماذا عن أهداف الإشعارات (مثل إنشاء بريد إلكتروني جديد للإشعار عبر واجهة برمجة التطبيقات)؟

تعديل: رداً على نفسي هنا ، وجدت نقطة نهاية api / alert-notifications. أعتقد أنه يحتاج فقط إلى التوثيق

بالطبع هناك http api لذلك ، ما عليك سوى الانتقال إلى صفحة إشعارات التنبيه ، وإضافة إشعار وتحقق من http api call grafana.

torkelo ، هل هناك أي واجهة

CCWeiZ Alerts هو جزء من لوحة القيادة json. لذلك يمكنك فقط إنشاء لوحة تحكم تحتوي على تنبيه وليس تنبيهات فقط.

يمكنك قراءة المزيد حول واجهة برمجة تطبيقات لوحة القيادة على http://docs.grafana.org/http_api/dashboard/

هل هذا متاح: أرغب في إعداد تنبيه إذا ما كانت هناك قيمة ما قبل 3 أيام ، فالقيمة لا تزداد. (تقول الطلبات ، إذا كانت القيمة الآن - الطلبات قبل 3 أيام أقل من 100 ، فإننا نقول أنه لا توجد طلبات كثيرة.). كيف نفعل ذلك؟

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات

القضايا ذات الصلة

victorhooi picture victorhooi  ·  3تعليقات

Minims picture Minims  ·  3تعليقات

kcajf picture kcajf  ·  3تعليقات

KlavsKlavsen picture KlavsKlavsen  ·  3تعليقات

jackmeagher picture jackmeagher  ·  3تعليقات