Libelektra: Crear trabajos: partes del conjunto de pruebas fallan con regularidad

Creado en 25 feb. 2019 · 14Comentarios · Fuente: ElektraInitiative/libelektra

Descripción

Abrí esto como un problema para realizar un seguimiento de todas las fallas de prueba temporales en uno de los trabajos de compilación. Las principales razones de las fallas de compilación son

las pruebas para los enlaces / complementos de notificación , y
las pruebas para el complemento criptográfico (esto solo se aplica al servidor de compilación de Jenkins)

. En un PR reciente tuve que reiniciar el trabajo de construcción de Jenkins 5 veces antes de que todo funcionara. En las relaciones públicas después de eso reinicié el trabajo de construcción de Jenkins tres veces, por lo que puedo recordar. De todos modos, en mi opinión, la tasa de fallos es demasiado alta.

Fracasos

| Ubicacion | Pruebas fallidas | Crear trabajo |
| ---------- | ------------- | ----------- |
| master | testmod_gpgme (1) | debian-stable-full |
| master | testmod_gpgme (1), testmod_zeromqsend (1) | debian-stable-full-ini |
| master | testmod_crypto_botan (1), testmod_fcrypt (1), testmod_gpgme (2), testmod_zeromqsend (1) | debian-stable-full-mmap |
| master | testmod_crypto_botan (1), testmod_fcrypt (2) | debian-unstable-full |
| master | testmod_crypto_botan (2), testmod_crypto_openssl (3), testmod_fcrypt (1) | debian-unstable-full-clang |
| PR #2442 | testmod_crypto_openssl (1), testmod_gpgme (1) | debian-stable-full-ini |
| PR #2442 | testmod_crypto_openssl (1), testmod_crypto_botan (1), testmod_fcrypt (1), testmod_gpgme (3) | debian-stable-full-mmap |
| PR #2442 | testmod_crypto_openssl (1), testmod_fcrypt (1) | debian-unstable-full |
| PR #2442 | testmod_crypto_openssl (1), testmod_crypto_botan (1), testmod_fcrypt (1) | debian-unstable-full-clang |
| PR #2442 | testmod_dbus (1), testmod_dbusrecv (1) | 🍎 MMap |
| PR #2443 | testmod_crypto_botan (1), testmod_fcrypt (1) | debian-unstable-full |
| PR #2443 | testmod_crypto_openssl (1), testmod_crypto_botan (1) | debian-unstable-full-clang |
| PR #2443 | testmod_dbus (1), testmod_dbusrecv (1) | 🍎 MMap |
| PR #2445 | testmod_crypto_openssl (1), testmod_crypto_botan (1), testmod_fcrypt (1) | debian-stable-full-ini |
| PR #2445 | testmod_crypto_openssl (2), testmod_crypto_botan (2), testmod_fcrypt (2), testmod_gpgme (1) | debian-stable-full-mmap |
| PR #2445 | testmod_crypto_openssl (2), testmod_fcrypt (2) | debian-unstable-full |
| PR #2445 | testmod_dbus (1), testmod_dbusrecv (1) | 🍏 GCC |

bug build

Fuente

sanssecours

👍1

Comentario más útil

Ahora implementé el reintento automático de ctest en # 3224. Si aún experimenta fallas temporales en las suites de prueba , vuelva a abrir el problema. (Podemos aumentar el número de intentos).

Para otras fallas de Jenkins / Docker, necesitamos encontrar otras soluciones, pero primero finalmente necesitamos hacer la migración. Por lo tanto, continúe reiniciando el trabajo en estos casos.

markus2330 en 17 nov. 2019

🚀1 🎉1

Todos 14 comentarios

¡Gracias por su resumen de estos problemas!

¿Es posible deshabilitar los trabajos solo en los lugares donde están fallando?

markus2330 en 25 feb. 2019

Para el complemento crypto y fcrypt @mpranj señaló que gpg-agent puede fallar en caso de alta carga del servidor. ¿Quizás podríamos crear un trabajo de compilación separado para las pruebas de los complementos crypto y fcrypt ? Para que no se bloqueen otros desarrollos.

petermax2 en 26 feb. 2019

¡Gracias por su aporte!

La separación de los trabajos problemáticos podría acortar los ciclos de reconstrucción. Pero creo que está claro que no queremos ninguna reconstrucción manual. Entonces tenemos las opciones:

haciéndolo más confiable
algunos bucles automáticos que vuelven a intentar estos errores
deshabilitar las pruebas (cuando alguien trabaja en estas partes, necesita activarlas nuevamente)

¿Qué piensas?

markus2330 en 26 feb. 2019

haciéndolo más confiable

difícilmente posible siempre que utilicemos gpg-agent (que es una molestia en los trabajos por lotes)

algunos bucles automáticos que vuelven a intentar estos errores

Esto me parece sucio.

deshabilitar las pruebas (cuando alguien trabaja en estas partes, necesita activarlas nuevamente)

Parece ser la opción que menos molestias causa, aunque tener pruebas de regresión manual tampoco es agradable.

petermax2 en 27 feb. 2019

Como se discutió en la reunión: debemos deshabilitar las pruebas.

markus2330 en 27 feb. 2019

👍1

Alternativa también discutida en la reunión: Usar ctest --rerun-failed

Al ejecutar ctest crea el archivo <cmake_build_dir>/Testing/Temporary/LastTestsFailed[_timestamp].log (la marca de tiempo solo se usa en el modo Panel de control). Este archivo también lo utiliza ctest --rerun-failed (consulte Kitware / CMake @ eb2decc02d28f41a3e189d5387be24552c42060f). Simplemente contiene los números y nombres de las últimas pruebas que fallaron.

Mi propuesta sería llamar ctest como antes. Si sale sin éxito, use grep en LastTestsFailed.log para verificar si una de las pruebas enumeradas anteriormente falló. Y solo entonces use ctest --rerun-failed . Esto provoca una salida menos duplicada / confusa.

Pero si el problema realmente es una alta carga del servidor, eso no ayudará mucho. En su lugar, podríamos probar ctest --test-load . Esto debería hacer que ctest mantenga la carga de la CPU por debajo de un cierto umbral.

En mi opinión, la mejor opción sería deshabilitar las pruebas y crear un pequeño trabajo de compilación que solo instale las dependencias necesarias para estos complementos / bibliotecas, solo compila lo necesario y solo ejecuta las pruebas problemáticas. De esa manera, podríamos lograr que el tiempo de ejecución se realice probablemente en unos pocos minutos, en cuyo caso el reinicio manual sería aceptable, creo. A modo de comparación, nuestros trabajos de FreeBSD actualmente tardan unos 10 minutos (7 minutos de construcción, 2 minutos de prueba, 1 minuto más) para ejecutar ~ 200 pruebas.

PD. No estoy seguro de nuestra configuración, pero debería ser posible reiniciar una canalización de jenkins desde una determinada etapa

kodebach en 27 feb. 2019

👍1

Alternativa también discutida en la reunión: Usar ctest --rerun-failed

¡Gracias por investigarlo!

Pero si el problema realmente es una alta carga del servidor, eso no ayudará mucho. En su lugar, podríamos probar ctest --test-load.

@ingwinlu hizo mucho trabajo en esta dirección. Nuestros servidores tienen el mayor rendimiento con alta carga. Es decir, ralentizaríamos nuestras pruebas con esas opciones.

En mi opinión, la mejor opción sería deshabilitar las pruebas y crear un pequeño trabajo de compilación que solo instale el

Los casos de prueba modulares son muy difíciles de lograr y mantener. @ingwinlu se esforzó mucho. Creo que no podemos volver a hacer este esfuerzo solo para algunas pruebas poco fiables.

PD. No estoy seguro de nuestra configuración, pero debería ser posible reiniciar una canalización de jenkins desde una determinada etapa

Eso seria genial. Pero no veo el botón de reinicio en nuestra GUI. ¿Necesitamos otro complemento o una versión más reciente? @ingwinlu intentó agregar "jenkins build * please" para todos los pasos de la canalización, desafortunadamente, no funcionó.

markus2330 en 28 feb. 2019

Parece que todavía tenemos fallas (ver dbus # 2532)

markus2330 en 25 mar. 2019

¿Qué hay de excluir los casos de prueba de dbus para las compilaciones de Mac?

markus2330 en 10 jun. 2019

👍1

Parece que todavía tenemos fallas (ver dbus # 2532)

Sí.

gcc --version

Configured with: --prefix=/Applications/Xcode-10.2.1.app/Contents/Developer/usr --with-gxx-include-dir=/Applications/Xcode-10.2.1.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX10.14.sdk/usr/include/c++/4.2.1

Apple LLVM version 10.0.1 (clang-1001.0.46.4)

Target: x86_64-apple-darwin18.5.0

Thread model: posix

InstalledDir: /Applications/Xcode-10.2.1.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin

(...)

DBUSRECV TESTS

==============

testing prerequisites

detecting available bus types - please ignore single error messages prefixed with "connect:"

connect: Failed to open connection to system message bus: Failed to connect to socket /usr/local/var/run/dbus/system_bus_socket: No such file or directory

test commit

test adding keys

../src/plugins/dbusrecv/testmod_dbusrecv.c:228: error in test_keyAdded: string "system/tests/testmod_dbusrecv/added" is not equal to "user/tests/foo/bar"

    compared: expectedKeyName and keyName (test_callbackKey)

test adding keys

testmod_dbusrecv Results: 34 Tests done — 1 error.

dominicjaeger en 19 ago. 2019

¿Pudiste reproducirlo localmente?

Aún no sabemos por qué este problema se produce de forma esporádica. Si tiene alguna aportación, sería genial.

¿Quizás simplemente podemos excluir las pruebas de los trabajos de construcción problemáticos? ¿O fallan los casos de prueba dbus * en cada trabajo de compilación en el que se ejecuta?

markus2330 en 19 ago. 2019

¿Pudiste reproducirlo localmente?

Lamentablemente no. Estoy en Ubuntu.

¿Quizás simplemente podemos excluir las pruebas de los trabajos de construcción problemáticos? ¿O fallan los casos de prueba dbus * en cada trabajo de compilación en el que se ejecuta?

Acabo de reiniciar el trabajo de compilación para ver si vuelve a suceder.

dominicjaeger en 19 ago. 2019

👍1

Por favor, vuelva a asignarme si es necesario.

petermax2 en 6 nov. 2019

❤1

Para otras fallas de Jenkins / Docker, necesitamos encontrar otras soluciones, pero primero finalmente necesitamos hacer la migración. Por lo tanto, continúe reiniciando el trabajo en estos casos.

markus2330 en 17 nov. 2019

🚀1 🎉1

¿Fue útil esta página

0 / 5 - 0 calificaciones

Temas relacionados

Jenkins: Falla la compilación de MinGW

sanssecours · 3Comentarios

Lanzamiento: debian

mpranj · 3Comentarios

Errores de prueba con una compilación mínima

e1528532 · 4Comentarios

bindings java: HelloElektra.java errores

dmoisej · 3Comentarios

generación de código para errores

markus2330 · 4Comentarios