Libelektra: les tests génèrent un nombre illimité d'agents gpg

Créé le 19 avr. 2018 · 36Commentaires · Source: ElektraInitiative/libelektra

Étapes pour reproduire le problème

construire elektra par exemple dans un conteneur docker, ou vérifier le serveur v2
exécuter des tests make run_nokdbtests
ps -ef
exécuter des tests make run_nokdbtests
ps -ef
????
Je me demande où tous tes pid sont allés

résultat attendu

les tests doivent arrêter gpg-agents une fois qu'ils sont terminés

Résultat actuel

chaque exécution de test génère plus d'agents gpg

Information système

Version Elektra: maître

Autres fichiers journaux et sortie

+ ps -ef
UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 05:57 pts/0    00:00:00 bash
root     11296     1  0 07:01 pts/0    00:00:00 sh -c /usr/bin/python2 /root/cppcms-1.2.0/tests/http_timeouts_test.py 
root     11297 11296  0 07:01 pts/0    00:00:00 /usr/bin/python2 /root/cppcms-1.2.0/tests/http_timeouts_test.py write 
root     28509     1  0 07:55 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.NmmZ2I/.gnupg --use-standard-soc
root     28519     1  0 07:55 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.6mb1t2/.gnupg --use-standard-soc
root     28539     1  0 07:55 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.5XdxDR/.gnupg --use-standard-soc
root     30656     1  0 08:00 pts/0    00:00:00 ps -ef
+ make run_nokdbtests
+ ps -ef
+ ps -ef
UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 05:57 pts/0    00:00:00 bash
root     11296     1  0 07:01 pts/0    00:00:00 sh -c /usr/bin/python2 /root/cppcms-1.2.0/tests/http_timeouts_test.py 
root     11297 11296  0 07:01 pts/0    00:00:00 /usr/bin/python2 /root/cppcms-1.2.0/tests/http_timeouts_test.py write 
root     28509     1  0 07:55 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.NmmZ2I/.gnupg --use-standard-soc
root     28519     1  0 07:55 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.6mb1t2/.gnupg --use-standard-soc
root     28539     1  0 07:55 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.5XdxDR/.gnupg --use-standard-soc
root     30778     1  0 08:02 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.GZbzqb/.gnupg --use-standard-soc
root     30788     1  0 08:02 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.PEjcKs/.gnupg --use-standard-soc
root     30808     1  0 08:02 ?        00:00:00 gpg-agent --homedir /tmp/elektra-test.d6yL2g/.gnupg --use-standard-soc
root     30923     1  0 08:02 pts/0    00:00:00 ps -ef

bug work in progress

Source

ingwinlu

👍1

Commentaire le plus utile

gardez à l'esprit que si vous partagez votre répertoire personnel, vous ne pourrez peut-être pas exécuter de tests en parallèle.
Et vous devrez toujours supprimer GNUPGHOME par la suite (vous ne voulez pas qu'un agent pgp persistant réponde aux appels de l'utilisateur connecté, n'est-ce pas?).

Et que se passerait-il si le système cible relais sur GNUPGHOME, vous auriez donc besoin de sauvegarder l'environnement existant et de le restaurer manuellement après les tests.

J'apprécierais que nous puissions prendre du recul et voir comment ces tests pourraient influencer les machines des utilisateurs, pas seulement l'environnement du serveur de test.

ingwinlu le 21 avr. 2018

👍2 ❤1

Tous les 36 commentaires

Merci d'avoir signalé le problème!

@ petermax2 Est-il possible que les commandes gpg pendant les tests engendrent des gpg-agents?

markus2330 le 19 avr. 2018

Oups, je pensais que gpg se connecterait toujours au même agent. Je vais me renseigner.

petermax2 le 19 avr. 2018

@ markus2330 c'est aussi la raison pour laquelle il y a tant d'agents gpg sur v2 signalés avec votre userid, car le conteneur docker fonctionne avec 1000: 1000.

mais le problème ne se limite pas à docker: debian-stretch-minimal en a aussi> 250

ingwinlu le 19 avr. 2018

certains nœuds ne sont pas affectés car ils sont configurés pour générer un gpg-agent pour jenkins qui est utilisé par les tests (probablement, doivent confirmer)

ingwinlu le 19 avr. 2018

Merci à tous les deux d'avoir examiné cela!

certains nœuds ne sont pas affectés car ils sont configurés pour générer un gpg-agent pour jenkins qui est utilisé par les tests (probablement, doivent confirmer)

Si nous ne pouvons pas trouver un moyen de tuer les agents que nous démarrons, nous pouvons simplement exiger que l'environnement ait déjà un gpg-agent (# 1888).

markus2330 le 19 avr. 2018

Peut-être que l'agent gpg n'est pas du tout requis pour démarrer et que nous pouvons le supprimer pendant les tests. Mais je dois y jeter un œil le soir.

petermax2 le 19 avr. 2018

❤2

mh généralement GPG_AGENT_INFO devrait être défini quand on est démarré, dans le passé, nous avons nettoyé les variables d'environnement afin que cela ait pu expliquer les multiples démarrages dans le passé. Je ne sais pas pourquoi cela se produit encore en ce moment ...

@ petermax2 les tests qui nécessitent gpg-agent (trouvés en renommant gpg-agent en gpg-agent.bak;)):

testmod_fcrypt
testmod_crypto_openssl
testmod_crypto_gcrypt

ingwinlu le 19 avr. 2018

👍1

testmod_crypto_botan doit s'exécuter exactement comme testmod_crypto_gcrypt et testmod_crypto_openssl . Le test Botan est-il en cours d'exécution sur le serveur?

petermax2 le 19 avr. 2018

@ petermax2 probablement oui. dans l'environnement où j'ai testé il n'y avait pas de botanique installé. il fonctionne cependant ici et probablement aussi des agents de frai.

ingwinlu le 19 avr. 2018

👍1

Ce n'est pas aussi simple. J'ai essayé d'appeler gpg avec l'argument --no-autostart pendant les tests unitaires, mais gpg démarre toujours l'agent. --no-use-agent est drôle. La page de manuel se lit comme suit:

--no-use-agent 
              This is dummy option. gpg2 always requires the agent.

Si nous ne pouvons pas trouver un moyen de tuer les agents que nous démarrons, nous pouvons simplement exiger que l'environnement ait déjà un gpg-agent (# 1888).

Pouvons-nous tenter le coup?

petermax2 le 19 avr. 2018

Ou avoir un travail cron comme

pgrep gpg-agent | xargs -d "\n" kill

ou quelque chose de similaire sur les serveurs / conteneurs de construction?

petermax2 le 19 avr. 2018

Je ferais vérifier si un agent est disponible, sinon le démarrer et le conserver. dans le test de nettoyage, arrêtez l'agent. tout le reste est un hack.

ingwinlu le 19 avr. 2018

👍1

Vous avez raison, la seule question est de savoir où le démarrage et l'arrêt doivent avoir lieu. Faire cela au sein de nos agents / dockers semble être plus facile que dans nos tests unitaires écrits en C.

markus2330 le 21 avr. 2018

👍1

Voici ce que j'ai appris jusqu'à présent:

Il est possible de supprimer le démarrage automatique du gpg-agent avec l'option --no-autostart , si elle est systématiquement utilisée avec tous les appels gpg . Cependant, sans gpg-agent gpg2 ne peut pas effectuer d'opérations, qui nécessitent la clé privée (c'est-à-dire le décryptage, les signatures).

Il est également possible de fork gpg-agent --server mais alors gpg2 ne peut pas se connecter à l'agent. La variable d'environnement GPG_AGENT_INFO est obsolète et n'est plus considérée par gpg2 .

Je vais essayer de fork et d'execv gpg-agent --daemon . J'ai juste besoin d'un moyen de trouver le PID du gpg-agent commencé afin que je puisse SIGTERM lorsque les tests sont effectués.

petermax2 le 21 avr. 2018

Faire cela au sein de nos agents / dockers semble être plus facile que dans nos tests unitaires écrits en C.

Beaucoup plus facile, je suppose :-)

petermax2 le 21 avr. 2018

Je pense que votre décision était juste d'utiliser simplement la méthode par défaut de gpg pour vous connecter aux agents.

Comme alternative au démarrage / arrêt de gpg-agent, nous pouvons également désactiver le "use-agent" dans .gnupg / gpg.conf

markus2330 le 21 avr. 2018

Je n'ai aucun problème avec le démarrage automatique d'un agent (et même le faire fonctionner). J'ai un problème avec les tests suivants en commençant un nouveau

ingwinlu le 21 avr. 2018

Je pense que votre décision était juste d'utiliser simplement la méthode par défaut de gpg pour vous connecter aux agents.

Dans un environnement de production, c'est la meilleure option. Sur ma machine, crypto et fcrypt connectent toujours au même agent et l'intégration avec mon Yubikey fonctionne très bien.

dans nos environnements de test, nous devons garder une seule instance de l'agent opérationnel avant de démarrer les tests. Je pense que le problème est que nous nettoyons l'environnement, comme

petermax2 le 21 avr. 2018

Je pense que le problème est que nous effaçons l'environnement

nous ne devrions plus. mais le problème persiste

ingwinlu le 21 avr. 2018

Si gpg-agent essaie de communiquer via un environnement, il ne peut évidemment pas fonctionner, le prochain test n'obtiendra jamais l'environnement défini par un test avant.

J'aime mieux suivre deux options:

nous démarrons / arrêtons correctement un agent gpg dans les conteneurs et documentons dans TESTING.md que l'agent gpg doit être en cours d'exécution (voir # 1888).
nous désactivons le démarrage des agents gpg (désactivez le "use-agent" dans .gnupg / gpg.conf devrait fonctionner, mais ne l'avons pas testé) et documentons ceci dans TESTING.md (voir # 1888).

Une configuration, où les démons démarrent à la demande sans moyen global de savoir si le démon a déjà été démarré (et les variables d'environnement ne sont pas globales mais spécifiques au processus), semble être interrompue. Nous ne devons pas essayer de résoudre ce problème dans les tests.

markus2330 le 21 avr. 2018

https://stackoverflow.com/questions/27459869/how-to-stop-gpg-2-1-spawning-many-agents-for-unit-testing

La raison pour laquelle vous créez de nombreux agents est le répertoire de base différent utilisant l'option --homedir, sinon un seul aurait été utilisé. Depuis GnuPG 2.1, toutes les communications avec l'agent sont effectuées via une socket dans le répertoire d'accueil de GnuPG.

ingwinlu le 21 avr. 2018

Nous n'utilisons pas l'option homedir. Et https://dev.gnupg.org/T3218 décrit la solution de contournement du stackoverflow comme "une solution de contournement (très maladroite)".

Peut-être que le simple démarrage de gpg-agent est la variante la plus évolutive (de manière contrôlée dans notre environnement). On dirait que dans les versions récentes, le démarrage de gpg-agent n'est plus facultatif. (ce qui rend mon option 2. ci-dessus absurde)

markus2330 le 21 avr. 2018

Nous n'utilisons pas l'option homedir.

Ouais, je n'ai pas trouvé d'où ça vient mais ça correspond au problème (voir op) car tous les agents sont apparus avec un autre.

ingwinlu le 21 avr. 2018

C'était un bon indice, j'ai appris que le démarrage de gpg-agent n'est plus optionnel.

Ce qui montre clairement que nous devons le démarrer et l'arrêter. Et n'essayez pas d'éviter le démarrage.

markus2330 le 21 avr. 2018

Nous n'utilisons pas l'option homedir.
Ouais je n'ai pas trouvé d'où ça vient mais ça correspond au problème (voir op)

Nous n'utilisons pas explicitement l'option --home-dir , mais ps -ef révèle que gpg définit quand même.

petermax2 le 21 avr. 2018

https://wiki.archlinux.org/index.php/GnuPG

$ GNUPGHOME est utilisé par GnuPG pour pointer vers le répertoire où ses fichiers de configuration sont stockés. Par défaut, $ GNUPGHOME n'est pas défini et votre $ HOME est utilisé à la place; ainsi, vous trouverez un répertoire ~ / .gnupg juste après l'installation.
Pour changer l'emplacement par défaut, exécutez gpg de cette façon $ gpg --homedir chemin / vers / fichier ou définissez la variable d'environnement GNUPGHOME.
''
@ petermax2 pouvez-vous vérifier si HOME est disponible dans votre suite de tests?

ingwinlu le 21 avr. 2018

également intéressant https://www.gnupg.org/documentation/manuals/gnupg/Ephemeral-home-directories.html :

Créez un répertoire temporaire, créez (ou copiez) une configuration qui répond à vos besoins, faites utiliser ce répertoire par gpg soit en utilisant la variable d'environnement GNUPGHOME, soit l'option --homedir. GPGME prend également en charge cela au niveau du contexte, en modifiant les informations du moteur des contextes. Maintenant, exécutez l'opération de votre choix, importez et exportez le matériel clé si nécessaire. Une fois terminé, vous pouvez supprimer le répertoire. Tous les services de backend GnuPG qui ont été démarrés le détectent et s'arrêtent

J'ai testé cela dans mon conteneur et il a nettoyé le processus automatiquement comme promis.

ingwinlu le 21 avr. 2018

@ petermax2 pouvez-vous vérifier si HOME est disponible dans votre suite de tests?

Oui, HOME est disponible:

HOME = /tmp/elektra-test.3vLR4L

petermax2 le 21 avr. 2018

OK donc quelque chose dans la suite de tests écrase HOME dans un répertoire tmp (ce qui est bien). Si cela est toujours disponible pendant le nettoyage, il doit simplement être supprimé pour arrêter l'agent. Ce serait une solution idéale.

ingwinlu le 21 avr. 2018

Si nous définissons simplement GNUPGHOME une seule instance de gpg-agent est générée. GNUPGHOME n'est pas écrasé avant le début du test.

Avec GNUPGHOME set, un seul gpg-agent est en cours d'exécution après plusieurs tests.

Je pense que c'est la solution la plus simple.

petermax2 le 21 avr. 2018

Et que se passerait-il si le système cible relais sur GNUPGHOME, vous auriez donc besoin de sauvegarder l'environnement existant et de le restaurer manuellement après les tests.

J'apprécierais que nous puissions prendre du recul et voir comment ces tests pourraient influencer les machines des utilisateurs, pas seulement l'environnement du serveur de test.

ingwinlu le 21 avr. 2018

👍2 ❤1

vous ne pourrez peut-être pas exécuter des tests en parallèle.

J'ai exécuté le script:

#!/bin/bash
mkdir /tmp/x
export GNUPGHOME=/tmp/x
for run in {1..1000000}
do
    ctest -R crypto_openssl &
done

sans aucun problème. GPG doit gérer le verrouillage, etc.

vous ne voulez pas qu'un agent pgp réponde aux appels de l'utilisateur connecté, n'est-ce pas?

C'est ainsi que gpg-agent été conçu: il s'exécute pour toujours jusqu'à la fin de la session utilisateur. Il n'écrit pas son PID à un endroit quelconque, il n'y a aucune commande pour le quitter. Il ne réagit qu'à SIGTERM .

J'ai essayé de fork le gpg-agent partir du test unitaire avec l'option --server , donc nous aurions un PID à kill par la suite. Mais alors gpg-agent n'ouvre pas les sockets requises à $GNUPGHOME et les tests unitaires rouvrent une autre instance de l'agent (qui s'exécute en mode --daemon ). De plus, il n'y a aucun moyen de faire gpg-agent ouvrir des sockets en mode --server (j'ai vérifié cela avec le code source de gpg-agent ).

gpg-agent est difficile à contrôler et peu documenté. Je lisais même le code source de gpg-agent . Notre cas d'utilisation n'est pas couvert. La seule option est SIGTERM .

petermax2 le 13 mai 2018

❤1

parallélisme

Je pensais plus à ce que vous vouliez séparer les agents gpg qui ne devraient pas s'influencer mutuellement. c'est-à-dire que vous voulez seulement que l'agent a ait la clé du test a et que l'agent b ait la clé du test b. Si cela n'est pas nécessaire, un home tmp codé en dur est correct.

tuer gpg-agent

Lors de la première enquête sur le problème, je suis tombé sur un site Web (lié ci-dessus) qui indiquait que la façon attendue d'arrêter un gpg-agent temporaire est de supprimer son répertoire de base gpg.

Donc, si vous définissez GNUPGHOME sur /tmp/elektra_tests/gpg et pendant le nettoyage du test, supprimez ce répertoire tmp, cela devrait aller.

ingwinlu le 14 mai 2018

👍2

Donc, si vous définissez GNUPGHOME sur / tmp / elektra_tests / gpg et pendant le nettoyage du test, supprimez ce répertoire tmp, cela devrait aller.

Ça marche! J'intégrerai ce correctif dans les cas de test crypto et fcrypt . Merci pour le tuyau!

petermax2 le 17 mai 2018

J'ai un prototype fonctionnel. PR arrive demain.

petermax2 le 17 mai 2018

Doit être corrigé avec # 2056. Veuillez rouvrir si le problème persiste.

petermax2 le 18 juin 2018

👍1

Cette page vous a été utile?

0 / 5 - 0 notes

Questions connexes

bogues dans les plugins de stockage

markus2330 · 3Commentaires

Jenkins: échec de la construction de MinGW

sanssecours · 3Commentaires

Fonctions de plugin : valeur de retour en cas de réussite

sanssecours · 4Commentaires

documentation de la liste kdb obsolète

dominicjaeger · 3Commentaires

Jenkins : délais de compilation

mpranj · 3Commentaires