Kubernetes: k8s: v1.3.10, gpu рдкрд░ рдХрдВрдЯреЗрдирд░ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП gpu рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреИрд╕реЗ рдХрд░реЗрдВ?

рдХреЛ рдирд┐рд░реНрдорд┐рдд 27 рдлрд╝рд░ре░ 2017  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: kubernetes/kubernetes

рдЕрдм рдореЗрд░реЗ рдкрд╛рд╕ рдЗрд╕ рдкреНрд░рд╢реНрди рдкрд░ рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд▓рдЧрднрдЧ рдПрдХ рд╕рдкреНрддрд╛рд╣ рдХрд╛ рд╕рдордп рд╣реИред рд▓реЗрдХрд┐рди рдореИрдВ рдЕрд╕рдлрд▓ рд░рд╣рд╛ред
рдкрд░реНрдпрд╛рд╡рд░рдг: рд░реЗрдбрд╣реИрдЯ7.2
k8s:v1.3.10 cuda:v7.5 рдХрд░реНрдиреЗрд▓ рд╕рдВрд╕реНрдХрд░рдг:367.44 t ensorflow:0.11 gpu:1080
рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдФрд░ k8s рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣рдорд╛рд░рд╛ рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо, рдпрд╣ ML рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рд╣реИред
рд╕реАрдкреАрдпреВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╕рдордп, рдпрд╣ рдареАрдХ рд╣реИ, рд▓реЗрдХрд┐рди рдЬреАрдкреАрдпреВ рдкрд░ рдХрд╛рдо рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛, рдореИрдВ рдЬрд╛рдирдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ рдХреНрдпреЛрдВред
рдореИрдВрдиреЗ рдЖрдкрдХреЗ рджреНрд╡рд╛рд░рд╛ рдХрд╣реЗ рдЧрдП рдХрдИ рдЙрджрд╛рд╣рд░рдгреЛрдВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛, рд▓реЗрдХрд┐рди рдлрд┐рд░ рднреА рдЕрд╕рдлрд▓ рд░рд╣рд╛
рдореЗрд░рд╛ рдХреНрд▓рд╕реНрдЯрд░: 1 рдорд╛рд╕реНрдЯрд░ 2 рдиреЛрдбред рдкреНрд░рддреНрдпреЗрдХ рдиреЛрдб рдореЗрдВ рдПрдХ GPU рдХрд╛рд░реНрдб рд╣реЛрддрд╛ рд╣реИ, рдХреЗрд╡рд▓ рдорд╛рд╕реНрдЯрд░ рдХреЗ рдкрд╛рд╕ рдирд╣реАрдВ рд╣реЛрддрд╛ рд╣реИ
рдкрд╣рд▓реЗ рдореИрдВрдиреЗ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЬреИрд╕реЗ @ рд╣реБрдИ-рдЭреА рдиреЗ рдХрд╣рд╛:

vim  test.yaml
apiVersion: v1
kind: Pod
metadata:
  name: nvidia-gpu-test
spec:
  containers:
  - name: nvidia-gpu
    image: nginx
    resources:
      limits:
        alpha.kubernetes.io/nvidia-gpu: 1

рд╣рд╛рдБ, рдореИрдВрдиреЗ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛, рдФрд░ рдпрд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдЕрдЧрд░ рдореИрдВ рдПрдирд╡реАрдбрд┐рдпрд╛-рдЬреАрдкреАрдпреВ рдмрджрд▓рддрд╛ рд╣реВрдВ: 1 рд╕реЗ 2, рдЕрд╕рдлрд▓ рд░рд╣рд╛ред рдлрд▓реА рд▓рдВрдмрд┐рдд рд░рдЦрдирд╛ред рдФрд░ рд╡рд░реНрдгрди рдкрд╛рдпрд╛ рдЧрдпрд╛: рдХреЛрдИ рдиреЛрдб рдЗрд╕реЗ рд╕рдВрддреБрд╖реНрдЯ рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ рд╣реИред рдХреНрдпреЛрдВрдХрд┐ рдкреНрд░рддреНрдпреЗрдХ рдиреЛрдб рдореЗрдВ рдХреЗрд╡рд▓ рдПрдХ рдЬреАрдкреАрдпреВ рдХрд╛рд░реНрдб рд╣реЛрддрд╛ рд╣реИ, рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред
рд▓реЗрдХрд┐рди рд╕рд╡рд╛рд▓ рдЖ рд░рд╣рд╛ рд╣реИ: рдЬреАрдкреАрдпреВ рдкрд░ рдХреИрд╕реЗ рдЪрд▓реЗрдВ? рдпрд╣ рдЙрджрд╛рд╣рд░рдг рдХреЗрд╡рд▓ рдпрд╣ рд╕рд╛рдмрд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ k8s gpu рдкреНрд░рд╛рдкреНрдд рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рдФрд░ gpu рдХреЛ рдЬрд╛рди рд╕рдХрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЙрд╕ рдкрд░ рдХреИрд╕реЗ рдЪрд▓рдирд╛ рд╣реИ? рдореИрдВ рдХреИрд╕реЗ gpu рд╕рдВрд╕рд╛рдзрди рдкрд░ рдПрдХ рдкреЙрдб рд░рди рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП yaml рдлрд╝рд╛рдЗрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдБ?

рдлрд┐рд░, рдореБрдЭреЗ рдПрдХ рдФрд░ рддрд░реАрдХрд╛ рдорд┐рд▓рд╛: nvidia-docker
рдореИрдВ gpu-рдЫрд╡рд┐ рдЦреАрдВрдЪрддрд╛ рд╣реВрдВ : gcr.io/tensorflow/t
рд▓реЗрдХрд┐рди рдЕрд╕рдлрд▓ рд░рд╣рд╛ред рдХреБрдЫ рддреНрд░реБрдЯрд┐ рдЬреИрд╕реЗ "CUDA libarary libcuda.so рдирд╣реАрдВ рдЦреЛрд▓ рд╕рдХрддрд╛, libcuda.so рдирд╣реАрдВ рдвреВрдВрдв рд╕рдХрддрд╛",
рдХреНрдпрд╛ рдХрд┐рд╕реА рдХреЛ рдПрдХ рд╣реА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рд╛ рд╣реИ?
рддрдм рдореИрдВрдиреЗ рдкрд╛рдпрд╛ рдХрд┐ рдХрд┐рд╕реА рдиреЗ рдХрд╣рд╛: рдЬреАрдкреАрдпреВ рдХреЛ рдПрдирд╡реАрдбрд┐рдпрд╛-рдбреЙрдХрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ
рд╕реМрднрд╛рдЧреНрдп рд╕реЗ рдореИрдВрдиреЗ рдЯреЗрдВрд╕рд░рдлрд╝реНрд▓реЛ рдХреЗ рд░реВрдк рдореЗрдВ рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛: https://www.tensorflow.org/install/install_linux#gpu_support рдиреЗ рдХрд╣рд╛, nvidia-docker рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдореИрдВрдиреЗ рдЕрдкрдирд╛ рдкреНрд░рд╢рд┐рдХреНрд╖рдг gpu рдкрд░ рдЪрд▓рд╛рдпрд╛, рдФрд░ gpu рдореЗрдореЛрд░реА рд▓рдЧрднрдЧ 7g, рд▓рдЧрднрдЧ 70%
рдореИрдВ рдЗрд╕ рддрд░рд╣ рджреМрдбрд╝рддрд╛ рд╣реВрдБ: nvidia-docker run -it ${image} /bin/bash
рдЕрдЬрдЧрд░ mnist.py
рд╣рд╛рдБ, рдпрд╣ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рд▓реЗрдХрд┐рди рдПрдХ рдирдпрд╛ рдкреНрд░рд╢реНрди рдЖ рд░рд╣рд╛ рд╣реИ: рдХреНрдпрд╛ рдореБрдЭреЗ рд╕реАрдкреАрдпреВ рдкрд░ рдЪрд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдбреЙрдХрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдП, рдФрд░ рдЬреАрдкреАрдпреВ рдкрд░ рдПрдирд╡реАрдбрд┐рдпрд╛-рдбреЙрдХрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдП? рдореИрдВ рд╕рд┐рд░реНрдл gpu рдкрд░ рдХреЗрд╡рд▓ docker , рд╢рд╛рдпрдж nvidia-docker рдкрд░ рдЪрд▓рддрд╛ рд╣реВрдВ, рд▓реЗрдХрд┐рди k8s рдкрд░ gpu рдХреИрд╕реЗ рдЪрд▓рд╛рдирд╛ рд╣реИред
k8s рдХрдВрдЯреЗрдирд░ рдиреЗ рдбреЙрдХрдЯрд░ рдХрд╛ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛, рд▓реЗрдХрд┐рди рдПрдирд╡реАрдбрд┐рдпрд╛-рдбреЙрдХрд░ рдХрд╛ рдирд╣реАрдВ, рддреЛ рдореИрдВ рдЗрд╕реЗ рдЙрд╕реА рддрд░рд╣ рд╕реЗ рдХреИрд╕реЗ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ, рдХреНрдпрд╛ рдЖрдк рдореЗрд░реА рдорджрдж рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ? рдореИрдВ рдЬрд╛рдирдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ k8s рдкрд░ gpu рдХреИрд╕реЗ рдЪрд▓рд╛рдирд╛ рд╣реИ, рди рдХрд┐ рдХреЗрд╡рд▓ рдПрдХ рдбреЗрдореЛ рдпрд╛ рдкрд░реАрдХреНрд╖рдг yaml k8s рд╕рдорд░реНрдерди gpu рдХреЛ рд╕рд╛рдмрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдПред
рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдЖрдк рдореБрдЭреЗ рдЬрд╡рд╛рдм рджреЗ рд╕рдХрддреЗ рд╣реИрдВ, рдореИрдВ рдЗрдВрддрдЬрд╝рд╛рд░ рдХрд░ рд░рд╣рд╛ рд╣реВрдБ ....
рдзрдиреНрдпрд╡рд╛рджред

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

рдореИрдВрдиреЗ рдЕрднреА рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛, рдпрд╣ рдХрд╛рдо рдХрд┐рдпрд╛ред рдореИрдВ рдЬреЛ рд╡реЙрд▓реНрдпреВрдо рдорд╛рдЙрдВрдЯ рдХрд░рддрд╛ рд╣реВрдВ рд╡рд╣ рдкрд╣рд▓реЗ рдЧрд▓рдд рдерд╛ред рдореИрдВ рдиреАрдЪреЗ рдХреЗ рд░реВрдк рдореЗрдВ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛ рдирдпрд╛ рдпрдорд▓

apiVersion: v1
kind: Pod
metadata:
  name: gpu-test
spec:
  volumes:
  - name: nvidia-driver
    hostPath:
      path: /var/lib/nvidia-docker/volumes/nvidia_driver/367.44
  containers:
  - name: tensorflow
    image: tensorflow:0.11.0-gpu
    ports:
    - containerPort: 8000
    resources:
      limits:
        alpha.kubernetes.io/nvidia-gpu: 1
    volumeMounts:
    - name: nvidia-driver
      mountPath: /usr/local/nvidia/
      readOnly: true

рдореИрдВ рдЕрдкрдиреА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рддрд╛ рд╣реВрдБ, рдзрдиреНрдпрд╡рд╛рдж

рд╕рднреА 3 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

@tbchj #42116 рдЕрдм рдорд░реНрдЬ рд╣реЛ рдЧрдпрд╛ рд╣реИ рдФрд░ рдЗрд╕реЗ 1.6 . рдХреЗ рд╕рд╛рде рд░рд┐рд▓реАрдЬрд╝ рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП

@cmluciano рд╣рд╛рдБ, рдзрдиреНрдпрд╡рд╛рдж, рд╢рд╛рдпрдж рдЖрдк рд╕рд╣реА рд╣реИрдВред рдореИрдВрдиреЗ рдЕрднреА рдкреВрд░реА рддрд░рд╣ #42116 рдкрдврд╝рд╛ рд╣реИ, рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдореБрдЭреЗ рдХреБрдЫ рдЪрд╛рд╣рд┐рдПред

рдореИрдВрдиреЗ рдЕрднреА рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛, рдпрд╣ рдХрд╛рдо рдХрд┐рдпрд╛ред рдореИрдВ рдЬреЛ рд╡реЙрд▓реНрдпреВрдо рдорд╛рдЙрдВрдЯ рдХрд░рддрд╛ рд╣реВрдВ рд╡рд╣ рдкрд╣рд▓реЗ рдЧрд▓рдд рдерд╛ред рдореИрдВ рдиреАрдЪреЗ рдХреЗ рд░реВрдк рдореЗрдВ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛ рдирдпрд╛ рдпрдорд▓

apiVersion: v1
kind: Pod
metadata:
  name: gpu-test
spec:
  volumes:
  - name: nvidia-driver
    hostPath:
      path: /var/lib/nvidia-docker/volumes/nvidia_driver/367.44
  containers:
  - name: tensorflow
    image: tensorflow:0.11.0-gpu
    ports:
    - containerPort: 8000
    resources:
      limits:
        alpha.kubernetes.io/nvidia-gpu: 1
    volumeMounts:
    - name: nvidia-driver
      mountPath: /usr/local/nvidia/
      readOnly: true

рдореИрдВ рдЕрдкрдиреА рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рддрд╛ рд╣реВрдБ, рдзрдиреНрдпрд╡рд╛рдж

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

ddysher picture ddysher  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

zetaab picture zetaab  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

chowyu08 picture chowyu08  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

jason-riddle picture jason-riddle  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

alexferl picture alexferl  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ