Tensorflow: tf.argmax는 역전파를 허용해서는 안 됩니다.

에 만든 2016년 04월 30일 · 1논평 · 출처: tensorflow/tensorflow

안녕하세요, 텐서플로

최근에는 argmax 함수를 사용하고 있지만 사용하기 전에 항상 tf.stop_gradient를 배치했습니다. 그러나 stop_gradient를 제거해도 tensorflow는 여전히 잘 작동합니다.

내가 뭔가를 잘못 이해하고 있는 것일 수도 있지만 argmax 는 미분 가능한 함수가 아닙니다. 백프롭을 제거해도 백프롭은 어떻게 작동합니까? stop_gradient 없이 argmax를 전달할 때 오류가 발생하지 않아야 합니까?

argmax를 구별할 수 있다면 이것이 어떻게 수행되는지 보여주는 리소스에 크게 감사드립니다. 감사합니다 TF!

출처

NickShahML

가장 유용한 댓글

Gradient는 거의 모든 곳에서 정의되므로 실제로 정의할 수 있습니다. 그다지 유용하지 않으므로 TensorFlow에서 이 작업에 등록되지 않았습니다.

x = tf.Variable([1., 1])
z = tf.argmax(x, 0)
sess = create_session()
xgrad = tf.gradients(z, x)
sess.run(tf.initialize_all_variables())
sess.run(xgrad)

LookupError: No gradient defined for operation 'ArgMax' (op type: ArgMax)

yaroslavvb 에 2016년 04월 30일

👍4 ❤1

>모든 댓글

Gradient는 거의 모든 곳에서 정의되므로 실제로 정의할 수 있습니다. 그다지 유용하지 않으므로 TensorFlow에서 이 작업에 등록되지 않았습니다.

x = tf.Variable([1., 1])
z = tf.argmax(x, 0)
sess = create_session()
xgrad = tf.gradients(z, x)
sess.run(tf.initialize_all_variables())
sess.run(xgrad)

LookupError: No gradient defined for operation 'ArgMax' (op type: ArgMax)

yaroslavvb 에 2016년 04월 30일

👍4 ❤1

이 페이지가 도움이 되었나요?

0 / 5 - 0 등급