Numpy: np.clip com entrada complexa não foi testado e tem comportamento estranho

Criado em 23 fev. 2020 · 8Comentários · Fonte: numpy/numpy

Isso surgiu em https://github.com/pytorch/pytorch/issues/33568. Isso parece estranho:

>>> np.clip([3 + 4.j], -1, 2)                                                                                       
array([2.+0.j])
>>> np.clip([3 + 4.j], -1+1.j, 2+12.j)  # imaginary component goes up                                                                   
array([2.+12.j])
>>> np.clip([1 + 4.j], -1+1.j, 2+12.j)  # imaginary component doesn't go up                                                                             
array([1.+4.j])

O único teste para entradas complexas é que não haja segfault.

O comportamento razoável pode ser um dos seguintes:

Recorte partes reais e imaginárias separadamente
Valor absoluto do clipe, sem alterar a fase
Pode haver outras opções. Contanto que esteja documentado, não tenho certeza se importa muito a escolha feita.

Não acho que seja uma questão muito importante, mas seria bom pelo menos ter o comportamento desejado documentado aqui.

00 - Bug numpy.core

Fonte

rgommers

Comentários muito úteis

@mruberry , concordei, de qualquer forma, nem tenho certeza se alguém tinha um caso de uso para isso, o que me motivaria muito a fazer qualquer coisa. Como um argumento para torná-lo um pouco menos ruim, se você garantir que min.real <= max.real e min.imag <= max.imag em oposição a apenas min <= max , então as coisas estão bem (embora atualmente não garanta isso em NumPy).

seberg em 10 abr. 2020

👍2

Todos 8 comentários

O comportamento atual é fazer x = sorted(x) por x = [min, clip(arr, min, max), max] , eu acho.

eric-wieser em 25 fev. 2020

Duvido que seja valioso quebrar a consistência com min, max, classificação aqui para uma escolha de comportamento não óbvia. Não que não possamos fazer isso, mas provavelmente também deveríamos discutir o comportamento de classificação mínimo / máximo ...
E se isso quer dizer que absmin , absmax e abssort fariam sentido e basicamente usariam isso para recorte.
Eu poderia ser mais facilmente convencido a apenas dar um erro por uma entrada não real.

EDITAR: Provavelmente o recorte de componentes na verdade permite o comportamento de Eric, uma vez que é mais estrito. Mas apenas uma nota, não tenho certeza se considero útil. A outra questão é: existe alguma usecase real para isso, afinal? Um que não fica mais claro com um código diferente?

seberg em 25 fev. 2020

Recorte partes reais e imaginárias separadamente

Essa seria minha primeira escolha.

Valor absoluto do clipe, sem alterar a fase

Pode ser útil, mas é mais complicado de implementar do que um simples clipe.

charris em 25 fev. 2020

👍1

A outra pergunta é: existe algum _usecase_ real para isso? Um que não fica mais claro com um código diferente?

Esta é uma boa pergunta. Não tenho certeza. Tudo que sei é que não deveria ser tão obviamente incorreto.

rgommers em 26 fev. 2020

Estou preocupado em cortar as partes reais e imaginárias separadamente. Se tivermos um array ordenado, por exemplo, então o recorte normalmente altera o array para ter três regiões: [min_value, unchanged, max_value]. Se cortarmos as partes reais e imaginárias de uma matriz complexa separadamente, entretanto, não teremos mais essas regiões separáveis. Em vez disso, os valores podem mudar mesmo se não compararem menos do que o mínimo ou maior do que o máximo!

Eu também recomendaria desativar o comportamento até que haja confiança sobre o que, exatamente, recortar um número complexo deve fazer. Minha proposta seria que se c <min_value fosse definido como min_value, e se c> max_value fosse definido como max_value.

mruberry em 10 abr. 2020

seberg em 10 abr. 2020

👍2

Também estou concordando com você @seberg ;).

Acho que vamos desabilitar o recorte (nós o chamamos de grampeamento) entradas complexas no PyTorch por enquanto. Nosso comportamento era inconsistente com o do NumPy, de qualquer maneira.

mruberry em 10 abr. 2020

👍1

só de ler esta edição, acho que, dada a comparação lexicográfica em numpy, esse comportamento realmente faz sentido. se estamos descontinuando a comparação lexicográfica, porém, clip, max e min também devem seguir. Estou presumindo que esse foi o consenso alcançado aqui, mas não estava muito certo a partir dos comentários e dos PRs vinculados.