Numpy: Tiempos de ejecución extremadamente largos en numpy.fft.fft (Trac # 1266)

Creado en 19 oct. 2012 · 19Comentarios · Fuente: numpy/numpy

_Billete original http://projects.scipy.org/numpy/ticket/1266 el 2009-10-19 por el usuario de trac koehler, asignado a unknown._

Aunque la documentación de numpy.fft.fft establece que:
"Esto es más eficiente para una potencia de dos. Esto también almacena un caché de memoria de trabajo para diferentes tamaños de fft, por lo que, en teoría, podría tener problemas de memoria si llama a esto demasiadas veces con demasiadas n diferentes". , Creo que puede ser importante informar de esta rareza en el tiempo de ejecución de fft.
Dependiendo de la longitud de la matriz, el tiempo de ejecución de fft varía mucho:

[ipython shell, from numpy import *]
In [1]: %time fft.fft(zeros(119516))
CPU times: user 22.83 s, sys: 0.39 s, total: 23.23 s
Wall time: 23.53 s

In [3]: %time fft.fft(zeros(119517))
CPU times: user 36.33 s, sys: 0.08 s, total: 36.40 s
Wall time: 36.51 s

In [5]: %time fft.fft(zeros(119518))
CPU times: user 4.88 s, sys: 0.08 s, total: 4.96 s
Wall time: 5.02 s

In [7]: %time fft.fft(zeros(119519))
CPU times: user 0.45 s, sys: 0.00 s, total: 0.45 s
Wall time: 0.45 s

In [9]: %time fft.fft(zeros(119515))
CPU times: user 0.07 s, sys: 0.00 s, total: 0.08 s
Wall time: 0.08 s

In [11]: %time fft.fft(zeros(119514))
CPU times: user 15.84 s, sys: 0.06 s, total: 15.90 s
Wall time: 15.95 s

In [13]: %time fft.fft(zeros(119513))
CPU times: user 272.75 s, sys: 1.03 s, total: 273.78 s
Wall time: 275.63 s

00 - Bug numpy.fft

Fuente

thouis

Comentario más útil

Esto debería arreglarse en numpy 1.17.

mreineck en 5 abr. 2019

👍2

Todos 19 comentarios

_ @ endolith escribió el 2009-11-20_

Relacionado: # 1177 http://projects.scipy.org/scipy/ticket/949

numpy-gitbot en 23 oct. 2012

_ @ rgommers escribió el 2011-03-01_

numpy-gitbot en 23 oct. 2012

_ @ rgommers escribió el 2011-03-01_

David C.ha implementado la transformación de Bluestein si la necesita: https://github.com/cournape/numpy/tree/bluestein

Esperemos que aterrice pronto en el maletero de Numpy.

numpy-gitbot en 23 oct. 2012

Hito cambiado a Unscheduled por @mwiebe el 2011-03-25

numpy-gitbot en 23 oct. 2012

en este pr se propone un acolchado a pequeños primos
https://github.com/scipy/scipy/pull/3144
tener la función para obtener un mejor tamaño de relleno podría ser una utilidad útil en numpys fftpack

juliantaylor en 18 ene. 2014

Sí, en lugar de m = 2 ** nextpow2(2 * n - 1) será más rápido usar algo como la función next_regular

endolith en 19 ene. 2014

También me he encontrado con este problema usando la función detect_equilibration de pymbar que llama repetidamente a np.fft y np.ifft a través de la función de autocorrelación statsmodels en muchas matrices cada vez más cortas. Descubrí perfilar el código, lo que finalmente me llevó a este hilo. La única solución hasta ahora es llamar explícitamente

 np.fft.fftpack._fft_cache.clear()

para asegurarse de que el requisito de memoria no crezca peligrosamente. Sin embargo, esta no parece ser la solución ideal. Sería bueno tener un kwarg como "memsafe = True" y / o una función para borrar manualmente el caché sin hacer referencia explícita a la variable global.

smcantab en 26 ene. 2015

@juliantaylor Padding no se aplica a FFT simples, ¿correcto? ¿Solo por convolución / correlación?

@rgommers El algoritmo de Bluestein acelera la FFT para tamaños principales, como se hace en https://github.com/scipy/scipy/issues/4288 , pero requiere el cálculo previo de chirridos complejos y es más eficiente cuando se mantiene el chirrido en la memoria y reutilizarlo repetidamente en fragmentos de datos. Entonces, no estoy seguro de si esto es bueno para numpy y tal vez solo difiera a scipy.fftpack.czt para esta aplicación.

De todos modos, creo que esto se puede cerrar como un duplicado de https://github.com/numpy/numpy/issues/1177 ? ¿A menos que algo más como el algoritmo de Rader sea mejor que el de Bluestein?

y el problema de @smcantab es diferente?

endolith en 16 feb. 2016

@endolith, esto fue hace mucho tiempo :) pero sí, ahora que lo miro de nuevo, parece un problema diferente. Sin embargo, el problema que informé podría ser relevante y tuve que implementar la solución que sugerí en pymbar para que funcione.

smcantab en 22 feb. 2016

Para su información, me encontré con alguien en una conferencia de audio que me mostró este ejemplo. Es fácil de reproducir y extremo.

%time np.fft.fft( np.random.randn(100000) )
Wall time: 16 ms
Out[16]: 
array([ 196.58599022  +0.j        ,  -88.38483360 +89.2507627j ,
       -166.72250316+339.27161306j, ...,   12.22959535 -64.01621313j,
       -166.72250316-339.27161306j,  -88.38483360 -89.2507627j ])

%time np.fft.fft( np.random.randn(100003) )
Wall time: 1min 42s
Out[17]: 
array([  13.36160617  +0.j        , -314.86472577-340.44686425j,
       -258.36716707-170.43805382j, ...,  -21.18014704+441.3618185j ,
       -258.36716707+170.43805382j, -314.86472577+340.44686425j])

fft de longitud 1e6: 16 MILLIsegundos

fft de longitud 1e6 + 3: 1 MINUTO y 42 SEGUNDOS

standarddeviant en 18 oct. 2017

Característica, no un error. FFTPACK solo es "rápido" cuando el tamaño se factoriza como un producto de los números 2, 3, 4, 5. Ha habido un deseo de larga data de usar un algoritmo más rápido para tamaños primos grandes, pero no se ha implementado. Tenga en cuenta que 100003 es primo.

charris en 18 oct. 2017

No lo llamaría una "función", pero es normal y no un error. :)

https://github.com/scipy/scipy/issues/4288 tiene el algoritmo de Bluestein, pero requiere el cálculo previo de un chirp complejo, por lo que sería necesario hacer algunas pruebas para ver en qué tamaños principales vale la pena.

endolith en 19 oct. 2017

👍1

Interesante. Lo principal que sé es que la implementación fft predeterminada para Julia y Matlab no tiene este comportamiento. Tengo curiosidad por saber qué hace la implementación de Julia para evitar este comportamiento.

standarddeviant en 19 oct. 2017

Julia y Matlab llaman a FFTW, lo que no podemos hacer debido a su licencia.

charris en 19 oct. 2017

Tenga en cuenta que existen enlaces de Python para FFTW; pyFFTW parece bastante actual. Si la velocidad de FFT es una preocupación, probablemente ese sea el camino a seguir. FFTPACK fue una buena implementación para su época, pero el código y el hardware han avanzado.

charris en 19 oct. 2017

@charris Definitivamente aprecio la información y eso es desafortunado, pero tiene sentido con respecto a la licencia.

standarddeviant en 20 oct. 2017

@standarddeviant También puede aplicar un parche a pyfftw sobre numpy / scipy para que use FFTW

endolith en 20 oct. 2017

Esto debería arreglarse en numpy 1.17.

mreineck en 5 abr. 2019

👍2

gracias @mreineck , cierre