Pdf.js: DPUScan pdf muestra pantalla negra

Creado en 1 sept. 2018  ·  14Comentarios  ·  Fuente: mozilla/pdf.js

Adjunte (recomendado) o haga un enlace al archivo PDF aquí:
No puedo obtener el documento oficial debido a la restricción. Pero adjunto la captura de pantalla. El problema parece ocurrir para todos los documentos DPUScan de pdf 1.5
img-20180831-wa0006

Configuración:

  • Navegador web y su versión: Firefox 45. También probado en Firefox 52
  • Sistema operativo y su versión: Windows 7
  • Versión PDF.js: Probado con 2.0.55.0 y 1.10.100
  • Es una extensión del navegador: No

Pasos para reproducir el problema:

  1. Al renderizar el documento de la versión DPUScan pdf 1.5 a través de pdf.js aparece una pantalla en negro. También intenté abrir el mismo documento a través del visor en línea y también terminé con la pantalla en negro.
  2. Adjunto la captura de pantalla del problema.

¿Cuál es el comportamiento esperado? (añadir captura de pantalla)
El PDF debe renderizarse correctamente

¿Qué salió mal? (añadir captura de pantalla)
Se muestra pantalla negra

Enlace a un visor (si está alojado en un sitio que no sea mozilla.github.io/pdf.js o como extensión de Firefox/Chrome):

1-core 3-pdf-broken

Comentario más útil

Hice un poco de depuración y miré jpx_stream.js. Después de jpxImage.parse(), el objeto tiene 1 mosaico que es solo ceros. El tamaño es correcto, es decir, 2496 x 3512 = 8765952.

(Con el otro archivo que adjunté, los bytes decodificados fueron todos 255)

Esto sugiere que el problema está en el decodificador JPEG2000 y no en el espacio de color como en PDFBox.

@rafaelcaviquioli este es un proyecto de código abierto y está impulsado por voluntarios que pueden o no tener tiempo. Re "mi cabeza depende de esta solución": si es así, libere a alguien o varias personas de su equipo durante unos días y pídales que depuren el decodificador JPEG2000. El espectáculo ocurre en
https://github.com/mozilla/pdf.js/blob/master/src/core/jpx.js
cerca de "caso 0xFF93:".
Compare lo que sucede con las especificaciones JPEG2000 (consulte https://jpeg.org/jpeg2000/ ) o compare lo que sucede con un decodificador JPEG2000 en funcionamiento, por ejemplo, el de Java,
https://github.com/jai-imageio/jai-imageio-jpeg2000/

Todos 14 comentarios

Desde https://github.com/mozilla/pdf.js/blob/master/.github/CONTRIBUTING.md :

Si el problema está relacionado con errores producidos por un PDF específico, incluya siempre el PDF proporcionando una URL donde los colaboradores puedan descargarlo. Sin un PDF para reproducir, tales ediciones se cerrarán.

Cerrando ya que no hay nada que podamos hacer sin un archivo PDF de ejemplo. Tal vez pueda crear un archivo PDF no clasificado con la misma herramienta para compartir aquí, después de lo cual podemos volver a abrirlo.

No podré compartir el archivo pdf aquí. ¿Puedo tener su ID de correo electrónico personal? para compartir el documento.

Finalmente logré obtener un archivo pdf no clasificado. He adjuntado el mismo aquí. ¿Puede alguien echar un vistazo?
prueba.pdf

El archivo también falla en PDFBox… en java la imagen tiene un espacio de color RGB icc pero en el raster tiene solo 1 banda con píxeles de 1 bit. Uno tendría que analizar la imagen JPEG2000 con una buena herramienta que diga qué metadatos hay realmente allí.
PDFJS-10026-imagen.zip

¿Alguna actualización que podamos implementar en el lado de pdf.js para representar el archivo pdf?

Aquí hay otro archivo PDF exótico con una imagen JPEG2000 que no se puede procesar con PDF.js (página 11, abajo a la derecha); la imagen JPEG2000 tiene 4 bits por píxel.
https://issues.apache.org/jira/secure/attachment/12655396/PDFBOX-2204-012411.pdf

¿Alguna corrección temporal que podamos aplicar al código pdf.js para procesar este pdf? Por favor recomiende.

Hola, ¿puede proporcionar una actualización?

¡Hola! Estoy teniendo el mismo problema :/

¿Podrías echarle un vistazo a esto? ¡El mismo problema aqui!

En realidad todo el equipo dependiendo de esto.

El mismo problema : /

Hice un poco de depuración y miré jpx_stream.js. Después de jpxImage.parse(), el objeto tiene 1 mosaico que es solo ceros. El tamaño es correcto, es decir, 2496 x 3512 = 8765952.

(Con el otro archivo que adjunté, los bytes decodificados fueron todos 255)

Esto sugiere que el problema está en el decodificador JPEG2000 y no en el espacio de color como en PDFBox.

@rafaelcaviquioli este es un proyecto de código abierto y está impulsado por voluntarios que pueden o no tener tiempo. Re "mi cabeza depende de esta solución": si es así, libere a alguien o varias personas de su equipo durante unos días y pídales que depuren el decodificador JPEG2000. El espectáculo ocurre en
https://github.com/mozilla/pdf.js/blob/master/src/core/jpx.js
cerca de "caso 0xFF93:".
Compare lo que sucede con las especificaciones JPEG2000 (consulte https://jpeg.org/jpeg2000/ ) o compare lo que sucede con un decodificador JPEG2000 en funcionamiento, por ejemplo, el de Java,
https://github.com/jai-imageio/jai-imageio-jpeg2000/

¿Fue útil esta página
0 / 5 - 0 calificaciones