Pdf.js: DPUScan pdf zeigt schwarzen Bildschirm

Erstellt am 1. Sept. 2018  ·  14Kommentare  ·  Quelle: mozilla/pdf.js

Anhängen (empfohlen) oder Link zur PDF-Datei hier:
Ich kann das offizielle Dokument aufgrund von Einschränkungen nicht erhalten. Aber ich habe den Screenshot angehängt. Das Problem scheint bei allen DPUScan-Dokumenten von pdf 1.5 aufzutreten
img-20180831-wa0006

Aufbau:

  • Webbrowser und seine Version: Firefox 45. Auch auf Firefox 52 getestet
  • Betriebssystem und Version: Windows 7
  • PDF.js-Version: Getestet mit 2.0.55.0 und 1.10.100
  • Ist eine Browsererweiterung: Nein

Schritte zum Reproduzieren des Problems:

  1. Das Rendern des DPUScan pdf 1.5-Versionsdokuments über pdf.js ergibt einen schwarzen Bildschirm. Ich habe auch versucht, dasselbe Dokument über den Online-Viewer zu öffnen, und es kam auch zu einem schwarzen Bildschirm.
  2. Anbei der Screenshot des Problems.

Was ist das erwartete Verhalten? (Bildschirmfoto hinzufügen)
PDF sollte korrekt gerendert werden

Was schief gelaufen ist? (Bildschirmfoto hinzufügen)
Schwarzer Bildschirm wird angezeigt

Link zu einem Viewer (falls auf einer anderen Website als mozilla.github.io/pdf.js oder als Firefox/Chrome-Erweiterung gehostet):

1-core 3-pdf-broken

Hilfreichster Kommentar

Ich habe etwas debuggt und mir jpx_stream.js angesehen. Nach jpxImage.parse() hat das Objekt 1 Kachel, die nur aus Nullen besteht. Die Größe ist korrekt, dh 2496 x 3512 = 8765952.

(Bei der anderen Datei, die ich angehängt habe, waren die dekodierten Bytes alle 255)

Dies deutet also darauf hin, dass das Problem im JPEG2000-Decoder liegt und nicht im Farbraum wie in PDFBox.

@rafaelcaviquioli Dies ist ein Open-Source-Projekt und wird von Freiwilligen betrieben, die Zeit haben oder nicht. Bezüglich "mein Kopf hängt von dieser Lösung ab": Wenn dem so ist, dann befreien Sie jemanden oder mehrere Leute Ihres Teams für ein paar Tage und lassen Sie sie den JPEG2000-Decoder debuggen. Die Show findet in statt
https://github.com/mozilla/pdf.js/blob/master/src/core/jpx.js
in der Nähe von "Fall 0xFF93:".
Vergleichen Sie, was mit den JPEG2000-Spezifikationen passiert (siehe https://jpeg.org/jpeg2000/) oder vergleichen Sie, was mit einem funktionierenden JPEG2000-Decoder passiert, z. B. dem von Java,
https://github.com/jai-imageio/jai-imageio-jpeg2000/

Alle 14 Kommentare

Von https://github.com/mozilla/pdf.js/blob/master/.github/CONTRIBUTING.md :

Wenn das Problem mit Fehlern zusammenhängt, die von einer bestimmten PDF-Datei erzeugt werden, fügen Sie die PDF-Datei bitte immer bei, indem Sie eine URL angeben, über die Mitwirkende sie herunterladen können. Ohne ein PDF zur Reproduktion werden solche Ausgaben geschlossen.

Schluss, da wir ohne eine Beispiel-PDF-Datei nichts tun können. Vielleicht können Sie mit demselben Tool eine nicht klassifizierte PDF-Datei erstellen, um sie hier zu teilen, danach können wir diese wieder öffnen.

Ich kann die PDF-Datei hier nicht teilen. Kann ich Ihre persönliche E-Mail-ID haben? um das Dokument zu teilen.

Endlich gelang es, eine nicht klassifizierte PDF-Datei zu erhalten. Dasselbe habe ich hier angehängt. Kann mal jemand nachsehen?
test.pdf

Die Datei schlägt auch in PDFBox fehl… in Java hat das Bild einen RGB-ICC-Farbraum, aber im Raster hat es nur 1 Band mit 1-Bit-Pixeln. Man müsste das JPEG2000-Bild mit einem guten Tool analysieren, das sagt, welche Metadaten wirklich da sind.
PDFJS-10026-image.zip

Irgendein Update, das wir auf der pdf.js-Seite implementieren können, um die PDF-Datei zu rendern?

Hier ist eine weitere exotische PDF-Datei mit einem JPEG2000-Bild, das nicht mit PDF.js gerendert werden kann (Seite 11, unten rechts); das JPEG2000-Bild hat 4 Bit pro Pixel.
https://issues.apache.org/jira/secure/attachment/12655396/PDFBOX-2204-012411.pdf

Irgendwelche temporären Korrekturen, die wir auf den pdf.js-Code anwenden können, um dieses PDF zu rendern? Bitte vorschlagen.

Hallo, kannst du bitte ein Update geben?

Hallo! Ich habe das gleiche Problem :/

Könntest du dir das bitte mal anschauen? Selbes Problem hier!

Eigentlich hängt das ganze Team davon ab

Gleiches Problem : /

Ich habe etwas debuggt und mir jpx_stream.js angesehen. Nach jpxImage.parse() hat das Objekt 1 Kachel, die nur aus Nullen besteht. Die Größe ist korrekt, dh 2496 x 3512 = 8765952.

(Bei der anderen Datei, die ich angehängt habe, waren die dekodierten Bytes alle 255)

Dies deutet also darauf hin, dass das Problem im JPEG2000-Decoder liegt und nicht im Farbraum wie in PDFBox.

@rafaelcaviquioli Dies ist ein Open-Source-Projekt und wird von Freiwilligen betrieben, die Zeit haben oder nicht. Bezüglich "mein Kopf hängt von dieser Lösung ab": Wenn dem so ist, dann befreien Sie jemanden oder mehrere Leute Ihres Teams für ein paar Tage und lassen Sie sie den JPEG2000-Decoder debuggen. Die Show findet in statt
https://github.com/mozilla/pdf.js/blob/master/src/core/jpx.js
in der Nähe von "Fall 0xFF93:".
Vergleichen Sie, was mit den JPEG2000-Spezifikationen passiert (siehe https://jpeg.org/jpeg2000/) oder vergleichen Sie, was mit einem funktionierenden JPEG2000-Decoder passiert, z. B. dem von Java,
https://github.com/jai-imageio/jai-imageio-jpeg2000/

War diese Seite hilfreich?
0 / 5 - 0 Bewertungen