Pdf2docx: 中文转换变乱码

创建于 2021-06-15  ·  4评论  ·  资料来源: dothinking/pdf2docx

最有用的评论

78这个问题可以大致解释我的问题。
这里想和你分享一点:因为我尝试了多种办法来进行PDF2Doc的转换,发现了一个特别好的网站:https://pdf2doc.com/
这个网站的转换效果很好,我尝试了转换几份文件,发现字体没有任何变化。
也想过找到它的解决办法,但是没有头绪,相信这对你会有所帮助。

所有4条评论

感谢提供问题和测试文件,这个是原始PDF文档的问题。我用PDF编辑器打开后提示

image

利用编辑器自带的修复功能另存为一个新文件后再转换,可以得到正确的文字,例如第一页的结果

image

您好,我有一个问题,是转换后的word字体和之前PDF的格式完全不一致了。比如之前PDF的格式是粗体,转换之后却变成普通格式了,而且发生了变化。

@natieburg 你先参考一下是否类似这个问题 https://github.com/dothinking/pdf2docx/issues/78

如果解释不了你的问题,可以新开一个issue,并且方便的话提供一个测试文件。

78这个问题可以大致解释我的问题。
这里想和你分享一点:因为我尝试了多种办法来进行PDF2Doc的转换,发现了一个特别好的网站:https://pdf2doc.com/
这个网站的转换效果很好,我尝试了转换几份文件,发现字体没有任何变化。
也想过找到它的解决办法,但是没有头绪,相信这对你会有所帮助。

此页面是否有帮助?
0 / 5 - 0 等级

相关问题

harrylyf picture harrylyf  ·  5评论

echan00 picture echan00  ·  9评论

Jalkhov picture Jalkhov  ·  5评论

JoHnTsIm picture JoHnTsIm  ·  7评论

jterrace picture jterrace  ·  3评论