Problem about font encoding in PDF/A generation
所以这是我的问题:
我目前正在开发一个将文档归档为 PDF/A-1 的 java 应用程序。我正在使用 PdfBox 生成 pdf,但由于字体的原因,我无法生成有效的 PDF/A-1 pdf。字体嵌入在 pdf 文件中,但该网站:https://www.pdf-online.com/osa/validate.aspx 告诉我这不是有效的 PDF/A,因为:
The key Encoding has a value Identity-H which is prohibited.
我在互联网上查看了这个 Identity-H 编码是什么,它似乎是字体的编码方式,就像 ansi 编码一样。
我已经尝试过使用不同的字体,如 Helvetica 或 arial unicode Ms 但没有任何效果,总是有这种 Identity-H 编码。我对编码中的所有这些混乱感到有点迷茫,所以如果有人可以解释一下会很棒的。这也是我编写的在 pdf 中嵌入字体的代码:
1
2 3 4 5 6 7 8 |
// load the font as this needs to be embedded PDFont font = PDType0Font.load(doc, getClass().getClassLoader().getResourceAsStream(fontfile), true); if (!font.isEmbedded()) |
感谢您的帮助:)
问题已解决:
我使用了 apache 的示例:CreatePDFA(我不知道为什么它会起作用,而不是我的代码):examples/src/main/java/org/apache/pdfbox/examples 中的示例
我添加以符合 PDF/A-3 要求:
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
doc.getDocumentCatalog().setLanguage("en-US");
PDMarkInfo mark = new PDMarkInfo(); // new PDMarkInfo(page.getCOSObject()); PDDocumentInformation info = doc.getDocumentInformation(); |
这是我将文件嵌入到 pdf 的代码:
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
private final PDDocument doc = new PDDocument(); private final PDEmbeddedFilesNameTreeNode efTree = new PDEmbeddedFilesNameTreeNode(); private final PDDocumentNameDictionary names = new PDDocumentNameDictionary(doc.getDocumentCatalog()); private final Map<String, PDComplexFileSpecification> efMap = new HashMap<>(); public void addFile(PDDocument doc, File child) throws IOException { Calendar date = Calendar.getInstance(); //first create the file specification, which holds the embedded file //Setting fs.setEmbeddedFile(ef); efMap.put(child.getName(), fs); names.setEmbeddedFiles(efTree); |
剩下的唯一问题是验证中的这个错误:
File specification ‘Test.txt’ not associated with an object.
希望对大家有所帮助。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/267508.html