在提问之前...
使用的环境
- **OS**: Microsoft Windows 10 家庭版 22H2 (内部版本19045.6466)
- **pdf2zh**: v1.9.11
请选择安装方式
exe
描述你的问题
翻译STM32数据手册后,PDF排版混乱
如何复现
- 翻译文档为:STM32L471数据手册,经过测试其他STM32的数据手册也有相似的问题,如STM32F103等
- 翻译服务使用bing,英文翻译为简体中文
- 翻译得到的文档的目录部分出现严重的排版混乱
预期行为
目录部分照原样排版
相关 Logs
原始PDF文件
stm32l471rg-P001-016.pdf
还有别的吗?
对于这些由其他应用程序而非扫描创建的PDF文件,是否可以考虑增加一个不使用OCR扫描而是直接使用PDF本身排版信息的模式?类似于下图这样,用Adobe Acrobat或类似PDF编辑软件其实可以直接打开并编辑各个部分的文字,即PDF文档本身就已经包含了文本信息和布局关系,只需要直接读取文本,翻译并放回原位即可

在提问之前...
使用的环境
请选择安装方式
exe
描述你的问题
翻译STM32数据手册后,PDF排版混乱
如何复现
预期行为
目录部分照原样排版
相关 Logs
原始PDF文件
stm32l471rg-P001-016.pdf
还有别的吗?
对于这些由其他应用程序而非扫描创建的PDF文件,是否可以考虑增加一个不使用OCR扫描而是直接使用PDF本身排版信息的模式?类似于下图这样,用Adobe Acrobat或类似PDF编辑软件其实可以直接打开并编辑各个部分的文字,即PDF文档本身就已经包含了文本信息和布局关系,只需要直接读取文本,翻译并放回原位即可