如何从PDF里提取文字和图片?

发布网友 发布时间:2022-04-20 14:27

我来回答

4个回答

热心网友 时间:2023-10-18 00:57

用OCR就可以了.
比如Office 2003中也提供了文字识别服务,结合那个Image writer可以很方便将PDF转成WORD。

Office2003实现PDF文件转Word文档

经过尝试,发现可以利用 Office 2003 中的 Microsoft Office Document Imaging 组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下:

用Adobe Reader 打开想转换的PDF文件 ,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将 “打印机”栏中的名称设置为 “Microsoft Office Document Image Writer”,确认后将该PDF文 件输出为 MDI格式的虚拟打印文件 。

注: 如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。

然后, 运行 “Microsoft Office Document Imaging”,并利用它来 打开 刚才保存的MDI文件,选择“工具→ 将文本发送到Word ”菜单,在弹出的窗口中选中“ 在输出时保持图片版式不变 ”,确认后系统会提示“必须在执行此操作前重新运行 OCR 。这可能需要一些时间”,不管它, 确认 即可。

注: 对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。

以上仅在 word2003 中可用,其他版本没有Microsoft Office Document Image Writer

热心网友 时间:2023-10-18 00:58

如果是标准PDF文件,可以直接选中文字(CTRL + C) 贴入WORD中,就可以了
如果不是标准的,那要另存为图片格式,然后再用尚书等图片识别软件识别文字

热心网友 时间:2023-10-18 00:58

我想你需要这个,功能强大,PDF转Word 。好就采纳,谢谢

热心网友 时间:2023-10-18 00:59

当一个PDF文件全部是图片,如何能将PDF的图片提取出来!用这个办法就可以了!

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com