1. 如果不是图片类做成的PDF 你可以尝试用veryPDF PDF2WORD 工具或者使用Solid Converter PDF 转换 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码,那么就先要把这些PDF文件转成位图形式(也就是常说的PDF转曲)然后再用工具转,当然这时候上面的2个工具基本无能为力了
2.对于是图片做成的PDF 那么我们就需要用OCR类软件进行识别了,你可以用比较简单的CAJviewer来提取 但是只能是一页页提取文字,或者你可以使用Readiris Corporate 12软件来进行识别,但是Readiris Corporate 12呢需要下载支持韩语 日语还有简体中文的亚洲语言包才是识别中文,但是这个软件的OCR识别率是比较好的~~~~当然还有ABBYY finereader 也是一款识别率很高的软件,关键还支持中文识别~~也是一款不可多得的OCR软件,这里我强力推荐这个软件。
3. 对于一些不允许做修改的PDF文件(就是加密加了权限的PDF),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做~~~
buyanfangqi@126.com
我帮你转,我有专门的工具,可以帮楼主尝试一下
如果页码不多发给我aq17zgy@163.com 表格和图片太多转换效果差