通俗的来说,pdf文档可以分成2类:第一类是由文本内容构成,文本可以编辑(前提是文档没有加密或其他保护);第二类是由图片构成,文本无法编辑(比如扫描了10页书,得到10张图片,然后用这10张图片做成pdf文档,图片上的文字当然没法编辑,所以不是真正的文本内容).
对于第二类,【只能使用具有OCR文字识别功能的软件】来把图像里的文字识别出来,变成真正的文本内容。
解决办法分两类:
1)把pdf文档存成图片格式(在 “文件——另存为” 里选择 ),然后用紫光TH-OCR、尚书OCR等软件把一张张的图片识别成txt文档,然后制作成word文件;
2)使用中国期刊网的CajViewer、Adobe Acrobat Pro9.0等具有OCR功能插件的软件,直接打开pdf文档,然后使用OCR工具直接识别选中范围内的文字内容。
PDF转Word 解决方法:
自己到网上下个Adobe Acrobat Professional软件,安装好后,打开PDF文件》文件》另存为》把“保存类型”改成“Microsoft Word 文档 (*.doc)”。这个是很麻烦啦 我是建议你找专业的人士 淘宝有一家
先要看pdf是文字格式还是图片格式,图片格式比较难办,需要扫描仪似的软件,例如ABBYY FineReader 11
给你提供下载地址吧
如何将PDF文件转换成Word文档?