如何把pdf文件转换成txt文档
现在是电子书的时代,很多朋友的电子设备只支持txt格式的文件,可是找到的一些不错的书籍却是pdf的格式。怎么把pdf格式转成txt格式呢?近来,总有朋友问我这个问题。 这里把我的方法写下来,分享给朋友们,希望能帮到大家。更希望起到抛砖引玉的作用,有更好的方法被分享出来。
工欲善其事,必先利其器,所以,需要先安装pdf文档的专用软件,推荐使用Adobe Acrobat 7 Professional或者Adobe Acrobat 9 Professional版本。不要使用Adobe Acrobat reader,因为功能太少。软件网上一搜,可以随便找到。
如果是由word文件转成的pdf文件,这个比较简单。
打开pdf文档,选择文件——另存为,如下图:
在弹出的另存为对话框中,保存类型——纯文本。就可以了。如下图:
如果没法直接保存成纯文本,报ASCII码错误的话,可以先保存为microsoft word文档,再由word文档转换成txt格式。
如果pdf文档是由扫描后的图片制作而成的,用上述方法就无法直接转换成txt格式了。需要用以下方法。
打开pdf文档,选择文件——另存为——保存类型选择jpeg图片格式。如下图:
存为jpeg格式的图片之后,需要安装OCR识别软件。推荐使用清华紫光OCR或者汉王OCR软件。软件网上都可以免费下到。我使用的是汉王OCR 8.0 。
安装好软件之后,运行OCR软件。选择文件——打开图像,如下图:
找到图片保存目录,打开从pdf文件转换成的图片。
图片文件打开以后,选择识别——开始识别:
识别完成后界面如下图:
上半部分是识别出来的文字,下半部分是原稿。因为识别软件以及图片清晰度的原因,有些字会与原稿有误,需要校对。校对过程中,如果原稿字太小,看不清楚,可以选择放大原稿操作。如下图:
校对完成,选择输出——到指定格式文件,保存成txt格式就可以了。如下图:
至此,很轻松的,txt格式的文档就转换好了。
最后说一句,校对很重要,因为需要与原稿对比着认真的看一遍。仔细才能做到无误。所以这个过程很花时间的。希望大家从网上分享到别人上传的txt格式的电子书,在享受阅读的快乐与愉悦的同时,请怀着感恩的心,感谢发帖者。因为这也是别人的劳动结晶。
我说的有两种方法:
1、用工具软件:pdf格式转成txt格式电子书工具
PDF2TXT 3.1汉化版可以快速把.pdf文件转换为.txt或.htm(.html)文件的小工具.操作简单,快捷
注:Adobe Acrobat Reader6.0以上版本可以直接把PDF文件另存为txt文件
点击这里下载 PDF2TXT 3.1 汉化版
http://www.skycn.com/soft/10747.html
2、你可以试试这个方法:点编辑-全部选定然后拷贝-粘贴到记事本里。
你能选定么,能选定直接ctrl+c复制。
如果连选定都选不了的话,那就是不能转化,因为有些pdf是图片转化而成的。这就没办法了。
电脑爱好者应该不是pdf的吧,应该是种程序类型的,是不能转化为txt文件的。
使用福昕阅读器,打开文件后另存为,在保存类型里边选择“文本文档”,存出来就是TXT模式了。很方便的!!
还有就是有关你说的乱码问题。网上转换出来的格式大多数都是UTF-8的编码,想改变编码,直接点开保存好的TXT文档,点击另存为,右下角有下图这个按钮【编码】,选择改为【ANSI】编码的,就不会出现乱码了。因为有些阅读程序是不支持UTF格式的文本的,ANSI通用。希望能帮到你!
看文件内容,如果是扫描版的格式,就无法转换,如果是文本格式,用“pdf
to
txt”软件就行了!
pdf文件怎么转换为txt格式呢