对于你的描述 可以判断你的文件是图片做成的,solid是没有办法处理这样的文件的~~你可以按下面的方法做~~~这是我不断的实践中自己总结的:
2. 对于是图片做成的PDF(特别是扫描件做成的PDF)文件
推荐用下面软件转换
2.1 页数比较少的用 CAJviewer 7.0 (带OCR组件完整版) ,支持直接打开PDF文件,识别文字。
2.2 页数比较多的可以用 Readiris Corporate 12软件来进行识别 (需要安装亚洲语言包,不然不识别中文)
2.3 页数比较多的还可以用 ABBYY finereader 9或者9以上版本(有简体中文版)进行识别转换。
这个软件的识别率很高,转换出来的版面基本保持原样,还可以手动人工框选识别,缺点就是识别速度较慢。
上面几个软件的识别率都还可以,不建议用什么OFFICE组件识别,太麻烦识别率也不高。
3. 对于一些不允许做修改的PDF文件(就是加密加了权限的PDF),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做~~~
你到网上去下载一个adobe acrobat,打开PDF后可以直接另存为RTF格式的文件,就可以用WORD打开了,基本能保持PDF的原版式。
如果原pdf文件中保存的就是图片格式的话,转换器是没有办法转为可编辑格式的,可以尝试用orc识别软件做扫描识别。
PDF分文字型和图片型,如果是图片型,其中的文字只能用OCR软件进行识别提
取,不能直接编辑。