DOC文件微软没有公布阿。可以看看OO的代码或者黑箱分析。不过工程量很大。
Win下倒是有接口,可惜不开源。
>我初学的...不理解楼上两位的意思,觉得C语言能否读取.doc文件是关键...
对,读取确实是个难题,用OO(openoffice)应该是可以的。
虽然很多介绍上有:
OpenOffice 公开了可编制脚本的接口,这使得它可以用 Java、C 、Python、OpenOffice.org Basic、Starscript、CORBA 或 OLE Automation 对文档内容进行编程。
但是实际上的相关DOC的处理还是很复杂的,
你的这个问题肯定能解决,但是一定是需要仔细研究一下OpenOffice的代码和实现,并且就我的理解,即使做出来,统计误差率应该在10%以上(可能会和直接字符串扫描的正确率相当)。
>如果可以读的话,可以对字符进行验证,如果是换行符'\n'就说明行数+1.
>加了一定的行数,就改页数+1了。我是这样想的
由于DOC未公开,所以谁都不知道他的换行是否以'\n'为判断,
也不知道其EOF等等到底是什么,
所以这个方法的可行性还是有待商榷的:)
我初学的...不理解楼上两位的意思,觉得C语言能否读取.doc文件是关键...
如果可以读的话,可以对字符进行验证,如果是换行符'\n'就说明行数+1.加了一定的行数,就改页数+1了。我是这样想的
word...需要分析以下协议了