如果只是提取文字,看看Word版本,找到RTF的规范,不是太复杂。
但是一般的Word里面有宏,那个就很麻烦。
格式不乱很难,人家字体有大小位置等信息,你都不要,那还能不乱?
写Word需要
如果从你学习C语言开始一直编到,能显示汉字,需要一年。
如果能够读懂RTF文件还需要两年。显示正确,需要XX年,因为每个文件不好说。
Word之类的软件,保守的说几千个人年是有的,上万也不夸张,一个人大约需要个不到1千年就有可能干完(前提是你必须一直能干)。
练手不合适。
不明白可以问,不过。问题不是几句话就可以说明白的。
纯围观。等提问者能用c自由操纵word文件格式(不知道是操纵哪个版本的)了,告诉一下大家。半年一年的等得起,不过看提问者提到学术这个词,估计2年不一定搞得定吧。不过我们会等的。 别人wps搞了很多年,也不见得完全兼容,openoffice还有abword也是不很兼容。提问者准备花多长时间逆向工程微软的word格式?准备花多久写操纵word的库呀,那些开源可是动不动就几十万行代码的。
建议先研究一下office文件存储格式吧