有谁知道用java语言怎么实现将word的doc格式文件转换为docx格式的

2025-01-03 20:35:42
推荐回答(3个)
回答1:

如果只是文字的话,直接读出来,然后用07的存回去,poi能实现。但是有目录什么的就麻烦了,03的读出来目录是一行代码,就容易出问题
我用的poi正好在纠结,最后没办法,用按键精灵一个个转的。有个word文档批处理软件貌似能做到,但是要收费。
下面的是我读取word文字的代码
03读取:
InputStream is = new FileInputStream(docfile);
WordExtractor ex = new WordExtractor(is);
text = ex.getText();
System.out.println(text);
07读取:
OPCPackage opcPackage = POIXMLDocument.openPackage(docxfile.getAbsolutePath());
POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
text = extractor.getText();
System.out.println(text);
最后:doc不一定是03的,也可能是07的

回答2:

由于doc和docx的底层格式不一样,docx采用标准ooxml所以最好的办法就是读出doc的实际内容再转存docx,poi的话应该要3.5以上支持docx吧

回答3:

这个问题我要关注下 因为我也没想过会需要转换格式