个人认为,第一种方法相对靠谱一点。毕竟你的目的是可以检索到附件。
优化建议:
提取摘要。索引全部附件不太可取,这对硬件的压力也很大。可以选择新增一个域,用来保存附件的摘要。从那行代码来看,附件应该都是文档类吧。lucene的Highlighter貌似有这个功能,也可以考虑用其它方式实现。摘要+附件名,附件检索的目的完全可以达到了。
增加相关域,根据对附件的检索需求,可以使用tika读取更多的相关信息,比如:附件名、附件大小、作者、时间、附件摘要,等相关信息。加上这些内容,一般的需求都能满足了。