首先要对文件作处理,使每个句子独立成行:
1. ctrl-o打开文本文件
2. ctrl-h打开replace窗口
在search for pattern输入[!。?]在replace with pattern输入$match\n即可
3. 点击replace,即可在所有叹号、句号、问号后面加入一个换行符。
然后对文本按照1行分割:
4. 打开File->SaveAs->Split by lines菜单,
* 在Split naming输入#.txt
* 在Split File by输入1,后面选Lines
5. 点击Next,并输入任意结果文件名,比如output.txt,即可在输出目录下生成1.txt, 2.txt, ...