在python中遇到了一些困难。我想把一个包含许多注释的.txt文件分割成一个列表。但是,我想对所有标点符号、空格和\n进行拆分,当我运行下面的python代码时,它会将我的文本文件分割成奇怪的地方。注意:下面我只试着在句点和尾行上分开来测试它。但它仍然经常把最后一封信用文字处理掉。
import regex as re
with open('G:/My Documents/AHRQUnstructuredComments2.txt','r') as infile:
nf = infile.read()
wList = re.split('