我在文本文件中搜索特定的字符串,并查找该字符串下面一行的数字。所以下面的例子让它更清晰。
这是文本文件的内容
2017-08-14 14:04:53,836 INFO - XML File FILE1 is created in /path/to/file
2017-08-14 14:10:04,696 INFO - #Instances Extracted: 32960
2017-08-14 14:17:52,248 INFO - XML File FILE2 is created in /path/to/file
2017-08-14 14:41:33,720 IN
我有包含以下内容的文件:
Sent
Trash
Drafts
Junk
我想用Python找到并删除它。
我知道循环来搜索文件和打开文件,我知道正则表达式是如何工作的,但是regex逐行读取文件,我不能只使用关键字进行搜索,因为有很多包含这些单词的文件(比如'Send'),我需要确切的内容。我能做什么?
我想是这样的:
with open(fullsourcefilename) as openfile:
if openfile.read() == "Sent\nTrash\nDrafts\nJunk":
但不管用。
考虑一个150万行的文本文件,每行大约50-100个单词。
要查找包含该单词的行,使用os.popen('grep -w word infile')似乎比
for line in infile:
if word in line:
print line
在python中,如何在文本文件中搜索单词呢?在这么大的无索引文本文件中搜索最快的方法是什么?