全文检索(倒排查找),类似于字典查找方式
三、全文检索
含义:
把文件中的内容提取出来,把文件一个一个划分成词组(分),
把词组组装成索引,在进行搜索的时候先对索引进行搜索,...同一个Document可以有相同的Field(域名和域值都相同)
5.分词
就是把提取的文档对象进行一个一个词组拆分;
拆分的时候需要去掉停用词(a, an, the ,的, 地, 得...获取需要创建索引的文件—->穿件Document对象—->进行分词
—->创建索引写对象
—->将文档加入到索引和文档的写对象中
—->索引写对象提交和关闭索引写对象流
@Test...Term进行搜索,如果找到结果那么删除,将更新的内容重新生成一个Document对象
* 如果没有搜索到结果,那么将更新的内容直接添加一个新的Document对象
* @throws Exception...;
//更新的对象
Document doc = new Document();
doc.add(new TextField("fileName", "xxxxxx", Store.YES