首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >利用Lucene测试索引生成的.fnm 和 .fdx 和 .fdt 和 .tii 和 .tis文件所包含的内容(详解)

利用Lucene测试索引生成的.fnm 和 .fdx 和 .fdt 和 .tii 和 .tis文件所包含的内容(详解)

作者头像
星哥玩云
发布2022-07-04 14:24:51
发布2022-07-04 14:24:51
7810
举报
文章被收录于专栏:开源部署开源部署

/*  *  * 这段代码用来测试文件segment.fnm等文件所包含的内容

 *

 * */

生成的索引文件.fnm中所包含了Document的所有Field名称。

如图就是生成索引:

第一个截图是:

.fnm文件

.fnm包含了Document中的所有field名称

.fdx文件

.fd是一个是一个索引,用于存储Document在.fdt中的位置

.fdt

.fdt文件用于存储具有Store.YES属性的Field数据

.tii

.tis文件用于存储分词后的词条(Term), 而.tii就是它的索引文件。

它标明了每个.tis文件中国的词条的位置

.tis

.tis文件用于存储分词后的词条(Term)

package segment;

import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter;

public class Segment {

private String INDEX_PATH = "E:\\Lucene项目\\索引文件"; Document doc1 = null; Document doc2 = null; public Segment(){

try { doc1 = new Document(); Field f1 = new Field("name1", "smi steve ted teddy terry", Field.Store.YES, Field.Index.TOKENIZED); Field f2 = new Field("name2", "what are you doing", Field.Store.YES, Field.Index.TOKENIZED); Field f3 = new Field("name3", "how do you do", Field.Store.YES, Field.Index.TOKENIZED); doc1.add(f1); doc1.add(f2); doc1.add(f3);

doc2 = new Document(); Field f4 = new Field("name4", "smi steve ted teddy terry", Field.Store.YES, Field.Index.TOKENIZED); Field f5 = new Field("name4", "what are you doing", Field.Store.YES, Field.Index.TOKENIZED); doc2.add(f4); doc2.add(f5);

IndexWriter writer = new IndexWriter(INDEX_PATH, new StandardAnalyzer(), true); writer.setUseCompoundFile(false); writer.addDocument(doc1); writer.addDocument(doc2); writer.close(); }catch(IOException e){ e.printStackTrace();

} }

public static void main(String[] args) { // TODO Auto-generated method stub Segment se = new Segment();

}

}

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档