3分钟

模板文件

  1. CRF++ 使用模板文件来生成特征。模板文件需要用户编写,从而指定需要生成哪些特征。
  2. 模板文件中,每一行都定义了一个特征模板。
  3. 模板文件中,以 # 开头的行是注释行。 空行也会被认为是注释行而被剔除。
  4. 有两种类型的特征模板,它们通过特征模板的第一个字符来区分。
    • Unigram 特征模板:模板的第一个字符串为U ,这种特征模板用于描述unigram 特征。
    • Bigram 特征模板:模板的第一个字符串为 B ,这种特征模板用于描述bigram 特征。