我是NLP的新手,我使用斯坦福NER工具对一些随机文本进行分类,以提取软件编程中使用的特殊关键字。
问题是,我不知道如何改变分类器和文本注解器来识别软件编程关键字。例如:
today Java used in different operating systems (Windows, Linux, ..)
分类结果应包括:
Java "Programming_Language"
Windows "Operating_System"
Linux "Operating_system"
请您帮助我如何定制StanfordNER分类器以满足我的需要?
我有以下数据:
Rank Platforms Technology
high Windows||Linux Unity
high Linux
low Windows Unreal
low Linux||MacOs GameMakerStudio||Unity||Unreal
low GameMakerStudio
Platforms和Technology都是分类变量。这里的问题是它们可以有一个,或者是空的,或者,特别是像GameMakerStud
红帽是从哪里来的?它是直接源自发行版(2年前),还是源于BSD或System?我只是想知道如何在Linux世界中对Redhat进行分类。
1991
Linus Torvalds releases the Linux® kernel.
1993
Bob Young incorporates ACC Corporation, a catalog business
that sells Linux and UNIX software accessories and books,
and distributes a magazine called New York UNIX.
1994
Marc