我有一个带有标记数据的文档,格式为Hi here's my [KEYWORD phone number], let me know when you wanna hangout: [PHONE 7802708523我想基于一组这些类型的标记文档训练一个模型,然后使用我的模型来标记新文档。这在NLTK中是可能的吗?我已经研究过和脚本,但这
我正在尝试制作一个大量使用pos标签的应用程序。但在我看来,nltk的pos标签功能似乎还不够好--例如:text = "Obama delivers his first speech."现在,当我在Python环境上投入了足够的时间和精力时,转到java对我来说似乎并不现实。此外,与java相比,我更倾向于使用C,因此为了将来的使用,Python也更接近C。因此,第一个问题是: 1)你真的认为Java更适
我想要做的是解析原始的自然文本,并找到所有描述日期的短语。I met him <date>yesterday</date>.它们是日期这一事实是无关紧要的(在现实生活中,它们甚至不是日期,但我不想在细节上让您感到厌烦),基本上它只是一组开放式的可能值。值本身的语法可以近似为上下文无关,但是手动构建它相当复杂,并且随着复杂性的增加,