我正在寻找一个良好的图书馆或一些项目,已经做了在短信文本规范化领域。我发现了一些很好的研究项目,比如这 one。
我使用Java作为编程语言。
简而言之,这个概念就是处理基于短信的文本,比如"tel him 2 go nw“,并将其转换为普通的英语文本”告诉他现在回家“()。
发布于 2011-11-14 09:20:19
为什么不直接从这样的站点下载字典:http://smsdictionary.co.uk/abbreviations并使用字符串替换?
发布于 2012-04-15 18:23:55
字典替换并不能割断它,因为它在翻译中忽略了上下文。你是把“2”翻译成“to”,“太”还是“2”?
您可以使用摩西(http://www.statmt.org/moses/)或短语(http://nlp.stanford.edu/software/phrasal/)获得一个语料库并自己训练一个统计模型。
作为斯坦福一号( Stanford,http://www-nlp.stanford.edu/sms/translate.php)的作者,我可以被说服为这样的服务提供一个基于REST的API,但我不知道对它的需求.
https://stackoverflow.com/questions/8119295
复制相似问题