首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >短信文本规范化

短信文本规范化
EN

Stack Overflow用户
提问于 2011-11-14 09:07:23
回答 2查看 954关注 0票数 4

我正在寻找一个良好的图书馆或一些项目,已经做了在短信文本规范化领域。我发现了一些很好的研究项目,比如 one。

我使用Java作为编程语言。

简而言之,这个概念就是处理基于短信的文本,比如"tel him 2 go nw“,并将其转换为普通的英语文本”告诉他现在回家“()。

EN

回答 2

Stack Overflow用户

发布于 2011-11-14 09:20:19

为什么不直接从这样的站点下载字典:http://smsdictionary.co.uk/abbreviations并使用字符串替换?

票数 4
EN

Stack Overflow用户

发布于 2012-04-15 18:23:55

字典替换并不能割断它,因为它在翻译中忽略了上下文。你是把“2”翻译成“to”,“太”还是“2”?

您可以使用摩西(http://www.statmt.org/moses/)或短语(http://nlp.stanford.edu/software/phrasal/)获得一个语料库并自己训练一个统计模型。

作为斯坦福一号( Stanford,http://www-nlp.stanford.edu/sms/translate.php)的作者,我可以被说服为这样的服务提供一个基于REST的API,但我不知道对它的需求.

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8119295

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档