我想知道是否有用于垃圾邮件和文本分类的贝叶斯过滤的好的和干净的面向对象编程(OOP)实现?这只是为了学习的目的。
发布于 2008-09-03 19:46:48
我绝对推荐Weka,这是一个用Java编写的开源数据挖掘软件:
Weka是用于数据挖掘任务的机器学习算法的集合。这些算法可以直接应用于数据集,也可以从您自己的Java代码中调用。Weka包含用于数据预处理、分类、回归、聚类、关联规则和可视化的工具。它也非常适合于开发新的机器学习方案。
如上所述,它附带了一系列不同的分类器,如SVM、Winnow、C4.5、朴素贝叶斯(当然)和更多(参见API doc)。请注意,众所周知,在垃圾邮件检测或文本分类领域,许多分类器具有比朴素贝叶斯更好的性能。
此外,Weka为您带来了一个非常powerful GUI的…
发布于 2008-08-04 08:54:16
也许是https://ci-bayes.dev.java.net/或http://www.cs.cmu.edu/~javabayes/Home/node2.html
我也从来没玩过。
发布于 2008-09-01 06:19:16
https://stackoverflow.com/questions/1083
复制相似问题