我有一个由人口普查数据(年龄、性别、就业类型、种族、教育水平等)组成的数据集。我的任务是编写一个算法来预测数据点(30,男性,白人等)年收入将超过50000美元。
到目前为止,我实现了一个运行30小时的KNN算法,但在测试数据上达到了大约90%的准确率。我希望使用SVM算法或朴素贝叶斯算法或其他任何可能在这里工作的东西来实现更高的准确性。
我正在寻找一种算法,它在python中实现起来相对简单(大约和KNN一样难),并且很可能达到很好的准确性。在这种情况下最好的选择是什么?如果KNN是最好的选择,那么为了进行比较,哪种算法最容易实现?
发布于 2019-05-01 14:53:21
很难说哪种算法的性能会更好。通常,对于传统的分类任务,比如你的分类任务,随机森林,梯度增强机器和支持向量机通常能提供最好的结果。
我不知道你所说的寻找一种“相对容易实现”的算法是什么意思,但是如果你使用scikit-learn,很多算法已经实现了,并且可以放在一两行代码中,所以你可以尝试所有的算法!
https://stackoverflow.com/questions/55931543
复制相似问题