我在做多元线性回归。我得到了大约100个不同的自变量(IV)和1个因变量(DV)。IV可以是二进制的,分类的或数字的-这里没有文本。DV是数值的。
通过亚马逊和他们的机器学习算法来创建这个模型的优点是什么,而不是仅仅使用正常的统计方法来解决这个模型呢?
发布于 2017-08-08 17:04:38
当然,您可以在本地机器上使用统计数据(R、Python或您选择的套件)来解决这个问题。没有什么能阻止你这样做。
一个因变量和数百个自变量很容易在一台台式机的范围内实现。听起来你需要一个广义线性模型。
我有一个六核心AMD机,32 at内存在家里。我确信我可以不用等太久就能解决你的问题。
您更大的问题可能是数据清理、准备和决定这100个自变量中的哪一个有意义。你会想要检查它们,以确保它们之间没有关联。也许一种PCA或套索技术可以帮助你赢得它们到最重要的一组。
您没有说明数据集中有多少行。即使有几百万排,你也是安全的。
在你的用例中,我没有看到任何东西表明神经网络应该是你的第一选择。
我会在AWS上运行机器学习算法,如果我有一个神经元(数百万或数十亿)的神经网络模型,需要那种只能从Amazon获得的分布式计算能力。我愿意拿出我的信用卡并支付特权,但如果我需要的话,我可以选择。
https://stackoverflow.com/questions/45570399
复制相似问题