我很想了解那些在机器学习/数据科学领域工作过的人对如何继续工作的见解。看起来有很多种选择1.)在医疗保健环境中快速学习和应用预测分析。3.)对于最终被使用的东西,有一个强大的用户基础
我希望能够学习和故障排除问题,没有问题或过时/利基软件,没有人使用。我不是一个伟大的自动行为,所以如果有良好的在线支持/教程,那就太好了。因此,我一直在粗略调查微软已经拥有了什么:似乎有R客户端、Microsoft机器学习服务器(以前的Microsoft R Server)、SQL Serve
为了进行培训,为了开始使用python进行机器学习和数据分析,我使用了一个非常小的数据集(20000行,600 of ) .But,因为几天后我决定更进一步,所以我已经下载了一个1Go的大数据集。我想做一些分析,并应用机器学习,所以我试着阅读csv文件与pyhton在木星笔记本和th文件仍在加载超过3个小时。
因此,我想知道,当您必须使用大型数据集时,应该遵循哪些最佳实践/流程?