对于我正在处理的特定任务,我有一个大约25 GB的数据集。我仍然在试验几种预处理方法,而且肯定还没有最终的数据。我不确定这类问题的通用工作流是什么,下面是我的想法:
另一种办法是:
这些方法中的哪一种是建议的?这将产生较少的费用,并经常使用在运行这类操作。有没有不同的工作流程,我在这里没有看到?
发布于 2018-08-02 11:01:33
在计费方面,费用是相同的,因为根据文档,保险丝操作就像任何其他云存储接口一样收费。在您的用例中,我不知道您将如何训练数据,但是如果您对文件执行了多个操作,最好是下载它们,在本地进行培训,然后上传最后的结果,即2个对象操作。例如,如果在培训期间更改或读取多个文件,则每个操作都将是一个对象操作。在工作流程方面,我觉得这个提议很好。
https://stackoverflow.com/questions/51639141
复制相似问题