您好,当我设置google cloud机器学习来训练神经网络时,突然我无法向google cloud提交作业。
没有错误,但是命令挂起了,没有做任何事情,而且我的实例正在运行.Here,命令如下:
gcloud ml-engine jobs submit training job9123 --runtime-version 1.0 --job-dir gs://dataset1_giorgaros2 --package-path trainmodule --module-name trainmodule.nncloud --region europe-west1 --config cloudml-gpu.yaml -- --train-file gs://dataset1_giorgaros2/nnn.p
谢谢!
发布于 2018-08-10 21:56:09
ML引擎作业日志有助于获取有关失败作业执行的更多详细信息,在大多数情况下,日志文件包含失败的原因。
Finding the job logs on ML engine
如果您每次都在训练作业执行过程中尝试相同的命令,则可能会获得有关作业名称的错误,这是由于ML engine上的每个作业的名称必须是唯一的,因为ML engine作业的命名约定规则对此进行了描述。
发布于 2018-06-11 20:33:34
尝试检查到google计算引擎的网络连接。
从run - https://console.cloud.google.com/检查日志
当然,请阅读文档:https://cloud.google.com/sdk/gcloud/reference/ml-engine/jobs/submit/training
https://stackoverflow.com/questions/50795413
复制相似问题