Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >使用TensorFlow 1.9时,CloudML作业不会终止

使用TensorFlow 1.9时,CloudML作业不会终止
EN

Stack Overflow用户
提问于 2018-08-14 23:36:46
回答 1查看 254关注 0票数 0

当使用TF 1.9 (即officially supported)时,我们的CloudML训练任务不会在训练完成后终止。工作就这样无限期地坐在那里。有趣的是,在TF 1.8上运行的CloudML作业没有问题。我们的模型是通过tf.Estimator创建的。

典型的日志(使用TF <=1.8时)为:

代码语言:javascript
运行
AI代码解释
复制
I  Job completed successfully.
I  Finished tearing down training program. 
I  ps-replica-0 Clean up finished.  ps-replica-0
I  ps-replica-0 Module completed; cleaning up.  ps-replica-0
I  ps-replica-0 Signal 15 (SIGTERM) was caught. Terminated by service. 
This is normal behavior.  ps-replica-0
I  Tearing down training program. 
I  master-replica-0 Task completed successfully.  master-replica-0
I  master-replica-0 Clean up finished.  master-replica-0
I  master-replica-0 Module completed; cleaning up.  master-replica-0
I  master-replica-0 Loss for final step: 0.054428928.  master-replica-0
I  master-replica-0 SavedModel written to: XXX  master-replica-0

当使用TF 1.9时,我们会看到以下内容:

代码语言:javascript
运行
AI代码解释
复制
I  master-replica-0 Skip the current checkpoint eval due to throttle secs (30 secs). master-replica-0 
I  master-replica-0 Saving checkpoints for 20034 into gs://bg-dataflow/yuri/nine_gag_recommender_train_test/trained_model/model.ckpt. master-replica-0 
I  master-replica-0 global_step/sec: 17.7668 master-replica-0 
I  master-replica-0 SavedModel written to: XXX master-replica-0 

有什么想法吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-20 06:21:02

检查你发送的作业id的日志,看起来只有一半的工人完成了他们的任务,另一半被卡住了,因此主机在等待他们活着,这导致了你的工作被卡住。

默认情况下,当使用tf.Estimator时,主服务器等待所有工作进程都处于活动状态。在有许多工人的大规模分布式培训中,重要的是要设置device_filters,使master只依赖PS才能存活,同样,工人也应该只依靠PS才能存活。

解决方案是在tf.ConfigProto()中设置设备筛选器,并将其传递给tf.estimator.RunConfig()的session_config参数。你可以在这里找到更多细节:https://cloud.google.com/ml-engine/docs/tensorflow/distributed-training-details#set-device-filters

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51851060

复制
相关文章
推荐17-Laravel 中使用 JWT 认证的 Restful API
在此文章中,我们将学习如何使用 JWT 身份验证在 Laravel 中构建 restful API 。JWT 代表 JSON Web Tokens 。我们还将使用 API 为用户产品创建功能齐全的 CRUD 应用。
猿哥
2019/09/24
11.2K0
推荐17-Laravel 中使用 JWT 认证的 Restful API
laravel dingo Api结合jwt 处理token校验
此命令会在 config 目录下生成一个 api.php 配置文件,你可以在此进行自定义配置。
joshua317
2021/04/20
5.7K0
laravel dingo Api结合jwt 处理token校验
laravel dingo/api添加jwt-auth认证
前面我们学了laravel dingo/api创建简单的api,这样api是开放给所有人的,如何查看和限制api的调用呢?可以用jwt-auth来验证,JSON Web Token Authentication
ytkah
2018/08/01
1.2K0
laravel dingo/api添加jwt-auth认证
JSON Web Token(JWT)教程:一个基于Laravel和AngularJS的例子
这是一篇介绍JSON Web Token(JWT)的文章,虽然可能用到的例子和Laravel和AngularJS有关,但知道了原理便能写出适用于自己的。同时,由于目前个人用的后台一直是java,前端也没用过AngularJS,vue也是最近才开始学,所以Laravel和AngularJS部分 并不十分了解,若有错误,欢迎及时提出。
WindCoder
2018/09/20
30.9K0
JSON Web Token(JWT)教程:一个基于Laravel和AngularJS的例子
laravel jwt 无感刷新token
b.刷新时间,刷新时间指的是在这个时间内可以凭旧 token 换取一个新 token。例如 token 有效时间为 60 分钟,刷新时间为 20160 分钟,在 60 分钟内可以通过这个 token 获取新 token,但是超过 60 分钟是不可以的,然后你可以一直循环获取,直到总时间超过 20160 分钟,不能再获取。 这里要强调的是,是否在刷新期可以一直用旧的token获取新的token,这个是由blacklist_enabled这个配置决定的,这个是指是否开启黑名单,默认是开启的,即刷新后,旧token立马加入黑名单,不可在用。
joshua317
2021/04/22
2.9K0
laravel 5.4 + dingo api + jwt 代替 Passport
新装一个LV composer create-project --prefer-dist laravel/laravel myApiProject 安装dingo api 在composer.json
guanguans
2018/05/09
1.4K0
Laravel 使用 Json Web Token(JWT)
首先,您需要在User model上实现Tymon\JWTAuth\Contracts\JWTSubject合同,这要求您实现2种方法getJWTIdentifier()和getJWTCustomClaims()
崔哥
2023/04/03
9640
Laravel使用 Jwt-auth 实现多用户接口认证
首先创建数据库和表(admins),在 routes/api.php 中,写上如下路由并创建对应控制器和方法。
用户10002156
2023/08/07
6670
Laravel使用 Jwt-auth 实现多用户接口认证
关于Laravel5.5增加的新功能——包自动发现
在Laravel5.5中,增加了一个新功能,就是支持包自动发现,这个有什么用呢,结合JWT的文档来说明会更好一些。
咪啪咪啪
2019/11/15
6760
uni-app+php+workman实现简单聊天功能之API开发
在之前的文章【laravel中Websocket基本使用】中我们已经初步搭建了websocket服务,现在我们只需要稍微修改一下Events即可 当连接成功时我们将客户端id发送的客户端
切图仔
2022/09/08
1.8K3
laravel5.6 反解token获取用户信息
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/129668.html原文链接:https://javaforall.cn
全栈程序员站长
2022/07/29
6680
Laravel JWT 通过token获取用户信息
官方文档 1.控制器 use Tymon\JWTAuth\Exceptions\TokenExpiredException; use Tymon\JWTAuth\Facades\JWTAuth; public function getAuthenticatedUser() { try { if (! $user = JWTAuth::parseToken()->authenticate()) { return response()->json(['use
切图仔
2022/09/14
2.6K0
Laravel JWT 通过token获取用户信息
Laravel Api实现JWT Token认证
在开发Api时,处理客户端请求之前,需要对用户进行身份认证,Laravel框架默认为我们提供了一套用户认证体系,在进行web开发时,几乎不用添加修改任何代码,可直接使用,但在进行api开发时,需要我们自己去实现,并且Laravel框架默认提供的身份认证不是jwt的,需要在数据库中增加api_token字段,记录用户认证token并进行身份校验,如果需要使用jwt,无需添加字段,需要借助三方库来实现。
Petrochor
2022/06/07
7700
Laravel Api实现JWT Token认证
lumen安装Horizon
昨天领导告诉我,要安装Horizon。但是我们使用的是lumen,官方的Horizon并不支持lumen。所以又去找第三方,结果发现已经八个月没有更新了。无奈尝试自己维护。发现一堆坑。根本填不完。今天早上想着去packagist去淘淘。还真让我发现了一个正在维护的: horizon-lumen。
魔王卷子
2019/05/31
1.9K8
laravel 中配置DingoApi 和JWT
创建 基础控制器、用户认证控制器,对应路由文件中的命名空间 App\Http\Controllers\Api\v1
友儿
2023/10/21
3250
laravel 中配置DingoApi 和JWT
点击加载更多

相似问题

Tymon\JWTAuth::toUser错误:需要令牌

30

找不到Tymon JWTAuth类

32

找不到类'Tymon\JWTAuth\Providers\LaravelServiceProvider‘

22

JWT-令牌:未找到类'Tymon\JWTAuth\Providers\JWTAuthServiceProvider‘

23

参数1传递给Tymon\JWTAuth\JWTGuard::login()必须实现接口Tymon\JWTAuth\Contracts\JWTSubject

12
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档