DeepMind私货公开，推出分布式机器学习库，TensorFlow、Keras可用

商业新知

修改于 2019-03-21 10:35:21

3480

文章被收录于专栏：AI人工智能AI人工智能

郭一璞发自凹非寺

量子位报道 | 公众号 QbitAI

DeepMind最近为TensorFlow 2.0献祭了自己私藏的工具：

TF-Replicator ，本来是内部自用的一个软件库，能够让从来没做过分布式系统的研究人员方便地在多GPU/云TPU上部署他们的TensorFlow模型，也适用于Keras。

目前，TF-Replicator的编程模型已经作为TensorFlow中tf.distribute.Strategy的一部分开源。

推特上的一位工程师惊叹：这简直是TensorFlow 2.0里隐藏的宝藏啊！

怎么用

使用TF-Replicator编写的代码与TensorFlow中为单个设备编写的代码类似，允许用户自由定义自己的模型运行循环。

用户只需要定义两个部分：

1.公开数据集的输入函数；

2.模型逻辑的步骤函数。

1# Deploying a model with TpuReplicator.

2repl = tf_replicator.TpuReplicator(3 num_workers=1, num_tpu_cores_per_worker=84)5with repl.context():6 model = resnet_model()7 base_optimizer = tf.train.AdamOptimizer()8 optimizer = repl.wrap_optimizer(base_optimizer)910# ... code to define replica input_fn and step_fn.1112per_replica_loss = repl.run(step_fn, input_fn)13train_op = tf.reduce_mean(per_replica_loss)1415with tf.train.MonitoredSession() as session:16 repl.init(session)17for i in xrange(num_train_steps):18 session.run(train_op)19 repl.shutdown(session)