
ray
快乐地笑
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Ray:一个分布式应用框架
下一代AI应用程序将持续与环境交互并从这些交互中学习。 这些应用程序在性能和灵活性方面都提出了新的和苛刻的系统要求。 在本文中,我们考虑这些要求并提出Ray - 一个分布式系统来解决它们.Ray实现了一个统一的接口,可以表示任务并行和基于actor的计算,由单个动态执行引擎支持。 为了满足性能要求,Ray采用分布式调度程序和分布式容错存储来管理系统的控制状态。 在我们的实验中,我们展示了超过每秒180万个任务的规模,并且比几个现有的具有挑战性的强化学习应用程序的性能好。原创 2019-06-28 11:13:01 · 3210 阅读 · 0 评论 -
Ray --内部运行机制、对象存储中对象的存储和容错
本篇主要介绍了分布式框架 Ray 的内部运行机制,对象的存储过程和容错能力。内部运行机制主要分为Ray的连接,远程函数的定义和使用以及获取对象ID的运行机制。对象存储主要是对象放入存储对象的序列化和从对象调出的反序列化,以及特殊的numpy数组的Apache Arrow 化存储。容错主要是进程和对象的恢复,丢失的actor不能重建,以及那些进程和对象不能重建问题。原创 2019-04-30 14:11:12 · 1813 阅读 · 0 评论 -
Tensorflow在分布式框架Ray中的使用
本篇主要介绍在Ray上使用tensorfloe的最佳方法。要查看更多使用TensorFlow的复杂示例,请查看A3C、ResNet、策略梯度和LBFGS。当正在分布式环境中训练一个深度网络,您可能需要在进程(或机器)之间传送您的深度网络。例如,可以在一台机器上更新您的模型,然后使用该模型在另一台机器上计算梯度。然而,交付模型并不总是那么简单。例如,直接尝试pickle Tensorflow图...原创 2019-04-28 22:49:36 · 2072 阅读 · 0 评论 -
Ray-分布式的SGD
Ray包含了同步分布随机梯度下降(SGD)的实现,它在性能上与Horovod和分布式TensorFlow中的实现相竞争。Ray SGD构建在Ray任务和参与者抽象之上,以提供与现有Ray应用程序的无缝集成。1.接口要使用Ray SGD,定义一个模型类:class ray.experimental.sgd.Model您的类必须实现与Ray SGD一起使用的这个接口。这支持任...原创 2019-04-27 15:00:46 · 1801 阅读 · 0 评论 -
Ray----Tune(6):Tune 的实例(一)
在我们的存储库中,我们为各种用例和调优特性提供了各种示例。原创 2019-04-24 17:24:57 · 5692 阅读 · 1 评论 -
Tune:一个分布式模型选择与训练研究平台
摘要: 现代机器学习算法对计算的要求越来越高,需要专门的硬件和分布式计算来在合理的时间范围内实现高性能。为了提高模型选择的效率,已经提出了许多超参数搜索算法,但它们对分布式计算环境的适应性往往是临时的。我们提出了一个统一的模型选择和训练框架Tune,它在训练脚本和搜索算法之间提供了一个窄腰接口。结果表明,该接口能够满足大范围超参数搜索算法的要求,可以直接将搜索扩展到较大的集群上,并简化了算法的实现...原创 2019-04-15 22:43:53 · 1429 阅读 · 0 评论 -
Ray----Tune(6):Tune 的实例(二)
三、PyTorch 实例mnist_pytorch转换PyTorch MNIST示例以使用Tune和基于函数的API。另外展示了argparse命令行解析来使用Tune。代码:# Original Code here:# https://github.com/pytorch/examples/blob/master/mnist/main.pyfrom __future__ import...原创 2019-10-30 20:10:28 · 1005 阅读 · 0 评论 -
Ray----Tune(5):Tune包中的类和函数参考
ray.tuneray.tune.grid_search(values)用于指定值上的网格搜索的快捷方法。参数: values –参数将被网格化的迭代器。ray.tune.register_env(name, env_creator)注册一个自定义环境,以便与RLlib一起使用。参数: name (str) –注册的名称。 env_cre...原创 2019-04-20 11:46:37 · 5120 阅读 · 0 评论 -
Ray----Tune(3):Tune试验(trial)调度
默认情况下,Tune使用FIFOSchscheduler类按顺序安排试验。不过,您还可以指定一个自定义调度算法,该算法可以提前停止试验或干扰参数。tune.run( ... , scheduler=AsyncHyperBandScheduler())Tune包括早期停止算法的分布式实现,例如中值停止规则,HyperBand和HyperBand的异步版本。这些算法具有很高的资源效率,在很多情况...原创 2019-04-13 22:35:29 · 2413 阅读 · 2 评论 -
Ray入门指南(3)----Ray--Actors
Actorsremote 函数在Ray中应该被认为是功能和无副作用。Ray使用actor扩展了数据流模型。actor本质上是一个有状态的worker(或服务)。当实例化一个新actor时,将创建一个新worker,并将acto的方法调度到该特定worker上,并且可以访问该worker并更改其状态。...原创 2019-04-02 22:34:29 · 4565 阅读 · 0 评论 -
Ray入门指南(1)----ray分布式框架的介绍
使用ray,你需要解决以下两个问题:1.ray执行同步任务时是怎样实现平行的。2.ray是怎样使用对象ID来表示不可变对象的远程对象的。原创 2019-03-27 15:09:24 · 13190 阅读 · 10 评论