
AWS Deepracer
文章平均质量分 73
网上一些Deepracer 的教程非常零散,本专栏以AWS Deepracer 基础为主,赛道比赛实战为辅,深入剖析deepracer,本文不会给出reward代码,只做理论分析和交流,部分赛道代码参看: https://github.com/fblrainbow/AWS_Deepracer
Rambo.Fan
眼中有阳光,风雨不阻行
展开
-
(框架)Deepracer 自动训练 框架的搭建
该框架通过配置好的参数自动进行模型训练,自动迭代,每完成一次迭代之后发送邮箱提醒。原创 2022-11-08 04:20:40 · 1565 阅读 · 0 评论 -
(实战)[2022 公司Deepracer 线上赛和线下赛]-002
线下比赛不确定因素太多,往往小车的表现没有线上好,这时候你需要对你的模型多做评估,选择一个稳定的模型进行比赛,否则可能没有成绩,运气成分占比较大。原创 2022-10-24 20:53:23 · 1019 阅读 · 0 评论 -
(实战)[自动驾驶赛车-中国联赛]-合集
亚马逊云科技也基于Amazon DeepRacer发起了全球开发者都能参与的Amazon DeepRacer联赛,让世界各地的人都能轻松参与机器学习,体验自动驾驶的乐趣。本次比赛免费报名,新注册的亚马逊云科技用户可免费试用10小时的DeepRacer Training,超出的时长需自行付费。本次大赛共分为四场线上月赛,每两场月赛为一个赛段,即7月赛和8月赛为一个赛段,10月赛和11月赛为一个赛段,每个赛段结束后,将会分别有一场线下比赛,每场月赛【专业组】排名前6的选手,将默认进入当前赛段的线下比赛。原创 2022-09-16 12:00:00 · 781 阅读 · 0 评论 -
(实战)[2022 Guinness Challenge]-001
比赛链接:比赛开始日期:2022/07/15 00:00:00比赛截止日期:2022/09/15 12:00:005圈总计时间最短排名,出界一次罚时3秒。原创 2022-09-13 12:00:00 · 1394 阅读 · 3 评论 -
(进阶)004 - AWS DeepRacer重要资料合集
Deepracer 入门必看资料原创 2022-07-31 15:30:19 · 2132 阅读 · 4 评论 -
(赛事-2022)[re:Invent 2018]-002:通过分析log多次迭代优化奖励函数后- 最快7.6s / 圈
Deepracer training 流程原创 2022-07-24 16:57:34 · 3745 阅读 · 1 评论 -
(赛事-2022)[re:Invent 2018]-001:介绍
2022年公司再次组织Deepracer比赛,这次是公司全球九个国家或地区比赛,分不同赛区。原创 2022-07-24 19:08:56 · 980 阅读 · 1 评论 -
(实战)[Ace Speedway]-001:获取赛道信息
文章目录1. 打印log的函数2. 下载 训练时的 log3. 下载评估 log4. 分析赛道信息5. 赛点可视化6. 通过评估log 可视化小车轨迹1. 打印log的函数在 reward_function 函数中加上以下指定内容,下载训练的log会 打印训练过程小车的实时状态 ### get full log waypoints=params["waypoints"], steps=params["steps"], x=params["x"], y=params原创 2022-05-26 12:00:00 · 949 阅读 · 0 评论 -
(基础)009 - AWS Deepracer训练时长以及收费标准
文章目录1. 免费时长2. 超时收费3. 模型储存费用4. 查看账单5. 避免踩坑1. 免费时长每一个新注册的用户都有10 小时的免费训练时间,这个10小时的免费训练时长是30 天内有效的,另外还送30 天5G的模型保存空间,这个在你注册完成的时候会有个提醒,也可通过账单查看2. 超时收费一般对于新手来说10小时的训练时长,仅够对Deeprace有一个初步的摸索,远达不到训练一个好的模型,毕竟开始尝试各种入口参数、超参都需要花费不少的训练时长。那么超过免费训练时长AWS是如何收费的呢?AWS 官方原创 2022-05-25 12:00:00 · 1286 阅读 · 0 评论 -
(实战)[re:Invent 2018]-002:通过分析奖励函数优化后- 8.4s / 圈
这里写自定义目录标题欢迎使用Markdown编辑器欢迎使用Markdown编辑器原创 2021-12-26 21:40:39 · 2983 阅读 · 7 评论 -
(实战)[re:Invent 2018]-001:赛道分析-(致敬1024)
打印log原创 2021-10-24 19:59:46 · 2121 阅读 · 0 评论 -
(进阶)003 - AWS DeepRacer分析log
文章目录下载 Evaluation log解压log,找到 `0-iteration.csv`log 可视化分析对各个维度进行分析对速度低于 `1.5` 的点进行筛选对赛道范围的进行筛选下载 Evaluation log解压log,找到 0-iteration.csvlog 可视化分析import osimport numpy as npimport pandas as pdfrom math import expfrom matplotlib.collections import Line原创 2021-10-31 23:42:03 · 1147 阅读 · 0 评论 -
(进阶)002 - AWS DeepRacer分析log
文章目录Log 数据提取使用Notepad++ 工具将log提取出来提取常量数据处理数据可视化提取变量数据处理数据可视化所有数据可视化选择部分点可视化总结Log 数据提取使用Notepad++ 工具将log提取出来提取常量使用自定义的log开始标签reward_constant_Log,搜索所有的行数据处理将上述结果copy到新的文件中提取出来的数据可以看到 track_length 赛道总长是一个始终不变的量,17.709159380834848mwaypoints赛道定点也是一原创 2021-10-10 03:26:32 · 1543 阅读 · 0 评论 -
(进阶)001 - AWS DeepRacer获取log
文章目录如何获取log一个打印log的代码示例下载logtraining log 文件结构Evaluation log文件结构如何获取log在reward_function 中通过print可以将params入口参数打印到log中,然后通过控制台Download logs可以获取自定义的log格式一个打印log的代码示例def reward_function(params): ''' Env: re:Invent 2018 ''' x = params['x']原创 2021-10-10 02:05:05 · 1133 阅读 · 0 评论 -
(基础)008 - 开始第一个Deepracer Model
本文是在你注册AWS 账户成功的情况下才能进行的,如果你还没有注册,请先参看我的上一篇文章。文章目录打开Deeprace 服务Deeprace 流程开始创建第一个model第一步:指定Model名称和赛道第二步:选择比赛类型、训练算法以及合适的超参比赛类型训练算法超参第三步:定义操作空间选择操作空间定义连续操作空间的一些参数转向角速度第四步:选择小车第五步:自定义奖励函数编写reward_function函数设置训练停止条件点击`Create model`完成model的创建打开Deeprace 服务原创 2021-10-15 12:00:00 · 1172 阅读 · 0 评论 -
(基础)007 - 注册一个AWS 账户
文章目录注册一个AWS账户步骤注册页面第一步第二步关键 第三步第四步第五步点击完成注册登录管理控制台操作管理控制台注册一个AWS账户步骤注册页面注册链接第一步第二步到这一步点继续之后,正常情况下手机会收到一条美元支付信息。如下:如果没有收到这一条信息说明你的注册没有成功,后面打开AWS Deepracer时会提示你没有注册成功,需要重新提交信息。关键 第三步这一步非常关键: 信用卡必须是可用于国际支付的(VISA),必须具有美元支付功能,我使用的公司给办的美元信用卡,之前试过人名币信原创 2021-10-12 20:00:00 · 2492 阅读 · 0 评论 -
(基础)006 - AWS Deepracer model 超参介绍
本文将对 AWS Deepracer model 的超参进行介绍,并分享个人在使用时的经验。超参数 (Hyperparameters)超参数是控制强化学习训练的变量。可以调整它们以优化训练时间和模型性能。梯度下降批量大小(Gradient descent batch size)从经验缓冲区中随机采样的近期车辆经验数量,用于更新底层深度学习神经网络权重。随机抽样有助于减少输入数据中固有的相关性。使用更大的批量大小来促进对神经网络权重的更稳定和平滑的更新,但要注意训练时间可能更长或更慢的可能性。该批次原创 2021-10-14 23:56:02 · 2320 阅读 · 0 评论 -
(基础)005 - 奖励函数的入口参数详解
文章目录奖励函数的形式入口参数paramsall_wheels_on_trackxyclosest_objectsclosest_waypointsdistance_from_centeris_crashedis_left_of_centeris_offtrackis_reversedheadingobjects_distanceobjects_headingobjects_left_of_centerobjects_locationobjects_speedprogressspeedsteering_an原创 2021-10-10 20:00:00 · 2768 阅读 · 0 评论 -
(基础)004 - AWS DeepRacer 操作空间、奖励函数、训练算法
文章目录操作空间离散操作空间连续操作空间离散与连续奖励函数训练算法近端策略优化 (PPO) 与 Soft Actor Critic (SAC)稳定与数据饥饿探索与开发熵操作空间在强化学习中,代理与环境交互时可用的所有有效动作或选择的集合称为操作空间。在 AWS DeepRacer 控制台中,您可以在离散或连续操作空间中训练代理。离散操作空间离散操作空间表示座席针对有限集中每个状态的所有可能操作。对于 AWS DeepRacer,这意味着,对于每种不同的环境情况,代理的神经网络会根据摄像头和(可选)L原创 2021-10-07 23:57:15 · 2903 阅读 · 0 评论 -
(基础)003 - AWS DeepRacer 中的强化学习
在强化学习中,代理(例如,以实现预期目标为目标的实际或模拟 AWS DeepRaker 工具)与环境以最大限度地提高代理的总奖励。代理采用操作, 以一个被称为策略,在给定的环境state并达到一个新的状态。任何操作都有关联的即时奖励。该奖励用于衡量操作的合用性。这种即时奖励视为由环境返回。AWS DeepRacer 中 强化学习的目标是了解给定环境中的最优策略。学习是一个试验和出错的迭代过程。代理采取随机初始操作来抵达新的状态。然后,代理迭代步骤,从新状态进入下一个状态。随着时间的推移,代理将发现原创 2021-10-07 23:10:46 · 528 阅读 · 0 评论 -
(基础)002 - AWS DeepRacer 概念和术语
文章目录AWS DeepRacer 服务AWS DeepRacer强化学习强化学习模型AWS DeepRacer 模拟器排行榜机器学习框架策略网络优化算法神经网络超参数AWS DeepRacer 轨道奖励函数经验情节经验迭代策略迭代训练作业评估作业AWS DeepRacer 服务AWS DeepRacer 是一项 AWS Machine Learning 服务,用于探索专注于自主赛车的强化学习。AWS DeepRacer 服务支持以下功能:在云端训练强化学习模型。在 AWS DeepRacer 控原创 2021-10-07 22:43:24 · 1277 阅读 · 0 评论 -
(基础)001 - AWS Deepracer简介
原创 2021-10-07 21:09:39 · 1544 阅读 · 0 评论