Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience

本文探讨了通过训练模拟场景的分布将策略转移到现实世界的问题。提出了一种使用真实世界经验调整模拟随机化的方法,通过匹配模拟与现实的策略行为,实现更有效的策略转移。实验展示了在摆钉和开柜门任务中,该方法能使策略成功应用于不同机器人。

Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience

模拟到实际循环闭环:使用真实世界的经验调整模拟随机化

Yevgen Chebotar, Ankur Handa, Viktor Makoviychuk Miles Macklin Jan Issac1 Nathan Ratliff1 Dieter Fox

Abstract—We consider the problem of transferring policies to the real world by training on a distribution of simulated scenarios. Rather than manually tuning the randomization of simulations, we adapt the simulation parameter distribution using a few real world roll-outs interleaved with policy training. In doing so,we are able to change the distribution of simulations to improve the policy transfer by matching the policy behavior in simulation and the real world. We show that policies trained with our method are able to reliably transfer to different robots in two real world tasks:swing-peg-in-hole and opening a cabinet drawer. The video of our experiments can be found at https: //sites.google.com/view/simopt.

我们通过培训模拟场景的分布来考虑将策略转移到现实世界的问题。我们不是手动调整模拟的随机化,而是使用与策略培训交错的一些真实世界的推出来调整模拟参数分布。通过这样做,我们能够通过匹配模拟中的策略行为和现实世界来改变模拟的分布以改善策略转移。我们表明,使用我们的方法训练的策略能够在两个真实世界的任务中可靠地转移到不同的机器人:摆钉和打开橱柜抽屉。 我们的实验视频可在https://sites.google.com/view/simopt上找到。

将模拟到现实传输循环闭环是机器人策略的强大传输的重要组成部分。

转载于:https://www.cnblogs.com/feifanrensheng/p/11167978.html

源码地址: https://pan.quark.cn/s/a4b39357ea24 遗传算法 - 简书 遗传算法的理论是根据达尔文进化论而设计出来的算法: 人类是朝着好的方向(最优解)进化,进化过程中,会自动选择优良基因,淘汰劣等基因。 遗传算法(英语:genetic algorithm (GA) )是计算数学中用于解决最佳化的搜索算法,是进化算法的一种。 进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择、杂交等。 搜索算法的共同特征为: 首先组成一组候选解 依据某些适应性条件测算这些候选解的适应度 根据适应度保留某些候选解,放弃其他候选解 对保留的候选解进行某些操作,生成新的候选解 遗传算法流程 遗传算法的一般步骤 my_fitness函数 评估每条染色体所对应个体的适应度 升序排列适应度评估值,选出 前 parent_number 个 个体作为 待选 parent 种群(适应度函数的值越小越好) 从 待选 parent 种群 中随机选择 2 个个体作为父方和母方。 抽取父母双方的染色体,进行交叉,产生 2 个子代。 (交叉概率) 对子代(parent + 生成的 child)的染色体进行变异。 (变异概率) 重复3,4,5步骤,直到新种群(parentnumber + childnumber)的产生。 循环以上步骤直至找到满意的解。 名词解释 交叉概率:两个个体进行交配的概率。 例如,交配概率为0.8,则80%的“夫妻”会生育后代。 变异概率:所有的基因中发生变异的占总体的比例。 GA函数 适应度函数 适应度函数由解决的问题决定。 举一个平方和的例子。 简单的平方和问题 求函数的最小值,其中每个变量的取值区间都是 [-1, ...
《基于STM32微控制器集成温湿度监测与显示功能的系统实现方案》 本方案提供了一套完整的嵌入式系统设计参考,实现了环境参数的实时采集、可视化呈现与异常状态提示。系统核心采用意法半导体公司生产的STM32系列32位微控制器作为主控单元,负责协调各外设模块的工作流程。 系统通过数字式温湿度复合传感器周期性获取环境参数,该传感器采用单总线通信协议,具有响应迅速、数据可靠的特点。采集到的数值信息通过两种途径进行处理:首先,数据被传输至有机发光二极管显示屏进行实时图形化显示,该显示屏支持高对比度输出,能够在不同光照条件下清晰呈现当前温度与湿度数值;其次,所有采集数据同时通过通用异步收发传输接口输出,可供上位机软件进行记录与分析。 当监测参数超出预设安全范围时,系统会启动声学警示装置,该装置可发出不同频率的提示音,以区分温度异常或湿度异常状态。所有功能模块的驱动代码均采用模块化设计原则编写,包含完整的硬件抽象层接口定义、传感器数据解析算法、显示缓冲区管理机制以及串口通信协议实现。 本参考实现重点阐述了多外设协同工作的时序控制策略、低功耗数据采集模式的应用方法,以及确保系统稳定性的错误处理机制。代码库中包含了详细的初始化配置流程、中断服务程序设计和各功能模块的应用程序接口说明,为嵌入式环境监测系统的开发提供了可靠的技术实现范例。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
这是一个“普通文本型”问题。 你使用 `curl` 下载文件时出现: ``` * transfer closed with outstanding read data remaining curl: (18) transfer closed with outstanding read data remaining ``` 尽管服务器返回了 `HTTP/1.1 200 OK`,但连接在数据未完整传输前被**提前关闭**,导致下载中断(只下载了部分数据)。 --- ### 错误含义(curl 错误码 18): > 在传输过程中,服务器端主动关闭连接,而客户端尚未接收完所有数据。 --- ### 可能原因分析: 1. **服务器异常终止响应** 服务器(如 `lighttpd/1.4.71`)可能因以下原因中断输出: - 内存不足; - 文件过大导致超时或缓冲区溢出; - 模块限制(如 CGI、FastCGI 超时); - 后端脚本崩溃或未正确流式输出。 2. **Transfer-Encoding: chunked 流处理错误** 响应头显示使用分块传输编码,若服务器发送的某一块格式错误或中途断开,则 `curl` 无法继续读取。 3. **网络不稳定或中间设备干扰** 防火墙、NAT、路由器等设备可能中断长时间大流量连接。 4. **服务器配置限制** `lighttpd` 或其他嵌入式服务可能设置了: - 最大响应时间; - 单个请求最大输出大小; - 连接空闲超时。 5. **目标文件路径资源不存在或读取失败** 虽然返回了 `200 OK`,但实际读取 `/newMicrotik-RouterOS-6.40.4.zip` 时发生 I/O 错误,服务器却未正确返回 `500`。 --- ### 解决方案建议: ✅ **1. 尝试添加 `--chunked` 明确支持分块传输** ```bash curl -v --chunked -H "Expect: " \ http://192.168.0.1:8085/newMicrotik-RouterOS-6.40.4.zip \ -o newMicrotik-RouterOS-6.40.4.zip ``` ✅ **2. 使用更稳定的协议方式(如有)** 如果支持 HTTP Range 请求,可尝试断点续传工具如 `wget` 或 `axel`: ```bash wget http://192.168.0.1:8085/newMicrotik-RouterOS-6.40.4.zip ``` ✅ **3. 检查服务器端日志** 查看 `lighttpd` 是否记录如下信息: - “connection timeout” - “file not found” - “write failed” 确保文件真实存在且可读。 ✅ **4. 改用小文件测试** 上传一个小型 zip 文件进行对比测试,确认是否为大文件特有问题。 ✅ **5. 调整服务器配置(如有权限)** 检查 `lighttpd.conf` 中: ```conf server.max-read-idle-time server.max-write-idle-time server.max-request-size ``` 适当增大或禁用限制。 --- ### 结论 该问题是**服务器端在发送大型文件时意外关闭连接**所致,而非客户端命令错误。虽然状态码为 `200`,但实际传输不完整。 推荐优先排查服务器稳定性与资源情况,并尝试换用 `wget` 或支持重试的下载工具完成任务。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值