- 博客(6)
- 收藏
- 关注
原创 PPO算法原理详解
PPO要解决的问题:传统策略梯度方法的不稳定性和TRPO的实现复杂性。核心机制:通过重要性采样实现数据重用,并通过Clipping机制限制新策略与旧策略的差异,确保更新在"信任域"内进行。关键公式JCLIPθEminrθAtcliprθ1−ϵ1ϵAtJCLIPθEminrθAtcliprθ1−ϵ1ϵAt物理意义。
2025-11-12 01:09:52
854
原创 linux无法启动
1. 检查/etc/fstab, 看有无已废弃的硬盘。如有请删掉,因为系统会试图mount这些不存在的硬盘而死机。2. 用fsck -y /dev/sdb1 来修复linux分区的盘,可用U盘启动盘来修复系统盘。...
2019-04-02 00:45:39
534
原创 linux 修复内核
sudo apt-get remove console-setup-linux installlibselinux1:amd64 installlinux-base installlinux-firmware installlinux-header...
2019-01-20 00:18:22
912
原创 关于AI算法芯片实现的几点看法(原创)
离开ASIC design一线的工作已经有很长时间了,现在一直在研究deep learning算法技术。今年有多家公司都已经发布或准备发布AI芯片,Apple, Qualcomm,google,华为都在列。现在我对deep learning的算法研究越来越深入了,(曾经我也是资深IC designer啊)时不时也会联想到AI芯片实现的问题。据我所圈里有些好友已经"偷偷"在设计AI芯片了。今天从算
2017-09-23 00:14:03
4166
1
原创 Check failed: error == cudaSuccess (8 vs. 0) invalid device function
大致的问题也就是说这个 其实还就是要设置显卡的计算能力。把caffelib中Configuration Properties的CUDA C/C++中Device中的Code Generation改为compute_30,sm_30;。就可以了。(GT 650M 的计算能力为sm_30)
2016-10-14 23:01:09
2071
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅