- 博客(57)
- 资源 (1)
- 收藏
- 关注
转载 强化学习训练营-Task3-PPO算法实战练习-20240507
文章目录R4 PPO(近段策略优化)算法讲解R4.1 由浅入深,简化版ppo(100行代码)R4.2 openai版本ppo算法实践 (训练超级玛丽)R4.2.1 设计DL模型R4.2.2 设计ppo的ac模型(Actor/Critic)R4.2.3 定义ppo 算法R4.2.3.1 定义PPOBuffer 用来存储交互数据,提供给模型训练使用R4.2.3.2 定义ppo算法 及 更新策略R4.2.3.3 PPO算法完整代码(添加log记录、mpi多进程)R4.2.3.3 主函数R4.2.3.4 查看训练过
2024-05-07 21:45:23
167
转载 强化学习训练营-Task2-PPO算法环境配置-20240507
一个动作执行后,环境会返回四个变量(obj:新的状态(对照前面环境初始化的状态理解)、reward:指定该动作获得的奖励值(在游戏中的得分)、done:回合是否结束(你控制的小人是不是死了,对应回合结束)、info:额外信息(该游戏较简单,info为空))是{1,2,3,4,5,6,7,8}中的一个数字,表示世界 是{1,2,3,4}中的一个数字,表示一个世界中的阶段 是{0,1,2,3}中的一个数字,指定要使用的rom模式 0:标准ROM 1:降采样ROM 2:像素rom 3:矩形ROM。
2024-05-07 21:29:21
209
转载 强化学习训练营-Task1-实战PPO通关超级玛丽-20240507
ppo算法作为强化学习领域out of art的算法,如果你要学习强化学习的话 ppo会是你最常用的算法。openai早已把ppo 作为自己的默认算法,所以我希望你能认真学完ppo算法并为自己所用。
2024-05-07 21:19:06
172
转载 深度学习训练营-基于人脸的常见表情识别实战-Task3-基于人脸的常见表情识别(3)——模型搭建、训练与测试-20240507
创建数据接⼝后,我们开始定义⼀个⽹络 simpleconv3return x上面就是我们定义的网络,是一个简单的 3 层卷积。在 torch.nn 下,有各种网络层,这里就用到了 nn.Conv2d,nn.BatchNorm2d 和 nn.Linear,分别是卷积层,BN 层和全连接层。in_channels:输入通道数out_channels:输出通道数kernel_size:卷积核的大小stride:卷积核的移动步长更全面的参数,请自查 API:https://pytorch.org/
2024-05-07 20:51:59
68
转载 深度学习训练营-基于人脸的常见表情识别实战-Task2-基于人脸的常见表情识别(2)——数据获取与整理-20240507
该 Task 就是本训练营的实战部分了,这一部分我们会讲解如何获取数据集,并对数据集进行整理。这个 Task 会涉及到数据集等文件的下载,请运行以下代码下载相关文件,由于需要对下载的文件进行解压,所以速度会比较慢,请耐心等候。如果你第一次运行这个项目,那么就跳过以下代码所有下载的文件均在(表情识别的英文名称)文件夹下,以下对各个文件进行说明TaskTask。
2024-05-07 20:43:47
79
转载 深度学习训练营-基于人脸的常见表情识别实战-Task1-基于人脸的常见表情识别(1)——深度学习基础知识
在信号处理领域中,任意一个线性系统的输出,就是输入信号和系统激励函数的卷积。放到数字图像处理领域,卷积操作一般指图像领域的二维卷积。一个二维卷积的案例如上,在图像上滑动,取与卷积核大小相等的区域,逐像素做乘法然后相加。卷积就是:一个核矩阵在一个原始矩阵上从上往下、从左往右扫描,每次扫描都得到一个结果,将所有结果组合到一起得到一个新的结果矩阵def corr2d(X, K): # X 是输入,K是卷积核h, w = K.shape # 获取卷积核的大小。
2024-05-07 20:10:07
58
转载 深度学习训练营-基于GAN实现人脸图像超分辨率重建实战-Task2-基于GAN实现人脸图像超分辨率重建实战-20240506
import os# 生成器损失定义self.mse_loss = nn.MSELoss() # MSE损失self.tv_loss = TVLoss() # TV平滑损失# 对抗损失# 感知损失# 图像MSE损失# TV平滑损失# TV平滑损失生成器损失总共包含4部分,分别是对抗网络损失,逐像素的图像MSE损失,基于VGG模型的感知损失,用于约束图像平滑的TV平滑损失。
2024-05-06 22:07:27
593
转载 深度学习训练营-基于GAN实现人脸图像超分辨率重建实战-Task1-超分辨基础(理论)-20240506
在前上采样框架中首先使用反卷积来完成上采样是一种很自然的操作,但是它计算复杂度较大,因此SRCNN的作者后来将该上采样过程放置在网络最后端,通过一个反卷积来学习该上采样过程,将其命名为FSRCNN框架。而Twitter图片与视频压缩研究组则采用了与反卷积完全不同的上采样思路,提出了ESPCN模型,其中核心思想是亚像素卷积(sub-pixel convolution),完整流程示意图如下:
2024-05-06 21:56:20
379
转载 深度学习训练营-基于DCGAN的图像生成实战-Task3-DCGAN生成微笑表情实战-20240506
权重初始化函数,为生成器和判别器模型初始化= -1:= -1:nn.Tanh()
2024-05-06 21:36:24
96
转载 深度学习训练营-基于DCGAN的图像生成实战-Task2-DCGAN生成手写数字图片实战-20240506
DCGAN 是第⼀个全卷积 GAN,⿇雀虽⼩,五脏俱全,最适合新⼈实践。DCGAN的⽣成器和判别器都采⽤了4层的⽹络结构。⽣成器⽹络结构如上图所⽰,输⼊为1×100的向量,然后经过⼀个全连接层学习,reshape为 4×4×1024的张量,再经过4个上采样的反卷积⽹络层,⽣成64×64的图,各层的配置如下:判别器输⼊64×64⼤⼩的图,经过4次卷积,分辨率降低为4×4的⼤⼩,每⼀个卷积层的配置如下:运行环境与数据集准备创建模型定义损失函数与优化器训练模型可视化。
2024-05-06 21:18:28
155
转载 深度学习训练营-基于DCGAN的图像生成实战-Task1-GAN理论-20240506
生成对抗网络(GANs)是当今计算机科学领域最有趣的想法之一。两个模型通过对抗过程同时训练。一个生成器(“艺术家”)学习创造看起来真实的图像,而判别器(“艺术评论家”)学习区分真假图像。训练过程中,生成器在生成逼真图像方面逐渐变强,而判别器在辨别这些图像的能力上逐渐变强。当判别器不再能够区分真实图片和伪造图片时,训练过程达到平衡。
2024-05-06 17:19:50
156
转载 机器学习训练营-Task03-机器学习算法(三):基于LightGBM的分类预测-20240506
LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,由2014年首届阿里巴巴大数据竞赛获胜者之一柯国霖老师带领开发。它是一款基于GBDT(梯度提升决策树)算法的分布式梯度提升框架,为了满足缩短模型计算时间的需求,LightGBM的设计思路主要集中在减小数据对内存与计算性能的使用,以及减少多机器并行计算时的通讯代价。LightGBM可以看作是XGBoost的升级豪华版,在获得与XGBoost近似精度的同时,又提供了更快的训练速度与更少的内存消耗。
2024-05-06 15:38:22
75
转载 机器学习训练营-Task02-机器学习算法(二): 基于XGBoost的分类预测-20240506
XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型,而是一个可供用户轻松解决分类、回归或排序问题的软件包。它内部实现了梯度提升树(GBDT)模型,并对模型中的算法进行了诸多优化,在取得高精度的同时又保持了极快的速度,在一段时间内成为了国内外数据挖掘、机器学习领域中的大规模杀伤性武器。更重要的是,XGBoost在系统优化和机器学习原理方面都进行了深入的考虑。
2024-05-06 11:30:04
84
转载 机器学习训练营-Task1-机器学习算法(一): 基于逻辑回归的分类预测-20240506
文章目录1 逻辑回归的介绍和应用1.1 逻辑回归的介绍1.2 逻辑回归的应用2 学习目标3 代码流程4 算法实战4.1 Demo实践Step1:库函数导入Step2:模型训练Step3:模型参数查看Step4:数据和模型可视化Step5:模型预测4.2 基于鸢尾花(iris)数据集的逻辑回归分类实践Step1:库函数导入Step2:数据读取/载入Step3:数据信息简单查看Step4:可视化描述Step5:利用 逻辑回归模型 在二分类上 进行训练和预测Step6:利用 逻辑回归模型 在三分类(多分类)上 进
2024-05-06 10:34:14
57
转载 Docker训练营——Docker-20240505
随着云原生、AI等技术的向前推进,容器技术逐渐成为每位算法同学的必备技能之一。本文档主要面向算法开发同学,从0基础实现将代码打包docker镜像-调试-提交仓库-提交云服务训练模型/天池大赛提交/学校服务器训练等流程。也同样适用于初次接触docker的同学。区别于开发同学,对于算法同学而言 仅需要掌握一部分基础命令达到自己的使用目的即可。因此此次简明教程面向算法同学和AI竞赛参赛者,帮助大家快速上手大赛提交和远程服务器训练。
2024-05-05 21:41:11
96
转载 SQL训练营-Task06-综合练习题-10道经典题目-天池龙珠计划SQL训练营-20240505
如果你还没有学习过SQL训练营的前几个章节知识,可以点击SQL训练营页面地址进入学习:https://tianchi.aliyun.com/specials/promotion/aicampsql天池龙珠计划训练营地址:https://tianchi.aliyun.com/specials/promotion/aicamps。
2024-05-05 20:18:38
80
转载 SQL训练营-Task04-集合运算-表的加减法和join等-天池龙珠计划SQL训练营-20240505
集合在数学领域表示“各种各样的事物的总和”, 在数据库领域表示记录的集合. 具体来说,表、视图和查询的执行结果都是记录的集合, 其中的元素为表或者查询结果中的每一行。在标准 SQL 中, 分别对检索结果使用UNIONINTERSECT,EXCEPT来将检索结果进行并,交和差运算, 像UNIONINTERSECTEXCEPT这种用来进行集合运算的运算符称为集合运算符。以下的文氏图展示了几种集合的基本运算.[图片来源于网络]
2024-05-05 19:47:04
105
转载 SQL训练营-Task05-窗口函数等--天池龙珠计划SQL训练营-20240505
SQL训练营页面地址:https://tianchi.aliyun.com/specials/promotion/aicampsql天池龙珠计划训练营地址:https://tianchi.aliyun.com/specials/promotion/aicamps。
2024-05-05 17:35:00
106
转载 SQL训练营-Task03-复杂查询方法-视图、子查询、函数等-天池龙珠计划SQL训练营-20240505
视图是一个虚拟的表,不同于直接操作数据表,视图是依据SELECT语句来创建的(会在下面具体介绍),所以操作视图时会根据创建视图的SELECT语句生成一张虚拟表,然后在这张虚拟表上做SQL操作。子查询指一个查询语句嵌套在另一个查询语句内部的查询,这个特性从 MySQL 4.1 开始引入,在 SELECT 子句中先计算子查询,子查询结果作为外层另一个查询的过滤条件,查询可以基于一个表或者多个表。谓词就是返回值为真值的函数。包括。
2024-05-05 17:05:49
78
转载 SQL训练营-Task02:SQL基础查询与排序-天池龙珠计划SQL训练营-20240430
SQL训练营页面地址:https://tianchi.aliyun.com/specials/promotion/aicampsql天池龙珠计划训练营地址:https://tianchi.aliyun.com/specials/promotion/aicamps。
2024-04-30 17:00:27
106
转载 SQL训练营-Task01:初识数据库与SQL-天池龙珠计划SQL训练营-20240430
节约篇幅,具体相关介绍以及给大家写到pdf里了,大家点击链接即可进入查看:http://tianchi-media.oss-cn-beijing.aliyuncs.com/dragonball/SQL/other/阿里云MySQL服务器使用介绍.pdf操作使用方便,未来趋势(数据上云),导入、导出数据方便,运行速度快。需要付费购买,不过现在对开发者有优惠活动,基础版本 1核1G,存储空间20G的,目前优惠价半年只需9.9元,一杯奶茶钱不到。
2024-04-30 15:54:27
135
转载 Python训练营-task4-【Python入门系列】用Pandas揭秘美国选民的总统喜好-20240430
从我们目前分析的2020.7.22-2020.8.20这一个月的数据来看,在选民的捐赠数据中拜登代表的民主党完胜特朗普代表的共和党,由于完整数据量过大,所以没有对所有数据进行汇总分析,因此也不能确定11月大选公布结果就一定是拜登当选。进行数据处理前,我们需要知道我们最终想要的数据是什么样的,因为我们是想分析候选人与捐赠人之间的关系,所以我们想要一张数据表中有捐赠人与候选人一一对应的关系,所以需要将目前的三张数据表进行一一关联,汇总到需要的数据。
2024-04-30 00:11:10
165
转载 Linux 内核对内存的管理和使用-转载-20230916
本节首先说明 Linux 0.12 系统中比较直观的物理内存使用情况,然后结合 Linux 0.12 内核中的应用情况,再分别概要描述内存的分段和分页管理机制以及 CPU 多任务操作和保护方式。最后我们再综合说明 Linux 0.12 系统中内核代码和数据以及各个任务的代码和数据在虚拟地址、线性地址和物理地址之间的对应关系。在 Linux 0.12 内核中,为了有效地使用机器中的物理内存,在系统初始化阶段内存被划分成几个功能区域,见图 5-5 所示。其中,Linux 内核程序占据在物理内存的开始部分,接下来
2023-09-16 18:10:55
248
转载 Spark和HDFS的关系
ResourceManager分配Container给ApplicationMaster,ApplicationMaster和相关的NodeManager通讯,在获得的Container上启动Executor,Executor启动后,开始向Driver注册并申请Task。Spark on yarn-client实现流程:(说明:在yarn-client模式下,Driver部署在Client端,在Client端启动。分解来看,Spark分成控制端(Driver)和执行端(Executor)。
2023-08-20 11:39:10
600
原创 使用memtier_benchmark工具对Redis进行测试记录-20230330
使用memtier_benchmark工具对Redis进程测试记录-20230330
2023-03-30 12:38:11
1733
转载 系统级性能分析工具perf的介绍与使用(转载)
测试环境:Ubuntu16.04 + Kernel:4.4.0-31系统级性能优化通常包括两个阶段:性能剖析(performance profiling)和代码优化。性能剖析的目标是寻找性能瓶颈,查找引发性能问题的原因及热点代码。代码优化的目标是针对具体性能问题而优化代码或编译选项,以改善软件性能。在性能剖析阶段,需要借助于现有的profiling工具,如perf等。在代码优化阶段往往需要借助开发者的经验,编写简洁高效的代码,甚至在汇编级别合理使用各种指令,合理安排各种指令的执行顺序。
2023-03-14 19:36:35
950
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人