- 博客(13)
- 资源 (3)
- 收藏
- 关注

原创 RLChina学习笔记(二) Value-based Methods
Value-based Methods基于价值的方法 Value-based Methods动态规划DP(Dynamic Programming)蒙特卡洛MC (Monte Carlo)时序差分学习TD(Temporary Difference Learning)Off-policy 学习DQN 及其变体基于价值的方法 Value-based Methods动态规划DP(Dynamic Programming)蒙特卡洛MC (Monte Carlo)时序差分学习TD(Temporary Differ
2020-09-11 10:33:55
661

原创 RLChina学习笔记(一) Introduction to Reinforcement Learning and MDP
RLChina学习笔记(一)Introduction to Reinforcement Learning and Value-based MethodsReinforcement Learning 简介关于强化学习 RLRL的特点RL问题RL方法分类马尔可夫决策过程(Markov Decision Processes )基于价值的方法 Value-based Methods动态规划DP(Dynamic Programming)蒙特卡洛MC (Monte Carlo)时序差分学习TD(Temporary D
2020-09-09 09:42:49
567
原创 使用MobaXterm 从Win10本地上传文件至服务器
如题,在学习Linux中发现服务器的网络不稳定,经常需要将安装包下载至win10本地,然后再上传至Linux服务器,因此使用MobaXterm SSH工具实现。第一步,连接远程服务器输入用户名和密码。第二步,点击SFTP服务第三步:拖拽文件第四步,ok!...
2022-04-04 16:43:17
6173
原创 Task02——支持向量机(Support Vector Machine,SVM)
支持向量机(Support Vector Machine,SVM)本系列是2022年12月DataWhale组队学习中sklearn机器学习实战中的第二个学习任务——SVM,开源的在线学习地址 ,下面我们就开始本次学习之旅了!支持向量机,英文名称Support Vector Machine,简称SVM,他是监督学习的一种,被广泛应用于统计分类以及回归分析中。它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。SVM是一种
2021-12-18 23:01:19
988
原创 Task01——线性回归+逻辑回归
本系列是2022年12月DataWhale组队学习中sklearn机器学习实战的学习任务,一共分为八个任务章节,开源的在线学习地址在这里,下面我们就开始本次学习之旅了!线性回归线性:两个变量之间的关系是一次函数关系的——图象是直线,叫做线性。非线性:两个变量之间的关系不是一次函数关系的——图象不是直线,叫做非线性。回归:人们在测量事物的时候因为客观条件所限,求得的都是测量值,而不是事物真实的值,为了能够得到真实值,无限次的进行测量,最后通过这些测量数据计算回归到真实值,这就是回归的由来。线性回
2021-12-15 22:14:45
1515
原创 Coggle打卡——Linux使用基础
Linux基础使用任务1:使用命令行登录指定的Linux环境本机环境是windows10系统,使用的SSH工具是MobaXterm,下载地址为:https://download.mobatek.net/2142021091974654/MobaXterm_Installer_v21.4.zip,下载完成后,解压该压缩包然后运行msi文件点击next,安装完成,运行MobaXterm。点击左上角的session,SSH,然后输入主机IP和用户名,密码。任务2:在目录下创建文件
2021-11-22 20:15:18
1023
原创 基于PaddlePaddle的深度ResNet网络进行眼疾识别项目
基于PaddlePaddle的深度ResNet网络进行眼疾识别项目项目介绍眼疾识别数据集iChallenge-PM数据集准备查看数据集图片定义数据读取ResNet网络模型使用PaddlePaddle定义ResNet网络训练过程参考文献项目介绍本项目是百度AI studio平台上的《21天百度架构师手把手带你零基础实践深度学习》课程的第二周实践作业,该次作业是基于PaddlePaddle的完整的深度学习项目。眼疾识别数据集iChallenge-PMiChallenge-PM是百度大脑和中山大学中山眼科
2020-08-25 10:56:44
3396
2
转载 np.dot()、np.multiply()、np.matmul()方法以及*和@运算符的用法总结
一:基本概念转载自:https://blog.youkuaiyun.com/FrankieHello/article/details/103510118(一)点积(dot product)又称为数量积、标量积(scalar product)或者内积(inner product),它是指实数域中的两个向量运算得到一个实数值标量的二元运算。(二)矩阵乘法两个运算的矩阵需要满足矩阵乘法的规则,即需要前一个矩阵的列与后一个矩阵的行相匹配。总之:上面的两个概念都是针对向量或者矩阵的运算,需要和标量的计算区分开来。二
2020-08-03 18:10:26
405
转载 tf.nn,tf.layers, tf.contrib概述
tf.nn,tf.layers, tf.contrib概述 转自: https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-211130ba7a.css https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-211130ba7a.css 我们在使用tensor
2020-06-13 19:05:32
221
原创 在sklearn.datasets中导入fetch_mldata时无法下载MNIST_Original数据集
问题在输入一下代码时,出现无法连接网络,这是因为fetch_mldata在0.22版本中已经删除了。from sklearn.datasets import fetch_mldatamnist = fetch_mldata('MNIST original')解决方法step 1:自己从GitHub上下载该数据集,https://github.com/amplab/datascien...
2020-03-19 23:11:03
1027
原创 Data Science in Python 之——Pandas
本文主要介绍Pandas的两个核心数据结构,Series和Dataframe,以及如何创建它们,如何索引,查询,删除,缺失值的处理。Series和Dataframe是Pandas中两个核心数据结构。1 The Series Data StructureSeries是一组类似与一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相对的数据标签(即索引)组成,由一组数据就可以产生最简...
2020-01-04 18:16:48
202
转载 Coursera: Applied Machine Learning in Python系列
系列之(二)——sklearn.neighbors.KNeighborsClassifier分类器解析sklearn.neighbors.KNeighborsClassifier()函数是用于实现K近邻投票算法的分类器KNeighborsClassifier( n_neighbors=5, weights='uniform', algorithm='auto', ...
2020-01-02 21:59:02
509
原创 Coursera: Applied Machine Learning in Python系列
Coursera: Introduction to Data Science in python Assignment 3欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数...
2020-01-02 21:39:43
554
Week+1.ipynb
2021-04-22
training.zip
2020-08-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人