- 博客(66)
- 收藏
- 关注
原创 利用GUP训练
网络模型和损失函数是不需要重新赋值的,只有数据需要重新赋值。gpu对比未用gpu:用了gpu的速度快。nvidia-smi查看gpu。
2024-08-29 14:20:24
317
1
原创 完整的模型训练路线
model.train() 和 model.eval ()在官网的torch.nn.Module小节中可以查看train 和evalmodel.train() 将模块设置为训练模式。这只对某些模块有影响,例如Dxopout、BatchNorm等。model.eval ()将模块设置为验证模式。这只对某些模块有影响。这等效于self.Train(False)。最好还是加上。在训练开始前加上.train(),在测试开始前加上.eval()。
2024-08-29 11:21:52
624
原创 损失函数与反向传播
损失函数只能处理float类型的张量。该Loss算法计算输入对数与目标对数之间的交叉熵损失,在训练 C 类分类问题时非常有用。
2024-08-28 10:03:48
332
原创 神经网络——非线性激活
Normalization Layers正则化层正则化可以加快神经网络的训练速度,用的比较少,不作介绍,自己看文档一般用于文字识别,自己看文档。在训练过程中,随机将输入张量的部分元素清零。主要作用是防止过拟合。用于自然语言处理。计算两个值之间的距离计算误差。
2024-08-26 16:30:29
839
原创 Dataloader
drop_last参数windows系统下如果出现BrokenPipeError的错误,可以考虑将 num_workers设置为0。
2024-08-26 11:14:52
551
原创 transforms
关注输入和输出类型- 关注官方文档- 关注方法需要什么参数- 不知道返回值类型的时候可以试错或者搜索- print- debug。
2024-08-23 13:58:16
497
原创 Zotero推荐插件
如图,右击标题栏 –> 勾选JCR分区、中科院分区、IF等所需要的列(没有这些列的选项,重启软件试试)–> 选中所有的条目 –> 从easyScholar更新期刊信息。③model设置的是gpt的对话模型,默认为gpt-3.5-turbo支持4k上下文,对于论文来说显得不够用,很容易出现下面的错误。右键任意一个列的名字,会弹出一个右键菜单,可以勾选/取消勾选一个列,并且在最后有两个操作按钮是【列设置】和【视图组】【小工具】:选择需要调整的条目,右键–小工具,即可设置。【配置Green Frog参数】
2024-07-16 16:45:40
1024
原创 Zotero安装使用
1.直接通过connector将资源保存到Zotero中,按下图进行操作,在点击Save to Zotero保存到自己的文件夹下。已经创建了一个帐户,已经安装了Zotero,可以用它来从任何地方同步和访问你的库。注意:下载与Zotero版本兼容的插件,如果出现不兼容,可以尝试之前的版本。插件安装方法:Zotero导航栏——工具——附加组件,选择下载好的插件。选择【 Custom】,【Standard】会默认放置C盘。3.使用ISBN、DOI或PubMed ID搜索源。选择自己的路径进行安装!
2024-07-16 14:57:06
2340
原创 pydotplus生成图像报错: GraphViz‘s executables not found
报错:GraphViz’s executables not found。(4)重启jupyter,重新执行DecisionTree.ipynb。Graphviz不是一个python tool,仍然需要安装。(2)解压后,编辑环境变量。(3)测试是否安装成功。
2024-05-22 18:46:47
601
原创 Pycharm使用Anaconda虚拟环境
这个警告说明当前所选的后端是非交互式的(non-interactive),因此无法显示图像。这可能是因为 Matplotlib 的后端设置为 ‘Agg’,它是一个非交互式的后端。如果你想要在代码运行时交互式地显示图像,可以考虑使用其他后端,如‘TkAgg’或‘Qt5Agg’。这个错误通常涉及到 Matplotlib 的后端设置问题。Matplotlib 后端是控制图形渲染的引擎,可以尝试更改后端来解决这个问题。在你的代码开头加上这两行代码,尝试用 ‘Agg’ ,看看是否能够解决这个错误。
2024-05-13 10:44:42
953
1
原创 anaconda虚拟环境pytorch安装
注意:Pytorch官网首页目前只更新到支持DUDA12.1的,还没更新到支持CDUA12.3 GPU的安装,官网首页的命令安装后只支持CPU。使用的文中这个末尾带nvidia的之前版本的命令,安装后CUDA12.3可正常在环境中使用GPU的Pytorch。注意:这里查看一下,自己的显卡驱动所能支持的版本,我这显卡驱动支持cuda12.3,所以我安装的cuda和pytorch都很新,你只需要根据自己需要更改版本就好了。以上就是验证PyTorch是否安装成功的常用方法。在命令窗口中直接输入命令–回车安装。
2024-05-10 20:04:41
1245
1
原创 《动手学机器学习》资源
(1)关于“代码可在线运行”:读者可以把GitHub上的代码下载下来,用任意支持ipynb格式的在线或本地工具运行,本书不提供在线运行的工具;(2)关于习题答案:本书不提供习题答案,读者自行练习。理论解读视频课程:可扫描书中二维码观看,也可通过。
2024-05-10 10:51:31
1093
原创 Anaconda虚拟环境
创建虚拟环境首先要查看当前已有环境,打开Anaconda Prompt,输入。这个环境用的python版本是3.9版本的,如果默认创建,会在C盘!接下来问你是否要安装这些包,输入y。就可以进入virtual 环境中。说明,我们现在已经有这几个环境。此时就完成虚拟环境的安装了。(1)若要创建一个虚拟环境。(2)进入环境,输入命令。回答y,就可以完全移除了。可以看到环境已经创建。
2024-05-10 09:57:28
1990
1
原创 Jupyter配置
(3)找到Jupyter Notebook(anaconda)的快捷方式,右键点击【属性】。在目标一行中,去掉最后面的C:\Users\YX\Desktop。(1)打开【Anaconda Prompt】,输入【jupyter notebook --generate-config】命令。从运行结果可知【jupyter_notebook_config.py】的位置。去掉前面的【#】,在单引号‘’中添加路径为事先新建的文件夹。(2)使用【记事本】打开。
2024-05-06 16:16:54
884
1
原创 Anaconda安装教程
Anaconda是一个数据科学平台,提供一个发行版的 Python 以及大量常用的数据科学包、库和工具。通过包含诸如 NumPy、Pandas、SciPy、Matplotlib等核心库,以及 Jupyter Notebook等开发工具,使数据分析、机器学习和数据可视化变得更加容易。Anaconda还包括一个包管理器 conda ,用于安装、更新和管理软件包,确保不同包之间的依赖关系得到妥善处理。
2024-05-06 15:30:23
700
1
原创 回归与聚类——K-Means(六)
随机设置K个特征空间内的点作为初始的聚类中心。对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别。接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)。如果计算得出的新中心点与原中心点一样,那么结束,否则重新进行第二步过程
2024-04-26 10:53:06
629
原创 分类算法——模型评估(八)
假设这样一个情况,如果99个样本癌症,1个样本非癌症,不管怎样我全都预测正例(默认癌症为正例),准确率就为99%但是这样效果并不好,这就是样本不均衡下的评估问题。在分类任务下,预测结果与正确标记之间存在四种不同的组合,构成混淆矩阵(适用于多分类)问题:如何衡量样本不均衡下的评估?召回率:99/99 = 100%答:ROC曲线与AUC指标。
2024-04-25 10:03:34
705
原创 分类算法——逻辑回归(七)
逻辑回归是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。逻辑回归的应用场景广告点击率是否为垃圾邮件是否患病金融诈骗虚假账号看到上面的例子,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器。逻辑回归的原理1输入逻辑回归的输入就是一个线性回归的结果。2激活函数sigmoid函数分析:回归的结果输入到sigmoid函数当中输出结果:
2024-04-24 10:45:26
918
原创 回归与聚类——岭回归(四)
岭回归,其实也是一种线性回归。只不过在算法建立回归方程时候,加上正则化的限制,从而达到解决过拟合的效果。带有L2正则化的线性回归——岭回归。
2024-04-23 11:53:18
356
原创 回归与聚类——过拟合与欠拟合(三)
欠拟合过拟合分析第一种情况:因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。第二种情况:机器已经基本能区别天鹅和其他动物了。然后,很不巧已有的天鹅图片全是白天鹅的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会认为那不是天鹅。过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂)欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在。
2024-04-23 11:32:03
555
原创 回归与聚类——性能评估(二)
回归当中的数据大小不一致,是否会导致结果影响较大。所以需要做标准化处理。均方误差(Mean Squared Error)MSE)评价机制:注:y^i为预测值,y-为真实值我们也可以尝试去修改学习率此时我们可以通过调参数,找到学习率效果更好的值。
2024-04-23 10:48:46
599
原创 回归与聚类——线性回归(一)
(1)定义与公式线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。
2024-04-22 11:52:48
1448
原创 分类算法——集成学习方法之随机森林(六)
在当前所有算法中,具有极好的准确率能够有效地运行在大数据集上,处理具有高维特征的输入样本,而且不需要降维能够评估各个特征在分类问题上的重要性。
2024-04-19 17:29:05
774
1
原创 分类算法——决策树(五)
优点:简单的理解和解释,树有可视化缺点:决策树学习者可以创建不能很好地推广数据的过于复杂的树,这被称为过拟合改进:减枝cart算法(决策树API当中已经实现,随机森林参数调优有相关介绍)随机森林注:企业重要决策,由于决策树很好的分析能力,在决策过程应用较多,可以选择特征信息熵、信息增益的计算DecisionTreeClassifier进行决策树的划分export_graphviz导出到dot文件。
2024-04-18 11:26:54
1270
原创 分类算法——文章分类(五)
优点:朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。对缺失数据不太敏感,算法也比较简单,常用于文本分类。分类准确度高,速度快。缺点:由于使用了样本属性独立性的假设,所以如果特征属性有关联时其效果不好。条件概率、联合概率计算方式与特征独立的关系贝叶斯公式的计算。
2024-04-17 19:07:53
468
原创 分类算法——朴素贝叶斯(四)
上式中,P(产品,超重|喜欢)和P(产品,超重)的结果均为0,导致无法计算结果。这是因为样本量太少了,不具有代表性,本来现实生活中,肯定是存在职业是产品经理并且体重超重的人的,P(产品,超重)不可能为0;而且事件“职业是产品经理”和事件“体重超重”通常被认为是相互独立的事件,但是,根据我们有限的7个样本计算“P(产品,超重)=P(产品)P(超重)”不成立。也就是说,朴素贝叶斯,之所以朴素,就在于假定了特征与特征相互独立。4、在女神喜欢的条件下,职业是程序员,体重是超重的概率?1、女神喜欢的概率?
2024-04-17 11:53:14
840
原创 分类算法——模型选择与调优(三)
数据介绍:将根据用户的位置,准确性和时间戳预测用户正在查看的业务官网:https://www.kagge.com/navoshta/grid-knn/data。
2024-04-16 18:25:49
809
原创 分类算法——KNN算法(二)
1KNN原理K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法,总体来说KNN算法是相对比较容易理解的算法。定义如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。来源:KNN算法最早是由Cover和Hart提出的一种分类算法、距离公式两个样本的距离可以通讨如下公式计算,又叫欧式距离距离计算有:曼哈顿距离(绝对值距离)、明可关斯基距离2电影类型分析其中?
2024-04-12 15:49:10
649
原创 分类算法——sklearn转换器和估计器(一)
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API。从中可以看出,fit_transform的作用相当于transform加上fit。标准化:(X- mean) / std。
2024-04-12 14:54:58
1043
变量进阶-数据结构和算法-归并排序
2024-08-31
王道python训练营Linux基础+python基础xmind
2024-08-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人