
python
文章平均质量分 68
马老c
这个作者很懒,什么都没留下…
展开
-
【Pytorch】使用tensorwatch神经网络结构可视化
首先使用conda 创建一个python3.6的新环境。后面是jupyter里显示的核的名字。后面跟的是刚刚创建的环境名称,pip 安装ipykernel。,将其中第 13 行代码改为。,解决方法,找到文件。安装graphviz。原创 2023-03-10 19:52:42 · 823 阅读 · 1 评论 -
【python】解决xml读取注释以及标签自闭合问题
xml读取注释,标签非自闭合原创 2022-12-14 19:01:30 · 970 阅读 · 0 评论 -
【python】python获取两个list交集|并集|差集
python获取两个list交集|并集|差集python获取两个set交集|并集|差集原创 2022-11-02 15:23:15 · 7093 阅读 · 0 评论 -
【Python】Python调试器pdb
当你在命令行看到下面这个提示符时,说明已经正确打开了pdb。原创 2022-08-09 16:24:39 · 913 阅读 · 1 评论 -
【scikit-learn】可视化决策树
可视化决策树import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import load_irisfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn import treeimport graphv原创 2022-01-03 15:05:05 · 1086 阅读 · 0 评论 -
【scikit-learn】Adaboost算法
目录原理实战原理AdaBoost,是英文"Adaptive Boosting"(自适应增强)的缩写,由Yoav Freund和Robert Schapire在1995年提出。它的自适应在于:前一个基本分类器分错的样本会得到加强,加权后的全体样本再次被用来训练下一个基本分类器。同时,在每一轮中加入一个新的弱分类器,直到达到某个预定的足够小的错误率或达到预先指定的最大迭代次数。整个Adaboost 迭代算法就3步:初始化训练数据的权值分布。如果有N个样本,则每一个训练样本最开始时都被赋予相同的权值:1原创 2022-01-02 21:07:22 · 831 阅读 · 0 评论 -
【scikit-learn】主成分分析(PCA)
目录PCA步骤PCA优缺点实战主成分分析 (PCA)不同主成分个数对应的可解释方差分析(Explained Variance)PCA主成分分析算法(PCA)是最常用的线性降维方法,它的目标是通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大(方差最大),以此使用较少的数据维度,同时保留住较多的原数据点的特性。PCA降维的目的,就是为了在尽量保证“信息量不丢失”的情况下,对原始特征进行降维,也就是尽可能将原始特征往具有最大投影信息量的维度上进行投影。将原特征投影到这原创 2021-12-30 21:43:12 · 1895 阅读 · 0 评论 -
【scikit-learn】K近邻(KNN)
KNNKNN(K-Nearest Neighbor)是最简单的机器学习算法之一,可以用于分类和回归,是一种监督学习算法。它的思路是这样,如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。也就是说,该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN用于分类计算待分类点与已知类别的点之间的距离按照距离递增次序排序选取与待分类点距离最小的K个点确定前K个点所在类别的出现次数返回前K个点出现次数最高的原创 2021-12-27 22:05:26 · 2206 阅读 · 0 评论 -
【scikit-learn】决策树
目录决策树决策树的分类相关概念决策树的构造特征选择:决策树的生成:决策树的裁剪决策树的优缺点优点缺点决策树生成算法以ID3算法为例实战决策树决策树学习采用的是自顶向下的递归方法,其基本思想是以信息熵为度量构造一颗熵值下降最快的树,到叶子节点处,熵值为0。是一种有监督学习。决策树呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型;预测时,对新的数据,利用决策模型进行分类。决策树的分类决策树可以分为两类,主要取决于它目标变量的类型。原创 2021-12-23 22:20:02 · 2600 阅读 · 0 评论 -
【Pytorch】RuntimeError: one of the variables needed for gradient computation
错误:RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation分析:新版本的pytorch把 Varible 和Tensor融合为一个Tensor, inplace操作,之前能对Varible 使用,但对Tensor使用就会出错查看是不是有如下表达x += res #报错改为x = x + res即可不报错了...原创 2021-12-21 16:27:16 · 340 阅读 · 0 评论 -
【scikit-learn】朴素贝叶斯
朴素贝叶斯分类常用于文本分类,尤其是对于英文等语言来说,分类效果很好。它常用于垃圾文本过滤、情感预测、推荐系统等。朴素贝叶斯第一阶段:准备阶段在这个阶段我们需要确定特征属性,同时明确预测值是什么。并对每个特征属性进行适当划分,然后由人工对一部分数据进行分类,形成训练样本。这一阶段是整个朴素贝叶斯分类中唯一需要人工完成的阶段,其质量对整个过程将有重要影响,分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。第二阶段:训练阶段这个阶段就是生成分类器,主要工作是计算每个类别在训练样本中的出原创 2021-12-20 17:04:17 · 419 阅读 · 0 评论 -
【scikit-learn】支持向量机(Support Vector Machine, SVM)
支持向量机(Support Vector Machine, SVM)SVM是一种二元分类模型,它依托的原理是如果能找到一条线,能够划分样本,并且训练点到线的间隔尽可能远,也就是所有点到超平面的最小值要最大,这样的分割线(一般叫超平面, Hyperplane)就是最好的分类方式,间隔叫作Margin。因此SVM的两个关键点就是:完全分类正确,及所有点到超平面的最小值要最大。1. 线性SVM设定超平面为wTx+b=0w^{T} x+b=0wTx+b=0, 在超平面上方我们定义y=1y=1y=1,下方定义原创 2021-12-18 22:29:49 · 554 阅读 · 0 评论 -
【scikit-learn】线性回归与逻辑回归
目录线性回归入门1.1 数据生成1.2 定义模型1.3 模型测试与比较多项式回归2.1交叉验证2.2 过拟合与欠拟合逻辑回归理论应用线性回归入门1.1 数据生成使用一个二维的函数生成数据,根据该函数生成一些数据点,给每个数据点加噪声import numpy as npimport matplotlib.pyplot as plt def true_fun(X): # 这是我们设定的真实函数,即ground truth的模型 return 1.5*X + 0.2np.random.s原创 2021-12-14 21:59:49 · 2701 阅读 · 0 评论 -
【深度学习】使用transformer实现OCR字符识别
目录1.数据集相关操作1.1标签最长字符个数统计1.2char和id的映射字典构建1.3数据集图像尺寸分析2.将transformer引入OCR2.1准备工作2.2数据集创建3.模型构建4.模型训练5.贪心解码6.总结本文是跟着datawhale组队学习学的,原文在这:动手学CV-Pytorch 6.2_使用transformer实现OCR字符识别1.数据集相关操作#! pip install opencv-pythonimport osimport cv2# 数据集根目录,请将数据下载到此位置原创 2021-10-21 21:48:39 · 1695 阅读 · 5 评论 -
【深度学习】Transformer原理学习——模型及代码
2017年谷歌在一篇名为《Attention Is All You Need》的论文中,提出了一个基于attention(自注意力机制)结构来处理序列相关的问题的模型,名为Transformer。Transformer没有使用任何CNN或者RNN的结构,而是使用了注意力机制attention,自动捕捉输入序列不同位置处的相对关联,善于处理长文本,高度并行工作。Transformer模型结构概览模型输入1. Embedding层2. 位置编码Positional Encodding其他模块掩模规范化层At原创 2021-10-16 22:07:32 · 1118 阅读 · 0 评论 -
【Windows】pycharm 文本编辑区中文乱码修复
深色主题Darcula使用后发现文本编辑区中文乱码,解决方法如下:点击file进入setting展开editor点击font取消show only monospaced fonts前的勾,不然下一步的字体找不到选择字体为微软雅黑 Microsoft YaHei,点击Apply应用, 解决问题试了其他字体好像都不行,只能微软雅黑。目前只有这种方法,但是字体看着太端正了,换不了其他的字体,如果有朋友有更好的解决方法,欢迎交流。...原创 2021-03-26 16:21:08 · 234 阅读 · 0 评论