- 博客(290)
- 资源 (3)
- 收藏
- 关注

原创 从零使用TensorFlow搭建CNN(卷积)神经网络
本节内容主要向大家介绍如何使用TensorFlow快速搭建自己的卷积神经网络,并通过cifar数据集训练验证。文章最后会有相关内容知识点的补给。
2022-10-17 08:00:00
8630
21

原创 LeetCode每日一题——面试题 01.02. 判定是否互为字符重排
给定两个字符串 s1 和 s2,请编写一个程序,确定其中一个字符串的字符重新排列后,能否变成另一个字符串。
2022-09-27 11:20:45
1046
3

原创 Python模糊字符串匹配工具包——FuzzyWuzzy
跟大家分享FuzzyWuzzy一个简单易用的模糊字符串匹配工具包。让你多快好省的解决烦恼的匹配问题!
2022-09-22 19:23:10
2365

原创 SymPy——Python科学计算神器
sympy是一个Python的科学计算库,用一套强大的符号计算体系完成诸如多项式求值、求极限、解方程、求积分、微分方程、级数展开、矩阵运算等等计算问题。虽然Matlab的类似科学计算能力也很强大,但是Python以其语法简单、易上手、异常丰富的三方库生态,个人认为可以更优雅地解决日常遇到的各种计算问题。
2022-09-05 11:59:48
1517
1

原创 Python基础——re表达式中re.sub()的用法
文章目录介绍语法参数介绍repl为函数时的用法示例介绍Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。语法re.sub(pattern, repl, string, count=0, flags=0)参数介绍pattern : 正则中的模式字符串。repl : 替换的字符串,也可为一个函数。string : 要被查找替换的原始字符串。count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。要注意,被替换的字符串,即参数repl,是普通的字符串
2022-05-02 09:50:23
2995

原创 Python爬虫——Scrapy_redis快速上手(爬虫分布式改造)
文章目录前言分布式原理scrapy_redis项目编写前言scrapy是python界出名的一个爬虫框架。Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。虽然scrapy能做的事情很多,但是要做到大规模的分布式应用则捉襟见肘。有能人改变了scrapy的队列调度,将起始的网址从start_urls里分离出来,改为从redis读取,多个客户端可以同时读取同一个redis,从而实现了分布式的爬虫。就算在同一台电脑上,也可以
2022-04-19 18:53:41
2106

原创 Python实现并查集
class bingchaji(): node = set() parent = dict() parent_size = dict() def __init__(self, a): for i in a: self.node.add(i) self.parent[i] = i self.parent_size[i] = 1 print(self.parent_size)
2022-03-28 17:56:51
958

原创 逻辑回归与二分类
目录一、简介二、逻辑回归的应用场景三、 逻辑回归的原理四、逻辑回归API五、分类的评估方法一、简介逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。二、逻辑回归的应用场景广告点击率是否为垃圾邮件是否患病金融诈骗虚假账号看到上面的例子,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器。三、 逻辑回归的原
2022-03-26 17:39:07
645

原创 主成分分析(PCA)
目录一、什么是主成分分析(PCA)二、API数据计算检测三、 案例:探究用户对物品类别的喜好细分降维一、什么是主成分分析(PCA)定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量作用:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。应用:回归分析或者聚类分析当中那么更好的理解这个过程呢?1.我们来看一张图2. 计算案例理解3. 假设对于给定5个点,数据如下(-1,-2) (-1, 0) ( 0, 0) ( 2, 1) ( 0, 1)
2022-03-18 21:16:38
274

原创 机器学习中的过拟合与欠拟合
线性回归的损失函数用最小二乘法,等价于当预测值与真实值的误差满足正态分布时的极大似然估计;岭回归的损失函数,是最小二乘法+L2范数,等价于当预测值与真实值的误差满足正态分布,且权重值也满足正态分布(先验分布)时的最大后验估计;LASSO的损失函数,是最小二乘法+L1 范数,等价于等价于当预测值与真实值的误差满足正态分布,且且权重值满足拉普拉斯分布(先验分布)时的最大后验估计
2022-03-16 19:03:36
2378

原创 有监督学习方法之线性回归
目录一、线性回归的原理二、线性回归的损失和优化原理三、 实例——波士顿房价预测四、拓展-关于优化方法GD、SGD、SAG五、 总结一、线性回归的原理1.1 线性回归使用场景房价预测销售额度预测金融:贷款额度预测、利用线性回归以及系数分析因子1.2什么是线性回归线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。**特点:**只有一个自变量的情况称为单变量回归,大于一个自变量情况的叫做多
2022-03-15 17:22:05
986

原创 集成学习方法之随机森林
目录一、 什么是集成学习方法二、什么是随机森林三、随机森林原理过程为什么采取bootstrap抽样四、随机森林API五、实例六、总结一、 什么是集成学习方法集成学习通过建立几个模型组合的来解决单一预测问题。它的工作原理是生成多个分类器模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。二、什么是随机森林在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。(关于决策树相关内容可以看俺的上一篇文章)例如, 如果
2022-03-14 17:40:04
315

原创 决策树算法
目录一、决策树原理二、决策树API三、案例:泰坦尼克号乘客生存预测四、决策树总结一、决策树原理认识决策树决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法怎么理解这句话?通过一个对话例子决策树就如同上图所示,将各个特征二分类,想一想这个女生为什么把年龄放在最上面判断!!1决策树分类原理详解为了更好理解决策树具体怎么分类的,我们通过一个问题例子问题:如何对这些客户进行分类预测?你是如何去划分? 有可能你的划分是
2022-03-13 13:58:19
2904

原创 K-近邻算法(KNN)
目录一、原理1.定义2. 距离公式3.举例分析二、API三、实际案例:预测签到位置1.题目要求2.分析3.代码四、K近邻方法总结一、原理1.定义如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。来源:KNN算法最早是由Cover和Hart提出的一种分类算法2. 距离公式两个样本的距离可以通过如下公式计算,又叫欧式距离3.举例分析电影类型分析 假设我们有现在几部电影其中? 号电影不知道类别,如何去预测?我们可以利用K近邻算
2022-03-06 11:46:39
850

原创 MySQL安装+配置
目录一、下载安装二、相关配置1. 配置环境变量2.新建data文件夹3.配置my.ini文件4.初始化5、登录设置6、退出一、下载安装首先在MySQL官网上下载安装包Mysql官网下载解压后选择合适的安装路径一路next安装二、相关配置1. 配置环境变量本步骤便于每次打开终端时操作,不用每次都进入到bin目录下输入相关命令在电脑的高级系统设置中配置环境变量选择path,点击编辑将MySQL安装路径下的bin目录地址加入2.新建data文件夹在MySQL安装路径下新建名为data的文
2022-03-05 11:37:55
455

原创 Excel快捷键
目录一、关于处理工作表的快捷键总结二、关于在工作表内移动和滚动的快捷键总结三、在选定区域内移动四、以“结束”模式移动或滚动五、在ScrollLock打开的状态下移动和滚动六、选定单元格、行和列以及对象七、选定具有特定特征的单元格八、扩展选定区域九、用于输入、编辑、设置格式和计算数据的按键十、输入特殊字符十一、输入并计算公式十二、编辑数据十三、插入、删除和复制单元格十四、设置数据的格式十五、使用“单元格格式”对话框中的“边框”选项卡十六、创建图表和选定图表元素十七、使用数据表单(“数据”菜单上的“记录单”命令
2022-02-26 15:56:20
418

原创 pandas中str内置函数
1、cat() 拼接字符串例子:>>> Series(['a', 'b', 'c']).str.cat(['A', 'B', 'C'], sep=',')0 a,A1 b,B2 c,Cdtype: object>>> Series(['a', 'b', 'c']).str.cat(sep=',')'a,b,c'>>> Series(['a', 'b']).str.cat([['x', 'y'], ['1', '2']], sep=','
2022-02-12 20:56:02
1642

原创 pd.to_numeric
目录作用参数描述errors中参数的解释downcast中参数的意义实例作用作用:将参数转换为数字类型。默认返回dtype为float64或int64, 具体取决于提供的数据。使用downcast参数获取其他dtype。参数描述参数 描述args 接受scalar, list, tuple, 1-d array, or Series类型errors 有3种类型{‘ignore’, ‘raise’, ‘coerce’}, 默认为‘raise’downcast {‘integer’,
2022-02-12 20:44:07
6063

原创 Python爬虫——Scrapy中请求响应、crawlspider、middleware
目录一、Scapy中request基础知识requestresponse二、Scrapy中crawlspidercrawlspider的使用实际案例三、Scrapy中下载中间件概念如何激活中间件如何编写一个下载中间件作用示例一、Scapy中request基础知识requestscrapy.Request(url, [callback=None, method='GET', headers=None, body=None, cookies=None, meta=Non
2022-01-29 12:49:16
1959

原创 聚类分析①
(方法名称) Parameters(参数) Scalability(可扩展性) Usecase(使用场景) Geometry (metric used)(几何图形(公制使用)) K-Means(K-均值) number of clusters(聚类形成的簇的个数) 非常大的n_samples, 中等的n_clusters使用MiniBatch 代码) 通用, 均匀的 cluster size(簇大小), flat geometry......
2022-01-25 18:11:37
1113

原创 pyecharts各种图表实现(超级全)
目录平面直角坐标系直方图折线图箱形图散点图带涟漪效果散点图k线图热力图象型图层叠图地理图表GEO-地理坐标系MAP-地图BMAP-百度地图基本图表饼图漏斗图仪表盘水球图日历图关系图平行坐标系极坐标系雷达图旭日图桑基图河流图词云图表格3D图表3D散点图3D折线图3D直方图3D地图树型图表树图矩形树图以下默认都是在Jupyter Notebook展示也可以将每个图代码的最后一行换为所创建的对象.render('名字.html')转换为html文件就可以查看啦平面直角坐标系直方图x_data = ['
2022-01-22 21:21:40
4805
1

原创 数据分析——RFM模型
这里写目录标题一、RFM模型概述R值:最近一次消费(Recency)F值:消费频率(Frequency)M值:消费金额(Monetary)二、基于RFM模型的实践应用1、基于RFM模型进行客户细分2、通过RFM模型评分后输出目标用户一、RFM模型概述RFM模型是网点衡量当前用户价值和客户潜在价值的重要工具和手段。RFM是Rencency(最近一次消费),Frequency(消费频率)、Monetary(消费金额),三个指标首字母组合,如图所示:R值:最近一次消费(Recency)消费指的是客户在店
2022-01-15 16:13:01
33478
6

原创 算法理论——快速幂思想(附例题)
文章目录例题引入题目要求示例快速幂解释及相应题解解释题解进阶题目题目要求示例题解例题引入题目要求实现 pow(x, n) ,即计算 x 的 n 次幂函数(即,xn)。示例示例 1:输入:x = 2.00000, n = 10 输出:1024.00000示例 2:输入:x = 2.10000, n = 3 输出:9.26100示例 3:输入:x = 2.00000, n = -2 输出:0.25000 解释:2-2 = 1/22 = 1/4 = 0.25快速幂解释
2021-12-06 21:41:52
4690

原创 Python基础——正则表达式
文章目录概述基础实例进阶re模块match()方法切分字符串分组贪婪匹配小结概述 字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样做不但麻烦,而且代码难以复用。 正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。 所以我们判断一个字符串是
2021-11-27 08:09:15
321

原创 算法理论——位运算详解(&、|、^、~、>>、<<)
文章目录一、位运算概述二、位运算概览三、位运算符详解1、按位与运算符(&)2、按位或运算符(|)3、异或运算符(^)4、取反运算符 (~)5、左移运算符(<<)6、右移运算符(>>)7、复合赋值运算符一、位运算概述从现代计算机中所有的数据二进制的形式存储在设备中。即 0、1 两种状态,计算机对二进制数据进行的运算(+、-、*、/)都是叫位运算,即将符号位共同参与运算的运算。口说无凭,举一个简单的例子来看下 CPU 是如何进行计算的,比如这行代码:int a = 35;
2021-11-19 21:04:13
1786

原创 算法理论——动态规划(一看就会)
文章目录动态规划的介绍基本思想要点相关步骤相关例题讲解题目要求思路代码其他例题题目要求题解动态规划的介绍基本思想动态规划算法的基本思想是:将带求解的问题分解成若干个相互联系的子问题,先求解子问题,然后从这些子问题的解中得到原问题的解;对于重复出现的子问题,只在第一次遇到的时候对它进行求解,并把答案保存起来,避免重复求解。该思想与记忆化搜索类似,即将计算步骤中的过程保存下来,避免重复运算要点动态规划适用于这些子问题不是独立的情况,也就是各子问题包含公共子问题需要记录每个子问题求解的问题结果,以供其
2021-11-17 13:06:27
4063

原创 Python基础——字符与ascii码的转换(速查)
文章目录字符转ascii数字ascii数字转字符大小写字母对应数字速查常用字符与对应ascii代码速查表字符转ascii数字ord(字符)ascii数字转字符chr(数字)大小写字母对应数字速查a—z:从小到大依次为 97—122A—Z:从小到大依次为 65—90常用字符与对应ascii代码速查表......
2021-11-15 20:06:19
2467

原创 算法理论——回溯算法及剪枝优化
文章目录回溯算法的介绍1、什么是回溯法2、回溯法的效率3、回溯法解决的问题4、如何理解回溯法实例解析题目描述解析回溯法三部曲完整代码剪枝优化解析优化后代码总结回溯算法的介绍1、什么是回溯法回溯法也可以叫做回溯搜索法,它是一种搜索的方式。在二叉树系列中,我们已经不止一次,提到了回溯,例如二叉树:以为使用了递归,其实还隐藏着回溯 (opens new window)。回溯是递归的副产品,只要有递归就会有回溯。所以以下讲解中,回溯函数也就是递归函数,指的都是一个函数。2、回溯法的效率回溯法的性能如
2021-11-09 00:15:15
5245
2

原创 Django——DRF中使用JWT
文章目录聊聊JWT1、JWT简介2、JWT 组成3、JWT 的使用方式4、JWT 的几个特点DRF中使用JWT1. 安装2. 使用聊聊JWT1、JWT简介JWT 是一个开放标准(RFC 7519),它定义了一种用于简洁,自包含的用于通信双方之间以 JSON 对象的形式安全传递信息的方法。JWT 可以使用 HMAC 算法或者是 RSA 的公钥密钥对进行签名。它具备两个特点:简洁(Compact)可以通过URL, POST 参数或者在 HTTP header 发送,因为数据量小,传输速度快自包含(S
2021-11-06 15:30:15
989

原创 算法理论——BFS与DFS(广度优先与深度优先)
目录BFS概念实现补充——关于在 Python 中使用队列三种方法比较分析实例思路代码DFS概念实现补充——关于在Python中使用栈分析实例思路代码BFS概念BFS,即 广度优先搜索。有的小朋友就问了:“哥哥哥哥,我就是想画画,你能不能讲人话?”说人话就是,我们按照这个步骤来做——实现这里就要介绍一下 队列,因为 广度优先搜索 和 队列 是好基友。什么是队列?就是一个先进先出的数组,和我们日常生活中的排队很像。当我们向队列插入一个新数的时候,它插在最后,当我们取出一个数的时候,要从头取。就
2021-10-31 16:40:57
4766
1

原创 Flask——总结
一、Flask介绍(轻量级的框架,非常快速的就能把程序搭建起来) Flask是一个基于Python开发并且依赖jinja2模板和Werkzeug WSGI服务的一个微型框架,对于Werkzeug本质是Socket服务端,其用于接收http请求并对请求进行预处理,然后触发Flask框架,开发人员基于Flask框架提供的功能对请求进行相应的处理,并返回给用户,如果要返回给用户复杂的内容时,需要借助jinja2模板来实现对模板的处理,即:将模板和数据进行渲染,将渲染后的字符串返回给用户浏览器。“微”(mic
2021-10-23 21:41:19
1247

原创 Python爬虫——Selenium
简介—Selenium是最广泛使用的开源Web UI(用户界面)自动化测试套件之一。----让我的程序连接到浏览器,让浏览器来完成各种复杂的操作,我们只接受最终的结果-----selenium; 自动化测试工具----可以打开浏览器。然后像人一样去操作浏览器, 程序员可以selenium中直接提取网页上的各种信息----环境搭建:pip install selenium -i清华源----下载浏览器驱动; https://npm.taobao.org/mirrors/chromedriver
2021-10-01 18:30:12
339

原创 Python爬虫——Scrapy
介绍:Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。Scrapy 常应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。通常我们可以很简单的通过 Scrapy 框架实现一个爬虫,抓取指定网站的内容或图片。Scrapy Engine(引擎): 负责Spider、ItemPipeline、Downloader、Scheduler中间的通讯,信号、数据传递等。Scheduler(调度器): 它负责接受引擎发送过来的Request请求,并按照一定的
2021-09-23 22:04:32
372

原创 MongoDB——副本集与分片
MongoDB 复制(副本集)MongoDB复制是将数据同步在多个服务器的过程。----复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证数据的安全性。----复制还允许您从硬件故障和服务中断中恢复数据。什么是复制?1保障数据的安全性2数据高可用性 (24*7)3灾难恢复4无需停机维护(如备份,重建索引,压缩)5分布式读取数据6MongoDB复制原理7mongodb的复制至少需要两个节点。其中一个是主节点,负责处理客户端请求,其余的都是从节点,负责
2021-09-18 16:12:37
1163
Python实现八大排序
2022-07-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人