
知识付费库
文章平均质量分 96
以实际应用为导向,将个人日常工作、学习到的信息进行整理汇总在此专栏下,便于回顾学习。当然也更希望对看到的你如果能有所帮助,那就更开心了(现不定期更新)
优惠券已抵扣
余额抵扣
还需支付
¥19.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
积跬步,慕至千里
知行合一!
想,都是问题;
做,才有答案!
展开
-
python常见图形代码可视化大全整理(包括动图)
可视化总结import matplotlib as mplimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore") # 忽略警告信息输出# mpl.style.use('ggplot')# 为了画图中文可以正常显示plt.rcParams['font.sans-serif']...原创 2020-04-23 20:40:09 · 14425 阅读 · 4 评论 -
python爬取华为应用商城app的标签信息
今天应该是元气满满的一天喽!原创 2020-06-20 22:09:03 · 5019 阅读 · 19 评论 -
数据库窗口函数总结
文章目录@[toc]一、什么是窗口函数1.1 定义1.2 基本语法1.3 注意事项1.4 窗口函数分类1.4 窗口函数的万能模板二、窗口函数的作用2.1 解决的问题类型2.2 具备的功能三.几种常用窗口函数的使用3.1 专用窗口函数rank, dense_rank, row_number[^4][^sql]3.2 聚合函数作为窗口函数[^sql]四、参考资料一、什么是窗口函数1.1 定义窗口函数,也叫OLAP函数(Online Anallytical Processing,联机分析处理),可以对数据库原创 2022-03-10 14:12:32 · 182 阅读 · 0 评论 -
时间序列分析方法——ARIMA模型案例
目录一、方法简介数据示例二、ARIMA模型python建模过程[^2]1 添加基础库2 读取数据3 绘制时间序列图4 自相关5 平稳性检验6 时间序列的差分d7 合适的p,q8 模型检验Ljung-Box检验9 模型预测时间序列分析方法1主要有:时间序列分解模型、指数平滑模型、ARIMA模型。一、方法简介方法简介时间序列分解模型该模型认为某一经济变量时间序列Yt主要由长期趋势T、季节变动S、周期变动C和不规则变动I四种因素构成,Yt是这四种因素的函数。Yt=f(Tt,St,Ct原创 2020-06-19 18:35:24 · 7980 阅读 · 4 评论 -
建立线性回归模型的完整步骤(附代码)
建立线性回归模型的完整步骤目录零、案例简介一、数据诊断1 正态性检验1.1 检验方法1.1.1 直方图法1.1.2 PP图与QQ图1.1.3 Shapiro检验和K-S检验1.2 校正方法2 多重共线性检验2.1 检验方法2.1.1 方差膨胀因子VIF2.2 校正方法3 线性相关性检验3.1 检验方法3.1.1 Pearson相关系数3.1.2 可视化的方法——散点图矩阵4 残差的独立性检验4....原创 2020-04-26 23:12:56 · 22456 阅读 · 0 评论 -
python实现:图(查找一条路径、全部路径、最短路径)
图 图是非线性的数据结构,由顶点和边组成。如果图中的顶点是有序的,那么图是有方向的,称之为有向图;否则,图是无向图。在图中,由顶点组成的序列称为路径。 在python中,可以采用字典的方式来创建图,图中的每个元素都是字典中的键,该元素所指向的图中其他元素组成键的值。 与树一样,对于图来说,也可以对其进行遍历。除了遍历外,还可以从图中搜索从一个顶点到另一个顶点的所有...原创 2019-04-09 16:18:42 · 22645 阅读 · 21 评论 -
word文档信息提取的完整实例
目录一、“胡言”二、具体实例一、“胡言”python真的提供了好多好用的库,对于word文档的信息提取和处理,也还是蛮友好的。结合Document函数和正则化,提取大部分自己想要的信息,真的是,手到擒来。本文的实例,主要也就是用到了Document的 paragraph对象 和 table对象,还有很多好用的对象,都还没有涉及,但有这两个已经实现了当前的需求。再配合正则表达式,就可以将自己想要的信息进行规范化处理。果然日常还是要多看看别的,接触一些新鲜的东西,有时候,就像打开了另一条通道一样,起.原创 2020-09-28 09:43:53 · 1878 阅读 · 0 评论 -
常用数据降维方法优缺点总结
一、数据降维的好处1.减少数据维度和需要的存储空间;2.节约模型训练计算时间;3.去掉冗余变量,提高算法的准确度;4.有利于数据可视化二、数据降维方法总结原创 2020-12-20 16:58:19 · 7558 阅读 · 0 评论 -
Python各模块:matplotlib、pandas、seaborn、plotly_express、pyecharts可视化方法大全整合(更新中...)
目录一、matplotlib模块1 饼图2 条形图2.1 垂直或水平条形图2.2 堆叠条形图2.3 水平交错条形图3 直方图4 箱线图4.1 单个箱线图4.2 分组箱线图5 折线图5.1 单条折线图5.2 两条折线图6 散点图7 气泡图8 竞赛条形图二、panda模块1 饼图2 条形图2.1 垂直条形图2.2 水平交错条形图3 直方图与核密度曲线4 分组折线图5 散点图三、seaborn模块1 ...原创 2020-05-08 21:09:31 · 1617 阅读 · 2 评论 -
聚类总结:各种聚类算法的分类、优缺点、适用场景总结
聚类总结:各种聚类算法的分类、优缺点、适用场景总结原创 2020-11-29 17:52:19 · 5138 阅读 · 4 评论 -
matplotlib常用的画图函数及示例总结
原创 2020-11-22 22:03:20 · 517 阅读 · 0 评论 -
常用于机器学习中的距离公式汇总
目录1 欧几里得距离^[1]2 曼哈顿距离3 切比雪夫距离4 闵可夫斯基距离5 马氏距离6 余弦相似度7 皮尔森相关系数8 汉明距离9 杰卡德距离10 编辑距离11 K-L散度1 欧几里得距离1欧几里得度量(euclidean metric)也称欧氏距离: 在数学中,欧几里得距离或欧几里得度量是欧几里得空间中两点间“普通”(即直线)距离。在欧几里得空间中,点x=(x1,x2,...,xn)x=(x_1,x_2,...,x_n)x=(x1,x2,...,xn)和 y=(y1,y2,...,yn)y原创 2020-11-12 10:53:32 · 273 阅读 · 0 评论 -
聚类性能度量 度量标准总结
针对现在看到的聚类性能指标,就行了汇总梳理,后续如果看到新的评价指标等现在自己还不曾接触的新的知识点时,会进一步更新。如果看不清,会在我的资源那里上传高清图。原创 2020-11-06 16:53:45 · 358 阅读 · 0 评论 -
python爬取小米应用商店app标签信息
目录一、需求二、分析三、python实现:获取应用app信息获取指定页面的文本数据获取应用一级标签ID信息获取一级标签和对应的app名称主程序四、小结一、需求针对小米应用商店的app信息,获取一级分类下对应的app名称。本博文暂时只获取一级分类及对应的app名称。网站信息如下图所示。二、分析针对页面的分类信息,通过查看页面源代码可知,分类的一级标签信息就嵌入在网页中,如下图所示:对于各一级标签下的app名称等信息,则单独在数据文件中,以下图数据为例:将response部分的数据,可以通.原创 2020-06-26 09:02:57 · 1564 阅读 · 5 评论 -
python 实现对 同比、环比、占比、贡献率、拉动率 、移动均值 等的计算(附详细代码和样例)
一、概念解释1.1 同比同比增长计算公式:同比增长率=(本期数-同期数)÷同期数×100同比增长率=(本期数-同期数)÷同期数×100%同比增长率=(本期数-同期数)÷同期数×100例子:比如说去年3月的产值100万,本年3月的产值300万,同比增长是怎么算的?是同比增长200%?还是同比增长300%?本题中,同比增长率=(300-100)÷100=200%同比增长率,一般是指和同期相比较的增长率。某个指标的同比增长=(某个指标的值-同期这个指标的值)/同期这个指标的值当同期数为负值的原创 2020-10-23 14:32:34 · 6331 阅读 · 0 评论