
Python
Leon_124
这个作者很懒,什么都没留下…
展开
-
Anaconda虚拟环境创建管理流程
jupyterlab环境配置原创 2022-08-09 14:53:48 · 381 阅读 · 0 评论 -
Spotpy
Python 模块,包含多种最优问题算法,如sceua、mcmc原创 2021-04-03 21:57:08 · 627 阅读 · 0 评论 -
线性___非线性
https://blog.youkuaiyun.com/lipengcn/article/details/80724088浅谈机器学习中的非线性关于机器学习中的线性和非线性,有两个聚焦点,一个是问题,一个是模型。问题的线性非线性,指的是样本点的分布,是否能在输入空间上用线性超平面区分。模型的线性非线性,是这次讨论的重点。模型的非线性基础数学说,线性指变量之间的数值关系,即满足成比例。因此,变量之间的多项式、指数等关系都算是非线性。网上有一批文章认为,ML 模型的线性非线性,指模型参...转载 2020-11-14 12:52:48 · 329 阅读 · 0 评论 -
如何实现多机器jupyter notebook自动同步
原理及工具原理:通过将jupyter notebook的默认读取路径配置到微云的同步路径,实现自动同步。工具:Jupyter Notebook、腾讯微云同步助手。步骤1.修改微云的同步目录路径a.路径必须为全英文,中文jupyter有可能会读取失败2.找出jupyter notebook的运行脚本文件位置a.win+R,输入cmdb.输入jupyter notebook --generate-configc.获取路径,一般是在.jupyter下的jupyt..转载 2020-10-12 09:57:30 · 2153 阅读 · 2 评论 -
Gradient boosting trees实现+特征值重要性+依赖相关——及相关包解释_整理
示例:https://zhuanlan.zhihu.com/p/40356430https://www.pythonf.cn/read/5079随机选择训练+测试样本参数解释:https://www.cnblogs.com/Yanjy-OnlyOne/p/11288098.html调参GridSearchCV解释:https://zhuanlan.zhihu.com/p/37310443plot_partial_dependence()官方文档:https:...原创 2020-10-11 22:29:23 · 655 阅读 · 0 评论 -
集成树模型的可解释性
机器学习模型相比于统计模型,显著的劣势是其可解释性。做回归时,统计模型有系数有P-value,机器学习却只能谈精度——但若论精度,统计模型折腾来折腾去,还是玩不过机器学习的。但人们对机器学习模型的可解析性并没有放弃,并一直在努力进行改进。树模型便是其中的佼佼者。集成树中,最出名的当属Random Forest(RF)和Gradient boosting trees(GBM),后者也是近年来大火的XGB的根基。而解释集成树模型的两大利器:Feature importance和Partial depende原创 2020-10-11 14:01:19 · 950 阅读 · 0 评论 -
Partial Dependence Plots —— 部分依赖图_特征如何影响模型预测
笔者把自己这篇原本发布在github page上的文章迁移到了这里,原github page网址:https://iceflameworm.github.io/2019/08/28/partial-plots/部分依赖图可以用来展示一个特征是怎样影响模型预测的。可以用部分依赖图回答一些与下面这些类似的问题:1. 假如保持其它所有的特征不变,经纬度对房价有什么影响?换句话说,相同大小的房子,在不同的地方价格会有什么差别?2. 在两组不同的人群上,模型预测出的健康水平差异是由他们的负债水平引起的,还是另有原转载 2020-10-11 13:49:03 · 7801 阅读 · 14 评论 -
scikit-learn 决策树算法中特征(自变量)重要性的计算
sklearn.tree.DicisionTreeClassifier类中的feature_importances_属性返回的是特征的重要性,feature_importances_越高代表特征越重要,scikit-learn官方文档1中的解释如下:The importance of a feature is computed as the (normalized) total reduction of the criterion brought by that feature. It is also转载 2020-10-09 22:07:55 · 4788 阅读 · 1 评论 -
决策树 vs 随机森林
本文以银行贷款数据为案例,对是否批准顾客贷款申请的决策过程进行了算法构建,并对比了决策树与随机森林两种机器学习算法之间的异同及各自的优劣。让我们从一个思维实验来阐述决策树和随机森林之间的差异。假设一个银行要给一位顾客批准一笔小额贷款,银行需要迅速做出决策。银行检查了这位顾客的信用记录和他的财政状况,并发现他还没有还上之前的贷款。因此,银行拒绝了他的申请。但是,这笔贷款跟银行所拥有的巨额资金相比实在是小的可怜,银行本可以轻易地批准这笔贷款并且也不会承担很多风险。于是,银行失去了一次赚钱的机会。现在转载 2020-10-09 22:03:56 · 3969 阅读 · 0 评论 -
Anaconda下调用arcpy——环境搭建+ jupyter notebook选择conda环境
1.安装了Anaconda2.Anaconda下创建python27环境新建环境之前set CONDA_FORCE_32BIT=1这样在配置环境和安装软件的包的时候就会默认32bit了,安装完成之后记得改回来。conda info 查看当前位数(如果想改回64位环境使用:set CONDA_FORCE_32BIT=,并回车)conda create -n py27 python=2.7 ##“-n”命令,会将虚拟环境安装在anaconda已安装路径默认的envs目录下,名原创 2020-09-08 17:41:13 · 4112 阅读 · 7 评论 -
python画横线竖线作为分界线
在作图的时候,经常会碰到需要添加分界线的情况,那么python里面那些函数可以方便的画出水平横线或者垂直竖线呢,下面介绍两种可以方便的添加水平或者垂直直线的函数。1.使用matplotlib.pyplot的hlines和vhlines ######导入需要模块 import numpy as np import matplotlib.pyplot as plt ######这是蝴蝶曲线部分 df = sns.load_dataset('iris') t转载 2020-07-09 10:14:52 · 14892 阅读 · 8 评论 -
Python可视化---seaborn
什么是SeabornSeaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与pandas数据结构以及scipy与statsmod原创 2020-07-09 09:30:36 · 310 阅读 · 0 评论 -
Excel数据转化为矩阵
def excel2m(path): data = xlrd.open_workbook(path) table = data.sheets()[0] nrows = table.nrows # 行数 ncols = table.ncols # 列数 c1 = np.arange(0, nrows, 1) datamatrix = np.zeros((nrows, ncols)) for x in range(ncols): co.转载 2020-07-04 15:07:51 · 6160 阅读 · 0 评论 -
Matplotlib绘制热图
https://www.osgeo.cn/matplotlib/gallery/images_contours_and_fields/image_annotated_heatmap.html原创 2020-07-01 10:34:36 · 848 阅读 · 0 评论 -
python添加趋势线
主要用的numpy里面的函数是polyfit,这个函数有三个参量(x,y,n),x和y是要输入的数据,n是要进行要拟合的多项式的最高次数,比如此次用的就是线性拟合,n=1,其返回值是多项式拟合的系数,对于线性拟合就是斜率和截距,另外要调用的函数就是poly1d,拟合出这个多项式来,用polyfit的返回值作为参数。代码如下作者:Nuphy链接:https://www.jianshu.com/p/a86e8ad51f10来源:简书著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处原创 2020-06-07 18:24:01 · 3785 阅读 · 1 评论 -
matplotlib
摘要:主要作用是设置画的图的分辨率,大小等信息plt.rcParams['figure.figsize'] = (8.0, 4.0) # 设置figure_size尺寸plt.rcParams['image.interpolation'] = 'nearest' # 设置 interpolation styleplt.rcParams['image.cmap'] = 'gray' # 设...转载 2020-05-01 10:07:29 · 436 阅读 · 0 评论 -
Jupyter Notebook介绍、安装及使用教程
https://www.jianshu.com/p/91365f343585转载 2020-04-30 11:09:55 · 380 阅读 · 0 评论 -
考虑海拔的IDW的插值
import pandas as pdfrom geopy.distance import vincentyimport numpy as nploworhigh = 'high' # 输入需要哪段 ,low 代表第一段,high代表第二段。year = 1951 # 是否要选择年份dem = pd.read_table('F:/AAA/PG-T-LAPSE-COR/llde...转载 2020-04-20 09:22:53 · 565 阅读 · 0 评论 -
python中的__init__
作者:追远·J链接:https://www.zhihu.com/question/46973549/answer/767530541来源:知乎作为典型的面向对象的语言,Python中 类 的定义和使用是不可或缺的一部分知识。对于有面向对象的经验、对类和实例的概念已经足够清晰的人,学习Python的这套定义规则不过是语法的迁移。但对新手小白而言,要想相对快速地跨过__init__这道坎,...转载 2020-03-05 09:46:34 · 264 阅读 · 0 评论 -
plotly模块
plotly是现代平台的敏捷商业智能和数据科学库,它作为一款开源的绘图库,可以应用于Python、R、MATLAB、Excel、JavaScript和jupyter等多种语言,主要使用的js进行图形绘制,实现过程中主要就是调用plotly的函数接口,底层实现完全被隐藏,便于初学者的掌握。下面主要从Python的角度来分析plotly的绘图原理及方法:###输出方式:...转载 2020-03-04 16:30:42 · 686 阅读 · 0 评论 -
ModuleNotFoundError: No module named 'pip._internal'
最近买了阿里云的Ubuntu16.04服务器, 默认是Python3.5, 我通过修改默认为Python3.6, 结果pip就不能用了,一直报错, 如下, root@iZwz98p61dhjsadfhjkarjhj5Z:~# pip -V Traceback (most recent call last): File "/usr/local/bin/pip", ...转载 2020-02-25 00:09:25 · 367 阅读 · 0 评论 -
实现Excel里每个sheet的排序并整合在一个sheet里
针对一个excel文件中多个sheet的批处理,excel的选定全部工作表功能可以解决很多问题(如:转置、替换等),但是对于排序确难以实现。因此在这里使用python工具来实现批量排序。 最终目的是实现对每个sheet文件排序后,将所有sheet拼接在一个sheet中。 最初打算先批量排序,然后在实现拼接。但是在运行批量排序的代码中发现sheet发生覆盖,虽然网上有避免覆盖的方法,...原创 2020-02-14 00:17:08 · 2375 阅读 · 0 评论 -
实现对excel文件中多个sheet的拼接
用到的Python模块如下:xlrdpandasopenpyxlxlrd、pandas、openpyxl1、python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。2、pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所...转载 2020-02-13 15:43:29 · 1744 阅读 · 0 评论 -
Python小甲鱼
(1)运算符优先级:assert() ——用于设置断点这个关键字为“断言",当其后面的条件为假时,程序自动崩溃并抛出AssertionError的异常。字符串str()、列表list()、元组tuple() 都属于序列。(2)函数函数定义defmyfunction() :括号内部参数为“形参”,运用函数时定义的参数为“实参”。函数文档 查看 x...原创 2020-02-12 16:09:11 · 1732 阅读 · 0 评论 -
常见Python运行时错误
当初学 Python 时,想要弄懂 Python 的错误信息的含义可能有点复杂。这里列出了常见的的一些让你程序 crash 的运行时错误。1)忘记在if,elif,else,for,while,class,def声明末尾添加 :(导致 “SyntaxError :invalid syntax”)该错误将发生在类似如下代码中:if spam == 42 ...转载 2020-02-11 22:47:06 · 411 阅读 · 0 评论 -
Arcpy数据列表与遍历
(1)返回数据列表的函数ArcPy中提供了大量可以返回数据列表的函数,可以方便后续遍历数据。函数名 说明 ListFields(dataset, wild_card, field_type) 返回数据集中的字段列表 ListIndexes(dataset, wild_card) 返回数据集中属性索引列表 ListDatasets(wild_card, f...转载 2020-02-11 18:30:04 · 4881 阅读 · 0 评论 -
python基础知识
python基本数据类型首先学习python的基本数据类型:共有七种(1) Number(数字)Python3 支持 int、float、bool、complex(复数)。在Python 3里,只有一种整数类型 int,表示为长整型,没有 python2 中的 Long。像大多数语言一样,数值类型的赋值和计算都是很直观的。内置的 type() 函数可以用来查询变量所指的对象...转载 2020-02-09 12:33:17 · 301 阅读 · 1 评论 -
Python编码规范
Linux 平台上,一个 python 源码文件应该以下部分组成。Windows 平台上,可以省略第一项。解释器声明 编码格式声明 模块注释或文档字符串 模块导入 常量和全局变量声明 顶级定义(函数或类定义) 执行代码#!/usr/bin/env python# -*- coding: utf-8 -*-"""通常这里是关于本文档的说明(docstring),须以半角的...转载 2020-02-09 12:28:14 · 116 阅读 · 0 评论