- 博客(219)
- 资源 (4)
- 收藏
- 关注
原创 学习ArcGIS的第一天
ArcGIS for Desktop是一套完整的专业GIS应用程序,包含有ArcMap、ArcCatalog、ArcToolbox、ArcScense、ArcGlobe和Model Builder等。其中ArcMap、ArcCatalog、ArcToolbox是核心的组件,ArcMap用来编辑数据、地图制图和地图分析;ArcCatalog用来进行数据组织管理;ArcToolbox是用作空间数据分析的工具。
2023-12-22 11:43:51
1603
原创 论文学习——泰森多边形法在小流域面雨量计算中的应用
研究泰森多边形算法,在小流域面雨量计算中的适用性。选取3种不同降雨量实例,流域多年面降雨量、典型场次、典型日面雨量。采用等值线法作为基准,对于泰森多边形法和算术平均值法计算面降雨量。实验数据交代含糊对比实验的图表相似度太高,意义不大研究区域适用性的意义不大。
2023-12-20 17:09:37
1058
原创 学习dtw-python库内容 && 动态弯曲距离(DTW)具体实现
执行 DTW 算法,并计算两个时间序列 x 和 y 之间的最佳匹配(optimal alignment)一下就好了,注意最后提示。
2023-05-09 10:51:17
3353
4
原创 学习k近邻算法(KNN)【自学且自用】
k近邻算法(k-nearest neighbour,k-NN)是一种基本分类与回归方法,是数据挖掘技术中原理最简单的算法之一。核心功能是解决有监督的分类问题。KNN能够快速高效地建立在特殊数据集上的预测分类问题,但是不产生模型,因此算法准确性高但是不具备强推广性。KNN 输入实例的特征向量,特征空间;KNN 输出为实例的类别,K类。K近邻三个基本要求:k值的选择、距离度量、分类决策规则。所以说,K的取值还是非常重要的,如上图所示,K=3和K=5会预测得到两个不同的结果。通过上面那张图我们知道 K 的
2023-05-04 10:32:48
628
原创 论文学习——数据挖掘技术在水文数据分析中的应用
数据挖掘也称为知识发现,是指从大量数据中抽取出那些隐含的、令人感兴趣的、有价值的知识的过程。数据挖掘是数据库技术的深层次应用,可以进一步提高信息资源的使用价值和使用效益,能更好的解决日益复杂多变的决策问题,进一步提高了决策的准确性和可靠性,为科学决策提供依据。
2023-04-11 15:44:46
1027
原创 论文学习——秦淮河水文水动力模型及实时校正
构建了秦淮河流域水文水动力模型;计算了秦淮河水系主要计算断面的水位流量过程;选择K最近邻算法(KNN) 和反馈法两种实时校正方法对模拟结果进行校正。
2022-12-13 20:02:55
1320
原创 第一天:Python元学习——通用人工智能的实现
随着生成对抗网络和胶囊网络等优秀算法的出现,深度学习得到了快速的发展。但是使用深度学习网络解决A任务时,假设A任务和B任务接近,但是深度神经网络也是要从头开始训练B任务的。元学习的目的是:“让机器学会学习”。也就是对于一个新任务,元学习模型可以利用之前从相关任务中获得的知识,也就是说无需从零开始训练。孪生神经网络主要用于各类别数据点较少的应用中。孪生神经网络大致上由两个对称的神经网络组成,它们具有相同的权重和架构,最后由能量函数EEE连接在一起。
2022-12-02 16:08:30
2292
6
原创 pyinstaller打包记录|| 打包成功,含xgboost打包遇到的问题
只需要打包这一个py文件,但是需要import xgboost,这是打包的难点。首先进入到代码py所在目录。把xgboost的包一整个都拷贝进来。在地址栏敲cmd进入命令行。
2022-11-22 18:13:45
1680
4
原创 论文学习——多度量水文时间序列相似性分析
多度量组合可以提高相似性分析的准确性本文方法:首先使用多个单一相似度量分别计算相似时间子序列;然后采用改进的BORDA投票法对各度量分析得到的相似子序列进行组合和排序,得到最终的相似时间子序列。
2022-11-11 20:17:08
1137
原创 Pytorch深度学习——循环神经网络基础 (07)
就是通常所说的分词,分出的每一个词语我们称之为token。常用的分词工具有很多:jieba分词: https://github.com/fxsjy/jieba分词方法:1.转换为单个字2.转换为单词例如:我爱深度学习(1) 我,爱,深度学习(2)我, 爱,深,度,学,习。
2022-11-08 15:37:51
1019
原创 用Nuitka打包python文件(虚拟环境中)
Nuitka作为一个打包工具,实现了工具的跨平台,Windows和Linux下都能对python文件进行打包,这里解释一下,nuitka只能打包python文件(也就是.py文件),对其他格式的文件无法打包。在Windows下最终打包成一个.exe文件,Linux下打包成Linux执行档。
2022-11-03 09:17:22
2460
原创 论文学习——基于神经网络和支持向量机的河口盐度预测比较研究
实验对象:闽江河口实验方法:采用BP神经网络、SVM支持向量机两种方法预测河口盐度实验结果:(1)SVM支持向量机具有更好的泛化性能和适用性;(2)SVM支持向量机在高盐度预测方面优势较为明显;(3)在样本数量较小的情况下,SVM支持向量机的结果精度较好。输入由6个数据组成,分别当天高潮位、前一天高潮位、前一天径流量、前两天径流量、前一天盐度、前两天盐度输出是预测的当天盐度由于量纲不同,数值差异较大,所以对这个6个数值做归一化处理。
2022-11-02 09:28:52
600
原创 使用pyinstaller打包python工程项目文件
之前学习的是用Docker打包python项目部署到云服务器上…然后一波未平一波又起,现在的需求是把python的项目打包成exe可执行文件放到另一台服务器上运行。其实打包一个py文件不难,只要一行语句。
2022-11-02 09:26:43
5048
8
原创 论文学习——基于滑动窗口预测的水文时间序列异常检测
首先基于滑动窗口对时间序列进行子序列分割,再以子序列为基础建立预测模型对未来值进行预测,并将预测值和实测值间差异范围大于预设阈值的序列点判定为异常。水文现象是时变现象,这一变化过程被称为水文过程。水文数据是对水文过程的离散记录,水文数据按其描述的物理量分为流量、水文、降雨量和蒸发量等水文时间序列。定义1 水文时间序列时间t是严格增加的。【句子】水文时间序列异常检测首先要解决的一个问题,是定义在给定的数据集合中,什么样的数据是异常;异常的定义决定了异常挖掘的目标。【句子】
2022-10-30 19:16:44
2360
原创 论文学习——黄河源区气象水文序列突变点诊断
综上分析,黄河源区60多a的降水量、径流量及最大洪峰流量序列存在两个突变点,受气候变化和人类活动的影响,黄河源区气象水文要素的一致性发生了改变。气象水文要素序列:年降水量、年径流量、年最大洪峰流量。
2022-10-28 10:02:57
1770
1
原创 论文学习——南四湖流域降水与天然径流量变化特征分析
针对不同时间序列长度,对比分析了各种方法所获得的趋势变化时间点之间的差异,表明趋势显著变化年份均不受时间序列长度影响。OK我也看不懂这个降水与天然径流量之间的变化特征的分析。研究汛期降水的空间分布特征?os:好奇怪,对南四湖流域。
2022-10-24 19:56:40
548
1
原创 论文学习——和田河流域近60年降水、气温与径流演变特征研究
水资源已成为和能源一样关键的战略性资源,特别是在干旱与半干旱区域尤为明显。还挺好奇这个图是咋画出来的。
2022-10-24 19:30:54
404
原创 孪生神经网络的学习进度记录
不要被名字误导,孪生和双胞胎没什么关系…简单来说,孪生神经网络(Siamese network)就是“连体的神经网络”,神经网络的“连体”是通过共享权值来实现的,如下图所示。(突然想到CNN 的特点也是权值共享…)权值共享:当神经网络有两个输入的时候,这两个输入使用的神经网络的权值是共享的(可以理解为使用了同一个神经网络)如果使用两个神经网络分别对图片进行特征提取,提取到的特征很有可能不在一个域中,此时我们可以考虑使用一个神经网络进行特征提取再进行比较。
2022-10-05 20:04:24
1326
原创 安装torch1.2.0 和 torchvision0.4.1(0.4.0没有成功..)
新建了一个虚拟环境,里面啥也没有。现在的pip list。
2022-10-04 20:47:39
1907
原创 论文学习: The autoregressive linear mixture model : time-series model for an instantaneous mixture of
向量自回归模型,为多元时间序列数据提供了一个简单的生成模型。向量自回归模型的自回归系数描述了一个网络过程。然而,在实际应用中,如宏观经济学或神经影像学,时间序列数据不是来自孤立的网络过程,而是来自多个网络过程的同时发生。标准的矢量自回归模型不能提供关于这种时间序列数据的基本结构的洞察力。在这项工作中,我们提出了自回归线性混合(ALM)模型。ALM提出将时间序列数据分解为共同发生的网络过程,我们称之为自回归成分。
2022-10-03 19:46:48
732
原创 Pytorch深度学习——实现手写数字识别 06
由05课已经知道,调用MNIST返回的结果中 图形数据是一个Image对象,需要对其进行处理。可以直接实例化,传入img 就可以自动生成 [C, H, W] 格式的数据了。是 torch.tensor 的属性,注意不要用到 np.array 上。【注意】 tensorflow是静态的,torch是动态的,所以可以写。[H, W, C]转换最后的结果应该是[C, H, W] 的。(1)mean: 均值指的是每个通道的均值。(2)std:方差指的是每个通道的方差。为了进行数据的处理,学习。
2022-10-02 16:48:08
1017
原创 Docker的基本操作
参考文章:https://blog.youkuaiyun.com/weixin_45525272/article/details/125751581。
2022-09-27 19:59:37
571
原创 Pytorch深度学习——优化算法、数据集类、数据加载器 05
总结:在自定义的数据集类中,继承Dataset类,同时需要实现两个方法__len__: 能够实现通过全局的len() 方法获取其中的元素个数;: 能够通过传入索引的方式获取数据,例如通过dataset[i]获取其中的第i条数据。6万个训练,1万个测试,都是黑白图像,像素是28*28可以看出,返回值是(图片,目标值)
2022-09-25 20:37:45
992
原创 【从零开始的学习记录】Docker学习项目打包
Image,镜像,包括应用及系统的只读数据包Contatiner,容器,虚拟机的运行实例Respositories,仓库,管理镜像文件进入的时候是命令模式,然后按i进入输入模式,输入完成之后要保存并退出首先按下Esc键,insert光标消失(说明进入了命令模式);shift +zz就可以保存并退出。然后再检查一下,vim daemon.json 进入,什么都不要按,此时是在命令模式下的,看到内容正确,输入:q表示正常退出。
2022-09-25 20:36:59
1393
原创 Pytorch深度学习——线性回归实现 04(未完)
在GPU上执行程序:(1)自定义的参数和数据,需要转化为cuda支持的tensor(2)model需要转化为cuda支持的model(3)执行的结果需要和cpu的tensor进行计算的时候:a. tensor.cpu() 把cuda的tensor转化为CPU的tensor。
2022-09-17 13:47:55
513
原创 使用Docker封装Python应用
Docker的前身是名为dotCloud的小公司,主要提供的是基于 PaaS(Platform as a Service,平台及服务)平台为开发者或开发商提供技术服务,并提供的开发工具和技术框架。因为其为初创的公司,又生于IT行业,dotCloud受到了IBM,亚马逊,google等公司的挤压,发展举步维艰。于是,在2013年dotCloud 的创始人,年仅28岁的Solomon Hykes做了一个艰难的决定:将dotCloud的核心引擎开源!
2022-09-16 20:07:51
988
原创 Pytorch学习——梯度下降和反向传播 03 未完
相当于把原来的tensor数据“抽离”出来,并部影响原来的tensor,然后进行深拷贝,转化为numpy数据。对于Pytorch中的一个tensor,如果设置它的属性,绘制成计算图之后,可以清楚的看到前向计算的过程。反向传播就是一个从右到左的过程,自变量。在输入是一个标量的情况下,可以调用输出。方法,但是在输出是一个向量的时候,调用。,那么会追踪对于该张量的所有操作。表示不需要追中这一块的计算。方法来进行反向传播,计算梯度。各自的骗到就是连线上梯度的乘积。属性,用来记录做过的操作;,此时能方便求出导数。
2022-09-13 10:34:40
633
原创 Pytorch学习——Pytorch的入门操作 02(未完)
CUDA 是一种NVIDIA退出的通用并行计算架构,该架构能够使GPU解决复杂的计算问题。是将一个张量的值 以一个python数字形式返回,但该方法只能包含一个元素的张量。注意:这里括号内都表示的是shape。对于包含多个元素的张量,可以考虑。,是和numpy的操作一样的。各种数值数都可以称为张量。类似于numpy中的。
2022-09-12 20:17:06
951
原创 Pytorch学习——入门知识 01
深度学习是机器学习的分支,以人工神经网络为基础,对数据的特征进行学习的方法。机器学习和深度学习的区别a. 特征抽取机器学习:人工的特征抽取过程深度学习:自动的进行特征抽取b. 数据量机器学习:数据量少,效果不好特别好深度学习:数据量多,效果更好框架a. 目前企业中常用的深度学习框架有很多,比如说Tensorflow,Caffe2,Keras,Theano, Pytorch,Chainer,DyNet,MXNet,CNTK 等等。
2022-09-07 21:09:47
1408
原创 桌面上出现一个.accelerate 文件夹,如何解决?
这是使用百度云的时候accelerate插件自动生成的,就是百度云的网页下载功能。当点击“下载”按钮就会出现这个文件夹。文件夹可以删除,但是只要你用百度云下载东西就又会生成,处理方式就是下载一个及时处理垃圾文件的小插件。回车,然后关闭cmd,刷新一下,桌面上应该就没有.accelerate 文件夹了。其实这文件夹没什么危害,放那也无所谓,觉得碍眼的话放到不会看到的地方就行了。查看是否有.accelerate 文件夹。(命令行里面的复制是鼠标右击)
2022-09-04 15:09:30
9086
3
原创 遗传算法(GA)学习 || 原理、本质、代码、例题
种群(Population):种群是指用遗传算法求解问题时, 初始给定的多个解的集合。遗传算法的求解过程是从这个子集开始的。个体(Individual):个体是指种群中的单个元素,它通常 由一个用于描述其基本遗传结构的数据结构来表示。例如, 可以用0、1组成的长度为1的串来表示个体。染色体(Chromosome):染色体是指对个体进行编码后 所得到的编码串。染色体中的每1位称为基因,染色体上由 若干个基因构成的一个有效信息段称为基因组。适应度函数(Fitness)...
2022-08-13 15:00:25
1249
原创 Windows系统下,python安装netCDF4步骤
自己写程序主要用的是Pycharm,查看一下当前的Python版本(在Terminal里面可以查看)选择Settings,查看Project Interpreter, 查看目前安装的包:重点去看了一下numpy和matplotlib从最后一张图可以看出,这里对numpy的版本是有要求的,需要大于等于1.9。...
2022-08-08 10:56:50
3367
原创 聚类算法评价指标——基于DBI指数的k-means算法(python代码)
Davies-Bouldin指数(DBI)(戴维森堡丁指数),又称为分类适确性指标,是由大卫L·Davies和唐纳德·Bouldin提出的一种评估聚类算法优劣的指标。属于内部指标,内部指标是利用数据集的固有特征和量值来评价一个聚类算法的结果。SiS_iSi。...
2022-07-19 10:59:35
4423
1
原创 论文学习——Correlative Channel-Aware Fusion for Multi-View Time Series Classification
目前已经有了小论文和专利的基本思路了…但是感觉方法和技术都不太能够体现咱们计算机学院的优势。所以,我爬上顶会来看看大佬们的技术!!这一篇是发在AAAI国际会议上的,AAAI的全称是人工智能促进协会,是人工智能领域的主要学术会议之一。AAAI主办的“AAAI人工智能会议”, 被认为是人工智能领域的顶级会议之一。第35届AAAI会议,(2021年)在加拿大温哥华举行,由于全球疫情影响,本次会议采用的是线上方式进行召开。【看不懂了,看不下去了,弃文,多视图是啥意思都不知道…】...
2022-07-11 15:07:11
527
4
原创 学习Python3数据结构——列表
Python中,列表示可变的,这是区别于字符串和元组最重要的特点。即列表可以修改,而字符串和元组不能。把添加到列表的结尾。通过添加指定列表L的所有元素来扩充列表。在上插入一个。例如会插入到整个列表之前删除列表中值为x的第一个元素。从列表的指定位置移除元素,并将其返回。表示传入参数i是可选的。 表示移除并返回最后一个元素。移除列表中的所有项。返回列表中第一个值为x的元素的索引。对列表中的元素进行排序逆序返回 列表的浅复制。...
2022-07-08 14:49:41
307
原创 论文学习——基于极值点特征的时间序列相似性查询方法
写在前面:《计算机应用研究》;作者:吴学雁、黄道平(华南理工大学)时间序列存在各种复杂变形(如平移、伸缩、间断等),且变形时间和变形程度均无法预料,而广泛采用欧式距离及其变体 对时间轴的变形非常敏感,一些轻微的改变就会导致欧式距离发生很大变化。在时间序列数据中,尤其是水文时间序列,最值得关注的往往是序列中的一些特征点。本文提出一种提取重要极值点的方法,依据重要极值点对时间序列进行分段表示;然后在此基础上使用一种改进的DTW方法进行相似性度量。时间序列相似性查询分为全序列匹配和子序列匹配两种方式。在全序列匹
2022-07-03 20:12:48
634
原创 论文学习——鄱阳湖星子站水位时间序列相似度研究
写在前面:《中国水利学会2020学术年会议集》;张汶海;中国水利水电科学研究院时间序列的相似性度量是数据挖掘技术的关键,直接影响到时间序列数据挖掘的结果。水位时间序列作为一种特定的水文过程,是一种典型的水文时间序列。欧式距离和动态时间弯曲距离,是计算时间序列相似性的两种经典算法弃文了,抱歉,一阶连接性系数不是我想要的...
2022-07-02 20:31:39
244
原创 论文学习——水文时间序列相似性查询的分析与研究
写在前面:《水文》;2009年;作者:李薇、孙洪林传统的时间序列相似性搜索研究,主要强调精确匹配,但是在数据挖掘应用中,由于数据量巨大,一般采用基于近似匹配的“近似搜索”。水文时间序列相似性挖掘的关键工作有:子序列的划分。 在国家水文数据库中,洪水工程已经按照产汇流理论进行了划分,形成了各类要素的摘录表。但是,在日值类过程中,则需要按拟解决的问题类型进行划分,需要使得划分规则既符合水文理论,又适合计算机处理。序列特征提取。一般是对序列进行变换,例如傅里叶变换、小波变换或者分段平均等方法映射到特征空间。相
2022-06-30 21:01:26
1235
深度学习数据+配合博文“在git上面看到的代码,浅学了一下”
2022-04-10
机器学习+pytorch+diabets数据集(糖尿病数据集)+配合博文“Pytorch深度学习实践(六)”
2022-03-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人