- 博客(5)
- 收藏
- 关注
原创 k-means聚类算法学习笔记(案例分析、python代码,结果可视化)
K-Means算法是一种典型的基于划分的聚类算法,也是一种无监督学习算法。K-Means算法的思想很简单,对给定的样本集,用欧氏距离作为衡量数据对象间相似度的指标,相似度与数据对象间的距离成反比,相似度越大,距离越小。预先指定初始聚类数以及个初始聚类中心,按照样本之间的距离大小,把样本集划分为个簇根据数据对象与聚类中心之间的相似度,不断更新聚类中心的位置,不断降低类簇的误差平方和(Sum of Squared Error,SSE),当SSE不再变化或目标函数收敛时,聚类结束,得到最终结果。
2023-02-14 12:11:38
4569
原创 决策树模型学习笔记(案例分析、推算过程、python代码)
决策树(decision tree)是一类常见的机器学习方法.以二分类任务为例,我们希望从给定训练数据集学得一个模型用以对新示例进行分类,这个把样本分类的任务,可看作对 “当前样本属于正类吗?” 这个问题的“决策”或“判定〞过程.顾名思义,决策树是基于树结构来进行决策的。信息增益法和基尼指数法(CART决策树),此次我主要学习了通过计算数据集的基尼指数来构建决策树。
2023-02-13 15:18:08
1942
原创 大数据开发学习笔记
大数据开发有两种 , 一种需要编写Spark、Hadoop的应用程序 , 另一种需要开发大数据处理系统本身 。 大数据开发工程师的职责是负责公司大数据平台的开发和维护、网络日志大数据分析、实时计算和流式计算等技术的研发和网络安全业务主题建模等工作 。
2023-02-12 13:46:43
1425
原创 马尔可夫模型实际运用(以金融领域为例)(python代码)
马尔可夫链(Markov Chain, MC)是概率论和数理统计中具有马尔可夫性质(Markov property)且存在于离散的指数集(index set)和状态空间(state space)内的随机过程(stochastic process)。适用于连续指数集的马尔可夫链被称为马尔可夫过程(Markov process),但有时也被视为马尔可夫链的子集,即连续时间马尔可夫链(Continuous-Time MC, CTMC)
2023-02-11 15:55:18
4012
6
原创 Python安装Talib库
python安装TA-Lib库。TA-Lib全称“Technical Analysis Library”, 即技术分析库,是Python金融量化的高级库,涵盖了150多种指标,包括股票、期货交易软件中常用的技术分析指标,如MACD、RSI、KDJ、动量指标、布林带等等,是一种高效便捷的金融量化分析库,在python中也可以轻松运用。
2022-10-31 13:18:58
18049
12
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人