
数据结构与算法
文章平均质量分 83
宁缺100
迈出的步伐不非得很大,只要你是在往正确的方向前行就行
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MAB多臂赌博机---汤普森采样算法
汤普森采样算法 原理 假设每个臂是否产生收益,决定于背后的一个概率分布,及产生收益的概率为p,每个臂对应的概率分布得出各自的随机数,最大的就是收益最高的 根据每次收益情况调整对应的概率分布 核心 (Beta)贝塔分布 贝塔分布: 是一种连续性概率密度分布,由形状参数(a,b)表示,一般用于伯努利事件成功概率的概率分布,定义域在(0,1)之间 伯努利试验:在同样的条件下重复地、相互独立地进行的一种随机试验 并且只有两种可能结果:发生或者不发生 分布特点: 对于不同的形状参数 a,b 分布很宽 a+b原创 2021-03-03 15:48:17 · 1248 阅读 · 1 评论 -
拉格朗日乘法解决约束条件下的最优问题
拉格朗日乘数法 寻找变量受一个或多个条件所限制的多元函数极 值方法。将n个变量和k个约束的最优问题转换为 n+k变量的方程组极值问题,变量没有约束。 拉格朗日乘数:约束方法梯度的线性组合中各向量的系数(法向量的系数) 用拉格朗日乘法解决约束条件下的最优问题 二元类型 目标函数: f(x,y) = x^2+4*y^2 -2*x+8y 约束条件: x+2*y=7 最优问题:在约束条件下找目标函数f(x,y)的最小值 几何问题:目标函数为一个椭圆,约束条件为直线,最优问题在几何上表现为,椭圆经原创 2020-10-09 09:35:56 · 2639 阅读 · 0 评论 -
挖掘导演最爱用的演员 关联规则-FPGrowph
概要 FP的全称是Frequent Pattern,在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快整个挖掘过程。 Aprior Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于我们...原创 2020-03-08 09:12:24 · 1160 阅读 · 0 评论 -
时间序列预测ARIMR(Spark scala,Python)
自回归滑动平均差分模型 AR 自回归 MA 滑动平均 I 差分法 AIC 准则 赤池消息准则,衡量统计模型拟合好坏的标准,值越小越拟合 最小信息量准则(An Information Criterion) 指导思想: 似然函数值越大越好 未知参数的个数越少越好 ARMA模型要求数据平稳,当数据不平稳时,需要差分。如果d阶差分后,序列平稳,叫做d阶单整序列 如果差分很多次,还.........原创 2019-11-04 10:47:27 · 4813 阅读 · 3 评论 -
朴素贝叶斯算法
分类,概率统计 条件概率 事件A在事件B发生的条件下的概率 P(A∣B)=P(AB)P(B) P(A|B)=\frac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB) 2.乘法公式 P(AB)=P(B)P(A|B)=P(A)P(B|A) n>=2 p(A_1A_2**A_n)=P(A_1)P(A_2|A_1)P(A_3|A_1A_2)...P(A_n|A_1A_2.....原创 2019-04-22 23:56:13 · 230 阅读 · 0 评论 -
红黑树
啥是虹黑树 一种自平衡二叉查找树 特性:节点是红色或黑色 根节点一定是黑色 每个叶节点都是黑色的空节点(NIL节点) 每个红节点的两个子节点都是黑色的(从每个叶子到跟的所有路径上不能有两个连续的红节点)(即对于层来说除了NIL节点,红黑节点是交替的,第一层是黑节点那么其下一层肯定都是红节点,反之一样) 从任一节点到其每个叶子节点的所有路径都包含相同数目的黑色节点 参考博客 博客Java TreeM...原创 2019-05-18 13:54:05 · 183 阅读 · 0 评论 -
经典数据结构 B树B+树和数据库索引
数据库索引 索引简单讲 就是数据库本身数据结构不适合各种搜索算法 也就是数据库提供给搜索算法的数据结构 Hash索引 B+ 索引 关于数据库索引参考以下博客 数据库索引详解 为啥不用红黑树等结构,偏要用B+树做索引 B树 B+树的存在就是为了提升数据库索引速度 必须要提到 局部性原理与磁盘预读 当一个数据被用到时,其附近的数据也通常会马上被使用程序运行期间所需要的数据通常比较集中 为了提升效...转载 2019-05-18 14:23:06 · 296 阅读 · 0 评论