机器学习
程勇uestc
电子科大
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
early fusion VS later fusion
一、early fusion VS later fusion\qquadearly fusion指的是先将不同的特征融合再一起,最后再使用分类器对其进行分类,这个融合过程发生在特征之间,一般称之为特征融合或者"early fusion";Later fusion指的是不同的特征使用不同的分类器,得到基于每个特征的分类结果,再对所有结果进行融合(可能是投票、加权平均等),这个融和发生在不同特征分类结果之间的融合,称为"later fusion"或”decision fusion“。\qquad一般用"ea原创 2020-05-26 16:53:39 · 9167 阅读 · 0 评论 -
FP-Growth在快速计算元素之间条件概率上的应用
一、算法介绍\quadFP-growth中,FP表示Frequent Pattern,是频繁模式的意思。该算法借助于FP树来完成对频繁项集的快速挖掘,在本文中,我们的目的是要借助FP树来找出每一项与其他项之间的条件概率。二、算法流程\quadFP-growth需要两次对数据进行两次遍历,第一次遍历是为了统计数据集中所有样本中每一元素的出现次数,根据各个元素出现次数对每个样本中各个元素按照这个...原创 2019-10-07 16:12:16 · 1587 阅读 · 0 评论 -
概率图模型
一、概率图内容框架给数据结构中的图赋予概率的意义表示有向图 bayes Network无向图 Markov Network推断精确推断近似推断确定近似性随机近似学习参数学习结构学习贝叶斯网络1、P(x1,x2,⋯ ,xp)=p(x1)∏i=2pP(xi∣x1,2,⋯ ,i−1)P(x_1...原创 2019-08-02 14:52:17 · 1096 阅读 · 0 评论 -
聚类算法效果衡量
一、误差平方和SSE(sum of square due to error)\quad聚类将数据化分为k类,用{C1,C2,⋯ ,Ck}\{C_1,C_2,\cdots,C_k\}{C1,C2,⋯,Ck}表示,每一类的中心点分别为{m1,m2,⋯ ,mk}\{m_1,m_2,\cdots,m_k\}{m1,m2,⋯,mk},则S...原创 2019-07-23 20:11:41 · 5221 阅读 · 0 评论 -
RNN,LSTM用于情感分类问题
1、词袋定义和keras自带分词和编码工具词袋定义n-gram: 是从一个句子中提取的 N 个(或更少)连续单词的集合 “The cat sat on the mat.”分解为2-gram: {"The", "The cat", "cat", "cat sat", "sat", "sat on", "on", &quo原创 2018-11-21 20:54:50 · 3988 阅读 · 0 评论 -
数据特征工程之量化装箱
量化装箱 假设这样一个数据集,里面某些属性的值差异很大,小的可能是10以内,大至几百几千,这样我们该如何去量化呢?直接将它们送入模型可行吗? 其实对于许多模型来说,跨越数个数量级的属性数值是有问题的。属性数值中较大的数值可能破坏包含原创 2018-11-05 21:44:07 · 1956 阅读 · 0 评论 -
kreas搭建神经网络预测波士顿房价(手写K折交叉验证)
1、程序说明所有注意事项均写入注释from keras.datasets import boston_housingimport numpy as npfrom keras import modelsfrom keras import layersfrom keras.optimizers import RMSprop# 载入数据(train_data, train_targe...原创 2018-11-07 11:23:31 · 4593 阅读 · 0 评论 -
keras搭建神经网络分类新闻主题
from keras.datasets import reutersimport numpy as npfrom keras import modelsfrom keras import layersfrom keras.optimizers import RMSpropfrom keras.losses import categorical_crossentropy'''数据集介绍...原创 2018-11-06 21:12:38 · 2316 阅读 · 0 评论 -
kears搭建神经网络分类mnist数据集
from keras.datasets import mnistfrom keras import modelsfrom keras import layersfrom keras.utils import to_categoricalfrom keras.optimizers import RMSprop(train_images, train_labels), (test_image...原创 2018-11-06 20:57:14 · 2417 阅读 · 0 评论 -
机器学习现状以及目前机器学习竞赛的主流框架或算法
Kaggle 上的竞争非常激烈(有些比赛有数千名参赛者,并提供数百万美元的奖金),而且涵盖了各种类型的机器学习问题,所以它提供了一种现实方法来评判哪种方法有效、哪种方法无效。那么哪种算法能够可靠地赢得竞赛呢?顶级参赛者都使用哪些工具? &nbs原创 2018-11-06 15:19:19 · 2893 阅读 · 0 评论
分享