- 博客(17)
- 资源 (1)
- 收藏
- 关注
原创 keras -- 实现cifar10分类
import keras from keras.datasets import mnist,cifar10 from keras.models import Sequential from keras.layers import Dense, Dropout, Flatten, MaxPooling3D from keras.layers import Conv2D, MaxPooling2D f
2017-12-13 11:05:18
1244
原创 tensorflow实践系列 -- 线性规划 (batch and stochastic)
import numpy as np import tensorflow as tf import matplotlib.pyplot as plt sess = tf.Session() #batch gradient descent x_vals = np.random.normal(1,0.1,100).reshape([100,1]) y_vals = np.repeat(10.0,10
2017-11-30 13:36:50
1176
原创 Python实现 线性回归(梯度下降)
import numpy as np import pandas as pd from numpy import * from pandas import * import matplotlib.pyplot as plt x = np.array([[1,2],[2,1],[3,2.5],[4,3], [5,4],[6,5],[7,2.7],[8,4.5],
2017-11-13 18:09:21
4972
1
原创 ml-预处理交叉检验
今天分析人类收入数据,想从中提炼分析出能够获得>50万年薪的人的特征都是什么,从中遇到了一个交叉验证的参数问题。 数据是从UIC获取的, csv_file = pd.read_csv('adult.data',header=None,names=['age', 'workclass',
2017-07-15 15:40:14
365
原创 ML--Apriori关联分析
Apriori算法通常用于发现样本间的某种关系,比如超市购物中心,通常会根据用户的数据,发现买牛奶的人通常也会买西瓜这样的关系, 来安排把牛奶和西瓜捆绑在一起进行销售。 Apriori的核心思想: 1.发现样本中的频繁集 2.从频繁集中挖掘关联规则 频繁集: 就是样本中出现的次数多的集合(这个多是相对的,算法需要定义一个度来表示什么才是真正的频繁) x(i)/n 看下图:
2017-07-11 14:57:41
377
原创 决策树-NBA比赛预测
思路: 1.获取NBA2017年的数据 2.格式化处理数据 3.设计统计分析模型 4.特征选取并进行机器学习 NBA的数据是自己在网上获取的csv数据,如下,可以直接保存成csv后缀的文本文件 Date,Start (ET),Visitor/Neutral,PTS,Home/Neutral,PTS,,,Notes Tue Oct 25 2016,7:30 pm,New York
2017-07-11 10:27:15
897
原创 ML-K-均值聚类算法
算法核心思想很简单,看下图: 1.算法k取值为2, 代表我们对这个样本进行2类划分,当然多类的划分算法类似 2.随机的获取两个点(用圆圈圈出的)即簇质心点,注意这两个点一定要在样本边界范围内,稍后的代码会给出实现 3.获取了这两个点后,通过计算所有的点到这两个点的距离,让每个点选择自己距离最近的质心点,这样这些属于同一个质心点的样本点都归为一簇 4.在获取的两个簇的样本
2017-07-05 14:03:51
602
原创 ML-朴素贝叶斯
在做分类算法的时候,很多算法都不错,但是有时可能需要获取到分类结果的概率,这时候就可以用上贝叶斯了 贝叶斯决策理论: 如果有两类数据,p1(x,y)的概率属于第一类, p2(x,y)的概率属于第二类,那么如果测试数据(x,y) p1(x,y) > p2(x,y) 就属于第一类 p2(x,y) > p1(x,y) 就属于第二类 这就是贝叶斯决策理论的核心思想了。 可以这样理解贝叶斯决策:
2017-07-01 16:00:54
265
原创 ML-决策树
决策树是一种进行类别递归分类的分类算法, 具体的原理就是构造一棵决策树,对所有相同的类别分别作为左右子节点(当然也可以是多树杈的树) 决策树的核心在于如何找到最优的特征值来对于数据集合进行分类。最好的方法就是用香浓定理了 香浓定理: H 就代表了训练集合所有特征的熵,得到了熵之后,我们就可以获取最大信息增益的方法来选择最佳的划分特征值。 python代码: d
2017-07-01 15:39:48
379
原创 ML-KNN
KNN-k 近邻算法 KNN属于分类算法,原理比较简单,简单概括就是对测试数据和所哟样本点进行距离的测算,最后选取K个最近的点的集合, 在其中选取类别出现最多的点的分类作为测试数据的分类。 以图说明,这里存在矩阵 trainMat = array([[1.,1.1],[1.,1.],[0.,0.],[0.,0.1]]) 作图: 当我们的
2017-07-01 10:51:32
1740
原创 ML-Regression
Linearing Regression: 算法: python实现: # coding=utf-8 from numpy import * import matplotlib.pyplot as plt filename = 'D:\machinelearninginaction\Ch08\ex0.txt' numLen = len(open(filena
2017-06-25 20:15:12
422
原创 nginx--过滤模块开发
config文件: ngx_addon_name=ngx_http_req_filter_module HTTP_FILTER_MODULES="$HTTP_FILTER_MODULES ngx_http_req_filter_module" NGX_ADDON_SRCS="$NGX_ADDON_SRCS $ngx_addon_dir/ngx_http_req_filter_module.c"
2016-12-08 10:28:38
259
原创 nginx--rbtree使用详解
红黑数的性质这里就不多说了网上很多,主要看看nginx是如何定义的rbtree和怎么使用它 rbtree = ngx_slab_alloc(shpool, sizeof(ngx_rbtree_t)); //从共享内存中创建一颗红黑树 sentinel = ngx_slab_alloc(shpool, sizeof(ngx_rbtree_node_t)); //创建了一个红黑
2016-11-10 10:53:47
2269
原创 nginx--队列的使用详解
nginx中的队列实现就是用的双向链表这种数据结构,节点代码如下: typedef struct ngx_queue_s ngx_queue_t; struct ngx_queue_s { ngx_queue_t *prev; ngx_queue_t *next; }; 所以,nginx的队列实现其实就是常用的链表操作,具体操作如下: #def
2016-11-09 14:17:10
3550
原创 nginx--共享内存使用详解
参考ngin官方模块对于共享内存的使用,可以在配置文件中对共享内存进行配置 { ngx_string("srs_request_node_zone"), NGX_HTTP_MAIN_CONF|NGX_CONF_TAKE1, ngx_http_srs_request_node_zone, 0, 0, NULL }
2016-11-09 11:04:55
7588
原创 调用 inet_ntoa 程序崩溃
调用 inet_ntoa 函数产生的段错误 “Segmentation fault (core dumped)” 的原因及解决办法 原因是在64位机上运行, 32位上是没问题的,只要加上头文件#include
2016-07-20 12:10:42
818
原创 c++ --单例的实现
单例的实现有很多的坑,并不是简单的一个static的成员获取就算是单例了,下面详细叙述下它的坑。 -. 懒汉模式 class singleton { private; singleton(); public: ~singleton(); static singleton getInstance(); { static sing
2016-01-03 11:06:29
436
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人