
python
xxuffei
这个作者很懒,什么都没留下…
展开
-
shuxuemoxing_iris visilization
玩转鸾尾花Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。\quad数据集内包含 3 类共 150 条记录,每类各 50 个数据,\quad每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种。\qua...原创 2020-03-11 00:47:26 · 530 阅读 · 0 评论 -
shuxuemoxing_knn
一 案例1(Ⅱ 肿瘤预测案例)【案例】给定10组肿瘤相关数据的特征值[3.3935, 2.3312], [3.1101, 1.7815], [1.3438, 3.3684], [3.5823, 4.6792], [2.2804, 2.8670], [7.4234, 4.6965], [5.7451, 3.5340], [9.1722, ...原创 2020-03-10 22:50:01 · 309 阅读 · 0 评论 -
python讲稿5 迭代器,可迭代对象,生成器
本文部分参考:Python迭代器,生成器–精华中的精华 https://www.cnblogs.com/deeper/p/7565571.html一 迭代器和可迭代对象迭代器是访问集合元素的一种方式。。迭代器只能往前不会后退。迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素,仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍...转载 2020-03-10 22:07:51 · 349 阅读 · 2 评论 -
python讲稿4_2 类2 单下划线,双下划线
Python 用下划线作为变量前缀和后缀指定特殊变量分三种:单下划线开始的变量,如_xxx,表示不能用’from module import *'导入双下划线开始的变量,如__xxx,表示类中的私有变量名前后各有双下划线的变量,如__xxx__,表示系统定义名字,也叫magic variable(魔术变量)class Student: def __init__(self,...原创 2020-03-10 22:06:35 · 244 阅读 · 0 评论 -
python讲稿4_1 类1 属性绑定和引用
1 python类1.1 python类定义class Employee: '所有员工的基类' empCount = 0 def __init__(self, name, salary): self.name = name self.salary = salary Employee.empCount += 1 def di...原创 2020-03-10 22:05:48 · 498 阅读 · 0 评论 -
python讲稿3 函数定义和函数参数
在Python中,定义一个函数要使用def语句,python强制要求格式1 定义我们以自定义一个求绝对值的my_abs函数为例:def my_abs(x): if x >= 0: return x else: return -x调用my_abs(x)如下:print(my_abs(-9))1.1 空函数def nop(): ...原创 2020-03-10 22:05:03 · 760 阅读 · 0 评论 -
python讲稿1(list,tuple,dict)
python变量类型python变量不需要类型声明.基本类型counter = 100 # 赋值整型变量miles = 1000.0 # 浮点型name = "John" # 字符串字符串s='runnoob'字符串的索引有2中顺序:从左到右索引默认0开始的从右到左索引默认-1开始的[头下标:尾下标] 获取的子字符串包含头下标的字符,但不包含尾下标的字符。...原创 2020-03-03 16:46:11 · 684 阅读 · 0 评论 -
python讲稿2 while,for循环
if else语句1.1 if elseif 判断条件: 执行语句……else: 执行语句……# 例1:if 基本用法 score=65if score<60: result='不及格'else result='及格'1.2 if elif elseif 判断条件1: 执行语句1……elif 判断条件2: 执行...原创 2020-03-03 16:44:38 · 950 阅读 · 0 评论 -
c和python版本快速排序算法
快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用,再加上快速排序思想----分治法也确实实用,因此很多软件公司的笔试面试,包括像腾讯,微软等知名IT公司都喜欢考这个,还有大大小的程序方面的考试如软考,考研中也常常出现快速排序的身影。快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and...转载 2019-05-09 10:25:28 · 162 阅读 · 0 评论 -
c和python版本冒泡排序算法比较,python调用c(c++)
c语言版冒泡排序#include <iostream>#include <sstream>#include <string.h>#include <stdio.h>#include <stdlib.h>#include <time.h>using namespace std;void bubble(int *a...转载 2019-05-09 10:24:52 · 299 阅读 · 0 评论 -
Logistic回归
假设现在有一些数据点,我们用一条直线对这些点进行拟合(该直线称为最佳拟合直线),这个拟合的过程就称为回归。利用Logistic(逻辑斯蒂)回归是一个分类模型而不回归模型。其进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“回归”一词源于最佳拟合,表示要找到最佳拟合参数。而最佳拟合参数就是在训练分类器时,通过最优化算法获得。首先,逻辑斯蒂回归是一种线性分类器,针对...转载 2019-05-09 10:23:16 · 325 阅读 · 0 评论 -
softmax详细的梯度求导
参考原文:https://blog.youkuaiyun.com/wfei101/article/details/80807749https://blog.youkuaiyun.com/fsdfasfawre/article/details/80586123本文通过一个简单的例子来看softmax的梯度求导过程.1 softmax函数softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可...转载 2019-05-09 10:22:24 · 17493 阅读 · 7 评论 -
GLM
原文地址:http://www.cnblogs.com/sumai/p/5240170.htmlhttp://www.cnblogs.com/BYRans/https://blog.youkuaiyun.com/tudaodiaozhale/article/details/804325520 准备知识:多项式分布多项式分布是二项分布的推广。二项分布(也叫伯努利分布)的典型例子是扔硬币,硬币正面朝上概率...转载 2019-05-09 10:18:18 · 1442 阅读 · 0 评论 -
python EM算法1
原文:https://blog.youkuaiyun.com/hx14301009/article/details/81228692https://blog.youkuaiyun.com/zouxy09/article/details/8537620假设我们需要调查我们学校的男生和女生的身高分布。在校园里随便地活捉了100个男生和100个女生,他们共200个人(也就是200个身高的样本数据)。一 高斯模型你开始喊...转载 2019-05-14 00:23:11 · 703 阅读 · 0 评论 -
python EM算法2
1硬币问题先看一个抛硬币问题,如果我们有A和B两个不均匀硬币,选择任意一个硬币抛10次(这里我们知道选择是的哪一个硬币),共计选择5次。正面记为H,背面记为T。记录实验结果,求A和B再抛正面向上的概率?使用极大似然估计(Maximum likelihood)来算:统计出每次实验,正反面的次数多次实验结果相加相除得到结果,P(A)=0.8,P(B)=0.45但是在实际过程中,很有可能...转载 2019-05-13 20:12:46 · 488 阅读 · 0 评论 -
EM算法双硬币模型的python实现
1 双硬币模型$\quad`假设有两枚硬币A、B,以相同的概率随机选择一个硬币,进行如下的抛硬币实验:共做5次实验,每次实验独立的抛10次,结果如图中a所示,例如某次实验产生了H、T、T、T、H、H、T、H、T、H,H代表正面朝上。假设试验数据记录员可能是实习生,业务不一定熟悉,造成下面两种情况 :$\quad`a) 表示实习生记录了详细的试验数据,我们可以观测到试验数据中每次选择的是A还是...转载 2019-05-13 20:12:13 · 2088 阅读 · 0 评论 -
python kmeans图像分割
原文:https://blog.youkuaiyun.com/google19890102/article/details/52911835一、理论准备1.1、图像分割图像分割是图像处理中的一种方法,图像分割是指将一幅图像分解成若干互不相交区域的集合,其实质可以看成是一种像素的聚类过程。通常使用到的图像分割的方法可以分为:基于边缘的技术基于区域的技术基于聚类算法的图像分割属于基于区域的技术。...转载 2019-05-13 20:11:32 · 16050 阅读 · 5 评论 -
linear regression2
1 多元线性回归的矩阵解法令J(θ)=12M∑i=1n(yi−(a+bxi))2=12M(y−xθ)T(y−xθ)J(\theta)=\frac{1}{2M}\sum\limits_{i=1}^n(y_i-(a+bx_i))^2=\frac{1}{2M}(y-x\theta)^T(y-x\theta)J(θ)=2M1i=1∑n(yi−(a+bxi))2=2M1(y−xθ)T(y−xθ)...转载 2019-05-09 10:26:29 · 219 阅读 · 0 评论 -
linear regression1
一元线性回归是数据挖掘的基础模型,其中包含了非常重要的数学回归的概念,是学习多元回归,广义线性回归的基础。本文主要讲解1)基础原理2)数学推导3)R语言演示,来介绍一元线性回归。整体思路:根据已知点求一条直线,希望直线与各个点距离之和为最小,根据最小二乘法算出最小时直线的参数。一、基础原理例1 假设你想计算匹萨的价格。虽然看看菜单就知道了,不过也可以用机器学习方法建一个线性回归模型,通过...转载 2019-05-09 10:27:05 · 328 阅读 · 0 评论 -
python12讲稿 bayes+tfidf多分类(3类)及总结对比
1 语料准备和加载模型import pdb,jieba,string#pdb.set_trace()import os,sysimport numpy as np#1 函数定义部分def textParse2(bigString): stop_f=open('d:/email/stopwords.txt',encoding='utf8') stopwords=list(...转载 2019-05-14 09:14:09 · 568 阅读 · 0 评论 -
GMM的EM算法实现
原文地址:http://blog.youkuaiyun.com/abcjennifer/article/details/8198352 在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对E转载 2017-12-03 05:21:28 · 371 阅读 · 0 评论 -
python讲稿7 Bernoulli naive bayes
from numpy import *import jiebaimport stringdef loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'd...转载 2019-05-14 09:20:53 · 780 阅读 · 0 评论 -
python讲稿6 Multinomial naive bayes
'''Created on Oct 19, 2010@author: Peter'''from numpy import *import jiebaimport stringdef loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ...转载 2019-05-14 09:20:20 · 560 阅读 · 0 评论 -
python9讲稿 bayes多分类(3类)
import pdb,jieba,string#pdb.set_trace()import os,sysimport numpy as np#1 函数定义部分def textParse2(bigString): stop_f=open('d:/email/stopwords.txt',encoding='utf8') stopwords=list() for li...转载 2019-05-14 09:19:41 · 359 阅读 · 0 评论 -
python10讲稿 bayes多分类(10类)
import pdb,jieba,string#pdb.set_trace()import os,sysimport numpy as np#1 函数定义部分def textParse2(bigString): stop_f=open('d:/email/stopwords.txt',encoding='utf8') stopwords=list() for li...转载 2019-05-14 09:19:02 · 311 阅读 · 0 评论 -
python13讲稿 knn
一 . K-近邻算法(KNN)概述\quad最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个训练对象被分到了多个类的问题,基于这些问题呢,就产生了KNN。\quadKNN是通过测量不同特征值之间的距离...转载 2019-05-14 09:18:18 · 327 阅读 · 0 评论 -
python11讲稿 bayes+tfidf多分类(2类)
import pdb,jieba,string#pdb.set_trace()import os,sysimport numpy as np#1 函数定义部分def textParse2(bigString): stop_f=open('d:/email/stopwords.txt',encoding='utf8') stopwords=list() for li...转载 2019-05-14 09:17:46 · 420 阅读 · 0 评论 -
K-means聚类算法及python代码实现
转载自https://www.cnblogs.com/ahu-lichang/p/7161613.htmlK-means聚类算法(事先数据并没有类别之分!所有的数据都是一样的)1、概述K-means算法是集简单和经典于一身的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为类簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标...转载 2019-05-13 20:10:49 · 6389 阅读 · 0 评论 -
python讲稿8 Gaussian bayes
高斯模型1. 通过一个例子来说明下面是一组人类身体特征的统计资料。当特征是连续变量的时候,运用多项式模型就会导致很多(不做平滑的情况下),此时即使做平滑,所得到的条件概率也难以描述真实情况。所以处理连续的特征变量,应该采用高斯模型。性别身高(英尺)体重(磅)脚掌(英寸)男618012男5.9219011男5.5817012男5....转载 2019-05-13 20:09:25 · 646 阅读 · 0 评论 -
Fuzzy c-means (FCM)聚类算法
转载:http://blog.youkuaiyun.com/AMDS123/article/details/53889924原理 允许同一数据属于多个不同的类。该算法(developed by Dunn in 1973 and improved by Bezdek in 1981)经常用于模式识别,基于最小化下列目标函数: , 其中, m 是大于1的实数,uij 是xi 属于类别转载 2017-12-04 12:21:04 · 1334 阅读 · 0 评论 -
urllib的使用1
1获取整页页面#python3import urllib.requestresponse=urllib.request.urlopen('http://www.baidu.com')data=response.read()html=data.decode("utf8")print(type(html))with open("d:/python/pachong/pc2.html",'w',e原创 2017-12-11 11:14:46 · 286 阅读 · 0 评论 -
使用爬虫爬取网站内容
思路url,通过指定的url下载页面的源代码,request库拿到源代码后,取获取包含我们抓取数据部分的标记内容遍历这个list,把解析之后的信息写入本地文件段子的标题段子的内容url='http://duanziwang.com/category/duanzi/page/'headers={'User Agent':'Mozilla/4.0 (compatible MSIE 6.0原创 2017-12-11 15:50:26 · 868 阅读 · 0 评论 -
王小草【机器学习】笔记--EM算法
原文地址:http://blog.youkuaiyun.com/sinat_33761963/article/details/53520898 EM算法的英文全称是Expectation Maximization Algorithm,也就是求期望最大化,也就是我们常说的目标函数求最大值的算法。EM算法,直观的说,就是有一堆未知的数据(比如一些特征值),这转载 2017-12-03 05:59:50 · 495 阅读 · 0 评论 -
kmeans++
k-means++算法选择初始seeds的基本思想就是:初始的聚类中心之间的相互距离要尽可能的远。wiki上对该算法的描述如下:从输入的数据点集合中随机选择一个点作为第一个聚类中心对于数据集中的每一个点x,计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)选择一个新的数据点作为新的聚类中心,选择的原则是:D(x)较大的点,被选取作为聚类中心的概率较大重复2和3直到k个聚类中心被选出来转载 2017-12-02 01:06:15 · 471 阅读 · 0 评论 -
Python print 中的逗号小技巧
http://blog.youkuaiyun.com/bestallen/article/details/51730176转载 2017-12-01 20:36:51 · 4008 阅读 · 0 评论 -
图像处理的几种方法
图像处理的几种方法1.使用skimage name details name details name details astronaut 宇航员图片 coffee 一杯咖啡图片 lena lena图片 camera 拿相机的人图片 coins 硬币 moon 月亮 checkerboard 棋盘 horse 马原创 2017-12-09 19:15:34 · 5713 阅读 · 0 评论 -
使用logisticRegression识别手写数字
画出数字from sklearn.datasets import load_digitsdigits=load_digits()fig=plt.figure(figsize=(6,6))fig.subplots_adjust(left=0,right=1,bottom=0,top=1,hspace=0.05,wspace=0.05)#绘制数字:每张图像8*8像素点for i in rang转载 2017-12-08 14:16:37 · 1526 阅读 · 0 评论 -
python2 与 python3 语法区别
概述#原稿地址:使用2to3 将代码移植到 Python 3几乎所有的Python 2程序都需要一些修改才能正常地运行在Python 3的环境下。为了简化这个转换过程,Python 3自带了一个叫做2to3的实用脚本(Utility Script),这个脚本会将你的Python 2程序源文件作为输入,然后自动将其转换到Python 3的形式。案例研究:将chardet移植到Python 3(p转载 2017-11-14 09:19:06 · 290 阅读 · 0 评论 -
欢迎使用优快云-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl转载 2017-11-14 02:15:34 · 164 阅读 · 0 评论 -
正则表达式爬虫1
正则表达式小例子import reli='hellonihaohello'a=re.search(r'\Ahello',li)print a.group()b=re.search(r'hello\Z',li)print b.group()li='i have a dream'c=re.search(r'\bhave\b',li)print c.group() content = '原创 2017-12-13 17:56:45 · 317 阅读 · 0 评论