- 博客(307)
- 资源 (6)
- 收藏
- 关注
原创 导数记录
偏导数是对一个变量求导,另一个变量当做数对x求偏导的话y就看作一个数,描述的是x方向上的变化率对y求偏导的话x就看作一个数,描述的是y方向上的变化率几何意义对x求偏导是曲面z=f(x,y)在x方向上的切线对y求偏导是曲面z=f(x,y)在x方向上的切线偏增量:x增加时f(x,y)增量或y增加时f(x,y)偏微分:在detax趋进于0时偏增量的线性主要部分detaz=fx(x,y)detax+o(detax)...
2020-07-31 10:24:10
377
转载 机器学习评估
1.介绍有三种不同的方法来评估一个模型的预测质量:estimator的score方法:sklearn中的estimator都具有一个score方法,它提供了一个缺省的评估法则来解决问题。Scoring参数:使用cross-validation的模型评估工具,依赖于内部的scoring策略。见下。Metric函数:metrics模块实现了一些函数,用来评估预测误差。见下。2.
2017-01-12 19:24:47
812
转载 python pycurl模块
转自:http://www.cnblogs.com/gide/p/5650655.html一、pycurl概述PycURl是一个C语言写的libcurl的python绑定库。libcurl 是一个自由的,并且容易使用的用在客户端的 URL 传输库。它的功能很强大,在PyCURL的主页上介绍的支持的功能有:FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET,
2016-10-15 11:05:03
6757
转载 Python爬虫之自动登录与验证码识别
转自:http://blog.youkuaiyun.com/tobacco5648/article/details/50640691在用爬虫爬取网站数据时,有些站点的一些关键数据的获取需要使用账号登录,这里可以使用requests发送登录请求,并用Session对象来自动处理相关Cookie。另外在登录时,有些网站有时会要求输入验证码,比较简单的验证码可以直接用pytesser来识别,复杂的验
2016-10-03 13:20:31
2744
转载 Python爬虫教程——模拟登录
转自:http://zqdevres.qiniucdn.com/data/20130909104208/index.html前面 我们介绍了如何获取页面的部分内容 和 模拟浏览器发送请求在前面的部分中 我们发送的请求使用的都是GET方法在HTTP请求中 还有一种请求方法也很常用 那就是POST方法GET方法是从服务器获取响应 POST方法是向服务器发送数据 然后接受响应
2016-09-29 08:54:01
8924
转载 linux下杀死进程(kill)的N种方法
转载一篇,最原始的出处已不可考,望见谅!常规篇: 首先,用ps查看进程,方法如下:$ ps -ef……smx 1822 1 0 11:38 ? 00:00:49 gnome-terminalsmx 1823 1822 0 11:38 ? 00:00:00 gnome-pty-helper
2016-08-19 13:54:24
18479
1
转载 树莓派启动浏览器
第一步,首先下载安装Google的Chrome浏览器:wget http://ftp.us.debian.org/debian/pool/main/libg/libgcrypt11/libgcrypt11_1.5.0-5+deb7u3_armhf.deb如果下载不了, 可以直接到上一层目录找最新版本wget http://launchpadlibrarian.net/218
2016-06-28 15:46:49
8548
转载 树莓派项目汇总(整理)
几个网站和论坛推荐树莓派可用软件包一览 http://www.raspberryconnect.com/raspbian-packages-listhttp://www.raspberrypi-spy.co.uk/极客工坊:http://www.geek-workshop.com/forum-
2016-06-17 18:25:17
13818
转载 python将py文件转换为pyc
其实很简单,用python -m py_compile file.pypython -m py_compile /root/src/{file1,file2}.py编译成pyc文件。也可以写份脚本来做这事:Code:import py_compile py_compile.compile('path') //path是包括.py文件名的路径
2016-05-17 17:15:48
18010
转载 linux itables控制防火墙
2.1 框架图 -->PREROUTING-->[ROUTE]-->FORWARD-->POSTROUTING--> mangle | mangle ^ mangle nat | filter | nat | | | |
2016-05-11 17:19:37
1039
原创 python邮件发送
#!/usr/bin/python# -*- coding: UTF-8 -*-import smtplibfrom email.mime.text import MIMETextfrom email.header import Header# 第三方 SMTP 服务mail_host="smtp.163.com" #设置服务器mail_user="*****" #用户名
2016-05-05 10:21:14
631
转载 机器学习算法 原理、实现与实战——模型评估与模型选择
1. 训练误差与测试误差机器学习的目的是使学习到的模型不仅对已知数据而且对未知数据都能有很好的预测能力。假设学习到的模型是Y=f^(X)Y=f^(X),训练误差是模型Y=f^(X)Y=f^(X)关于训练数据集的平均损失:Remp(f^)=1N∑i=1NL(yi,f^(xi))Remp(f^)=1N∑i=1NL(yi,f^(xi))其中NN是训练样本容量。
2016-04-09 19:52:44
4830
转载 支持向量机理解
(一)SVM的背景简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Ac
2016-03-21 22:11:01
4446
1
原创 svm支持向量机相关参数
C是惩罚系数 就是说你对误差的宽容度 这个值越高,说明你越不能容忍出现误差 gamma是你选择径向基函数作为kernel后,该函数自带的一个参数。隐含地决定了数据映射到新的特征空间后的分布。
2016-03-20 14:27:42
4895
转载 python 数据处理清洗
1.背景 项目需要,打算用python实现矩阵的去噪和归一化。用numpy这些数学库没有找到很理想的函数,所以一怒之下自己用标准库写了一个去噪和归一化的算法,效率有点低,不过还能用,大家如果有需要可以拿去。 (1)去噪算法:根据概率论的知识,如果一组数据服从正态分布,我们设均值是n,方差是v,那么对于每个离散数值有百分之九十二以上的概率会在(n-3*v,n+3*v)的区间内。所
2016-03-19 15:37:16
5881
转载 python的splinter实现浏览器操作
python splinterimport timefrom splinter import Browserimport win32apidef splinter(url): #open the chrome browser,need to download the chrome driver #browser = Browser('chrome') brows
2016-02-07 12:08:09
8710
转载 树莓派穿透内网
家里的宽带没有公网IP,从外面没有办法SSH到树莓派上。如果有公网IP的话,现在一般的路由器都支持端口转发功能,在路由器的管理界面添加一条转发规则即可。不过有一天,我突然想到了SSH的端口转发功能,其实很简单的一条命令:ssh -N -f -R 8022:localhost:22 xxx@remote-host.com简单解释一下,-N表示了不要执行任何命令,-f表示在后台执
2016-01-15 15:28:45
3477
转载 cx_oracle设置问题汇总
cxoracle版本与oracle instantclient版本 必须严格匹配(花了很多时间)http://cx-oracle.sourceforge.net/ oracle 10gcx_Oracle-5.1-10g.win32-py2.6.msiinstantclient-basic-win32-10.2.0.4.zip解压instantclient-b
2016-01-14 12:12:57
1911
转载 python爬山算法
这篇文章主要介绍了爬山算法,爬山法(climbing method)是一种优化算法,其一般从一个随机的解开始,然后逐步找到一个最优解(局部最优)然后用Python实现了这个算法,需要的朋友可以参考下一、爬山法简介爬山法(climbing method)是一种优化算法,其一般从一个随机的解开始,然后逐步找到一个最优解(局部最优)。 假定所求问题有多个参数,我们在通过爬
2016-01-11 16:14:04
7096
2
转载 python求最优解的集中算法
优化算法通常用来处理问题最优解的求解--这个问题有多个变量共同决定的,举一个例子比如有这样一张 人员关系表,需要绘制一张SOSO华尔兹(一种socialnetwork,http://tag.soso.com/),比如: 绘制方法有很多种,我们希望能够最终展现给用户的绘制是比较好阅读的,比如交叉线比较少,每个人的点排的比较开等等。 我们利用以下一个数据格式来描述最
2016-01-11 16:00:04
24228
转载 用Sklearn做判别测试
这里我使用pandas来加载数据集,数据集采用kaggle的titanic的数据集,下载train.csv。import pandas as pddf = pd.read_csv('train.csv')df = df.fillna(0) #将缺失值都替换为0df.head()PassengerIdSurvivedPclassName
2016-01-08 17:58:44
6693
转载 使用国内镜像源来加速python pypi包的安装
pipy国内镜像目前有: http://pypi.douban.com/ 豆瓣http://pypi.hustunique.com/ 华中理工大学http://pypi.sdutlinux.org/ 山东理工大学http://pypi.mirrors.ustc.edu.cn/ 中国科学技术大学 对于pip这种在线安装的方式来说,很方便
2016-01-08 15:30:48
3611
转载 机器学习算法的要点(附 Python 和 R 代码)
前言谷歌董事长施密特曾说过:虽然谷歌的无人驾驶汽车和机器人受到了许多媒体关注,但是这家公司真正的未来在于机器学习,一种让计算机更聪明、更个性化的技术。也许我们生活在人类历史上最关键的时期:从使用大型计算机,到个人电脑,再到现在的云计算。关键的不是过去发生了什么,而是将来会有什么发生。工具和技术的民主化,让像我这样的人对这个时期兴奋不已。计算的蓬勃发展也是一样。如今,
2016-01-07 22:54:25
2144
转载 机器学习算法分类
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。学习方式根据数据类型的不同,对一
2016-01-07 22:30:19
549
转载 Kmeans、Kmeans++和KNN算法比较
K-Means介绍 K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示: 如图所示,数据样本用圆点表示,每个簇的中心点用叉叉表示。(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样
2016-01-07 22:15:08
579
转载 matplotlib windows下安装
反反复复安装又卸载好多次终于把matplotlib安装成功了,主要参考的三个链接:链接1 http://blog.sciencenet.cn/blog-579770-738240.html链接2 http://www.open-open.com/lib/view/open1393488232380.html链接3 http://blog.youkuaiyun.com/yang6464158/art
2015-12-31 13:43:40
3194
转载 python version 2.7 required,which was not found in the registry
安装PIL-1.1.7.win32-py2.7的时候,不能再注册表中识别出来python2.7 方法:新建一个register.py 文件,把一下代码贴进去,保存## script to register Python 2.0 or later for use with win32all# and other extensions that require Python r
2015-12-25 15:13:46
511
原创 python 设置网页全屏显示
备注:安装pyqt1.sudo apt-get -y install python-qt42.sudo apt-get install python-dev3.sudo apt-get install python-xlib
2015-12-01 17:43:57
5209
转载 python pymouse 控制鼠标
最近在做数据抓取的时候,遇到一个问题,关于flash的链接地址是写在flash文件里面的,必须要点击下才能知道下面的链接地址是什么,但是这个点击不能open swf的url地址,这样打开的是flash,不是里面的超链接,怎么办,模拟鼠标操作,让鼠标移动到flash文件上执行点击操作,然后再捕获弹出的视窗,这样就可以捕获弹出的内容来。具体实现,使用外部库PyMouse,使用pip可以直接
2015-12-01 17:39:27
12469
1
转载 edm模版设计
EDM(E-mail marketing 即邮件营销)在几乎所有的商业公司都免不了成为一种重要的推广手段,所以作为一个前端难免还是要与邮件打交道——只是邮件模板的编写和传统页面有很大的不同。很早以前,我写过一篇 line-height导致的邮件图像间隙,那是我第一次遇到诸如此类的问题。文中的两个参考链接是当时最值得一读的两篇专稿,到了今天,它们仍然可以当仁不让地作为最佳实践的准则。只是其中一篇链接
2015-11-13 11:25:56
3623
原创 网络基本知识TCP与UDP
半双工是在同一时刻只单向。是接收或者是发送;全双工是在同一时刻能双向。可以同时接收和发送!主要体现在网卡和路由,好像交换机也是!这是两个工作在TCP/IP协议传输层的两个不同的协议,是用来传输数据用的。TCP:Transfer Control Protocol,传输控制协议。这是一个全双工的、面向连接的、可靠的并且是精确控制的协议。主要是用在那些实时性不
2015-11-07 12:03:37
574
转载 python 文件删除 移动 复制等操作
用python实现了一个小型的自动发版本的工具。这个“自动发版本”有点虚, 只是简单地把debug 目录下的配置文件复制到指定目录,把Release下的生成文件复制到同一指定,过滤掉不需要的文件夹(.svn),然后再往这个指定目录添加几个特定的文件。 这个是我的第一个python小程序。 下面就来看其代码的实现。首先插入必要的库: 1 impor
2015-10-15 16:32:07
6520
转载 python的timer带参数传递
我们经常需要定时的执行某个任务,在Linux下我们有强大的crontab,但是在Python这个粒度(定时执行函数),如何处理呢?除了第三方的模块外,标准库为我们提供了sched模块和Timer类。先说sched模块,准确的说,它是一个调度(延时处理机制),每次想要定时执行某任务都必须写入一个调度。使用步骤如下:(1)生成调度器:s = sched.scheduler(ti
2015-10-01 20:07:20
18386
转载 python连接数据库设置
Pymssql是python用来连接Mssql的一个模块,包含两个扩展模块Pymssql这是遵循DB-API标准的模块_mssql是一个直接操作SQL Server的底层模块,它有很多有用的功能,但是不遵循DB-API标准。 pymssqlCnx类 用于连接Mssql数据库你可以使用pymssql.connect()来初始化连接类。它允许如下的参数。dsn:连接字符串,
2015-10-01 12:33:19
2246
转载 python的list的拷贝
特别注意:lista=listb 不是将listb的值拷贝到lista!!!定义:lista = [2,[4,5]]5种拷贝方式:1.listb = lista[:]2.listb = list(lista)3.listb = [i for i in lista]4.import copy; listb = copy.copy(lista)5.impor
2015-09-30 21:32:23
6790
原创 python 字符串与变量连接
python中变量和字符串的连接字符串中加含变量,一定要内外包围相同。如下输出:table='abc'str1='select * from '+table+''str2="select * from "+table+""str3='select * from "'+table+'"'str4="select * from '"+table+"'"print 's
2015-09-30 15:33:55
17708
转载 SQL语句判断数据库、表、字段是否存在
--判断[TestDB]是否存在if exists(select 1 from master..sysdatabases where name='TestDB') print 'TestDB存在'else print 'TestDB不存在'--判断表[TestTb]是否存在if exists(select * from TestDB..syscolumns
2015-09-30 13:45:39
3057
转载 python连接odbc
在Linux中,如果要使用ODBC并连到MS SQLServer,我们需要为Linux操作系统安装并配置好UnixODBC模块。很多教程中的操作步骤比较复杂,我将其中关键步骤精简到三步:本教程以刚刚安装好的Ubuntu 12.04环境为例:第一步,安装FreeTDS模块:命令:在命令行终端中输入命令:sudo apt-get install tdsodbc并输入管理员密
2015-09-23 20:28:43
7033
matplotlib 1.4.2.win amd64 py2.7
2015-12-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人