- 博客(14)
- 收藏
- 关注
转载 PCA降维的数学推导
http://blog.codinglabs.org/articles/pca-tutorial.htmlPCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇...
2018-03-09 17:19:32
1248
转载 基于scikit-learn包实现机器学习之KNN(K近邻)
sklearn内置数据集数据是机器学习的关键,在机器学习工作中我们需要花费大量的时间来采集和整理数据,合理且科学的数据是得到良好机器学习效果的关键。一般而言,一个分类问题的机器学习过程需要用到四块数据内容,分别是:训练数据,一般用train来表示训练数据的分类属性,一般用target来表示测试数据,一般用test来表示测试数据的真实分类属性,用于评估分类器性能,一般用expecte
2018-01-22 01:04:00
456
转载 linux上通过virtualenv部署虚拟环境
virtualenv可以搭建虚拟且独立的python环境,可以使每个项目环境与其他项目独立开来,保持环境的干净,解决包冲突问题。一、安装virtualenv virtualenv实际上是一个python包,所以我们可以用easy_install或者pip安装。下面介绍在CentOS系统上的安装方法。 easy_install安装方式:
2017-12-19 21:59:03
2252
原创 uuid简单用法
uuid可用于给各文件命名 import uuid a = uuid.uuid4() print(a)输出UUID(‘240603a6-daf5-4153-9bdb-eaaf42ef32ac’)
2017-11-07 17:47:03
1910
转载 Fiddler使用,http原理
Fiddler的基本介绍 Fiddler的官方网站: www.fiddler2.com Fiddler的官方帮助:http://docs.telerik.com/fiddler/knowledgebase/quickexec Fiddler官方网站提供了大量的帮助文档和视频教程, 这是学习Fiddler的最好资料。 Fiddler是最强大最好用的Web调试工具
2017-11-07 13:29:51
856
转载 selenium.webdriver中添加代理
Firefox中设置代理ip method_1 from selenium import webdriver profile = webdriver.FirefoxProfile() profile.set_preference(‘network.proxy.type’, 1) profile.set_preference(‘network.proxy.http’, ‘127.0.0.
2017-10-26 00:14:38
3148
1
原创 ChainMap用法
from collections import ChainMap这是ChainMap的parents和new_child()用法values = ChainMap() values[‘x’] = 3 values = values.new_child() values[‘x’] = 2 print(values) values = values.new_child() print(val
2017-10-21 11:20:36
1049
转载 _slots_用法
class Student(object): slots = (‘name’, ‘age’) # 用tuple定义允许绑定的属性名称class GraduateStudent(Student): passs = Student() # 创建新的实例 s.name = ‘Michael’ # 绑定属性’name’ s.age = 25 # 绑定属性’age’ERROR: Att
2017-10-21 10:55:36
413
转载 可变长参数列表*args,**kwargs
或者可以叫做,在Python中如何使用可变长参数列表函数定义 这是一种特殊的语法,在函数定义中使用*args和kwargs传递可变长参数. *args用作传递非命名键值可变长参数列表(位置参数); kwargs用作传递键值可变长参数列表下面的例子传递一个位置参数以及两个可变长参数def test_var_args(farg, *args): print “formal arg:”, fa
2017-10-21 10:47:23
377
转载 scrapy传递item
def parse(self, response): # collect `item_urls` for item_url in item_urls: yield Request(url=item_url, callback=self.parse_item) def parse_item(self, response):
2017-10-20 00:42:47
1003
原创 webdriver保存验证码截图
element = wait.until ( EC.visibility_of_element_located((By.CSS_SELECTOR,'.quc-main .quc-field-captcha img'))) #获取验证码browser.save_screenshot('screenshot.png')left = element.location['x']
2017-10-18 23:32:39
1210
转载 webdriver.chrome()禁止加载图片
from selenium import wendriverchrome_options = webdriver.ChromeOptions()prefs = {"profile.managed_default_content_settings.images": 2}chrome_options.add_experimental_option("prefs", prefs)browser
2017-10-18 21:31:58
13233
原创 python中过滤器filter用法
#第一个参数是一个返回bool值的一般函数或lambda函数,第二个参数是一个可迭代对象#最后返回一个可迭代对象,可以通过list获得def is_positive(item): return item>0values = [1,-2,3,-4]print(filter(is_poditive,values))a = list(filter(is_positive,values)
2017-10-10 21:40:31
11117
原创 Beautiful学习笔记
```pythonfrom bs4 import BeautifulSoup```# # 标签选择总结:获取tag时,总是获取第一个,若返回结果只有一个,则直接返回元素,若结果有多个,以迭代器返回,通过enumerate返回,两个标签之间若有换行,则有一个"\n "标签# 标签选择器### 选择元素(只返回第一个匹配标签)```pythonhtml = """
2017-10-08 16:52:54
309
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人