独行特立喵-优快云博客

转载 PCA降维的数学推导

http://blog.codinglabs.org/articles/pca-tutorial.htmlPCA（Principal Component Analysis）是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示，可用于提取数据的主要特征分量，常用于高维数据的降维。网上关于PCA的文章有很多，但是大多数只描述了PCA的分析过程，而没有讲述其中的原理。这篇...

2018-03-09 17:19:32 1292

转载基于scikit-learn包实现机器学习之KNN(K近邻)

sklearn内置数据集数据是机器学习的关键，在机器学习工作中我们需要花费大量的时间来采集和整理数据，合理且科学的数据是得到良好机器学习效果的关键。一般而言，一个分类问题的机器学习过程需要用到四块数据内容，分别是：训练数据，一般用train来表示训练数据的分类属性，一般用target来表示测试数据，一般用test来表示测试数据的真实分类属性，用于评估分类器性能，一般用expecte

2018-01-22 01:04:00 492

转载 linux上通过virtualenv部署虚拟环境

virtualenv可以搭建虚拟且独立的python环境，可以使每个项目环境与其他项目独立开来，保持环境的干净，解决包冲突问题。一、安装virtualenv virtualenv实际上是一个python包，所以我们可以用easy_install或者pip安装。下面介绍在CentOS系统上的安装方法。 easy_install安装方式：

2017-12-19 21:59:03 2293

原创 uuid简单用法

uuid可用于给各文件命名 import uuid a = uuid.uuid4() print(a)输出UUID(‘240603a6-daf5-4153-9bdb-eaaf42ef32ac’)

2017-11-07 17:47:03 1940

转载 Fiddler使用，http原理

Fiddler的基本介绍　　Fiddler的官方网站: www.fiddler2.com Fiddler的官方帮助：http://docs.telerik.com/fiddler/knowledgebase/quickexec　　Fiddler官方网站提供了大量的帮助文档和视频教程，这是学习Fiddler的最好资料。　　Fiddler是最强大最好用的Web调试工具

2017-11-07 13:29:51 883

转载 selenium.webdriver中添加代理

Firefox中设置代理ip 　　method_1 from selenium import webdriver profile = webdriver.FirefoxProfile() profile.set_preference(‘network.proxy.type’, 1) profile.set_preference(‘network.proxy.http’, ‘127.0.0.

2017-10-26 00:14:38 3194 1

原创 ChainMap用法

from collections import ChainMap这是ChainMap的parents和new_child()用法values = ChainMap() values[‘x’] = 3 values = values.new_child() values[‘x’] = 2 print(values) values = values.new_child() print(val

2017-10-21 11:20:36 1079

转载 _slots_用法

class Student(object): slots = (‘name’, ‘age’) # 用tuple定义允许绑定的属性名称class GraduateStudent(Student): passs = Student() # 创建新的实例 s.name = ‘Michael’ # 绑定属性’name’ s.age = 25 # 绑定属性’age’ERROR: Att

2017-10-21 10:55:36 452

转载可变长参数列表*args,**kwargs

或者可以叫做，在Python中如何使用可变长参数列表函数定义这是一种特殊的语法，在函数定义中使用*args和kwargs传递可变长参数. *args用作传递非命名键值可变长参数列表（位置参数）; kwargs用作传递键值可变长参数列表下面的例子传递一个位置参数以及两个可变长参数def test_var_args(farg, *args): print “formal arg:”, fa

2017-10-21 10:47:23 406

转载 scrapy传递item

def parse(self, response): # collect `item_urls` for item_url in item_urls: yield Request(url=item_url, callback=self.parse_item) def parse_item(self, response):

2017-10-20 00:42:47 1040

原创 webdriver保存验证码截图

element = wait.until ( EC.visibility_of_element_located((By.CSS_SELECTOR,'.quc-main .quc-field-captcha img'))) #获取验证码browser.save_screenshot('screenshot.png')left = element.location['x']

2017-10-18 23:32:39 1254

转载 webdriver.chrome()禁止加载图片

from selenium import wendriverchrome_options = webdriver.ChromeOptions()prefs = {"profile.managed_default_content_settings.images": 2}chrome_options.add_experimental_option("prefs", prefs)browser

2017-10-18 21:31:58 13340

原创 python中过滤器filter用法

#第一个参数是一个返回bool值的一般函数或lambda函数，第二个参数是一个可迭代对象#最后返回一个可迭代对象，可以通过list获得def is_positive(item): return item>0values = [1,-2,3,-4]print(filter(is_poditive,values))a = list(filter(is_positive,values)

2017-10-10 21:40:31 11184

原创 Beautiful学习笔记

```pythonfrom bs4 import BeautifulSoup```# # 标签选择总结：获取tag时，总是获取第一个，若返回结果只有一个，则直接返回元素，若结果有多个，以迭代器返回，通过enumerate返回，两个标签之间若有换行，则有一个"\n "标签# 标签选择器### 选择元素(只返回第一个匹配标签)```pythonhtml = """

2017-10-08 16:52:54 340

u014197417的博客