
python
文章平均质量分 71
七十二时雲
这个作者很懒,什么都没留下…
展开
-
Django常用配置
MySQL数据库DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': '数据库名字', 'PORT': 3306, 'HOST': '数据库IP地址', 'USER': '数据库用户名', 'PAS...原创 2018-10-31 12:53:36 · 194 阅读 · 0 评论 -
python3-cookbook 学习笔记(一)
一、数据结构与算法序列操作:序列解包占位符:_ 占位需要丢弃的值 解包可迭代对象:* 产生一个列表对象,解压不确定个数或任意个数的可迭代对象时使用 想要解压后丢弃的值可使用*_或*ign(ignore) 命名切片: slice() 创建切片对象 属性:start、stop、step 方法:indices(size) 映射到一个已知大小...原创 2019-04-30 14:55:13 · 367 阅读 · 0 评论 -
Python虚拟环境--virtualenv
安装pip install virtualenv使用: 创建一个虚拟环境: cd my_project_dirvirtualenv venv #venv为虚拟环境目录名,目录名自定义 virtualenv venv 将会在当前的目录中创建一个文件夹,包含了Python可执行文件,以及 pip 库的一份拷贝,这样就能安装其他包了。虚拟环境的名字(此例中是 venv )可...原创 2019-01-23 13:09:25 · 167 阅读 · 0 评论 -
python写的一些小功能合集(持续更新ing)
获取字典中的objkey对应的值,适用于字典嵌套# dict:字典# objkey:目标key# default:找不到时返回的默认值def dict_get(dict, objkey, default): for k, v in dict.items(): if k == objkey: return v else: ...原创 2019-04-30 14:19:47 · 304 阅读 · 0 评论 -
整理了一些工作(学习)中用到的python包
爬虫requests HTTP客户端库 urllib 处理url selenium 提供所有WebDriver的实现 beautifulsoup 从web页面获取信息 lxml 解析html和xml,支持xpath解析数据(数据分析/机器学习/自然语言处理/数据可视化...)keras 构建深度学习原型(基Tensorflow/Theano/C...原创 2019-04-30 14:52:36 · 358 阅读 · 0 评论 -
python:ImportError: No module named 'setuptools'
两种方法安装setuptools:===1===Python 2.x: sudo apt-get install python-setuptoolsPython 3.x: sudo apt-get install python3-setuptools如果安装后出现以下错误:AttributeError: module 'setuptools.dist' has no a...原创 2019-04-26 10:29:30 · 26699 阅读 · 7 评论 -
pip错误 ImportError: No module named _internal
2.x:curl https://bootstrap.pypa.io/get-pip.py -o get-pip.pypython2.7 get-pip.py --force-reinstall如果上述方法未能解决,尝试以下方法python2 -m pip install --user --upgrade pip3.x:wget https://bootstrap...原创 2019-05-09 11:41:44 · 1561 阅读 · 0 评论 -
python setup.py build 编译错误
1 fatal error: Python.h:原因:没有安装python的开发环境以及开发包解决:sudo apt-get install python-dev2fatal error: fuzzy.h原因:头文件丢失,通常为缺少对应的开发包解决:sudo apt install libfuzzy-dev...原创 2019-05-22 16:50:06 · 9068 阅读 · 1 评论 -
cuckoo1.2安装详解
本文仅安装说明,安装过程中如遇问题请参考另一篇cuckoo避坑指南环境:VMware14.1.3host: Ubuntu16.04guest: xp****************************************host安装配置**************************************************建议安装aptitude (包管理工...原创 2019-05-28 18:28:11 · 4090 阅读 · 0 评论 -
32个爬虫项目
WechatSogou [1]- 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。DouBanSpider [2]- 豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的She...转载 2019-06-11 10:24:40 · 922 阅读 · 0 评论 -
python 内存管理
Python中的内存管理涉及包含所有Python对象和数据结构的私有堆。Python内存管理器在内部确保对此私有堆的管理。需要注意的是,Python堆的管理是由解释器本身执行的,并且用户无法控制它。从源码来看,分为以下几层:level +3:内置类型分配器 level +2:python对象分配器 level +1:python原生内存分配器 level 0:底层通用分配器 l...原创 2024-12-23 14:08:25 · 804 阅读 · 0 评论 -
sklearn DecisionTree原理及实例
决策树原理:树,信息增益原创 2018-10-20 15:02:41 · 3812 阅读 · 0 评论 -
Python的22个编程技巧
1. 原地交换两个数字Python 提供了一个直观的在一行代码中赋值与交换(变量值)的方法,请参见下面的示例:x,y= 10,20print(x,y) # (10, 20)x,y= y,xprint(x,y) # (20, 10)赋值的右侧形成了一个新的元组,左侧立即解析(unpack)那个(未被引用的)元组到变量 和 。一旦赋值完成,新的元组变成了未被引用状...转载 2018-09-03 23:00:33 · 238 阅读 · 0 评论 -
python BeautifulSoup
对象的种类:Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag 、NavigableString 、BeautifulSoup、Comment 。1 Tag:Tag 对象与XML或HTML原生文档中的tag相同Tag对象属性 属性 解释 属性 解释 .name 获取tag的名字...原创 2018-09-19 20:32:09 · 439 阅读 · 0 评论 -
python urllib库基本使用
urllib是python提供的一个爬虫的原生框架,python发起网络请求都是通过该框架 1 request.urlopen(url) 打开远程连接 返回值是一个响应对象,响应对象包含响应头和响应体【注意】urlopen()这个函数只能用于发送简单的请求,无法添加请求头,添加请求头需要使用request.Request()方法import urllib.request...原创 2018-09-20 15:52:21 · 1805 阅读 · 0 评论 -
python Panads
Panads是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的,其纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具,Panads的数据类型包含Series、DataFrame和Panel.本文主要介绍Series和DataFrame类型的基本使用方法。import numpy as npimport pandas as pdfrom pandas ...原创 2018-10-14 18:14:32 · 613 阅读 · 0 评论 -
Scrapy运行流程
Scrapy组件:* 引擎【Engine】:处理整个系统的数据流处理 触发事务* 调度器【Scheduler】:接收Engine发来的请求并压入队列,在请求时执行出队* 下载器【Downloader】:通过Engine拿到调度器出队的URL执行下载操作,并将response返回给Spiders* 爬虫【Spiders】:从Downloader返回的response中提取item,即实体(...原创 2018-10-12 21:42:44 · 986 阅读 · 0 评论 -
python NumPy
NumPy中数据类型包含array(数组)、matrix(矩阵)和character(字符串数组)。array类旨在成为用于多种数值计算的通用n维数组,matrix类则专门用于促进线性代数计算,而chararray类的存在是为了向后兼容Numarray(不建议用于新开发)。本文主要介绍array类及其子类matrix的基本使用方法。#导入numpy库import numpy as np...原创 2018-10-11 20:00:29 · 327 阅读 · 0 评论 -
scikit-learn K-近邻算法(KNN)
k-近邻算法原理:采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定。 缺点:时间复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。 工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据 与所属分类的对应关系。输人没有标签的新数据后,将新数据的每个特征与样本集中数据对应的 特征进行比较,...原创 2018-10-17 18:18:56 · 6151 阅读 · 0 评论 -
scikit-learn 线性回归 原理与使用
一、 普通线性回归数学依据:最小二乘法(y - w*x)^2 y^2 - 2*w*x*y + x^2*w^2-2xy + 2x^2*w = 0-y + wx = 0xw = yxTxw = xTy # 两边乘以xT 转置矩阵w = (xTx)^-1(xTy) # 平方和最小的情况:w在求导时为0 Attibutescoef_ : 变量中的系数。sh...原创 2018-10-19 20:27:55 · 621 阅读 · 0 评论 -
scikit-learn fetch_olivetti_faces人脸识别实例
分别使用线性回归,岭回归,KNN,以及ExtraTrees回归进行分析from sklearn.linear_model import LinearRegression,Ridgefrom sklearn.neighbors import KNeighborsRegressorfrom sklearn.ensemble import ExtraTreesRegressorimport sk...原创 2018-10-19 21:30:21 · 5460 阅读 · 2 评论 -
scikit-learn LogisticRegression原理及实例
Attibutescoef_ : 变量中的系数。shape (1, n_features) or (n_classes, n_features)intercept_ :截距。shape (1,) or (n_classes,)n_iter_ :所有类的实际迭代次数。shape (n_classes,) or (1, )Methodsdecision_function(X):预测样...原创 2018-10-20 11:23:35 · 4379 阅读 · 0 评论