- 博客(13)
- 资源 (1)
- 收藏
- 关注
原创 scrapy 爬取某图源码
spiders写法:中meizi.py-- coding: utf-8 --import scrapyimport os,randomimport requestsfrom pypinyin import lazy_pinyinfrom Meizi.items import MeiziItemUA=[{‘User-Agent’:‘Mozilla/5.0 (Macintosh; U;...
2020-01-04 15:33:59
851
原创 SSM IDEA 配置
1.首先配置pom.xml引入相关jar包如下:<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/...
2019-12-31 10:09:51
165
转载 我的机器学习之路-sklearn
1、广义线性回归目标值 y 是输入变量 x 的线性组合。 数学概念表示为:如果y1 是预测值,那么有:y(w, x) = w_0 + w_1 x_1 + … + w_p x_p在整个模块中,我们定义向量 w = (w_1,…, w_p) 作为 coef_ ,定义 w_0 作为 intercept_一元回归也叫做最小二乘法使用 X 的奇异值分解来计算最小二乘解其复杂度为如果 X 是一个 s...
2019-07-05 13:22:20
249
原创 爬虫小练手
import requests,random,timefrom lxml import etreeUA=[‘Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50’,‘Mozilla/5.0 (Windo...
2019-05-02 14:11:30
165
转载 Python爬虫,get方法的封装
大家经常使用Python3的urllib库进行get请求,得到数据,来封装爬虫的行为。下面封装了一个方法供大家参考使用:这里比较规范的使用了工程化的思想,考虑了日志的编写;爬虫发送get请求时,则考虑了UA等http request head部分的设置;并且支持代理服务器的信息处理;返回的状态码不是200时的处理;并且考虑了超时问题,及网页的编码问题import sysimport lo...
2018-11-28 10:46:26
422
原创 python连接mysql封装即可使用
from pymysql import *#python中调用pymysqlclass Mysqlpython: def __init__(self,database, host="localhost", user="root", password="123456", ...
2018-11-28 10:31:20
1881
原创 python小脚本邮件微信发送
微信发送:from threading import Timerfrom wxpy import *import requestsfrom wechat_sender import Senderbot = Bot()#bot = Bot(console_qr=2,cache_path="botoo.pkl") #这里的二维码是用像素的形式打印出来!,如果你在win环境上运行,替换为...
2018-11-28 10:22:46
1387
转载 python进程
进程:程序在计算机中的一次执行过程, 进程是一个动态的过程,占有计算机资源,有一定的生命周期* 同一个程序不同的运行过程是不同的进程。因为分配的资源和生命周期都不相同进程的创建流程1. 用户启动一个程序或者调用接口发起进程创建2. 操作系统接收用户请求分配计算机资源创建进程3. 操作系统将一定状态的进程提供给用户使用4. 用户利用操作系统提供的进程完成任务进程相关概念c...
2018-11-21 20:00:28
252
转载 mysql 高级
1、外键(foreign key) 1、定义 :让当前表字段的值在另一个表的范围内选择 2、语法 foreign key(参考字段名) references 主表(被参考字段名) on delete 级联动作 on update 级联动作 3、使用规则 1、主表、从表字段数据类型要一致 2、主表被参考字段 :主键 4、示例 表...
2018-11-21 15:38:03
180
转载 mongo(无关系型文档数据库)
第一天MongoDB (芒果数据库)数据存储阶段文件管理阶段 (.txt .doc .xls)优点 : 数据可以长期保存 数据有一定格式化规范 可以大量存储 使用简单方便缺点 :数据一致性差 用户查找修改不方便 数据冗余数据库管理阶段优点 : 数据组...
2018-11-18 10:39:55
577
转载 git代码协同管理工具
代码协同管理工具SVN GIT什么是gitgit是一个开源的分布式版本控制系统。用于高效敏捷的管理大小项目代码。git特点* git 可以管理各种文件,特别是代码项目。多使用在*nix系统中* 是分布式管理,不同于集中管理。这是git和svn的核心区别* 更好的支持分支* 拥有全球唯一的版本号* 代码安全性更加有保证* 开源方便,数据传输速度更快,可以无网络操作...
2018-11-18 10:11:23
696
转载 数据库连接池技术
正常数据库连接 #建立数据库 db = pymysql.connect(user="root",password='123456',port=3306,host=localhost,database="mysql",charset="utf-8")#创建游标cur = db.cursor()#游标方法cur.execute("")#提交到数...
2018-11-16 18:08:27
627
python机器学习
2018-10-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人