- 博客(13)
- 资源 (1)
- 收藏
- 关注
原创 scrapy 爬取某图源码
spiders写法:中meizi.py -- coding: utf-8 -- import scrapy import os,random import requests from pypinyin import lazy_pinyin from Meizi.items import MeiziItem UA=[ {‘User-Agent’:‘Mozilla/5.0 (Macintosh; U;...
2020-01-04 15:33:59
862
原创 SSM IDEA 配置
1.首先配置pom.xml引入相关jar包 如下: <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/...
2019-12-31 10:09:51
175
转载 我的机器学习之路-sklearn
1、广义线性回归 目标值 y 是输入变量 x 的线性组合。 数学概念表示为:如果y1 是预测值,那么有: y(w, x) = w_0 + w_1 x_1 + … + w_p x_p 在整个模块中,我们定义向量 w = (w_1,…, w_p) 作为 coef_ ,定义 w_0 作为 intercept_ 一元回归也叫做最小二乘法 使用 X 的奇异值分解来计算最小二乘解其复杂度为如果 X 是一个 s...
2019-07-05 13:22:20
263
原创 爬虫小练手
import requests,random,time from lxml import etree UA=[ ‘Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50’, ‘Mozilla/5.0 (Windo...
2019-05-02 14:11:30
176
转载 Python爬虫,get方法的封装
大家经常使用Python3的urllib库进行get请求,得到数据,来封装爬虫的行为。下面封装了一个方法供大家参考使用: 这里比较规范的使用了工程化的思想,考虑了日志的编写;爬虫发送get请求时,则考虑了UA等http request head部分的设置;并且支持代理服务器的信息处理;返回的状态码不是200时的处理;并且考虑了超时问题,及网页的编码问题 import sys import lo...
2018-11-28 10:46:26
435
原创 python连接mysql封装即可使用
from pymysql import *#python中调用pymysql class Mysqlpython: def __init__(self,database, host="localhost", user="root", password="123456", ...
2018-11-28 10:31:20
1904
原创 python小脚本邮件微信发送
微信发送: from threading import Timer from wxpy import * import requests from wechat_sender import Sender bot = Bot() #bot = Bot(console_qr=2,cache_path="botoo.pkl") #这里的二维码是用像素的形式打印出来!,如果你在win环境上运行,替换为...
2018-11-28 10:22:46
1399
转载 python进程
进程: 程序在计算机中的一次执行过程, 进程是一个动态的过程,占有计算机资源,有一定的生命周期 * 同一个程序不同的运行过程是不同的进程。因为分配的资源和生命周期都不相同 进程的创建流程 1. 用户启动一个程序或者调用接口发起进程创建 2. 操作系统接收用户请求分配计算机资源创建进程 3. 操作系统将一定状态的进程提供给用户使用 4. 用户利用操作系统提供的进程完成任务 进程相关概念 c...
2018-11-21 20:00:28
265
转载 mysql 高级
1、外键(foreign key) 1、定义 :让当前表字段的值在另一个表的范围内选择 2、语法 foreign key(参考字段名) references 主表(被参考字段名) on delete 级联动作 on update 级联动作 3、使用规则 1、主表、从表字段数据类型要一致 2、主表被参考字段 :主键 4、示例 表...
2018-11-21 15:38:03
189
转载 mongo(无关系型文档数据库)
第一天 MongoDB (芒果数据库) 数据存储阶段 文件管理阶段 (.txt .doc .xls) 优点 : 数据可以长期保存 数据有一定格式化规范 可以大量存储 使用简单方便 缺点 :数据一致性差 用户查找修改不方便 数据冗余 数据库管理阶段 优点 : 数据组...
2018-11-18 10:39:55
590
转载 git代码协同管理工具
代码协同管理工具 SVN GIT 什么是git git是一个开源的分布式版本控制系统。用于高效敏捷的管理大小项目代码。 git特点 * git 可以管理各种文件,特别是代码项目。多使用在*nix系统中 * 是分布式管理,不同于集中管理。这是git和svn的核心区别 * 更好的支持分支 * 拥有全球唯一的版本号 * 代码安全性更加有保证 * 开源方便,数据传输速度更快,可以无网络操作 ...
2018-11-18 10:11:23
714
转载 数据库连接池技术
正常数据库连接 #建立数据库 db = pymysql.connect(user="root",password='123456',port=3306,host=localhost,database="mysql",charset="utf-8") #创建游标 cur = db.cursor() #游标方法 cur.execute("") #提交到数...
2018-11-16 18:08:27
638
python机器学习
2018-10-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人