- 博客(42)
- 收藏
- 关注

原创 网页三大特征及爬虫思路和流程(爬虫)
网页三大特征:1.网页都有自己唯一的URL(统一资源命令符)来进行定位2.网页都使用HTML(定位超文本标记语言)来描述页面信息3.网页都使用HTTP/HTTPS(超文本传输协议)协议来传输HTML数据爬虫的设计思路:1.首先确定需要爬取的网页URL地址2.通过HTTP/HTTPS协议来获取对应的HTML页面3.提取HTML页面里有用的数据 a.如果是需...
2018-08-10 09:01:20
2168

原创 递归
递归的定义: 递归就是子程序(或函数)直接调用自己或通过一系列调用语句间接调用自己,是一种描述问题和解决问题的基本方 法。递归常用来解决结构相似的问题递归有两个基本要素: 1. 边界条件:确定递归到何时终止,也称为递归出口 ...
2018-06-09 11:57:02
1079

原创 闭包.py
闭包在一个外函数中定义一个内函数,内函数里运用了外函数的临时变量,并且外函数的返回值是内函数的引用。这样就构成了一个闭包。一般情况下,在我们认知当中,如果一个函数结束,函数的内部所有东西都会释放掉,还给内存,局部变量都会消失。但是闭包是一种特殊情况,如果外函数在结束的时候发现有自己的临时变量将会在内部函数中用到,就把这个临时变量绑定给了内部函数,然后自己在结束。def outter(fun): ...
2018-05-23 13:36:01
264

原创 迭代器.py
迭代器:from collections import Iterable迭代器迭代是python最强大的功能之一,是访问集合元素的一种方式。字符串,列表或元组对象都可用于创建迭代器:字符串,列表或元组==>(Iterable object)可迭代对象迭代器是一个可以记住遍历的对象的上一个位置。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问结束。迭代器只能往前不会后退。迭代器有两个...
2018-05-21 10:43:45
227

原创 python二期练习题及答案
请利用filter()过滤出1到100中平方根是整数的数import mathnums=list(filter(lambda x:math.sqrt(x)%1==0,range(1,101)))print(nums)输出结果:[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]def sqrt2(x): flag=False for i in rang...
2018-05-20 17:02:43
1100

原创 异常.py
异常:即便Python程序的语法是正确的,在运行它的时候,也有可能发生错误。运行期检测到的错误被称为异常。异常分类 1可控:通过代码能解决的 2:不可控1 可控 Exception 分类: 1 运行时异常 2 编译时异常try: 有可能发生异常的代码:1/0except 异常类型: 捕获并处理语句excep...
2018-05-19 11:59:49
131

原创 set集合.py
java:list,set,map 动态数组set:集合是一个无序 不重复的集合。无序唯一基本功能包括关系测试和消除重复元素。集合对象还支持union(联合),intersection(交集),difference(差集)和sysmmmetric difference(对称差集)等数学运算。注意:想要创建空集合,必须使用set() 而不是{} {}用于创建空字典:{}set1=set()se...
2018-05-13 13:13:00
613

原创 列表
1.列表的数据项不需要具有相同的类型创建一个列表,只要把逗号分隔的不同数据项使用方括号括起来即可list1=['Google','Runoob',1997,2018];print("list1[0]:",list1[0])列表也可以使用切片:原来字符串的切片这里也可以使用print(list[1:3])2.列表的增,删,改,差增:list1.insert(4,2018),list.append...
2018-05-07 11:00:11
109

原创 Python中lambda表达式
一、lambda表达式形式lambda后面跟一个或多个参数,紧跟一个冒号,以后是一个表达式。冒号前是参数,冒号后是返回值。lambda是一个表达式而不是一个语句。lambda表达式可以出现在Python语法不允许def出现的地方。lambda表达式返回一个值。二、与def的区别lambda用来编写简单的函数,不会再重复利用的函数。而def用来处理强大的任务。...
2018-05-01 17:56:14
151

原创 phython推导式
推导式comprehensions(又称解析式),是Python的一种独有特性。推导式是可以从一个数据序列构建另一个新的数据序列的结构体。 共有三种推导:1.列表(list)推导式2.字典(dict)推导式3.集合(set)推导式一.列表推导式用[]生成list基本表达式[表达式 for in 变量 列表]或者[表达式 for in 变量 列表 if 条件]eg:求(x,y)其中x是0-5之间的偶...
2018-04-30 13:09:58
904
原创 HTTP和HTTPS
HTTP协议(超文本传输协议): 一种发布和接收HTML页面的方法。HTTPS: 在HTTP的基础上加入SSL(安全套接层),用于web的安全传输协议,在传输层对网络进行加密,保障在Internet上数据 传输的安全HTTP的端...
2018-08-13 09:51:06
608
原创 爬虫的种类及相关知识
爬虫: 通用爬虫和聚焦爬虫通用爬虫: 搜索引擎用的爬虫系统 一.目标: 尽可能的把互联网上所有的网页都下载下来,放到本地服务器里形成备份, 再对这些网页做相关处理(提取关键字,去掉广告),最后提供给一个用户检索接口。 二.爬取流程: ...
2018-08-13 08:42:52
2398
原创 数据的获取方式
大数据时代数据获取的方式:1.企业生产的用户数据:大型互联网公司 ,中小企业2.数据咨询管理公司3.政府/机构提供的公开数据4.第三方数据平台购买数据5.爬虫数据获取...
2018-08-10 09:16:32
2970
原创 Get和Post请求的区别(爬虫)
get 和 post请求的区别:Get:请求的url会附带查询参数Post:请求的url不带参数对于Get请求:查询参数在QueryString里保存对于Post请求:查询参数在From表单里保存...
2018-08-10 08:55:54
2320
原创 http请求方法及其get 和 post的区别 状态码
首先要了解 http是基于客户端/服务端的架构模型 url:统一资源定位符 用于描述一个网络的资源其次http常见的方法: get:请求指定的页面,并返回实体主题(获取/查询) put:从客户端向服务端传送的数据取代指定的文档的内容(增) ...
2018-07-17 11:43:11
1074
原创 django开发Web项目步骤
数据需求设计文档设计数据库1.概要设计 抽象 把名词变成表名 基本属性2.详细设计 命名规范 数据格式3.绘制ER图 关系模型图 MySQ...
2018-07-14 11:01:15
844
原创 自定义富文本django分页
django分页1.先导入一个模块 from django.croe.paginator import Paginator2.在views里写一个函数: def welcome(request): blogSet = Blog.objects blogSet = Blog.values('id','title','creatdateTime','BlogUser__uesrna...
2018-07-12 10:31:28
268
原创 如何上传文件,富文本编辑器
本文关于 如何上传文件,富文本编辑器files的使用方法: 文件对象:request.FILES.get() 获取上传的文件对象 文件对象:.name 文件...
2018-07-10 11:37:42
1442
原创 django搭建blog(后期工作)
设计model(数据库表)1.blog表: 打开blog目录下的models.py文件,这是定义blog数据结构的地方2.通过admin管理: 通过Admin后台来管理blog表数据。打开 admin.py 文件3.登录Admin后台添加blog : ...
2018-07-07 11:53:32
171
原创 django搭建blog框架(前期准备工作)
Django:最适合开发有限期的完美web框架A:创建项目:a:创建liudajing项目和blog应用django-admin startproject liudajing #创建liudajing项目liudajing>python manage.py startapp blog #创建blog应用b:项目目录及相关分析blog/ : admin.py : ...
2018-07-05 11:08:53
161
原创 django基础
注册:(按照请求方式分类) 要来注册(GET) get又叫 url 提交 来注册(POST) post主题提交Form 表单提交分2中 get postweb 开发中 页面相应方式 服务器向客户端响应内容2种方式: ...
2018-07-03 10:51:59
150
原创 django框架
C/S : 客户端——服务端B/S : 浏览器——服务端(操作系统 数据库 编辑语言 页面 css js)django 框架py_mysql安装: 第一步:在cmd中输入pip 第二部:输入pip list 第...
2018-06-28 11:39:30
215
原创 MySQL第四章
注释:视图 如何创建视图以及注意事项 索引 常用类型 如何创建/删除索引以及注意事项 查看索引 备份和恢复视图: 虚拟表,通常作为执行查询的结果而创建的,便于快速搜索数据 创建视图: CREATE VIEW索引: 提高搜索速度,改善数据性能 常用索引: ...
2018-06-26 11:35:22
584
原创 事务
注释:什么是事务,事务的特性,如何创建事务以及自动关闭事务和开启事务事务: (transaction)是作为单个逻辑工作单元执行的一系列操作 多个操作作为一个整体向系统提交,要么都执行,要么都不执行 事务是一个不可分割的工作逻辑单元事务的特性:(ACID)属性 原子...
2018-06-23 11:52:20
127
原创 Mysql第三章
EXISTS子查询的语法: SELECT ......FROM 表名 WHERE EXISTS(子查询); 子查询有返回结果:EXISTS子查询结果为TRUE 子查询无返回结果:EXISTS子查询结果为FALSE,外层查询不执行子查询注意事项: ...
2018-06-19 11:10:36
617
原创 MySQL查缺补漏
数据库: 关系型管理系统:RDBMS(Relational Database Management System) 特点: 数据以表格的形式出现 每行为各种记录名称 每列为记录名称所对应的数据域 许多的行和列组成一张表格 若干的表格组成datab...
2018-06-16 12:08:25
278
原创 MySQL续篇
MySQL的存储引擎: 存储引擎的类型:MyISAM,InnoDB,Memory,CSV等9种MyISAM与InnoDB类型主要区别: InnoDo除了不支持全文索引其他的都支持(处理事务,数据行锁定,外键约束),空间大小较大约2倍 ...
2018-06-14 10:01:24
162
原创 mysql
时下流行的数据库: oracle sql server mysql数据库的概念: 就是“数据”的“仓库” 数据库中包含表,关系以及操作对象 数据存放在表中mysql的优势: ...
2018-06-12 11:51:15
128
原创 Python回顾
python中字符串定义的三种方式 '','' '',''' '''list分片处理 list[开始:结束:步长] list[开始:结束]=listdate=[i for i in range(1,21)]date[7:12]=[9,99,999]print(date)输出结果:[1, 2, 3, 4, 5, 6, 7, 9, 99, 999, 13, 14, 15, 16, 17, ...
2018-06-05 11:34:15
121
原创 网络编程.py
学习目标:如何基于socket编程,来开发一款C/S架构(C:client客户端 S:server服务端)软件网络编程:实现计算机与计算机间的通信通信协议: TCP:可靠,有状态的,长连接的协议,像打电话一样 UDP:不可靠,无连接,像发短信一样TCP和UDP属于运输层 创建TCP Scoket: s=socket.socket(socke...
2018-06-02 11:48:58
178
原创 线程.py
线程进程和CPU之间的关系:CPU运行的就是线程,运行的多了就是进程,同时运行了多个线程就变成了多线程(仅限个人理解)概念: 线程:进程中的每个子任务,不能独立存在,CPU执行的最小单位 进程:独立的所有子任务的集合特点: 进程:内存独立,CPU独立,速率低共享数据难,安全性高 线程:内存共享,CPU使用独立,速率高共享数据易,安全性低线程的...
2018-05-31 12:01:12
157
原创 xml
XML可扩展标记语言特点:与操作系统,编程语言的开发平台无关 实现不同系统之间的数据交换作用:数据交互 配置应用程序和网站 节点自由扩展XML文档结构声明:<?xml version="1.0"encoding="UTF-8"?>文档元素描述信息(文档结构)XML标签: XML文档内容由一系列标签元素组成<元素名 ...
2018-05-29 12:07:15
192
原创 文件流I/O.py精简版
本文讲述文件,目录的相关方法 File对象方法: file对象提供了操作文件的一系列方法 OS 对象方法: 提供了处理文件及目录的一系列方法I/O函数输出方法是用print语句,你可以给它传递零个或多个用逗号隔开的表达式。此函数把你传递的表达式转换成一个字符串表达式读取键盘输入 包括raw_input函数和input函数Python提供了两个内置函数从标准输入读入一行文本,默认的标...
2018-05-26 02:12:36
169
原创 枚举.py精简版
本文主要从枚举的相关定义,取值,迭代器,比较四方面讲解1. 枚举的定义(三条)首先,定义枚举要导入enum模块。枚举定义用class关键字,继承Enum类。用于定义枚举的class和定义类的class是有区别(用class定义的类,实际上就是一种类型)from enum import Enumclass Color(Enum): red = 1 orange = 2 y...
2018-05-26 00:39:11
147
原创 函数(带参函数).py精简版
定义带参函数def 函数名称(参数列表): #形式参数 简称:形参 代码块 return[表达式]参数列表 只是占位符,体现参数列表 每个参数都没有提供具体的数值调用带参函数[变量]=带参函数(参数列表) #实际参数 简称:实参为每个参数传递对应的数值按参数顺序将实际参数赋值给形式参数普通的参数称为位置参数调用参数时,传递的...
2018-05-25 10:29:18
424
原创 函数(无参函数).py精简版
函数有组织的,可重复使用的带码块用于执行一个单一的,相关动作的代码块函数的使用 先定义函数 再调用函数分类 无参函数 带参函数定义无参函数def 函数名称(): 代码块 return[表达式]函数以关键字def开始,后跟函数名和小括号"()"函数的代码块以冒号":"开头并缩进return语句退出函数调用如果return后有表达式,则传递返回值;否则,返回none...
2018-05-24 23:49:20
1158
原创 随机数 模块 推导.py
随机数 random时间戳 种子(此时此刻,从他开始扩展)1.random.choice(range(1,34))随机取1-33之间的一个随机数,可以重复2.random.choices(range(1,34),k=6,weight=range(1,34))方法,可以产生6个,但有可能重复,可看源码3.常用:shus=random.sample(range(1,34),6)随机取6个,不重...
2018-05-24 01:38:58
324
原创 异常和日志
class sexExcption(Exception): ''' 自定义异常类 ''' passtry: sex=input('请输入性别:') if sex!='男' and sex!='女': raise Exception('性别只能是男或女')except sexExcption as ex: print(ex)...
2018-05-23 23:23:18
217
原创 冒号排序.py
a,b=3,5b,a=a,b #允许同时赋值#冒号排序nums=[23,6,5,16,88,55,16,78]for i in range(len(nums)-1): if nums[i]>nums[i+1]: nums[i],nums[i+1]=nums[i+1],nums[i]print(nums)输出结果:[6, 5, 16, 23, 55, 16, 78...
2018-05-20 18:07:58
216
原创 phython 一期参考答案
n=1sum=0while n<=100: if n%2= =0: sum+=n n=n=1print(sum)2.while True: n= int(input('请输入一个数字:')) if n= =0: break sum+=nprint(sum)3.n=1while n<=100: if n%3==...
2018-05-02 00:03:25
1486
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人