- 博客(8)
- 收藏
- 关注
原创 python 实现单链表逆序
python 实现单链表逆序coding=utf-8节点类class ListNode(object):def init(self, x):self.data = xself.next = None链表类class SingleList(object):def init(self):# 初始化头节点self.head = None# 头插法添加节点def add(self...
2020-01-05 17:46:37
669
原创 python数据分析 pandas学习笔记(一)pandas系列
一.系列说明系列(Series)是能够保存任何类型的数据的一维标记数组。轴标签统称为索引。语法:pandas系列可以使用以下构造函数创建pandas.Series(data, index, dtype, copy)构造函数的参数如下data数据采取各种形式,如:ndarray,list,constantsindex索引值必须是唯一的和散列的,与数据的长度相同。 ...
2019-01-07 16:41:50
346
原创 python数据分析笔记(一)NumPy Ndarray 对象
NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。ndarray 对象是用于存放同类型元素的多维数组。ndarray 中的每个元素在内存中都有相同存储大小的区域。ndarray 内部由以下内容组成:一个指向数据(内存或内存映射文件中的一块数据)的指针。数据类型或 dtype,描述在数组中的固定大小值的格子...
2019-01-05 15:51:00
419
翻译 python内存管理机制
关于python的存储问题(1)由于python中万物皆对象,所以python的存储问题是对象的存储问题,并且对于每个对象,python会分配一块内存空间去存储它(2)对于整数和短小的字符等,python会执行缓存机制,即将这些对象进行缓存,不会为相同的对象分配多个内存空间(3)容器对象,如列表、元组、字典等,存储的其他对象,仅仅是其他对象的引用,即地址,并不是这些对象本身关于引用计数器...
2019-01-02 10:20:28
148
翻译 python线程和进程(知识了解)
很多同学都听说过,现代操作系统比如Mac OS X,UNIX,Linux,Windows等,都是支持“多任务”的操作系统。什么叫“多任务”呢?简单地说,就是操作系统可以同时运行多个任务。打个比方,你一边在用浏览器上网,一边在听MP3,一边在用Word赶作业,这就是多任务,至少同时有3个任务正在运行。还有很多任务悄悄地在后台同时运行着,只是桌面上没有显示而已。现在,多核CPU已经非常普及了,但是...
2018-12-25 11:47:25
123
原创 常见的反爬虫和应对方法
一,通过 Headers 反爬虫:从用户请求的 Headers 反爬虫是最常见的反爬虫策略。很多网站都会对 Headers 的 User-Agent进行检测,还有一部分网站会对 Referer 进行检测(一些资源网站的防盗链就是检测 Referer)。如果遇到了这类反爬虫机制,可以直接在爬虫中添加 Headers,将浏览器的 User-Agent 复制到爬虫的Headers 中;或者将 R...
2018-12-25 09:07:59
758
原创 python爬虫实战笔记(二)数据缓存mangodb实现类方法
一.代码实现及说明# coding=utf-8import pickleimport zlibfrom datetime import datetime, timedeltafrom pymongo import MongoClientfrom bson.binary import Binaryclass MongoCache(object): """ 数据库缓...
2018-12-19 11:53:27
267
原创 python爬虫实战笔记(一)
一,认识爬虫1、爬虫概念爬虫是什么?生活中,爬虫就是爬行的虫子,毛毛虫、蛆、蜘蛛(spider)蜘蛛网:从任何一端都可以到达任何一端,由很多的节点构成互联网爬虫。互联网:从一个地址开始可以到达其它任何地址a链接 href 网址(url)互联网爬虫:写一个程序,功能就是打开一个url,从内容中获取我们想要的数据都有哪些语言可以实现这种功能?(1)php,号称世界上最美丽的...
2018-12-17 22:00:42
194
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人