- 博客(2)
- 收藏
- 关注
原创 [Python]实战——百度贴吧爬虫
网络爬虫(Web Spiders)是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。半年前,我接触了Lucene搜索引擎开发——开始了网络爬虫之旅;当时,采用的是纯JAVA开发环境,对百度某吧几百万帖子进行了全面爬取。那时候我对Python一点都不了解,今天对《Pyhon基础教程:第2版·修订版》以及极客学院相关视频进行了学习,形成了本文。 Key Word
2017-01-02 15:36:17
778
原创 [Data Structure]九大内部排序算法
排序(Sorting)是计算机程序设计中的一种重要操作,它的功能是将一个数据元素(或记录)的任意序列,重新排列成一个按关键字有序的序列。由于待排序的记录数量不同,使得排序过程中涉及的存储器不同,可将排序方法划分为两大类: 内部排序,是指待排序列完全存放在内存中所进行的排序过程,适合不太大的元素序列。 外部排序,指的是大文件的排序,即待排序的记录存储在外存储器上,待排序的文件无法一次装入内存,需要在内存和外部存储器之间进行多次数据交换,以达到排序整个文件的目的。 九大内部排序:直接插入排序、折
2016-12-30 11:19:02
603
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人