- 博客(18)
- 资源 (10)
- 收藏
- 关注
原创 排序算法----快速排序
快速排序采用分治法策略来把一个序列分成两个子序列。步骤从数列中挑选出一个元素,称为基准; 重新排序数列,所有元素比基准小的放在基准前面,所有元素比基准大的放在基准后面(相同的数据可以放在任意一边),在这个分区结束后,该基准处于数列的中间位置,这个称为分区操作; 递归的把小于基准值的子数列和大于基准值的子数列排序 python代码def quick_sort(alist, s...
2018-12-11 17:40:40
225
原创 排序算法----归并排序
归并排序采用了二分法,首先对于一个长数组,将其不停的分为左边和右边,以此递归分下去,直到把数组分解成最小单元。然后合并两个有序数组,比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位,直到一个数组为空,最后把另一个数组的剩余部分复制过来即可。 时间复杂度:O(nlogn)稳定性:稳定缺点:空间复杂度很大python代码实现li = [4, 2, 1, 3...
2018-12-11 10:43:59
221
原创 排序算法----希尔排序
希尔排序是插入排序的一种更高效的改进版本,它是非稳定的排序算法。希尔排序是基于插入排序的两点性质提出的改进算法: 插入排序对于已经排序好的数据操作时效率高,可以达到线性排序的效率,但是一般来说插入排序是低效的,因为插入排序每次只能将数据移动一位,例如如下序列[1,2,3,4,5],需要降序排列,当我们采用插入排序时,每次插入都需要移动位置,此时插入排序的效率就很低。基...
2018-12-10 15:57:51
249
原创 排序算法----插入排序
基本思想:在要排序的一组数中,假定前n-1个数已经排序好,现在将第n个数插入到前面的有序数列中,使得着n个数也是排好顺序的,如此反复循环,直到全部排好顺序。时间复杂度:O(n^2)python代码:def insert_sort(li): #升序 for i in range(1 , len(li)): # 第一个数字顺序确定,外层循环表示还需要排序的数字个数 ...
2018-12-10 11:31:48
973
原创 排序算法----选择排序
选择排序的思路是,先从序列中找到最小的元素,放在第一个位置,然后找到第二小的元素,放在第二个位置,以此类推,直到排好所有的值。时间复杂度:O(n^2),需要进行比较的次数为第一轮n-1,n-2,n-3...1,总的比较次数n*(n-1)/2例如:a=[1,2,3,4,5,6]python3代码def select_sorted(li): for i in range(...
2018-12-07 12:06:34
192
原创 排序算法----冒泡排序
冒泡排序是一种简单的排序算法,算法的原理如下: 1. 比较相邻元素,如果第一个比第二个大,就交换他们两者之间的顺序 2. 对每一对相邻元素作相同工作,从开始第一对到结尾最后一对,第一次完毕后,最后的元素就是最大值。 3. 针对所有元素重复上述操作,除了最后一个 4. 持续每次对越来越少的元素重复上面操作,直到没有任何一对数字需要比较。例如有一个数...
2018-12-07 10:16:14
221
转载 linux常用基础命令
无论是前端还是后端同学,一些常用的linux命令还是必须要掌握的。发布版本、查看日志等等都会用到。以下是我简单的总结了一些简单又常用的命令,欢迎大家补充。希望能帮助到大家基础篇1、进入目录cd 目录名2、显示当前路径pwd3、显示路径下的文件lsls -a 显示隐藏文件。隐藏文件以 ...
2018-12-07 09:40:33
166
原创 python进阶—numpy进阶(二)
主要内容:排序,搜索 python列表排序a = [1,2,3,4,5]# 排序a.sort() # 默认升序排序,无返回值,直接修改列表元素顺序a.sort(reverse=True) # 按照升序排序sorted(a) # 内建函数排序,有返回值,创建新的列表对象numpy列表排序numpy提供多种排序函数,如下:import numpy as np...
2018-07-31 15:42:35
1037
原创 python进阶—matplotlib教程
简介:matplotlib是python著名的绘图库,它提供了一整套和matlab相似的API,十分适合交互式进行制图。作为一套面向对象的会图库,它所绘画的图表中的每个绘图元素,都会在内存中有一个对象与之对应,我们只需要调用pyplot绘图模块就能快速实现绘图和设置图表的各种细节。1、简单绘制(折线图)import matplotlib.pyplot as pltimport nump...
2018-07-30 19:09:43
356
原创 python进阶—numpy进阶(一)
内容:矩阵mat、通用函数、除法、线性计算等1、矩阵import numpy as np# 创建矩阵print("####创建矩阵####")a = np.mat("1 2 3;4 5 6") # 通过str创建b = np.mat(np.arange(10).reshape(5,2)) # 通过ndarray创建c = np.matrix(np.arange(6).re...
2018-07-27 16:16:34
1094
原创 python进阶—numpy案例(一)
首先总结一下numpy如何读取txt,excel,csv等格式的文档。import numpy as nparr2 = np.arange(12).reshape(3,4)# 保存数据到txt文档(fmt:数据格式,delimiter:分隔符)np.savetxt(r"C:\Users\67505\Desktop\numpyData.txt", arr2, fmt="%d", de...
2018-07-25 15:30:14
3822
原创 python进阶—pandas教程(二)
pandas数据结构(DataFrame) DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值),DataFrame既有行索引也有列索引,可被看作是有Series组成的字典。 1、创建DataFrameimport pandas as pdimport numpy as np# 创建DataFra...
2018-07-25 10:57:24
488
原创 python进阶—pandas教程(一)
简介 pandas是基于numpy构建的库,在数据处理方面可以把它理解为numpy的加强版,由于numpy主要用于科学计算,特长不在于数据处理,我们平常处理的数据一般带有列标签和index索引,这时pandas作为数据分析包而被开发出来。pandas数据结构(Series/DataFrame) 1、Series创建 Series类似一维数组的数...
2018-07-24 15:32:41
1508
原创 python基础—numpy教程
简介 numpy作为作为python中科学计算的核心库,包含了很多实用的数学函数,涵盖线性代数运算、傅里叶变换、随机数生成等功能。它提供了一个高性能多维数据对象,以及操作这个对象的工具。 1、多维数组创建(ndarray)import numpy as np# 数组的创建(ndarray)print("####数组的创建####")a1 = n...
2018-07-23 16:16:35
501
原创 机器学习实战-决策树
算法概述 决策树和K近邻一样,都是解决分类问题的算法。决策树从名字解读,目标是建立一棵树,数据看作树的根或者叶,选取数据的特征作为树的一个个分支(决策点),每个分支把数据集分为了不同的数据子集,这里体现了分类的决策,最后直到数据集无法再进行划分。决策树作为预测模型,代表了对象属性和对象标签之间的映射关系,我们可以发现数据内部蕴含的知识(k近邻无法获取数据的内在含义) ...
2018-07-18 15:37:04
340
原创 python爬虫—天猫商品
采用selenium模拟浏览器抓取天猫红酒销售和价格数据,主要解决了以下几个问题1、采用selenium时爬虫效率问题,这里禁止了加载图片和加载javascript,代码如下# 获取浏览器驱动(禁止加载图片和javascript)options = webdriver.ChromeOptions()pref = {'profile.default_content_setting_va...
2018-01-30 14:08:54
1145
原创 python爬虫—天气数据
采用python 的bs4和urllib从网站:http://www.tianqihoubao.com/lishi/beijing/month/201710.html,爬取了2011年1月到2017年11月13日天气数据,主要有以下四个字段:data(时间)、weather(天气)、temperature(温度)、wind(风力风向),四个字段的数据'''Created on 2017-1...
2017-11-14 12:50:26
1392
原创 机器学习实战-K近邻算法(KNN)
1、算法概述 最简单的分类器是把全部的训练数据所对应的特征和标签都记录下来,当测试数据的特征和某个训练样本的特征完全匹配时,便可以给测试数据打上该训练样本的标签,但是我们无法保证所有的测试对象都能在训练数据集中找到与之唯一对应的标签,可能该标签不存在或者存在多个不同的标签,基于这些问题产生了K近邻算法(KNN)。2、工作原理 存在一个样本数据集,并且每个样本...
2017-06-19 16:11:43
459
python数据分析与挖掘实战(pdf+code+data)
2019-01-25
tesserocr-2.2.2-cp36-cp36m-win32.whl
2018-07-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人