
Python数据挖掘
冰彡棒
每天进步一点点,你也可以在难受的时候,买一张机票去自己想去的地方,而不是躲在被窝里哭。
展开
-
Python数据挖掘学习--01基本模块介绍以及环境安装
一、数据挖掘介绍 数据挖掘利用了来自如下一些领域的思想: (1) 来自统计学的抽样、估计和假设检验, (2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术原创 2017-09-15 12:26:09 · 395 阅读 · 0 评论 -
Python数据挖掘学习02--numpy和pandas模块基本使用
一、numpy模块导入numpy模块并命名为npy>>> import numpy as npy1、创建数组(1)一维数组>>> x = npy.array(['22','18','15','4']) >>> x array(['22', '18', '15', '4'],dtype='<U2') >>>(2)二维数组>>> y = npy.array([['aa','bb','cc'],['12'原创 2017-09-15 15:35:44 · 742 阅读 · 0 评论 -
Python数据挖掘04---matplotlib数据可视化分析
一、matplotlib基本介绍 Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。 通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。 二、Matplotlib基础知识 1.Matplotlib中的基本图表包括的元素 (1)x轴和y轴:水...原创 2017-09-17 15:26:11 · 943 阅读 · 0 评论 -
Python数据挖掘学习03--pandas模块数据的导入实战
导入使用的是pandas模块 import pandas as pda 下面就可以使用pda 以下介绍了5种数据导入的 1、csv c = pda.read_csv("C:\Users\ME\Desktop\数据\hexun.csv") 2、excel d = pda.read_excel("C:\Users\ME\Desktop\数据\hexun.xls") 3、sq...原创 2017-09-15 15:44:15 · 841 阅读 · 0 评论 -
Python数据挖掘05--词云(wordcloud)找出老九门中热门词语
注意 window系统安装wordcloud模块时可能会出现需要安装C++等错误,此时使用https://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy网站的whl自己进行安装将不会再报错 资料中所用到老九门文件和图片,点击下载 import wordcloud as wc # 词云模块 import matplotlib.pylab as plb ...原创 2018-02-28 22:31:52 · 474 阅读 · 0 评论 -
Python数据挖掘06--淘宝网数据处理
淘宝数据:第一列标题,第二列链接,第三列价格,第四列评论 所用到数据sql文件点击下载 一、数据预处理 数据预处理指的是对数据进行初步处理,把脏数据处理掉,否则很容易影响最终结果。 常见的的预处理包括: 1、缺失值处理 2、异常值处理 3、数据集成 在数据量大的情况下采用删除处理法,是比较优质的一种处理方法。 二、实战分析 步骤: 1、爬取淘宝数据存入数据库(...原创 2018-02-28 23:41:24 · 1182 阅读 · 2 评论 -
Python数据挖掘07--KNN算法理论与实现
一、KNN算法 KNN算法是一种解决分类问题的算法之一。 一般实现KNN算法有两种思路: 1、通过KNN算法自行写Python代码源生实现 2、依据一些集成模块直接调用实现 二、KNN算法理论思路 1、计算新个体到各旧数据之间的距离 2、统计出距离最短的前K个商品 3、统计距离最短的前K个商品中哪一个类别最多 4、将新商品归为类别最多的这一个类别 三、代码实...原创 2018-03-03 22:23:12 · 372 阅读 · 0 评论